Réflexions sur la théorie des ensembles
Un article de Caverne des 1001 nuits.
Sommaire |
Introduction
Cet article tente d'analyser certaines défaillances fondamentales de la théorie axiomatique des ensembles de Zermelo-Fraenkel, théorie qui fut conceptualisée à la suite de la théorie dite "naïve" des ensembles de Cantor, exprimée dans le langage courant. Le but de cet article est de montrer que si le fait même de formaliser la théorie des ensembles de Cantor était une nécessité, la fomalisation de Zermelo-Fraenkel grave dans le marbre des ambiguïtés sémantiques qui font que la théorie axiomatique des ensembles ne peut servir à d'autres domaines de la pensée.
Nous étudierons certaines de ces approximations, notamment au travers d'exemples précis, ceci afin de remettre en cause la formalisation elle-même, et donc certains axiomes de cette théorie. Notre but serait d'obtenir une théorie axiomatique des ensembles qui pourrait avoir des applications en dehors des mathématiques[1].
De plus, nous remettrons en cause une certaine vision de l'infini en provenance de cette théorie des ensembles, vision qui résulte de ces ambiguïtés de notations.
L'hypothèse sous-tendant les axiomes de la théorie Zermelo-Fraenkel
Introduction
Il y a deux façons de se sortir des paradoxes causés par la théorie des ensembles de Cantor, notamment du paradoxe de Russell, qui s'exprime en formalisme actuel par y = {x | x ∉ x} :
- soit considérer que tout objet est un ensemble, ce qui mène à la théorie Zermelo-Fraenkel (ZFC) ;
- soit d'utiliser une approche typée des objets, approche qui remet en cause de façon fondamentale l'universalité du symbole binaire ∈.
C'est cette seconde approche que nous voudrions appuyer, une approche qui considère que la fonction binaire ∈ est une fonction qui dépend du contexte manipulé.
Exemple d'une approche typée
Soit A l'ensemble des pièces détachées d'une voiture B. Nous noterons :
- A = {x : x est une pièce détachée de B}.
Dans la théorie ZFC, on écrit :
- x ∈ A.
Or, nous omettons dans cette définition la notion de partie de B. Ainsi, nous pourrions définir un nouveau symbole comme ♦ pour écrire :
- A = {x : x ♦ B}.
Cette notation nous donne donc deux perspectives : celles de A, ensembliste au sens traditionnel, et celle de B, ensembliste au sens de "est une partie de".
Supposons que x1 soit la roue avant gauche de la voiture B. x1 est une roue. Elle fait donc partie du sous-ensemble C de A des roues de B. Nous pouvons écrire :
- C = {x : x est une roue de B},
- x1 ∈ C,
- et naturellement C ⊂ A.
Soit G, l'ensemble de toutes les roues de toutes les voitures. Nous pouvons écrire :
- C ⊂ G,
- x1 ∈ G.
Mais là encore, nous perdons une notion de typologie. Si G est vu comme le "concept" de roue, alors il nous faut un nouveau symbole pour définir le fait que x1 soit une roue (une "instance" de roue). Ainsi la notation pourrait ressembler à :
- C ⊂ G,
- x1 ◊ G.
Finalité d'une approche typée
L'approche typée est très bien connue en programmation orientée objet où l'on distingue les symboles ♦ et ◊ du symbole générique ∈, souvent complètement inutile car trop vague.
La finalité d'une approche typée est de contextualiser l'approche que nous avons des ensembles et de caractériser ces ensembles en fonction :
- de ce qu'ils contiennent,
- de ce qui doit être démontré.
Chose surprenante, cette approche est courante dans d'autres branches des mathématiques car personne ne se permettrait de considérer que l'on peut inverser une matrice réelle aux mêmes conditions que l'on inverse une matrice composée d'éléments complexes. L'opérateur d'inversion de matrice est donc dépendant du type que l'on manipule. Il devrait en être de même dans la logique ensembliste.
Un problème d'infini
L'idée que nous défendons ici est que les concepteurs de la théorie ZFC voulurent garder le concept d'infini de Cantor et donc se placèrent dans une posture de refus d'une approche typée, optique qui impliquait une quasi disparition de la notion d'infini.
En restant suffisamment généraux sur les concepts utilisés et notamment en fusionnant a priori les éléments et les ensembles (ce qui pourrait être vu comme une fusion des opérateurs binaires ∈ et ⊂ et une non contextualisation de ces opérateurs), la théorie ZFC prend pour hypothèse la construction d'une théorie ensembliste générale ayant pour but :
- la perfection au travers d'un niveau d'abstraction très (trop) général,
- la construction d'un socle mathématique qui de facto s'écarte de la réalité mentale de manipulation des ensembles,
- la conservation du concept cantorien d'infini.
La théorie ZFC est donc un acte engagé et non une mise à plat simple des axiomes de base de la théorie naïve des ensembles. C'est un acte biaisé qui peut expliquer pourquoi l'arithmétique a beaucoup moins d'applications concrètes que l'analyse par exemple.
Les insuffisances du calcul des prédicats de premier ordre
Or, nous sommes ici en pleine confusion de "type" de notions manipulées. Remettons les choses à plat : considérons d'abord que lorsque l'on dit que x est un ensemble, on peut écrire x ⊂ x, mais en aucun cas x ∈ x. En effet, dans la seconde écriture, nous avons a à gauche considéré comme un élément et x à droite considéré comme un ensemble.
Une définition commune de l'inclusion
L'inclusion est couramment définie comme suit :
- soit A et B deux ensembles ;
- A ⊂ B équivaut à ∀ a ∈ A, a ∈ B.
Pour des ensembles de cardinaux finis, il est simple de montrer que A ⊂ A et que si A ⊄ A, cela signifie qu'il existe un a qui est à la fois élément et non élément de A.
Une mauvaise définition de l'ensemble
Le symbole ∈ définit une ambiguïté certaine qui est l'illustration d'une mauvaise définition de ce qu'est l'appartenance à un ensemble. Car au lieu de définir un seul symbole pour cette appartenance, nous avons de fait, en analyse conceptuelle
Or, dans les flous de la théorie des ensembles, flous causés par la non typologie des symboles (chose pourtant peu courante en analyse), Russell étudie : ∃ x ensemble : x ⊄ x. Si x est un ensemble d'éléments finis, il n'existe pas un tel ensemble x. Mais si nous envisageons que x est un ensemble d'ensembles, cela peut changer la vision des choses.
Au lieu d'utiliser des symboles ambigus comme ∈ ou ⊂, définissons une fonction binaire d'appartenance, φ : dans le contexte de x et de ses éléments, au lieu d'écrire a ∈ x, nous noterons φ(x, a) = vrai. L'avantage d'une telle notation est de mettre x en paramètre de la fonction d'appartenance φ et non plus en symbole absolu. φ est une fonction qui n'a pas de raison de se comporter de la même façon dans les cas suivants :
- φ(x1, a) = vrai ;
- φ(x2, a) = faux ;
- φ(y, z) = vrai ;
- etc.
La fonction φ est une fonction qui s'adapte au "type" des deux paramètres, le premier étant considéré comme l'ensemble et le second comme l'élément. Ainsi, si nous raisons inclusion
Le problème de l'identité x = x
Le passage à la limite en analyse n'équivaut pas à la récurrence