A l'origine était SARAH... 2-ième partie

Comment contourner le paradoxe de la Vision Par Ordinateur.

Dans le cadre de ma thèse d’état (1986), j’ai créé et développé un système auto-adaptatif qui était un système général de Reconnaissance des Formes (RF) : SARAH (Système d’Apprentissage et de Reconnaissance Automatique Hiérarchisé).

Il existe d’autres approches auto-adaptatives, comme les réseaux neuronaux qui sont réalisés dans un ordinateur en utilisant trois grandes étapes :

au neurone biologique du cerveau, on fait correspondre un petit automate informatique dit « neurone formel »,
à l’architecture complexe du cerveau, on fait correspondre une architecture connectant une très grande quantité (ex :10 000) de neurones formels, dite « réseau de neurones »,
pour un objectif précis, on approche un fonctionnement simple du cerveau par un processus permettant au réseau de neurones d’apprendre un comportement (par exemple classer des objets) en imitant un être humain poursuivant le même objectif et guidant le système.

SARAH était un système auto-adaptatif structuré en trois niveaux :

un niveau prédicteur capable d’identifier des détails caractéristiques d’une classe d’objets. Ici, les informations utilisent un chemin déductif : c’est à partir de l’image de l’objet que l’on prédit la classe,
un niveau vérificateur capable de conserver en mémoire des sortes de cartographies globales d’une classe d’objets (silhouettes). Ici, les informations utilisent un chemin inductif : c’est en supposant la classe de l’objet que l’on vérifie son image,
un niveau stratégique, ou méta, capable de combiner, en phase de reconnaissance, les résultats des niveaux précédents, et de modifier les représentations de détails et globales des silhouettes en vue d’améliorer la connaissance générale du système sur les classes à reconnaître.

SARAH était donc un système doué de capacités cognitives, capable d’apprendre à reconnaître les classes d’objets quelconques présentées par un homme.

Il fonctionnait en trois phases réalisant le processus auto-adaptatif :

Une phase d’apprentissage :
Au départ, SARAH est ignorant et ne connaît rien des objets et des classes à reconnaître. Un homme, nommé « Le Professeur » (car connaissant bien les objets, et donc leurs classes) présente à SARAH des suites d’objets représentatifs des classes à reconnaître.
SARAH fait des essais, propose des classes, commet des erreurs, mais enregistre cependant les bons résultats et cherche à faire mieux. Petit à petit, il garde en mémoire les détails et les silhouettes globales caractéristiques des objets et organise l’ensemble pour faire comme Le Professeur.

Une phase de reconnaissance :
Elle commence quand Le Professeur juge que SARAH répond aussi bien que lui pour classer correctement les objets des classes à reconnaître. SARAH devient autonome, il a généralisé les notions de classes de l’ensemble d’apprentissage et reconnaît seul les objets.

Une phase de réactualisation :
À tout moment, le professeur peut intervenir, par exemple si des objets d’une classe inconnue sont présentés à SARAH. L’enfant qui connaît la classe générale des fleurs, et qui a déjà vu une rose, des marguerites et du muguet va sans doute s’interroger en voyant pour la 1ère fois une tulipe. S’il n’a jamais appris ce nom il ne peut pas l’inventer ! C’est à son « Professeur »…, c’est-à-dire sa mère ou son père, de lui dire « c’est une tulipe ».

La phase de réactualisation est en fait la phase de fonctionnement normal de SARAH. Les résultats de la reconnaissance des objets sont utilisés par le système lui-même, avec ou sans Le Professeur pour accroître constamment ses propres performances de reconnaissance.
Cette remarque montre que l’ensemble des objets utilisés pour l’apprentissage est un ensemble ouvert dépendant fortement du contexte. Cela semble logique, car la véritable connaissance n’est-elle pas, par définition, susceptible d’évolution en fonction du contexte ? À une certaine époque, il était facile de reconnaître un étudiant en sciences d’un étudiant en droit, car seul ce dernier portait à coup sûr une cravate. De même l’un de mes collègues était facilement reconnaissable car c’était le seul à porter également une cravate. Cependant, si ce détail « présence d’une cravate » semblait permettre à lui tout seul de reconnaître certains étudiants ou l’un de mes collègues, il ne permettait pas de reconnaître des étudiants en sciences. Cette remarque très naïve montre combien il est illusoire de fixer une fois pour toutes des caractéristiques jugées pertinentes pour effectuer une reconnaissance. Les performances de SARAH étaient donc dépendantes du contexte de l’apprentissage et pouvaient évoluer en fonction d’un changement de celui-ci.

Si par définition les systèmes auto-adaptatifs copient (ou modélisent) notre propre fonctionnement face à l’apprentissage et à la reconnaissance d’objets, ils ont bien évidemment des limites.

L’homme dispose d’une culture qui s’est forgée pendant des millénaires. Il possède des capacités de reconnaissance remarquables dans une infinité de domaines. Les machines de RF peuvent souvent travailler beaucoup plus vite que l’être humain pour reconnaître, trier, identifier des objets… mais dans des domaines d’applications toujours très restreints. Les capacités de reconnaissance de l’homme, comme celles de l’intelligence, sont en revanche extrêmement larges et adaptables à toutes sortes de domaines. Ce que ne savait pas faire SARAH en 1986, et qu’aucun ordinateur même correctement programmé ne sait toujours pas faire aujourd’hui en 2011, est de reconnaître à tout moment toutes sortes d’objets dans des situations variées, ce que l’homme, lui, sait très bien faire.

Mais où est donc l’analogie entre SARAH et Polynesia ?

Si vous avez consulté, dans ce même site, la rubrique : « Le livre sur le livre » dans « Naissance de Polynesia/Et… » vous avez pu voir les différentes techniques employées pour la rédaction de la trilogie Polynesia.

J’évoque par exemple la technique classique de l’écriture linéaire – approche déductive – consistant à commencer par le début pour aller, chapitre par chapitre, vers la fin.
Je parle aussi de l’intérêt d’écrire la fin avant toute chose, et de remonter alors – approche inductive – vers le début.
J’utilise également « Le livre sur le livre » qui, d’un niveau stratégique, combine et organise les approches précédentes et met de nouveaux chapitres là où il en manquait, comme pour combler les espaces vides entre les pierres du guet…

En 2003, quand j’ai commencé à penser à l’écriture de Polynesia, j’ai développé une stratégie permettant de gérer une structure complexe en trois époques : passé, présent, futur. J’ai pris conscience que pour faire exister le livre, je devais trouver un moyen de maîtriser sa complexité de telle manière qu’elle ne nuise pas à l’intérêt du lecteur. Il fallait développer des outils. Je me rends compte aujourd’hui même, en mars 2011, que ces outils d’écriture présentent une étonnante analogie avec ceux que j’ai développés il y a 30 ans pour participer à des recherches sur la résolution de problèmes complexes : faire faire à une machine ce que nous faisons tous les jours depuis notre naissance, c’est-à-dire apprendre continuellement à reconnaître les objets du monde réel.

L’écriture déductive du livre : prédire la fin chapitre par chapitre, est comme le niveau prédicteur de SARAH.
L’écriture inductive du livre : vérifier que le début mène à la fin, est comme le niveau vérificateur de SARAH.
Le livre sur le livre est exactement le niveau méta ou stratégique de SARAH.

Est-ce une découverte ? Nous sommes ce que nous avons appris à être. Finalement, un modèle de structuration des connaissances a imprégné mes pensées, mes souvenirs et mes habitudes au point que j’aie pu y faire implicitement référence, sans même m’en rendre compte ! Alors, quand en 2003 je jette les premières pierres de Polynesia, inconsciemment je ressors de ma mémoire le modèle de SARAH pour structurer mes livres et c’est ainsi que naît Polynesia.

Mai te reira iho ä !

Jean-Pierre Bonnefoy

A l’origine était SARAH... 2-ième partie

Comment contourner le paradoxe de la Vision Par Ordinateur.