Accueil du site > Projets > Autres financements

FONDATION DE FRANCE

publié le , mis à jour le

Contexte théorique

Pour lire ce texte, la première chose que vous avez faite est de poser votre regard au début de la phrase. Maintenant vous déplacez votre regard, vous arrêtant sur chaque mot, tentant d’en extraire les lettres pour identifier ce mot parmi tous ceux que vous connaissez, de le prononcer, éventuellement à haute voix, et de passer au suivant. Du moins c’est l’impression que vous avez.

Ces mécanismes complexes comme le déplacement du regard, l’extraction des caractéristiques orthographiques ou la prononciation sont autant de domaines qui ont été étudiés de manière plus ou moins indépendante par les scientifiques. Par exemple l’étude des déplacements du regard a permis de mettre en évidence le fait que l’on ne lisait pas tous les mots, et que la position du regard dans la phrase n’était pas due au hasard mais était le résultat d’une planification (Vitu, O’Regan, & Mittau, 1990). Il en va de même pour la prononciation. Il est probable que vous n’ayez pas besoin de reconnaître chacune des lettres des mots que vous avez l’habitude de lire, avant de les prononcer, du moins c’est ce que proposent les modèles à double voie : le modèle Dual Route Cascade, DRC (Coltheart et al. 2001) et le modèle Connectionist Dual Process, CDP+ (Perry et al., 2007).

Depuis de reconnaissance de mots est le modèle à Activation Interactive (AI) de McClelland et Rumelhart en 1981. Ce modèle a montré de manière élégante que la perception d’un mot est influencée par les mots que l’on connaît déjà. Il est à la base des modèles récents de lecture parmi les plus populaires dans la communauté scientifique : le modèle Dual Route Cascade, DRC (Coltheart et al. 2001) et le modèle Connectionist Dual Process, CDP+ (Perry et al., 2007). Pourtant ces modèles peinent à rendre compte des enjeux actuels que sont le codage de la position des lettres du mot et l’apprentissage de la lecture. Le problème de la position des lettres est difficile à résoudre car la position est importante pour distinguer des mots comme "loin" et "lion". Pourtant on puet lire un tetxe dnot les mtos ont leurs lrettes manlgéées. Ce problème est traité aujourd’hui par des modèles dédiés comme SERIOL (Whitney, 2001) ou SCM (Davis, 2010). Le problème de l’apprentissage est, quant à lui, abordé de manière naturelle par les modèles connexionnistes (McClelland et Seidenberg, 1999). Une première implémentation d’un modèle d’auto-apprentissage double voie a été tentée récemment (Ziegler et al., 2014 ). Mais ces modèles utilisent des bases d’apprentissage qui ne correspondent pas à celles d’un enfant débutant lecteur. Ils ne sont pas plausibles.

Le projet BRAID

Le premier objectif de notre projet est de créer un modèle permettant d’étudier les mécanismes cognitifs mis en œuvre dans la reconnaissance visuelle des mots. A cette fin, nous avons développé BRAID, un modèle bayésien algorithmique de reconnaissance visuelle de mots écrits.

Ce modèle se distingue tout d’abord par son formalisme. Les connaissances contenues dans le modèle sont exprimées à l’aide de distributions de probabilité et les liens entre ces connaissances à l’aide de relations de dépendance. Chaque tâche que simule BRAID, comme l’identification de lettre ou la décision lexicale, est décrite par une question probabiliste. Les solutions apportées par BRAID sont le résultat d’inférence, basées sur les connaissances du modèle.

En ce qui concerne le fond, BRAID est à la fois conventionnel et innovant. Assez classiquement, le modèle repose sur une structure parallèle et dynamique à trois niveaux. Un premier niveau permet l’extraction dynamique des informations visuelles en fonction de la position du regard et de l’acuité. Un second niveau va permettre d’accumuler l’information visuelle dans des représentations internes des lettres. Enfin un troisième niveau décrit les connaissances lexicales, c’est-à-dire les relations entre les mots connus et les lettres qui les composent.

A cette structure assez classique, BRAID ajoute tout d’abord un modèle d’interférence latérale, au niveau de la perception des lettres. Mais l’apport le plus important de ce modèle est l’ajout d’un composant attentionnel qui joue le rôle de filtre entre le niveau de perception des traces écrites et leur stockage. Ce filtre accélère la prise d’information dans les zones d’intérêt au détriment des zones moins informatives.

Les travaux actuels sur le modèle BRAID ont pour but, premièrement, d’explorer sa capacité à rendre compte des observations expérimentales sur le lecteur expert ou le lecteur ayant un déficit de lecture, et deuxièmement, de l’étendre, pour en faire un modèle de l’apprentissage des connaissances orthographiques.