



Publié le
Lecture 16 mins
Retour articulatoire visuel pour l’aide à la prononciation
T. HUEBER, P. BADIN, G. BAILLY, F. ELISEI, Gipsa-lab, Département Parole et Cognition, Grenoble

Plusieurs recherches sont actuellement menées pour concevoir des systèmes permettant à un locuteur de visualiser en temps réel ses propres mouvements articulatoires. l'objectif de ces systèmes de « retour articulatoire visuel » est d'aider un locuteur à mieux comprendre où se positionnent ses articulateurs (notamment sa langue) lorsqu'il parle, lui permettant ainsi de mieux les contrôler. Les applications visées par ces systèmes sont la rééducation orthophonique et l'aide à l'apprentissage des langues étrangères.
Motivations Les troubles de l’articulation sont d’origines multiples. Ils peuvent être liés à une malformation de l’appareil vocal, à un mauvais contrôle moteur, à un déficit auditif, à une intervention chirurgicale de la sphère ORL, etc. Le traitement de ces troubles nécessite la mise en place d’un processus de rééducation orthophonique. Les protocoles actuels mis en oeuvre pour cette rééducation sont basés essentiellement sur la répétition « d’exercices » : le praticien analyse qualitativement la parole produite par le patient, met en place une stratégie adaptée et décrit cette dernière au patient. L’efficacité de la rééducation repose donc sur la compréhension de l’origine exacte du trouble par le praticien, sur la qualité de l’échange avec le patient et sur la bonne intégration par ce dernier des indications qui lui sont données. Or, si le praticien dispose aujourd’hui d’outils informatiques dédiés pour affiner son diagnostic et quantifier les progrès effectués, il est fréquent que le patient ne dispose de son côté que d’indications « verbales » qu’il doit confronter au ressenti qu’il a de son propre geste articulatoire (exemple : « pour produire le son [k], pressez l’arrière de la langue contre le palais puis relâchez… »). Cependant, il est fréquent que le patient peine à transformer les indications du praticien en une « cible articulatoire » concrète, qu’il doit visualiser mentalement et tenter d’atteindre. Le temps et l’énergie nécessaires à sa rééducation se voient alors rallongés. C’est ce manque de conscience sur la position des articulateurs de la parole, dans l’espace comme dans le temps, que les systèmes dits de « retour articulatoire visuel », tentent de combler. Système de retour visuel articulatoire Vizart3D. Le retour articulatoire visuel Un système de « retour articulatoire visuel » (ou visual articulatory feedback en anglais) est un système permettant à un locuteur de visualiser tout ou partie de ses propres mouvements articulatoires, pendant, ou peu de temps après les avoir effectués (figure 1). Figure 1. Retour articulatoire visuel (principe général). L’objectif de ces systèmes est d’améliorer la conscience que le locuteur a de ses propres mouvements articulatoires, comme par exemple la position de sa langue, pour (peut-être) mieux les corriger. La conception de systèmes de retour articulatoire visuel est un domaine de recherche en pleine expansion, qui implique différentes communautés des sciences de la communication parlée, regroupant ainsi des chercheurs en technologies vocales, en phonétique, en sciences cognitives, des orthophonistes et des ORL. S’il est relativement simple d’enregistrer les mouvements des articulateurs externes, comme les lèvres et la mâchoire, en utilisant par exemple une simple caméra vidéo, il est en revanche plus complexe de capturer les mouvements d’articulateurs internes, comme ceux de la langue. Plusieurs approches, utilisables dans le cadre d’une séance de rééducation orthophonique, ont à ce jour été proposées dans la littérature. Les paragraphes suivants tentent d’en dresser une liste (non exhaustive). L’électropalatographie Mis au point au début des années 1960, l’électropalatographe ou EPG est un instrument de mesure basé sur un palais artificiel, couvert d’électrodes de contact (le nombre d’électrodes peut varier entre 60 et 120 (figure 2A). Cet instrument permet de suivre, en temps réel, les zones du palais touchées par la langue, pendant la production de la parole, comme pendant la déglutition. La visualisation de ces zones de contact s’effectue généralement sur un écran d’ordinateur, qui affiche un tableau dont les cases représentent de façon schématique l’organisation spatiale des électrodes sur le palais artificiel ; une case « s’allume » lorsque la langue rentre en contact avec l’électrode qu’elle représente (figures 2A et 2B). L’EPG est donc un instrument particulièrement bien adapté à l’étude des consonnes occlusives et fricatives, qui impliquent un contact de la langue avec le palais. Parmi les systèmes aujourd’hui disponibles sur le marché, on citera principalement ceux commercialisés par les sociétés Articulate Instruments et CompleteSpeech (système SmartPalate). L’EPG est encore aujourd’hui très utilisé dans le cadre d’études phonétiques, portant sur la caractérisation de la parole normale comme pathologique. Son utilisation dans le cadre de la rééducation orthophonique a fait l’objet de nombreuses études de cas (1). Les cas les plus étudiés concernent les enfants, et portent sur les troubles liés aux fentes palatines, à l’apraxie, et à certaines formes de dysarthrie. Dans ces études, l’EPG est utilisé à la fois comme outil de diagnostic aidant le praticien à comprendre l’origine du trouble articulatoire, et comme système de retour visuel permettant au patient d’appréhender son propre geste lingual (ou celui du praticien si ce dernier est également équipé d’un palais artificiel). Cependant, il n’existe (à notre connaissance) que très peu d’études fournissant une évaluation quantitative « massive » des thérapies orthophoniques basées sur l’EPG. On citera principalement l’étude de K.I. Michi et coll.(2) qui porte sur un groupe de 6 enfants japonais âgés de 4 à 6 ans, présentant une fente palatine. Cette étude montre notamment que l’utilisation de l’EPG permet d’accélérer la thérapie (moins de séances nécessaires pour atteindre le but thérapeutique, en comparaison d’un protocole de rééducation standard). Si l’EPG semble un outil intéressant pour améliorer la « conscience articulatoire » d’un locuteur, cette technique présente cependant des inconvénients. Outre la nécessité de construire un palais artificiel adapté à la morphologie de chaque sujet et l’impact de cette modification géométrique et sensorielle sur l’articulation, les différentes études de cas reportées dans la littérature laissent en effet apparaître une variabilité inter-individuelle relativement importante. Cette variabilité peut dans une certaine mesure s’expliquer par les difficultés que peuvent avoir certains patients à « lire » les patterns EPG (comme ceux présentés figure 2C). Il semble en effet difficile pour certains de décrypter cette visualisation schématique « bidimensionnelle » des points de contacts langue-palais, et de se représenter « dans l’espace » la cible articulatoire à atteindre. Par ailleurs, l’EPG ne renseigne que sur les zones de contact de la langue avec le palais, et non sur la distance qui les sépare. Figure 2. A. Électropalatrographe. B. Séance de rééducation orthophonique utilisant l’EPG. C. Exemples de patterns EPG. (Illustrations : Queen Margaret University) L’EPG ne peut donc pas être utilisé pour corriger l’articulation de tous les phonèmes, comme par exemple les voyelles moyennes et ouvertes. C’est notamment ce que va permettre l’échographie, une technique dont l’utilisation dans le cadre du retour visuel pour la correction orthophonique est de plus en plus étudiée. L’échographie (imagerie ultrasonore) L’échographie est une technique d’imagerie médicale qui peut être utilisée pour capturer le mouvement de la langue pendant la production de la parole. La sonde ultrasonore est alors placée sous le menton du locuteur (figure 3A). Lorsque la sonde est orientée dans le sens de la longueur de la langue, on obtient une coupe de la cavité buccale dans le plan sagittal médian (figure 3B). Figure 3. A. Échographie du conduit vocal. B. Images ultrasonores de la langue dans le plan sagittal médian (position de « repos » à gauche, lors d’un [k] à droite). Une coupe dans le plan coronal est obtenue en orientant la sonde dans le sens de la largeur de la langue. Ce mode de visualisation, qui révèle les détails du septum lingual, reste assez peu utilisé car il ne permet pas la visualisation simultanée des parties postérieures et antérieures de la langue lors de la production de parole. La structure la plus évidente dans le plan sagittal médian est la surface de la langue qui est délimitée par la limite inférieure de la longue et fine bande très échogène. Certaines contraintes limitent la visibilité complète des déformations de la langue : sur les images échographiques, la surface de la langue est notamment interrompue de part et d’autre par deux « ombres acoustiques » causées par la présence, sur la trajectoire du faisceau ultrasonore, de l’os hyoïde pour celle de gauche et de l’os de la mâchoire pour celle de droite. L’ombre acoustique de la mâchoire peut parfois être à l’origine d’une occultation de l’apex. Par ailleurs, le palais n’est visible que très partiellement, et uniquement lorsque qu’il est en contact avec la langue. Ceci se produit notamment lors de la déglutition, pendant laquelle la langue épouse la forme du palais osseux, et lors de l’articulation de certaines consonnes palatales ou vélaires. Malgré ces restrictions, l’échographie est l’une des rares techniques d’imagerie présentant de bonnes résolutions temporelles (de l’ordre de 80 images par seconde) et spatiales (inférieure à 1 mm). Pour plus d’informations sur l’utilisation de l’échographie pour l’étude du conduit vocal, nous invitons le lecteur à consulter(3). Inoffensive et non invasive, l’échographie est une technique bien adaptée pour une utilisation dans le cadre d’une séance de rééducation orthophonique. Il n’existe cependant à ce jour aucun système commercial d’échographie dédié « exclusivement » à l’imagerie du conduit vocal. Plusieurs chercheurs ont cependant conçu, à partir d’échographes classiques, des systèmes adaptés à l’étude des mouvements articulatoires. Ces systèmes permettent notamment l’enregistrement simultané et synchrone du flux d’images ultrasonores avec d’autres types de signaux. On citera notamment le système développé par la société Articulate Instruments qui permet la synchronisation du flux d’images ultrasonores avec le signal EPG. On citera également le système Ultraspeech, que nous développons au Gipsa-lab, qui est un système portable, permettant de synchroniser le
Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.
pour voir la suite, inscrivez-vous gratuitement.
Si vous êtes déjà inscrit,
connectez vous :
Si vous n'êtes pas encore inscrit au site,
inscrivez-vous gratuitement :
Articles sur le même thème
Pagination
- Page 1
- Page suivante