Une solution avancée basée sur l'apprentissage automatique pour la thérapie EMDR à distance

Une solution avancée basée sur l’apprentissage automatique pour la thérapie EMDR à distance

Mis à jour le 14 février 2024

Un article de Fiani, F., Russo, S., et Napoli, C., publié dans Technologies

Article publié en anglais – accès libre en ligne

Résumé

Pour ce travail, une étude préliminaire a proposé des interfaces virtuelles pour la psychothérapie et les pratiques psychologiques à distance. Cette étude visait à vérifier l’efficacité de telles approches pour obtenir des résultats comparables à la psychothérapie en présence, lorsque le thérapeute est physiquement présent dans la pièce. 

En particulier, nous avons mis en œuvre plusieurs techniques conjointes d’apprentissage automatique pour la détection de la distance, l’étalonnage de la caméra et le suivi des yeux, assemblées pour créer un environnement virtuel complet pour l’exécution d’un protocole psychologique pour un état méditatif de pleine conscience auto-induit. Ce protocole est également applicable à la phase de désensibilisation de la thérapie EMDR. 

Cette étude préliminaire a prouvé que, par rapport à une simple tâche de contrôle, telle que remplir un questionnaire, l’application du protocole de pleine conscience dans un cadre entièrement virtuel améliore considérablement la concentration et réduit le stress des sujets sur lesquels il a été testé, prouvant ainsi l’efficacité d’une approche à distance par rapport à une approche en présence. 

Cela ouvre la possibilité d’approfondir l’étude, de créer une interface entièrement fonctionnelle qui sera applicable dans diverses applications de psychothérapie sur le terrain où la présence du thérapeute ne peut pas toujours être garantie.

Introduction 

Au cours de la dernière décennie, les demandes de psychothérapie virtuelle ont considérablement augmenté, l’une des principales nouveautés étant l’introduction de l’apprentissage automatique dans le traitement des traumatismes. L’apprentissage automatique pourrait potentiellement aider à personnaliser les approches thérapeutiques, en analysant les schémas de réaction des patients et en optimisant les interventions en fonction des besoins individuels. Cependant, il présente également l’avantage d’accroître l’efficacité de la psychothérapie à distance. La dernière tendance en matière de psychothérapie, en particulier pendant et après l’épidémie de COVID, a lentement mis en évidence le besoin de nouvelles approches pouvant être utilisées même dans des situations où la présence physique d’un thérapeute ne peut être garantie. L’une de ces thérapies est la thérapie EMDR (Eye-Movement Desensitization and Reprocessing) [1], un traitement largement reconnu, principalement pour les patients souffrant du Trouble de stress post-traumatique (TSPT), qui nécessite strictement la présence physique et l’évaluation d’un thérapeute, en raison de certaines contraintes dans le protocole formalisé de la thérapie.

Dans le cadre de l’EMDR, le processus d' »exposition » diffère de la simple thérapie d’exposition. Dans la thérapie d’exposition traditionnelle, le patient est progressivement exposé aux stimuli redoutés ou traumatisants de manière contrôlée, ce qui lui permet d’affronter et de traiter les émotions associées. En revanche, l’EMDR incorpore une stimulation bilatérale, telle que des mouvements oculaires, pendant la phase d’exposition. Les mouvements oculaires de l’EMDR sont censés faciliter le traitement des souvenirs traumatiques. Francine Shapiro, conceptrice de l’EMDR, a proposé que la stimulation bilatérale aide à intégrer et à désensibiliser les souvenirs pénibles. Le mécanisme exact n’est pas entièrement compris, mais on suppose qu’il est lié aux capacités naturelles de traitement de l’information du cerveau.

Le protocole EMDR se déroule en huit phases : histoire du patient, préparation, évaluation, désensibilisation, installation, scanner corporel, clôture et réévaluation.

L’EMDR peut également être appliqué aux personnes présentant une détresse légère. Le protocole est adaptable et les étapes du traitement peuvent être modifiées pour répondre aux besoins des personnes présentant des symptômes plus légers. La flexibilité de l’EMDR permet aux thérapeutes d’adapter leur approche aux besoins spécifiques et au niveau de confort de chaque patient, garantissant ainsi un traitement efficace et personnalisé, même en cas de détresse légère. La littérature fait état de nombreux cas de thérapies EMDR appliquées avec succès à des patients présentant des symptômes légers [2,3,4]. Cependant, malgré la légèreté de la condition en question, le protocole thérapeutique EMDR est structuré de la même manière, ce qui nécessite les huit phases déjà présentées.

La phase de désensibilisation du protocole [5] est au cœur de l’EMDR. Elle implique que le patient se concentre sur un souvenir cible tout en s’engageant dans une stimulation bilatérale (telle que des mouvements oculaires) afin de réduire l’intensité émotionnelle associée à ce souvenir. Lorsqu’elle est réalisée par stimulation visuelle, la phase 4 nécessite de suivre attentivement le mouvement de la main du thérapeute. Actuellement, l’attention visuelle des patients doit être vérifiée manuellement par le thérapeute, une tâche qui peut être imprécise en raison de la fatigue causée par la longue durée du stimulus administré par le thérapeute. Grâce aux techniques les plus récentes d’apprentissage automatique et, en particulier, à la reconnaissance et au suivi du regard, nous pouvons détecter automatiquement l’engagement des sujets dans la tâche de désensibilisation dans l’environnement virtuel produit. Cela nous permet d’analyser l’adhésion du sujet aux mouvements prescrits, offrant au psychothérapeute la possibilité d’évaluer les réactions du patient telles qu’elles sont évaluées par l’algorithme.

Cette étude présente un travail préliminaire pour le développement d’un système informatique qui permettra la réalisation d’une méditation de pleine conscience auto-induite grâce à l’utilisation de techniques avancées et récentes d’apprentissage automatique. La tâche sera exécutée en administrant une stimulation visuelle bilatérale identique à celle utilisée pendant la phase de désensibilisation du protocole EMDR, prouvant ainsi la répétabilité de notre système pour une utilisation future de l’EMDR. Au lieu de nous concentrer sur le traitement des traumatismes, nous nous attacherons à mesurer et éventuellement à réduire les niveaux de stress des sujets concernés. Le système recueillera automatiquement les données concernant le patient, mesurera la distance entre le patient et l’écran et demandera au patient de se repositionner dans une position idéale, calibrera la caméra pour améliorer la qualité du suivi oculaire et, enfin, exécutera le protocole de pleine conscience en effectuant une stimulation visuelle bilatérale par le biais d’une barre lumineuse virtuelle s’exécutant sur l’écran. L’ensemble de la stimulation sera suivi par un algorithme de suivi oculaire basé sur la vision par ordinateur, qui générera une trajectoire pour le regard du sujet et la comparera à celle attendue, afin de déterminer si le patient exécute correctement la tâche.

Il est important de noter que cette étude souligne que le rôle du psychothérapeute n’est en aucun cas remplacé ou marginalisé. Au contraire, le thérapeute joue un rôle central en tant que facilitateur et guide tout au long des exercices virtuels. La plateforme virtuelle sert d’outil d’orientation et de supervision constantes par le thérapeute, garantissant une expérience thérapeutique personnalisée et de soutien. Cette approche collaborative tire parti de la synergie entre la technologie et l’expertise humaine, améliorant ainsi l’efficacité globale des séances de psychothérapie virtuelle. La plateforme de thérapie virtuelle privilégie le confort de l’utilisateur, permettant aux patients d’interrompre les exercices ou les séances à tout moment s’ils ressentent une gêne ou une détresse. En outre, les patients ont la possibilité de passer à un mode où ils peuvent voir le thérapeute et interagir avec lui directement, comme dans un appel vidéo normal, ce qui favorise un sentiment de familiarité et de confort. Évidemment, dans ce dernier cas, il serait possible de tirer parti du soutien technologique offert par notre système. Cette flexibilité nous permet d’adapter l’expérience thérapeutique aux besoins des patients.

Plusieurs travaux sont disponibles dans la littérature concernant les interfaces virtuelles pour la psychothérapie, en particulier dans le contexte de l’utilisation de l’apprentissage automatique pour leur mise en œuvre. Les applications et les techniques spécifiques sont incroyablement vastes, plusieurs applications étant destinées au diagnostic, au dépistage et au soutien de la maladie d’Alzheimer et, en général, des troubles cognitifs. Ces travaux portent principalement sur les tâches visuelles, auditives et motrices, avec un accent particulier sur la partie mnémonique, à la fois avec des méthodes plus simples, telles que les arbres de décision [6], et avec des méthodes plus avancées, telles que les CNN et les GAN [7]. L’un des plus importants utilise les CNN et l’apprentissage par transfert pour identifier la maladie d’Alzheimer grâce à des tâches de mémoire visuelle qui nécessitent l’analyse d’un ensemble d’images séquentielles présentant de légères différences entre elles [8]. Cependant, peu de travaux, voire aucun, s’attaquent au problème des interfaces virtuelles spécifiquement pour les SBA visuelles avec des applications à l’EMDR et au protocole de pleine conscience. D’autres approches disponibles pour l’EMDR à distance existent sous la forme de barres lumineuses individuelles ou de kits contenant des barres lumineuses, des écouteurs et des stimulateurs tactiles, mais elles présentent plusieurs inconvénients :

  • Ils nécessitent souvent l’installation de logiciels spécifiques et ne sont pas intégrés dans le matériel mis à la disposition des utilisateurs ; 
  • Ils peuvent être contre-intuitifs pour certains utilisateurs, nécessitant de longs manuels d’instruction et un grand nombre de câbles pour fonctionner ;
  • Ils ont un coût élevé et ne sont donc pas accessibles à tous les utilisateurs ;
  • Les barres lumineuses et les kits EMDR sont souvent expédiés à partir d’un nombre limité de pays (par exemple, les États-Unis), ce qui les rend difficilement accessibles dans le monde entier.

Outre le matériel physique, plusieurs applications, commerciales et non commerciales, existent également en ligne pour effectuer l’EMDR à distance à l’aide d’une barre lumineuse virtuelle sous la forme d’un point mobile. Cependant, toutes les approches disponibles ne fournissent qu’une interface visuelle, ce qui oblige le thérapeute à vérifier manuellement l’exécution de la tâche par le patient lors d’un appel vidéo. En raison des infrastructures actuellement disponibles, la transmission des données n’est pas totalement en temps réel, et les retards dans la transmission de la vidéo du patient peuvent réduire l’efficacité des traitements, en raison du ralentissement de la réponse du thérapeute aux distractions du sujet. Notre instrument, en revanche, est non seulement en temps réel et intégré au matériel déjà possédé par les sujets, avec la possibilité d’exécuter l’application sur n’importe quel appareil doté d’un écran et d’une caméra, mais il sera également actionné à l’aide de l’apprentissage automatique. Cela permet de pallier les éventuels retards dans la transmission des données vidéo au thérapeute en vérifiant l’adhésion du patient aux mouvements prescrits directement du côté du client, le thérapeute effectuant une validation des distractions enregistrées automatiquement. Dans notre travail, nous avons utilisé trois techniques différentes d’apprentissage automatique qui ont été combinées pour créer une architecture fluide : la détection de la distance, l’étalonnage de la caméra et le suivi des yeux. Elles ont fourni une infrastructure solide par rapport à celles déjà disponibles, capable de simuler une barre lumineuse virtuelle et de vérifier conjointement l’adhésion du sujet à la stimulation.

En ce qui concerne la détection des distances, de nombreuses approches disponibles dans la littérature s’appuient simplement sur des mesures matérielles, mais de nombreux travaux, en particulier en ce qui concerne la détection des visages, préfèrent des métriques basées sur les caractéristiques faciales. Les principales caractéristiques utilisées concernent les yeux – par exemple, les mesures de la distance entre les coins des yeux [9] ou entre les pupilles [10]. Les yeux ne sont cependant pas la seule caractéristique utilisable, une autre option populaire étant la mesure de la distance entre les points de repère du visage, tels que le nez et la bouche [11]. En raison de l’absence de reproductibilité d’une telle approche, il existe d’autres mesures qui ne reposent pas sur les caractéristiques faciales, comme la mesure de la distance d’un objet de dimension connue sur la scène. Un excellent exemple d’utilisation qui peut également contourner le problème de la dimension standardisée est Dist-YOLO, une modification de YOLOv3 [12] qui ajoute au réseau la possibilité de mesurer la distance des objets délimités [13]. Enfin, une autre option récente utilise des données de nuages de points pour estimer la distance [14], créant une représentation Bird’s Eye View (BEV) qui est utilisée comme entrée d’un réseau YOLOv4 standard [15].

Pour réaliser l’étalonnage de la caméra, la technique la plus répandue dans la littérature est l’utilisation de points positionnés à des endroits stratégiques de l’écran, appelés points d’observation, dont la configuration dépend du type d’application [16]. Les schémas les plus courants sont l’étalonnage en trois points, généralement utilisé pour la lecture de textes sur une seule ligne, l’étalonnage en cinq points et l’étalonnage en neuf points, principalement utilisés pour les applications à large vision, l’étalonnage en cinq points étant un étalonnage simplifié en neuf points et, enfin, l’étalonnage en treize points, principalement utilisé pour la lecture de paragraphes.

En ce qui concerne le suivi des yeux, enfin, nous disposons déjà d’une grande variété d’approches dans la littérature. Le suivi oculaire peut être abordé non seulement avec l’apprentissage automatique, mais aussi avec l’internet des objets et l’informatique en nuage (cloud computing) [17]. Alors que l’internet des objets et l’informatique en nuage se concentrent principalement sur l’amélioration de la fiabilité du système et de la vitesse de calcul, l’apprentissage automatique offre plusieurs approches flexibles. La régression symbolique, en particulier, donne d’excellents résultats dans l’amélioration de la phase d’étalonnage [18]. De meilleures approches sont disponibles sous la forme de réseaux neuronaux, tels que les réseaux neuronaux convolutifs (CNN) et les réseaux neuronaux profonds (DNN), mais elles nécessitent une grande quantité de données qui ne sont pas facilement disponibles. Parmi eux, de nombreux CNN profonds préexistants fonctionnent de manière optimale pour les tâches de vision et de perception. Parmi les possibilités, citons VGGNet [19], qui a également été comparé à AlexNet pour vérifier leur précision lors de l’ajustement [20] ; ResNet [21] ; U-Net [22], qui est généralement combiné à DenseNet et obtient des résultats similaires à SegNet [23] ; et, enfin, Graph Convolutional Networks (GCN) [24], une approche relativement nouvelle qui associe les CNN classiques aux Graph Neural Networks (GNN), avec l’avantage de pouvoir fusionner naturellement différents groupes de caractéristiques, afin d’obtenir une formation plus stable.

Outre les approches CNN standard, une approche relativement nouvelle du suivi des yeux est l’utilisation de réseaux neuronaux récurrents (RNN) [25], qui améliorent les prédictions en analysant les images précédentes de la vidéo capturée, afin d’effectuer une analyse contextuelle, en particulier dans une approche mixte (CNN + RNN). Enfin, les réseaux adversoriels génératifs (GAN) ont également donné de bons résultats, le CycleGAN étant particulièrement efficace pour le suivi des yeux, car il résout le problème de précision des GAN standard en introduisant un double traitement de l’image, ce qui permet de suivre l’évolution de la précision [26].

Les approches susmentionnées peuvent également être étendues au suivi du regard, une sous-classe du problème du suivi des yeux, qui estime avec précision la position de la pupille et la direction du regard, ce qui permet d’identifier le point de l’écran sur lequel les personnes concentrent leur attention [27]. Il existe plusieurs méthodes de suivi et d’estimation du regard [28], que l’on peut classer en méthodes basées sur la cartographie 2D, méthodes basées sur un modèle 3D et méthodes basées sur l’apparence. Les approches visuelles standard sont également fonctionnelles en tant que solution au problème du suivi du regard, l’accent étant mis sur le prétraitement et l’analyse des images, et plusieurs articles ont abordé le problème avec des approches visuelles.

Ce travail avait deux objectifs principaux. Premièrement, nous voulions vérifier l’efficacité de notre algorithme d’eye-tracking dans la reconstruction d’une trajectoire générée par des mouvements oculaires rapides en suivant une cible en mouvement et en captant les distractions des sujets. Deuxièmement, après avoir vérifié la qualité de l’approche, nous voulions valider notre thèse selon laquelle une approche virtuelle peut être comparable à une approche en présence et est plus performante que d’autres méthodes de relaxation, telles que la respiration diaphragmatique ou une tâche de distraction, telle que le remplissage d’un questionnaire. Notre travail a confirmé que l’approche virtuelle est très efficace pour réduire les niveaux de stress des sujets sélectionnés pour cette étude, par rapport à notre groupe de contrôle et aux sujets qui respirent de manière diaphragmatique. De plus, notre algorithme, lorsqu’il est utilisé dans des conditions environnementales correctes, est capable de discerner correctement le nombre de distractions des patients. Cela rend notre approche appropriée pour être testée sur la thérapie EMDR, étant donné la similitude des tâches entre la phase de désensibilisation du protocole et la méditation de pleine conscience, avec la possibilité d’approfondir le travail, pour générer une interface entièrement virtuelle pour l’ensemble du protocole EMDR.

Cette étude s’est également intéressée aux contraintes, obstacles et problèmes éthiques potentiels liés à l’utilisation d’interfaces virtuelles en psychothérapie. Dans la section des résultats, nous donnons un aperçu détaillé des mesures prises pour garantir le respect des normes éthiques et résoudre les problèmes potentiels. En outre, la section discussion comprend une exploration approfondie des limites et des défis rencontrés au cours de l’étude. Nous reconnaissons l’importance des considérations éthiques dans la thérapie virtuelle et proposons des remèdes et des stratégies pour atténuer ces préoccupations. Notre objectif est de contribuer au dialogue en cours sur les pratiques éthiques dans la psychothérapie virtuelle et d’offrir des perspectives pour la recherche future dans ce domaine.

L’article est structuré comme suit : La section 2 analysera le développement de l’application, en mettant l’accent sur l’extraction des données et le choix des algorithmes pour la détection de la distance, l’étalonnage et le suivi des yeux. La section 3 présentera brièvement notre environnement de test et nos sujets, ainsi que les résultats obtenus. La section 4 se concentre sur l’analyse et la comparaison des données obtenues, avec une mention des orientations futures de ce travail. Enfin, la section 5 présente les conclusions de cette étude.

En savoir plus 

Références de l’article :

  • auteurs : Fiani, F., Russo, S., et Napoli, C.
  • titre en anglais : An Advanced Solution Based on Machine Learning for Remote EMDR Therapy
  • publié dans : Technologies, 11(6), 172
  • doi : https://doi.org/10.3390/technologies11060172

Aller plus loin 

Formation(s) : Travailler à distance en thérapie EMDR

Dossier(s) : Dossier EMDR en ligne

M’inscrire Vous avez une question ?