Depuis le début de l'aventure Lifen, nous avons toujours été convaincus que l'Intelligence Artificielle représente un moyen d’améliorer la qualité des soins et de simplifier la vie quotidienne des professionnels de santé en les déchargeant des tâches fastidieuses et à faible valeur ajoutée, telles que la double-saisie.
Lifen Intégration permet d’intégrer les documents médicaux en quelques clics dans le DPI : une fois importés, les documents sont analysés par l’IA afin de réduire au minimum les entrées manuelles et les erreurs. L’objectif est donc de faciliter le travail des équipes.
Jusqu'à présent, notre intelligence artificielle a permis l’analyse de 75 millions de documents. Elle a été formée et continue de s’améliorer en permanence sur la base de ces documents analysés quotidiennement.
Comment notre Intelligence Artificielle se met-elle au service de l’intégration de documents médicaux ?
Nous avons interviewé Bettina Sarafis, Machine Learning Engineer chez Lifen, pour comprendre comment Lifen Intégration est au service de l’intégration de documents et permet ainsi de libérer du temps pour les équipes médicales.
Comment fonctionne l’Intelligence Artificielle chez Lifen ?
L'intelligence artificielle (IA) est le concept qui permet à une machine ou à un système de détecter, de raisonner, d'agir ou de s'adapter comme un humain.
Le machine learning (ML) est une application de l’Intelligence Artificielle : grâce au ML, le système apprend et s’améliore de manière itérative. Le machine learning utilise des algorithmes pour analyser une quantité conséquente de données, les apprendre et ainsi prendre des décisions adaptées en toute autonomie. Plus le système est entrainé (et donc le plus de données est utilisées), plus il est performant.
L'objectif du machine learning est d'apprendre à une machine à exécuter une tâche spécifique et à fournir des résultats précis en identifiant des modèles.
[Source]
Comment l’IA de Lifen est-elle entrainée ?
Notre Intelligence Artificielle est entrainée selon une boucle qu’on peut diviser en 3 parties :
1ère partie : Inférence AI
L'IA détecte les documents entrants téléchargés par les utilisateurs sur l’application Lifen. Les utilisateurs peuvent mettre à jour la détection. Dès lors qu’un document est importé dans Lifen Intégration par un utilisateur, notre intelligence artificielle est appelée afin de prédire dans le document les informations nécessaires à son intégration (qui est le patient ? quel est la date de séjour ? quel est le type du document ?).À chacune de ces informations prédites - qui est le patient ? par exemple - est associé un niveau de confiance - à quel point je suis sure que cette information prédite est vraie ?En fonction de ce niveau de confiance, l’intégration sera possiblement automatique. Sinon l’utilisateur va devra valider ou modifier certaines des informations pré-remplies, correspondants aux prédictions de notre IA. Ensuite, les utilisateurs valident les métadonnées des documents pour déclencher des flux de travail en aval, tels que les intégrations dans le DPI.
2ème partie : Étiquetage
Notre intelligence artificielle est entraînée sur un dataset de documents le plus représentatif de la donnée réelle. Ce dataset de documents est construit à la main par notre équipe d’ingénieurs en Machine Learning. Cet étape s’appelle l’”étiquetage”. On associe à chaque document du dataset une étiquette avec la vérité : qui est le patient, quel le type de document etc.
Grâce aux modifications des utilisateurs, on sait sur quels documents notre intelligence artificielle fait défaut et donc sur quels documents il faut se baser pour l’améliorer. Cela permet aux ingénieurs en Machine Learning de choisir les documents pertinents pour valider manuellement les nouvelles étiquettes à ajouter à l'ensemble de données d'apprentissage.
Au fur et à mesure que les utilisateurs valident ou modifient les métadonnées des documents (informations pré-remplies correspondants aux prédictions de notre IA), les identifiants des documents sont stockés avec des informations sur les validations des utilisateurs (par exemple, le type de document détecté par l'IA était correct, mais le prénom du patient est erroné). Cela permet aux ingénieurs en Machine Learning de choisir les documents pertinents pour valider manuellement les nouvelles étiquettes à ajouter à l'ensemble de données d'apprentissage. Afin de valider la vérité terrain pour les modèles (détection de code-barres, type de document) sur lesquels s'entraîner, les équipes n’ont accès qu’au texte pseudonymisé et/ou image flou qu’ils examinent.
3ème partie : Entraînement de l'IA
Au fur et à mesure que de nouveaux documents étiquetés sont ajoutés au dataset d'entraînement, de nouveaux modèles peuvent être entraînés et évalués. Celle-ci doit apprendre de nouvelles expressions et patterns et ne pas désapprendre les anciens). Cette nouvelle IA peut ensuite être intégrée dans l’application pour remplacer le modèle utilisé pour l’'inférence (la première partie).
La boucle est bouclée.
les candidats modèles les plus pertinents (modèles qui ont appris de nouvelles expressions et n'ont pas désappris les anciennes) sont ensuite intégrés dans l'IA d'inférence pour boucler la boucle.
Les modèles utilisés chez Lifen
Le principe de notre Intelligence Artificielle est de de détecter dans le document, les informations nécessaires à l'intégration de celui-ci de manière automatique.
Nos modèles ont une architecture qu’on peux découper en 2 étapes :
Ces artefacts appartiennent à deux catégories principales :
Étape 1 - Représentation des mots de manière significative
On veut représenter les mots en fonction de leur signification. Avec cette représentation, paracétamol et Doliprane ont une représentation vectorielle proche, tandis que chaussure et patient vont avoir une représentation plus éloignée. Cette première étape est commune à tous nos algorithmes (on utilise le même modèle, modèle de type Language model) et permet au modèle de s’adapter à un grand nombre de templates de documents sans jamais les avoir vu.
Étape 2 - Apprentissage d’une tâche
On apprend à notre IA à réaliser une tâche bien précise comme extraire le patient ou la date de séjour. On a un modèle par tâche.
La boucle d’entraînement de notre IA permet de produire des artefacts (également appelés modèles) à partir des données brutes et, le cas échéant, des étiquettes de vérité terrain.