L’intelligence Artificielle au service de la structuration de la donnée de santé

Depuis le début de l'aventure Lifen, nous avons toujours été convaincus que l'Intelligence Artificielle représente un moyen d’améliorer la qualité des soins et de simplifier la vie quotidienne des professionnels de santé en les déchargeant des tâches fastidieuses et à faible valeur ajoutée, telles que la double-saisie.

Lifen Intégration permet d’intégrer les documents médicaux en quelques clics dans le DPI : une fois importés, les documents sont analysés par l’IA afin de réduire au minimum les entrées manuelles et les erreurs. L’objectif est donc de faciliter le travail des équipes.

Jusqu'à présent, notre intelligence artificielle a permis l’analyse de 75 millions de documents. Elle a été formée et continue de s’améliorer en permanence sur la base de ces documents analysés quotidiennement.

Comment notre Intelligence Artificielle se met-elle au service de l’intégration de documents médicaux ?

Nous avons interviewé Bettina Sarafis, Machine Learning Engineer chez Lifen, pour comprendre comment Lifen Intégration est au service de l’intégration de documents et permet ainsi de libérer du temps pour les équipes médicales.

‍

Comment fonctionne l’Intelligence Artificielle chez Lifen ?

L'intelligence artificielle (IA) est le concept qui permet à une machine ou à un système de détecter, de raisonner, d'agir ou de s'adapter comme un humain.

Le machine learning (ML) est une application de l’Intelligence Artificielle : grâce au ML, le système apprend et s’améliore de manière itérative. Le machine learning utilise des algorithmes pour analyser une quantité conséquente de données, les apprendre et ainsi prendre des décisions adaptées en toute autonomie. Plus le système est entrainé (et donc le plus de données est utilisées), plus il est performant.

L'objectif du machine learning est d'apprendre à une machine à exécuter une tâche spécifique et à fournir des résultats précis en identifiant des modèles.

[Source]

‍

Comment l’IA de Lifen est-elle entrainée ?

Notre Intelligence Artificielle est entrainée selon une boucle qu’on peut diviser en 3 parties :

1ère partie : Inférence AI

L'IA détecte les documents entrants téléchargés par les utilisateurs sur l’application Lifen. Les utilisateurs peuvent mettre à jour la détection. Dès lors qu’un document est importé dans Lifen Intégration par un utilisateur, notre intelligence artificielle est appelée afin de prédire dans le document les informations nécessaires à son intégration (qui est le patient ? quel est la date de séjour ? quel est le type du document ?).À chacune de ces informations prédites - qui est le patient ? par exemple - est associé un niveau de confiance - à quel point je suis sure que cette information prédite est vraie ?En fonction de ce niveau de confiance, l’intégration sera possiblement automatique. Sinon l’utilisateur va devra valider ou modifier certaines des informations pré-remplies, correspondants aux prédictions de notre IA. Ensuite, les utilisateurs valident les métadonnées des documents pour déclencher des flux de travail en aval, tels que les intégrations dans le DPI.

2ème partie : Étiquetage

Notre intelligence artificielle est entraînée sur un dataset de documents le plus représentatif de la donnée réelle. Ce dataset de documents est construit à la main par notre équipe d’ingénieurs en Machine Learning. Cet étape s’appelle l’”étiquetage”. On associe à chaque document du dataset une étiquette avec la vérité : qui est le patient, quel le type de document etc.

Grâce aux modifications des utilisateurs, on sait sur quels documents notre intelligence artificielle fait défaut et donc sur quels documents il faut se baser pour l’améliorer. Cela permet aux ingénieurs en Machine Learning de choisir les documents pertinents pour valider manuellement les nouvelles étiquettes à ajouter à l'ensemble de données d'apprentissage.

Au fur et à mesure que les utilisateurs valident ou modifient les métadonnées des documents (informations pré-remplies correspondants aux prédictions de notre IA), les identifiants des documents sont stockés avec des informations sur les validations des utilisateurs (par exemple, le type de document détecté par l'IA était correct, mais le prénom du patient est erroné). Cela permet aux ingénieurs en Machine Learning de choisir les documents pertinents pour valider manuellement les nouvelles étiquettes à ajouter à l'ensemble de données d'apprentissage. Afin de valider la vérité terrain pour les modèles (détection de code-barres, type de document) sur lesquels s'entraîner, les équipes n’ont accès qu’au texte pseudonymisé et/ou image flou qu’ils examinent.

3ème partie : Entraînement de l'IA

Au fur et à mesure que de nouveaux documents étiquetés sont ajoutés au dataset d'entraînement, de nouveaux modèles peuvent être entraînés et évalués. Celle-ci doit apprendre de nouvelles expressions et patterns et ne pas désapprendre les anciens). Cette nouvelle IA peut ensuite être intégrée dans l’application pour remplacer le modèle utilisé pour l’'inférence (la première partie).

La boucle est bouclée.

les candidats modèles les plus pertinents (modèles qui ont appris de nouvelles expressions et n'ont pas désappris les anciennes) sont ensuite intégrés dans l'IA d'inférence pour boucler la boucle.

‍

‍

Les modèles utilisés chez Lifen

Le principe de notre Intelligence Artificielle est de de détecter dans le document, les informations nécessaires à l'intégration de celui-ci de manière automatique.

Nos modèles ont une architecture qu’on peux découper en 2 étapes :

Ces artefacts appartiennent à deux catégories principales :

Étape 1 - Représentation des mots de manière significative

‍On veut représenter les mots en fonction de leur signification. Avec cette représentation, paracétamol et Doliprane ont une représentation vectorielle proche, tandis que chaussure et patient vont avoir une représentation plus éloignée. Cette première étape est commune à tous nos algorithmes (on utilise le même modèle, modèle de type Language model) et permet au modèle de s’adapter à un grand nombre de templates de documents sans jamais les avoir vu.

Étape 2 - Apprentissage d’une tâche

‍On apprend à notre IA à réaliser une tâche bien précise comme extraire le patient ou la date de séjour. On a un modèle par tâche.

La boucle d’entraînement de notre IA permet de produire des artefacts (également appelés modèles) à partir des données brutes et, le cas échéant, des étiquettes de vérité terrain.

*Visualisation : algorithme de prédiction du sexe/genre du patient*

‍

Quelle sont les applications concrètes de l’IA chez Lifen ?

Communication médicale : Envoi automatisé de documents médicaux

Depuis le logiciel métier, les professionnels de santé peuvent envoyer des documents à leurs correspondants sur tous les canaux (MSSanté, Apicrypt, postal, boîte mail classique).

Notre Intelligence Artificielle détecte automatiquement les destinataires et les praticiens peuvent préciser dans notre annuaire, le plus à jour de France, leur préférence de réception et automatise l'envoi.

Intégration de documents : L'IA au service de l'intégration de documents

Notre IA permet de rationaliser et automatiser massivement l'envoi de documents médicaux.

Grâce à l’Intelligence Artificielle, les équipes peuvent automatiser l'intégration via l'extraction automatique d’informations des documents apportés par les patients (documents scannés), les documents en pièces joints des mails MSSanté reçus, les documents numériques internes à l’établissement.

Tous les documents de toute source sont centralisés au sein de Lifen puis intégrés au sein du DPI.

‍

Quelles informations détecte-t-on ?

Quelles sont les informations demandées ?

Nous utilisons une seule et même Intelligence Artificielle pour nos produits. Cependant, en fonction de la solution utilisée (Lifen Documents ou Lifen Intégration), ce ne sont pas les mêmes informations qui sont extraites.

Lorsque Lifen Intégration est utilisée, plusieurs informations sont demandées : identité du patient, date de séjour, type de documents médicaux. Notre IA va scanner le document. En fonction du contexte du documents et des zones de texte, elle va détecter qui est le patient, quels sont les destinataires, quelle est la date du séjour.

L’identité du patient est détectée sur la base du Nom Prénom, Prénom, Date de naissance. Ces informations seront ensuite rapprochée avec les identités présentes dans la GAM / GAP de l’établissement (garantissant la bonne identification du patient).

‍

Lors de la détection du type de document : une quinzaine sont détectables par notre Intelligence Artificielle. Nous basons les types de documents sur la base LOINC , qui est la référence pour les types de documents médicaux. Les principaux types de documents qu’on retrouve sont : les compte-rendus d'opérations, lettre de liaison, prescription, compte-rendu d'examen de bio, etc.

Qu’est ce que la base LOINC ?

LOINC est un langage commun (un ensemble d'identifiants, de noms et de codes) permettant d'identifier les mesures, les observations et les documents relatifs à la santé. LOINC est un riche catalogue de mesures, notamment des tests de laboratoire, des mesures cliniques telles que les signes vitaux et les mesures anthropométriques, des instruments d'enquête normalisés, etc. La base contient également des codes pour les collections de ces éléments, tels que les panels, les formulaires et les documents.

Elle permet l'échange et l'agrégation de résultats cliniques pour la prestation de soins, la gestion des résultats et la recherche, en fournissant un ensemble de codes universels et de noms structurés pour identifier sans ambiguïté les éléments que l'on peut mesurer ou observer.

Source

‍

Quels gains tangibles pour les utilisateurs ?

Sur la base des métadonnées détectées par l'IA, nous allons pouvoir intégrer le document dans le DPI au bon endroit pour le bon patient, à la bonne date et et avec le bon type de document.

Sur les 12 derniers mois, notre Intelligence Artificielle a analysé 23,5 millions documents uniques. 88% de ces documents sont prêts à l’envoi et nous avons 98,8% de taux de détection patient.

En utilisant notre application, il y a donc à la fois le gain de temps pour l'utilisateur, mais aussi un gain de sécurité face aux erreurs humaines.

‍

L’assurance de gagner du temps pour les équipes

Dans 91% des cas, l’IA va détecter toutes les informations. L’utilisateur n’aura rien à faire et le gain de temps est alors important.

Dans les 9% restants, l’utilisateur devra vérifier les informations pré-remplies par l’IA dans le document ou les remplir lui-même.

Par exemple, l’utilisateur devra :

valider / vérifier l’adresse du destinataire car celle-ci n’a pas été retrouvée dans l’annuaire des praticiens, notre annuaire (Annuaire MSSanté et l’Annuaire de Santé national) se compose de 100 % des professionnels de santé avec leur préférence de réception, et nous le mettons à jour quotidiennement.
vérifier l’identité du patient car la distinction Nom / Prénom n’est pas claire,
remplir l’identité du patient car 2 patients sont mentionnés dans le document,
ou encore la validation de l’adresse détectée car celle-ci n’est pas conforme aux normes,
l’utilisateur peut aussi être amener à vérifier ou compléter les traits d’identité du patient car il ne correspond à aucun des patients de la GAM de l’établissement.

Dans tous les cas, la majeure partie du travail aura déjà été faite.

‍

Éliminez les erreurs humaines

Un second bénéfice a pu être constaté sur la réduction du nombre d’erreurs.

Les secrétariats et médecins intègrent quotidiennement des dizaines de documents et doivent donc remplir manuellement des centaines de champs. Des erreurs peuvent alors s’immiscer dans les informations remplies.

Utiliser une IA avec ce niveau de confiance et avec les vérifications qui sont demandées aux utilisateurs, permet de générer beaucoup moins d'erreurs humaines. En effet, notre application est branchée à la GAM de l'établissement. Donc lorsqu'on détecte un patient, il faut que ce patient existe dans la GAM sur la base de plusieurs traits d'identification : et par conséquent nos règles métier permettent donc de sécuriser l'intégration des documents au bon endroit.

Structurer la donnée de santé et la rendre accessible pour un DPI qualitatif

In fine, que les champs soient complétés automatiquement grâce à l’IA ou manuellement par les personnes en charge de l’intégration des documents dans le DPI, Lifen Intégration permet aux professionnels de santé de bénéficier d’une meilleure lisibilité des dossiers patients, et donc globalement, à l’établissement de disposer d’un DPI plus qualitatif.

‍

Conclusion

En résumé, grâce à Lifen Intégration, les documents médicaux sont intégrés en quelques clics dans le DPI : une fois importés, les documents sont analysés par l’IA pour en extraire les informations clés, dont l’identité patient, qui est matchée avec les identités présentes dans la GAM / GAP de l’établissement.

Lorsque les informations sont validées, les documents sont intégrés dans le DPI. Le processus est totalement automatisé et les interventions humaines limitées au strict minimum.

Lifen Intégration permet ainsi aux secrétaires de gagner du temps en matière d’intégration de documents dans le DPI tout en fiabilisant les informations reportées dans les dossiers patients.

Communication Médicale

L’intelligence Artificielle au service de la structuration de la donnée de santé

Temps de lecture :

6

minutes

Comment fonctionne l’Intelligence Artificielle chez Lifen ?

Comment l’IA de Lifen est-elle entrainée ?

1ère partie : Inférence AI

2ème partie : Étiquetage

3ème partie : Entraînement de l'IA

Les modèles utilisés chez Lifen

Étape 1 - Représentation des mots de manière significative

Étape 2 - Apprentissage d’une tâche

Quelle sont les applications concrètes de l’IA chez Lifen ?

Communication médicale : Envoi automatisé de documents médicaux

Intégration de documents : L'IA au service de l'intégration de documents

Quelles informations détecte-t-on ?

Quelles sont les informations demandées ?

Qu’est ce que la base LOINC ?

Quels gains tangibles pour les utilisateurs ?

L’assurance de gagner du temps pour les équipes

Éliminez les erreurs humaines

Structurer la donnée de santé et la rendre accessible pour un DPI qualitatif

Conclusion

Jeanne Lapierre

Découvrez nos autres articles

Nous serons à Santexpo !

Mobiliser la donnée de santé à des fins de qualité : Lifen et Maincare (La Poste Santé & Autonomie et filiale de Docaposte) annoncent un partenariat pour accompagner les établissements de santé dans la réalisation des audits qualité

Les premiers résultats du partenariat entre Lifen et Gustave Roussy démontrent la force de l’IA dans la structuration de données pour la recherche clinique : plus de 1 000 parcours patients structurés en moins de trois mois

Essayez Lifen dès maintenant

Inscription

Installation

Votre compte est validé