L’extraction automatique d’informations grâce aux techniques de NLP

1- Le pipeline général du processus d’extraction d’informations à partir d’un document non structuré

2- Quelques techniques d’extraction automatique d’information :

Étiquetage morpho-syntaxique (Part-of-speech tagging)

Cette technique consiste à associer aux mots d’un texte les informations grammaticales correspondantes, comme la catégorie grammaticale (nom propre, verbe, adjectif…), le genre et le nombre à l’aide d’un outil informatique (analyseur morpho-syntaxique) comme spaCy, NLTK et BERT etc.

Reconnaissance des entités nommées (Named Entity Recognition)

La reconnaissance d’entités nommées (NER) est une sous-tâche de l’extraction d’informations qui vise à localiser et à classer les entités nommées mentionnées dans un texte non structuré dans des catégories prédéfinies telles que des noms de personnes, des organisations, des lieux, etc.

La modélisation thématique (Topic Modelling)

La modélisation thématique est une technique de traitement du langage naturel non supervisée qui utilise des modèles statistiques pour étiqueter et regrouper des groupes de textes qui partagent des sujets communs.

  • pour la recherche pharmaceutique (découverte de médicaments, d’effets indésirables et analyse automatisée d’essais cliniques).

--

--

AmIA Solutions est une start-up nantaise qui apporte de l’innovation aux services de sinistres des assurances. Contactez-nous pour en savoir plus !

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
AmIA Solutions

AmIA Solutions

1 Follower

AmIA Solutions est une start-up nantaise qui apporte de l’innovation aux services de sinistres des assurances. Contactez-nous pour en savoir plus !