Extraction du graphe des résultats d'un article scientifique (Valda, Pierre Senellart) — sujet déjà choisi

Le but de ce projet est d'utiliser des techniques d'extraction d'information pour automatiquement extraire d'un article scientifique (informatique théorique, mathématiques, physique théorique) au format PDF la liste des résultats (théorèmes, lemmes, propositions) qui y sont contenus, leurs preuves, et le graphe de dépendances des résultats utilisés dans la preuve d'autres résultats. En fonction de l'avancée du projet, on pourra essayer d'étendre les résultats initiaux en suivant l'une des pistes suivantes :

  • validant les résultats sur des fichiers PDF automatiquement compilés à partir d'un source LaTeX connu, et donc automatiquement annotés
  • entraînant un extracteur (par exemple, champ aléatoire conditionnel) à partir d'un corpus annoté
  • construisant un graphe de dépendances inter-papiers
  • modélisant la provenance et l'incertitude des informations extraites
  • construisant des graphes de dépendance inter-papiers

Contact : Pierre Senellart

Last modified: Thursday, 27 September 2018, 12:05 AM