Méthode de construction d’entrepôts de données temporalisées guidée par les ontologies

Introduction

Un grand nombre de systèmes de santé requiert la sauvegarde, la manipulation et la collecte de données temporalisées [Mate et al. 2015]. D’une part, vu l’hétérogénéité et le grand nombre de sources de données, les méthodes classiques de construction d’entrepôt de données sont difficiles, voire impossibles, à mettre en place, car elles sont fondées sur de vagues règles de pratique non automatisables [Khnaisser et al. 2015]. D’autre part, la modélisation du temps est un sujet d’intérêt pour plusieurs domaines de recherche. Les recherches sur la représentation et le raisonnement temporel en médecine ont commencé vers la fin des années 1980 [Adlassnig et al. 2006]. Les problématiques de représentation des informations temporelles ont été abordées de deux points de vue : un point de vue relationnel, de manière à pouvoir représenter, stocker et faire évoluer les données en garantissant leur intégrité et un point ontologique, de manière à pouvoir représenter et raisonner sur des données [Tao et al. 2010]. La définition d’une nouvelle méthode de construction guidée par un modèle de connaissances (ontologie) en respectant les contraintes découlant de son intégration à un système informationnel est un moyen de modélisation mieux adapté dans ce genre de situation

Objectif

Il s’agit (a1) de proposer un modèle ontologique temporel qui permettra l’arrimage optimal entre l’approche relationnelle et l’approche ontologique réaliste (a2) de s’assurer que le modèle ontologique temporel proposé permette l’annotation temporelle des concepts médicaux de telle façon qu’un raisonnement temporel adapté aux grands volumes de données médicales puisse être automatisé efficacement, (b) de proposer une méthode et un atelier de construction d’entrepôts de données temporalisées à partir d’ontologies de références (c) de prouver l’efficacité de la méthode en l’appliquant à un cas réel dans le domaine de la santé.

Méthode

Le projet consiste à effectuer les étapes suivantes :

  1. étendre le modèle relationnel temporel et l’algorithme de temporalisation définis dans par l’ajout du traitement de l’indétermination,
  2. vérifier (et valider) la complétude du modèle temporel en des méthodes d’annotations temporelles et des modèles de raisonnement existants,
  3. développer un modèle ontologique du temps en tenant en compte des algorithmes d’inférences des modèles de raisonnement,
  4. intégrer le modèle ontologique du temps développer en (3) dans une ontologie du domaine,
  5. développer l’algorithme de traduction de l’ontologie (4) à un schéma de l’entrepôt de données temporalisées,
  6. définir un modèle de mise en correspondance (mapping) entre les sources et l’ED et un modèle de mise en correspondance entre l’ontologie et l’ED pour permettre l’alimentation en données et leur exploitation subséquente à partir du modèle de connaissances en assurant la traçabilité des transformations,
  7. choisir un cas réel pour prouver l’efficacité de la méthode. Le cas réel doit permettre de valider la complétude du modèle ontologique, du modèle relationnel et du modèle de mise en correspondance.

Les étapes sont intégrées dans un atelier composé de plusieurs modules coordonnés par différents correspondeurs spécialisés pour assurer une construction semi-automatisée sur la base des modèles approuvés par les analystes (ontologie de référence) et en recourant le moins souvent possible à des décisions ad hoc.

Références

Adlassnig, K.-P., Combi, C., Das, A.K., Keravnou, E.T., and Pozzi, G. 2006. Temporal representation and reasoning in medicine: Research directions and challenges. Artificial Intelligence in Medicine 38, 101–113. http://dx.doi.org/10.1016/j.artmed.2006.10.001.
Khnaisser, C., Lavoie, L., Diab, H., and Ethier, J.-F. 2015. Data Warehouse Design Methods Review: Trends, Challenges and Future Directions for the Healthcare Domain. Communications in Computer and Information Science, 76–87. http://dx.doi.org/10.1007/978-3-319-23201-0_10.
Mate, S., Köpcke, F., Toddenroth, D., et al. 2015. Ontology-Based Data Integration between Clinical and Research Systems. PLOS ONE 10, e0116656. http://dx.doi.org/10.1371/journal.pone.0116656.
Tao, C., Wei, W., Solbrig, H., Savova, G., and Chute, C. 2010. CNTRO: A Semantic Web Ontology for Temporal Relation Inferencing in Clinical Narratives. AMIA Annual Symposium Proceedings 2010, 787–791. [PMC]

Affiche

Journée de l’école ED393, Saint-Malo, France
Saint_Malo_2016_CK

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *