Introduction
Un grand nombre de systèmes de santé requiert la sauvegarde, la manipulation et la collecte de données temporalisées [Mate et al. 2015]. D’une part, vu l’hétérogénéité et le grand nombre de sources de données, les méthodes classiques de construction d’entrepôt de données sont difficiles, voire impossibles, à mettre en place, car elles sont fondées sur de vagues règles de pratique non automatisables [Khnaisser et al. 2015]. D’autre part, la modélisation du temps est un sujet d’intérêt pour plusieurs domaines de recherche. Les recherches sur la représentation et le raisonnement temporel en médecine ont commencé vers la fin des années 1980 [Adlassnig et al. 2006]. Les problématiques de représentation des informations temporelles ont été abordées de deux points de vue : un point de vue relationnel, de manière à pouvoir représenter, stocker et faire évoluer les données en garantissant leur intégrité et un point ontologique, de manière à pouvoir représenter et raisonner sur des données [Tao et al. 2010]. La définition d’une nouvelle méthode de construction guidée par un modèle de connaissances (ontologie) en respectant les contraintes découlant de son intégration à un système informationnel est un moyen de modélisation mieux adapté dans ce genre de situation
Objectif
Il s’agit (a1) de proposer un modèle ontologique temporel qui permettra l’arrimage optimal entre l’approche relationnelle et l’approche ontologique réaliste (a2) de s’assurer que le modèle ontologique temporel proposé permette l’annotation temporelle des concepts médicaux de telle façon qu’un raisonnement temporel adapté aux grands volumes de données médicales puisse être automatisé efficacement, (b) de proposer une méthode et un atelier de construction d’entrepôts de données temporalisées à partir d’ontologies de références (c) de prouver l’efficacité de la méthode en l’appliquant à un cas réel dans le domaine de la santé.
Méthode
Le projet consiste à effectuer les étapes suivantes :
- étendre le modèle relationnel temporel et l’algorithme de temporalisation définis dans par l’ajout du traitement de l’indétermination,
- vérifier (et valider) la complétude du modèle temporel en des méthodes d’annotations temporelles et des modèles de raisonnement existants,
- développer un modèle ontologique du temps en tenant en compte des algorithmes d’inférences des modèles de raisonnement,
- intégrer le modèle ontologique du temps développer en (3) dans une ontologie du domaine,
- développer l’algorithme de traduction de l’ontologie (4) à un schéma de l’entrepôt de données temporalisées,
- définir un modèle de mise en correspondance (mapping) entre les sources et l’ED et un modèle de mise en correspondance entre l’ontologie et l’ED pour permettre l’alimentation en données et leur exploitation subséquente à partir du modèle de connaissances en assurant la traçabilité des transformations,
- choisir un cas réel pour prouver l’efficacité de la méthode. Le cas réel doit permettre de valider la complétude du modèle ontologique, du modèle relationnel et du modèle de mise en correspondance.
Les étapes sont intégrées dans un atelier composé de plusieurs modules coordonnés par différents correspondeurs spécialisés pour assurer une construction semi-automatisée sur la base des modèles approuvés par les analystes (ontologie de référence) et en recourant le moins souvent possible à des décisions ad hoc.
Références
Khnaisser, C., Lavoie, L., Diab, H., and Ethier, J.-F. 2015. Data Warehouse Design Methods Review: Trends, Challenges and Future Directions for the Healthcare Domain. Communications in Computer and Information Science, 76–87. http://dx.doi.org/10.1007/978-3-319-23201-0_10.
Affiche
Journée de l’école ED393, Saint-Malo, France
Saint_Malo_2016_CK