Pour acquérir une compréhension approfondie des maladies humaines, les biologistes exploitent généralement les données des patients à la recherche de profils pertinents.
Les jeux de données cliniques sont souvent non étiquetés et comportent des caractéristiques, tels que des biomarqueurs, répartis en classes exprimant des fonctions biologiques communes. On cherche ici à extraire des règles pouvant combiner à la fois l'information des biomarqueurs et des fonctions biologiques.
Les outils existants de la fouille de données multi-relationnels (MR), sont plutôt limités dans la forme des règles (conclusions atomiques) et ignorent la composition des caractéristiques.
Notre approche s'appuie sur une extension MR de l'analyse formelle de concepts, renforcée par des opérateurs de propositionnalisation flexibles et une modélisation MR dédiée aux données des patients.
Click here to read the article
M. Wajnberg et al., "Mining Heterogeneous Associations from Pediatric Cancer Data by Relational Concept Analysis," 2020 International Conference on Data Mining Workshops (ICDMW), 2020, pp. 597-604, doi: 10.1109/ICDMW51313.2020.00085.