=Paper=
{{Paper
|id=Vol-547/paper-7
|storemode=property
|title=Construction d'un système d'aide à la décision médicale pour la détection des arythmies cardiaques à l'aide d'arbres de décision flous
|pdfUrl=https://ceur-ws.org/Vol-547/2.pdf
|volume=Vol-547
|dblpUrl=https://dblp.org/rec/conf/ciia/Behadada09
}}
==Construction d'un système d'aide à la décision médicale pour la détection des arythmies cardiaques à l'aide d'arbres de décision flous==
<pdf width="1500px">https://ceur-ws.org/Vol-547/2.pdf</pdf>
<pre>
 Construction d’un système d'aide à la décision médicale
   pour la détection des arythmies cardiaques à l'aide
                d'arbres de décision flous
         Omar Behadada doctorant chercheur Laboratoire de génie biomédical
                        Département d’électronique Biomédicale
                      E-mail : O_behadada@mail.univ-tlemcen.dz
            M.A Chikh maître de conférences Département d’informatique
                      E-mail : mea_chikh@mail.univ-tlemcen.dz
       Laboratoire de génie biomédical, Département d’électronique Biomédicale
                         Faculté des Sciences de L’ingénieur ;
            Ammar Mohammed magister, Laboratoire de génie biomédical
                        Département d’électronique Biomédicale
                             E-mail : amm1222k@yahoo.fr

                          Université ABOUBEKR BELKAÏD
                       Tel: 213 43 28 56 89, Fax: 213 43 28 56 86
          Résumé. L’extraction de connaissances est un processus interactif et
itératif d’analyse d’un grand ensemble de données brutes afin d’en extraire des
connaissances exploitables, et où l’utilisateur-analyste (cardiologue) joue un rôle
central. Dans la perspective de conception de systèmes d’extraction de connaissances
et de classification à partir d’une base de données cardiologiques, nous présentons une
méthode basée sur les arbres de décision flous. La première partie présente la
problématique du choix des caractéristiques d’un battement cardiaque. Ensuite nous
appliquons l’arbre de décision flou pour la classification de quelques anomalies
cardiaques. Dans la troisième partie nous montrons l’intérêt des règles de décision
extraites dans l’interprétabilité des résultats de la classification.
  .
Mots clés : Extraction de connaissances, arbre de décision flou, base de données
cardiologiques, sélection des attributs, règles de décision.

1 Introduction
    De nos jours, les nouvelles technologies de l’information produisent de nouvelles
approches méthodologiques tentant d’en extraire non seulement une information
valide et fiable, mais plus généralement des connaissances permettant d’étayer la
décision. Deux grands types d’approches peuvent être distingués aux analyses des
données : l’une est décisionnelle et s’attache le plus souvent à la modélisation, l’autre
est exploratoire et a pour objectif de synthétiser un ensemble d’informations plus ou
moins hétérogènes (l’approche est alors essentiellement descriptive).
   Les nouveaux outils d’extraction des connaissances à partir des données (ECD)
s’inscrivent clairement dans le versant exploratoire des études statistiques mais
s’enracinent également dans ce second type de logique. Certaines de ces méthodes
sont récentes, le concept d’ECD apparaît pour la première fois en 1989.
  Dans ce présent article nous avons appliqué la méthode de l’arbre de décision flou
pour extraire des règles de décision afin de construire un système de classification de
quelques anomalies cardiaques.

   Un arbre de décision est un outil d'aide à la décision et à l'exploration de données.
Il permet de modéliser simplement, graphiquement et rapidement un phénomène
mesuré plus ou moins complexe. Sa lisibilité, sa rapidité d'exécution et le peu
d'hypothèses nécessaires à priori par contre La logique floue a été proposée par
Zadeh [Zadeh, 1965] pour modéliser l’information et pour se rendre compte du
caractère vague des connaissances que nous, les humains, manipulons au quotidien, le
couplage de la logique floue avec les arbres de décision rend les règles extraites plus
linguistiques et plus explicites.

  2. Prétraitement de la base de données :
   Nous avons collecté les données cardiaques des différents battements pour les
différents enregistrements à partir de la base de données MIT-BIH avec les anomalies
cardiaques ciblés (tableau 1).

       Tab.1 : Les différents enregistrements choisis avec le nombre d’exemples
                                     sélectionnés
       Enregistrement          Nbre 'N' Nbre 'V'       Nbre 'R'    Nbre 'L'

           100                    62          0            0            0
           101                    5           0            0            0
           103                    58          0            0            0
           105                    10          0            0            0
           106                    27          34           0            0
           109                    0           0            0            104
           111                    0           0            0            41
           113                    6           0            0            0
           115                    10          0            0            0
           116                    45          0            0            0
           118                    0           0            12           0
           119                    50          34           0            0
           122                    5           0            0            0
           123                    5           0            0            0
           124                    0           0            33           0
           200                    0           25           0            0
           203                    0           15           0            0
           207                    0           0            0            40
           208                    0           152          0            0
           212                    5           0            26           0
           214                    0           50           0            50
           215                    103         0            0            0
  2.1. Caractérisation du battement cardiaque

   Un battement cardiaque est caractérisé par une succession d’onde de nature
électrique (électrocardiogramme ECG), il présente un grand intérêt diagnostic.


                   Figure 1 : Différentes ondes à détecter par IMPE


   Caractérisation du battement cardiaque par des descripteurs pertinents est
indispensable lors de la conception et l’implémentation de tout modèle de
reconnaissance d’une anomalie cardiaque. Il convient de remarquer que de
nombreuses approches citées dans la littérature ont porté sur la difficulté que
représentent la mesure et le choix des paramètres pertinents du signal ECG et leur
classification. On peut citer les travaux menés par plusieurs chercheurs, pour la
réduction du complexe QRS pour chaque battement cardiaque. Acharya et al.
[Acharya 2004][9] ont utilisé l'entropie spectrale, les déviations standards et la mesure
de l'exposant de Lyapunov de la variation rythmique, pour la classification neuronale
des arythmies cardiaques. Zhou [Zhou 2003][10] a appliqué la méthode de l'ACP
pour réduire la taille du complexe QRS. Le vecteur réduit est présenté ensuite à
l'entrée d'un réseau neuronal, pour la détection du battement ventriculaire prématuré.
Lagerholm et Person [Lagerholm 2000][2] ont Caractérisé chaque cycle cardiaque par
son intervalle RR et les coefficients résultant de la décomposition du complexe QRS
en fonctions d'Hermite de base.
   Dans notre travail nous avons conçu notre propre interface de mesures qui permet
de localisé les différents ondes.
   2.2. Sélection des attributs :
   La sélection de nos attributs est liée avec la connaissance médicale cardiologique
(tableau 2).

                            Tab.2: Les différents descripteurs
   Paramètres                                          Signification
Durée P                           Largeur de l’onde P
Intervalle PR                     Du début de l’onde P jusqu’au début du QRS
Complexe QRS                      Début de l’onde Q jusqu’à la fin de l’onde S
   Segment ST                     De la fin de l’onde S ou R jusqu’au début de l’onde
                                  T
   Intervalle QT                  Du début du QRS jusqu’à la fin de l’onde T
    RRp                           La distance entre le pic R du présent battement et le
                                  pic R du battement précédent.
   RRs                            Entre le pic R du présent battement et le pic R du
                                  battement suivant.
   RDI (retard de la déflexion    Du début du QRS jusqu’au sommet de la dernière
   intrinsecoïde)                 positivité de l’onde R.
   Durée battement                Début de l’onde P jusqu’à la fin de l’onde T.
   RRs \ RRp                      Le rapport RRs\RRp

     2.3. Exploration de la base de données :
      Une exploration de la base de données permet de voir clairement la corrélation
  entre les attributs et la classe ciblé.
     2.3.1. Représentation bidimensionnelle :
        Nous avons testé séparément les attributs en fonction de leurs classes sachant
  qu’ils sont codés (0,1,2 et 3).
     0 :c’est le cas normal (N).
     1 :c’est le cas extrasystole ventriculaire (V).
     2 : c’est les cas bloc de branche droit (R).
     3 : c’est les cas bloc de branche gauche (L).


Figure 3 -a : Une représentation de segment   Figure 3-b : Une représentation de durée P
P-R en fonction des classes                   en fonction des classes
     Figure 4-a : Une représentation de      Figure 4 -b : Une représentation de
   segment ST en fonction des classes        largeur QRS en fonction des classes


  Commentaires :

   Nous voyons clairement que la durée de P dans la (figure 3 (a)) a parfaitement la
même plage de variation pour les 3 classes (N, R, et L) et une variation presque nulle
pour la classe V ce qui est très logique du point de vue physiologique (dans le cas
d’une extrasystole ventriculaire (V), l’onde P est absente).Par contre le segment PR
varie d’une manière très similaire pour les quatre clases (figure 3 (b)), donc son effet
est négligeable pour l’entrée du classifieur. Le complexe QRS varie différemment
dans le cas normal(N) et dans les cas pathologiques (V, R, et L) (figure 4 (a)). Les
autres paramètres varient différemment d’une classe à une autre, Ce qui peut être très
utile dans le renforcement des paramètres du classifieur. Nous déduisons qu’un seul
paramètre seul ne peut pas être discriminant pour les différentes classes.

   2.3.2. Représentation tridimensionnelle
   Dans cette partie, nous avons testé l’effet de deux paramètres ensemble à la fois sur
les 4 classes ciblées. La couleur rouge (+) représente le cas normal .La couleur verte
(+) représente le cas extrasystole ventriculaire. La couleur bleue (+) représente le cas
bloc de branche droit. La couleur violette (+) représente le cas bloc de branche
gauche.
Figure 5-a : Représentation 3D de la durée P      Figure 5-b : Représentation 3D de la
et le segment PR en fonction des classes          largeur du QRS et le RRs/RRp en fonction
                                                  des classes

  Commentaire :

   Nous avons déjà remarqué, la limite d’un seul paramètre à discriminer entre les
différentes classes dans la 1ère expérimentation, ce qui nous a poussé à voir l’intérêt
d’augmenter le nombre des attributs. Et nous remarquons clairement dans la (figure
5(a)) que seul le nuage de points pour le cas durée P nulle (couleur verte) se distingue
des autres, ce qui correspond à la classe extrasystole ventriculaire, par contre pour le
dernier couple (largeur QRS, RRs/RRp) (figure 5(b)) nous distinguons une bonne
discrimination entre les pathologies, les nuages de points des différentes classes sont
nettement séparés. Nous pouvons tirer de ces expérimentations menées sur les
différents paramètres du vecteur d’entrée d’un classifieur des arythmies cardiaques les
points suivants :
 1- Les performances de tout modèle de classification, indépendamment de la
technique utilisée, dépend énormément du vecteur d’entrée.
 2- Une représentation géométrique des paramètres d’entrée peuvent être intéressante
sur le plan visuel et sur le choix final de ces paramètres. Mais néanmoins une
visualisation de plus de deux paramètres devient difficile à représenter.
 3- Des paramètres comme : RRs, RRs/RRp, Durée P et largQRS sont très pertinents
pour la reconnaissance des pathologies comme V, R et L. Une bonne mesure des
différents paramètres reste décisive pour la suite de la classification.
3. Rappel sur l’induction d’un arbre de décision flou(ADDF)
   Considérons le problème général suivant. Soit f(x1,…,x n) y=f(x1,…,x n) une
relation d’entrée/sortie inconnue, les entrées x1 à x n étant des variables explicatives
potentielles et y la sortie. Parmi les entrées, certaines sont importantes, d’autres
redondantes, d’autres enfin inutiles. L’induction d’un ADDF consiste à :
   Hiérarchiser les variables d’entrée en fonction de leur importance.
   Évaluer l’utilité de prendre en compte ou non certaines entrées, soit en ligne, soit
hors ligne par élagage.
   Il faut, pour cela, un ensemble d’apprentissage,
E = { (xi, yi) ;x i = (x i1,…,x iM),yi ∈ R , pour i = 1 à P } , où les xij , pour j = 1 à
M,
   Sont des variables linguistiques possédant m j fonctions d’appartenance,
(Ajk)mkj=1.
   Les fonctions d’appartenance forment des partitions floues triangulaires sur les
domaines d’entrée. Sans perte de généralité, la T-norme utilisée est le produit :
   ET(x, y) = x * y. ces choix apportent la propriété suivante :
                               ∑ α ( x) ≡ 1
                               F
                                       F
                                                                                           (1)
  Et l’équation (1) devient :


                           ADDF(x) =                ∑ α ( x)c
                                                        F
                                                                     F           F          (2)


   La construction automatique d’un arbre nécessite des mesures comme l’entropie et
le gain d’information.
   Dans un problème de classification, dans le cas idéal, les vecteurs d’apprentissage
associés à un nœud terminal (une feuille) appartiennent à la même classe.
   On dit alors que la feuille est “pure“. Ce n’est évidemment pas toujours possible et
l’objectif de l’induction vise à créer des feuilles avec un degré de mélange minimum.

   Le partitionnement est réalisé à chaque nœud par des tests portant sur une
variable : il faut donc choisir le meilleur test, l’entropie permet de faire le bon choix
de la classe.
   - la notion de représentation de la classe k au nœud N pour une modalité Aj de la
variable traitée, joue un rôle central. Elle est définie par :
                       P

  r (k, j, N)=     ∑ µ ( x ) ٨ µ ( x ) ٨ α ( x ) (3)
                   i =1
                           k       i
                                               Aj           ij           N   i


  On en déduit les paramètres Pk et wj utilisés pour le calcul du gain:
            ∑ r (k , j , N )                   ∑ r (k , j , N )
                                           =
               j                                j
  Pk=                                                                                (4)
          ∑∑ r (k , j, N ) ∑ α ( X )
           k       j
                                                    P

                                                                 N       i
                                                i =1

           ∑ r (k , j , N ) ∑ r (k , j , N )
   wj=         k
                            =                (5)k

          ∑ ∑ r (k , j , N ) ∑ α ( x )
           k       j
                                                     P

                                                                 N       i
                                                    i =1
   Le gain d’information apporté par un attribut X au nœud N est :

   G(X, N)=I(N)-Info(X,N)                           (6)

   Avec

   I(N)=-   ∑ P log P
            k
                k               k   Information au nœud N (entropie)     (7)


   Info(X,N)=   ∑ w I (X )
                    j
                            j       j    Information apportée par X au nœud N (8)


4. Construction du système d’inférence flou (SIF)
    Le deuxième point important dans l’extraction des règles et surtout pour le cas
d’induction des règles flous,est le choix des modalités floues car ce dernier représente
l’aspect linguistique dans le raisonnement flou.
    Une modalité floue ou le sous-ensemble flous avec les attributs forme une règle de
la forme :
    « Si attribut k est SEF i et attribut k’ est SEF i ‘’ alors classe C »
    Nous concluons qu’un choix rigoureux des modalités floues doit être fortement
exigé afin de pouvoir parler d’une induction des règles réussite.
    Dans notre approche nous avons choisi les modalités floues selon la nature de
variation des données en gardant les paramètres d’entrée présentés dans le tableau
suivant :
Tous les sous ensemble flous (SEF) sont initialisés après analyse sauf pour le cas de
l’arbre Addf1 ou nous les avons initialisés manuellement (avec l’avis du cardiologue).

                                Tab.3. attributs avec le nombre de SEF
 Attributes     Addf1           Addf2 Addf3
 DurP             3             3           3
 Seg PR                 2       3          3
 LargQRS                3       3          3
 SegST                  2       3        inactive
 InterQT                3       3           3
 RR p                   2       3          3
 RR s                   2       3          3
 RDI                    2       3          3
 Durée bat              2       3        inactive
 RRs                    2                  3
                                3
 /RRp
    Figure 5-a : Histogramme de          Figure 5-b : Histogramme de segment St
  la durée avec la partions floue                avec la partions floue


      Figure 6-a : Histogramme du segment PR           Figure 6-b : Histogramme du
              avec la partions floue                 RRs/RRp avec la partions floue.


   Les figures 5 et 6 montrent clairement la relation entre la distribution des données,
différents attributs et le choix de ses modalités floues.
   Nous remarquons que le choix de trois modalités floues pour attributs segment PR
est très bien et uniformément réparti par contre le choix de 3 modalités floues pour
l’attribut durée P avec des modalités initialisées manuellement n’est pas représentatif.
5. Conception du modèle de classification :
   En vue de bien voir l’effet de nos choix déjà faits et afin de pouvoir extraire une
connaissance depuis notre base de données notre approche d’extraction de
connaissances c’est utiliser l’apprentissage supervisé par arbre de décision flou en
construisant un système capable de reconnaître des arythmies cardiaques avec une
base de connaissances comme référence. Cet objectif nous ramène à évaluer la qualité
des classifieurs conçus et exploiter la connaissance induite après apprentissage de
l’arbre (classifieur) qui donne les meilleur résultats.la boite à outils FisPro[10]
logiciel dédié au système d’inférence flou.
5.1. Critères de performances :


           Paramètres                  Addf1        Addf2            Addf3

           True positive                 203        206                  206
           True negative                 58         341                  307
           False positive                470        84                   100
           False negative                 3         0                     0
           Sensitivity (se)            98,543       100                  100
           Specificity (SP)            10,984       80,023             75,429
           Rate FP                     89,015       19,764             24,570
           CC                          30,163       71,103             67,320

  5.2. Résultats obtenus :
   Nous constatons que le meilleur taux de reconnaissance est obtenu par le
classifieur ADDF2 ce qui nous confirme le bon choix des modalités floues et la
sélection des attributs.
Une sensibilité de 100% et avec un faut négatif de 0 nous montre la reconnaissance
de l’anomalie ESV a 100%.
Par contre le classifieur ADDF1 avec un taux de reconnaissance de 30,16% à cause de
la mauvaise initialisation des points modaux.

5.3. Analyse des règles de classification à partir d’un arbre de décision flou:
   L’avantage principal d’un arbre de décision flou c’est l’interprétabilité des résultats
et aussi leur capacité à extraire la connaissance d’une base exemples ce qui
constitue un intérêt majeur dans un système d’aide au diagnostic [12].
   Cette connaissance se traduit par un ensemble de règles sous forme de :
  « Si A et SEF1 et B est SEF2 et…alors c’est C1 »

   Discussion :
   A fin de mieux évaluer la qualité de notre connaissance induite par l’arbre de
décision flou nous allons analyser les règles du deuxième arbre qui a donné des
meilleurs résultats par rapport aux autres avec une bonne classification et des règles
très significatives et très crédibles et conformes avec l’expertise humaine.


   Figure 7 : histogramme présentant les règles en fonction du nombre d’exemples
                                     l’activant

   En regardant l’histogramme de la figure 4-20 nous voyons clairement les règles
principales qui sont très activées et d’autres moins, avec un nombre d’exemples
différents, la règle 9 est activée avec peu d’exemples (seulement 17 exemples).
   La règle 7 « Si durée P petite et QRS grand et RRs/RRp petite alors ESV »est
activée avec 134 exemples, cette règle est vérifiée physiologiquement.
   Le résultat de notre application se présente sur la table des règles où on remarque
les attributs avec leur modalité flous et la classe inférée.


    6. Conclusion :
    Dans cet article nous avons présenté une méthode d’extraction de règles de
décision depuis des données numériques et nous avons réussi a tiré une connaissance
conforme avec l’expert du domaine d’application (cardiologue).
       Les arbres de décision flous présentement un avantage majeur dans la
classification à cause de leurs simplicité, et leur rapidité d’exécution ainsi de leur
facilité d’interprétation. L’induction des règles de décision à partir de l’arbre induit
représente l’un de ses avantages principaux. Notons que dans le domaine médical,
tout expert exige de toute méthode automatique d’aide au diagnostic de justifier ses
décisions, une caractéristique absente dans plusieurs techniques citées dans la
littérature en particulier les réseaux de neurones. La méthode que nous présentons
dans cet article offre aux médecins une base de connaissance explicite (sous forme
de règles) acquise d’une base de données médicale. L’expert aura la possibilité
d’accepter les règles, de les modifier, de les supprimer ou d’ajouter d’autres.
      La qualité du signal ECG représente une contrainte majeure pour la
reconnaissance des différentes pathologies. Ainsi que le mode d’acquisition a un rôle
majeur pour différencier entre l’extrasystole ventriculaire et les blocs de conduction.
Nos données extraites de la base MIT-BIH est composée essentiellement de
battements de la dérivation DII ce qui constitue un handicap majeur lors de la
classification.
      Nous avons réussi à implémenter un classifieur basé sur l’arbre de décision flou.
Les résultats obtenus sont très encourageants, vu le manque d’informations dans la
base de données utilisée (présence d’une seule dérivation). Le meilleur classifieur
dans les expérimentations menées a un taux de classification de 71%, une
performance qui peut être améliorée, si on augmente le nombre de dérivations. Nous
avons mené plusieurs changements sur quelques paramètres (choix des nombres des
modalités floues et l’emplacement des points modaux) afin de choisir la meilleure
structure.
   7. References
   [1] World Health Organization 2005, Library Cataloguing-in-Publication Data.
   [2] Lagerholm, M., and al., “Clustering ECG complexes using hermite functions and self-
organizing maps”, IEEE Trans. Biomed. Eng. pp. 838-848, 2000.
   [3] Silipo1 R., “Investigating electrocardiographic features in fuzzy models for cardiac
arrhythmia classification”, 4th workshop on intelligent data anlysis in medecine and
pharmacology (IDAMAP), Washington, Nov 1999.
   [4] Belgacem, N., “détection et classification des arythmies cardiaques par application des
réseaux des neurones”. juin 2002.
   [5]      Hedeili, N., “Classification des arythmies cardiaques par l’analyse composante
principale et les réseaux de neurones”.2004.
   [6] Zadeh L.A, "fuzzy sets", Information and Control, 8: 338-353, 1965.
   [7] Une interface développée sous matlab, "Laboratoire de Génie biomédical", l'Université
de Tlemcen.
   [8] Acharya R.U., and al., “Classification of cardiac abnormalities using heart rate signals”,
Med. Bio. Eng. Comp, Vol. 42 p.288-293, 2004.
   [9] Zhou J., “Automatic Determining of Premature Ventricular Contraction Using Quantum
Neural Networks”, Proc. of the 3rd IEEE Symposium on BioInformatics and bioEngineering
BIBE'03, pp. 169-173, 10-12 March 2003.
   [10] Serge Guillaume, Brigitte Charnomordic and Jean-Luc Lablée. "FisPro: open source
software for systems fuzzy inference"
   INRA-Cemagref http://www.inra.fr/bia/M/fispro,2002.
   [11] Behadada O., « Application des arbres de décision flous dans la reconnaissance des
arythmies cardiaques » 06 décembre 2007.
    [12] Serge GUILLAUME, "Représentation des connaissances et systèmes d'inférence
floue". THÈSE Doctorat en Génie informatique, Automatique, Traitement du signal.
Université Paul Sabatier, Toulouse III. Soutenu le 21 novembre 2005.

</pre>