<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="fr">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main">Mapping de terminologies diagnostiques en cancérologie par l&apos;intermédiaire du NCI Metathesaurus Mapping of diagnostic terminologies in oncology using the NCI Metathesaurus</title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
						<author>
							<persName><forename type="first">Bérénice</forename><surname>Brechat</surname></persName>
							<affiliation key="aff0">
								<orgName type="department">Equipe de Recherche en Informatique Appliquée à la Santé</orgName>
								<orgName type="laboratory">ISPED</orgName>
								<orgName type="institution">Université de Bordeaux</orgName>
							</affiliation>
							<affiliation key="aff1">
								<orgName type="department" key="dep1">Service d&apos;Information Médicale</orgName>
								<orgName type="department" key="dep2">Pôle de Santé Publique</orgName>
								<orgName type="institution">CHU de Bordeaux</orgName>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Fleur</forename><surname>Mougin</surname></persName>
							<affiliation key="aff0">
								<orgName type="department">Equipe de Recherche en Informatique Appliquée à la Santé</orgName>
								<orgName type="laboratory">ISPED</orgName>
								<orgName type="institution">Université de Bordeaux</orgName>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Frantz</forename><surname>Thiessard</surname></persName>
							<affiliation key="aff0">
								<orgName type="department">Equipe de Recherche en Informatique Appliquée à la Santé</orgName>
								<orgName type="laboratory">ISPED</orgName>
								<orgName type="institution">Université de Bordeaux</orgName>
							</affiliation>
							<affiliation key="aff1">
								<orgName type="department" key="dep1">Service d&apos;Information Médicale</orgName>
								<orgName type="department" key="dep2">Pôle de Santé Publique</orgName>
								<orgName type="institution">CHU de Bordeaux</orgName>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Vianney</forename><surname>Jouhet</surname></persName>
							<affiliation key="aff0">
								<orgName type="department">Equipe de Recherche en Informatique Appliquée à la Santé</orgName>
								<orgName type="laboratory">ISPED</orgName>
								<orgName type="institution">Université de Bordeaux</orgName>
							</affiliation>
							<affiliation key="aff1">
								<orgName type="department" key="dep1">Service d&apos;Information Médicale</orgName>
								<orgName type="department" key="dep2">Pôle de Santé Publique</orgName>
								<orgName type="institution">CHU de Bordeaux</orgName>
							</affiliation>
						</author>
						<title level="a" type="main">Mapping de terminologies diagnostiques en cancérologie par l&apos;intermédiaire du NCI Metathesaurus Mapping of diagnostic terminologies in oncology using the NCI Metathesaurus</title>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">BFA25F3B47957D43E2F4E1436A9B413E</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-25T04:14+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<textClass>
				<keywords>
					<term>CIM-O3</term>
					<term>NCI Thesaurus</term>
					<term>mapping de terminologies biomédicales ICDO3</term>
					<term>NCI Thesaurus</term>
					<term>Terminology mapping</term>
				</keywords>
			</textClass>
			<abstract>
<div xmlns="http://www.tei-c.org/ns/1.0"><p>En France, plusieurs terminologies sont utilisées en routine pour coder des diagnostics de cancer (CIM10 pour le PMSI, CIM-O3 au sein des registres, ADICAP pour l'anatomo-pathologie). Cette hétérogénéité est un frein majeur pour l'utilisation secondaire des données diagnostiques recueillies. Il est nécessaire de mettre en correspondance les différentes terminologies diagnostiques de cancérologie au sein d'un système cohérent et hiérarchisé. Le NCI Thesaurus, qui est une terminologie internationale visant à représenter l'ensemble des connaissances en cancérologie, semble être une excellente base pour constituer ce système unifié. Dans ce travail, le mapping existant entre la CIM-O3 et le NCI Thesaurus au sein du NCI Metathesaurus est considéré. Plus de deux tiers des codes CIM-O3 sont associés à un code NCI Thesaurus unique. Une analyse qualitative des mappings multiples et des cas où un code CIM-O3 n'a pas de correspondant NCI Thesaurus a été réalisée. Différents types de causes ont été identifiés et des pistes de solution sont proposées en discussion.</p></div>
			</abstract>
		</profileDesc>
	</teiHeader>
	<text xml:lang="fr">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="1">Introduction</head><p>Les activités liées à la santé produisent aujourd'hui une masse importante d'information qu'il faut trier, traiter, recouper pour qu'elle soit exploitable, mais aussi stockée en vue d'une utilisation ultérieure. Face à ces problématiques, les acteurs du domaine médical ont pris conscience de l'importance de structurer l'information qu'ils génèrent <ref type="bibr" target="#b0">[1]</ref>, mais ces données sont produites par une multitude d'acteurs différents et leur mise en correspondance reste complexe. Le domaine de la cancérologie illustre bien cette production considérable d'information par des sources multiples. On dispose par exemple de données issues de la clinique, de la recherche ou encore de l'épidémiologie. Pour représenter ces données, un certain nombre de classifications ont été créées et l'enjeu est aujourd'hui de trouver des correspondances entre elles. Les registres des cancers, qui visent à recueillir de façon exhaustive de nombreux éléments relatifs aux cancers incidents dans la population, sont organisés en réseaux avec une volonté de standardiser ce recueil. Le choix s'est porté sur la Classification Internationale des Maladies pour l'Oncologie (CIM-O3) comme nomenclature commune pour la codification des cancers <ref type="bibr" target="#b1">[2]</ref>. Pour assurer leur fonction, les registres collectent de l'information issue de sources, et donc de terminologies multiples telles que la classification internationale des maladies ou l'ADICAP (codification des lésions élaborée par l'Association pour le Développement de l'Informatique en Cytologie et en Anatomie Pathologique). Ces registres sont également exploités dans de nombreux travaux et études relatifs au cancer, où leurs données sont croisées avec d'autres bases de données codées grâce à des nomenclatures diverses. Disposer d'un mapping exhaustif entre la CIM-O3 et d'autres terminologies présente donc un intérêt majeur. Le NCI Thesaurus est une terminologie internationale de référence développée par le National Cancer Institute américain, visant à représenter l'ensemble des connaissances largement utilisée en cancérologie, que ce soit en clinique, en recherche translationnelle et fondamentale, ou encore en épidémiologie. De ce fait, elle semble être un excellent pivot de mapping entre les terminologies du spectre de la cancérologie. On retrouve le NCI Thesaurus, ainsi que la CIM-O3, au sein d'un système unifié de terminologies biomédicales qui contient la plupart des terminologies utilisées dans le domaine de la cancérologie et qui a été développé sur la base de l'UMLS <ref type="bibr" target="#b2">[3]</ref> : le NCI Metathesaurus. L'objectif principal de cette étude est de représenter l'ensemble des concepts de la CIM-O3 au sein du NCI Thesaurus via le NCI Metathesaurus. Pour cela, une analyse de la correspondance entre les concepts CIM-O3/ NCI Thesaurus a été réalisée pour identifier d'éventuelles inexactitudes, erreurs ou absences de mapping.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2">État de l'art</head><p>La question de l'interopérabilité entre diverses ontologies a été largement étudiée ces dernières années, avec en particulier la volonté de proposer des méthodes automatiques <ref type="bibr" target="#b3">[4,</ref><ref type="bibr" target="#b4">5]</ref>. Dans le domaine biomédical également, cette problématique a généré de très nombreux travaux et l'utilisation de l'UMLS comme pivot a été souvent investiguée <ref type="bibr" target="#b5">[6,</ref><ref type="bibr" target="#b6">7,</ref><ref type="bibr" target="#b7">8]</ref>. En revanche, il existe peu de travaux où le mapping est basé sur le NCI Metathesaurus <ref type="bibr" target="#b8">[9]</ref>. Disposer d'un mapping de qualité entre la CIM-O3 et une terminologie internationale de référence tel le NCI Thesaurus présente un intérêt majeur pour le partage des données épidémiologiques des registres des cancers. On retrouve des travaux portant sur la recherche d'inconsistances d'un tel mapping, réalisés à partir de versions antérieures du NCI Metathesaurus <ref type="bibr" target="#b8">[9]</ref>. Cependant, aucune version corrigée et validée de ce type de mapping n'est actuellement disponible. L'actualisation des concepts portés par ce Metathesaurus justifie également un nouveau travail de mapping.</p><p>3 Matériel et méthodes 3.1 Terminologies utilisées pour le mapping</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1.1">La CIM-O3</head><p>La Classification Internationale des Maladies pour l'Oncologie (CIM-O3 ou ICDO3 en version anglaise), est une classification <ref type="bibr" target="#b9">[10]</ref>, principalement utilisée par les registres de tumeurs cancéreuses pour le codage des caractéristiques de tumeurs. La CIM-O3 possède un axe morphologique pour décrire la morphologie de la tumeur et un axe topographique qui précise une localisation. Un code CIM-O3 de tumeur est composé de 10 caractères correspondant à l'agrégation des quatre caractères du code topographique, suivis des cinq caractères du code morphologique, éventuellement suivis d'un caractère facultatif (Figure <ref type="figure" target="#fig_0">1</ref>). A chaque code CIM-O3 correspond un terme préféré et des inclusions décrivant généralement des notions plus précises. Par exemple, le code 9440/3 a pour terme préféré « Glioblastome, SAI » et pour inclusions « Glioblastome multiforme », « Spongioblastome multiforme » et « Gliome à cellules indifférenciées ». La CIM-O3 nécessite donc une post-coordination pour le codage des tumeurs car le diagnostic n'est pas codé tel-que dans la terminologie. Il faut, pour coder un diagnostic précis de tumeur, associer un élément morphologique de la terminologie à un élément topographique de la terminologie. </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1.2">Le NCI thesaurus</head><p>Le NCI Thesaurus (NCI) est une terminologie de référence développée par le National Cancer Institute américain, qui couvre le vocabulaire anglais utilisé en cancérologie au sens large <ref type="bibr" target="#b10">[11]</ref>. La version utilisée dans ce travail est celle qui est intégrée dans le NCI Metathesaurus (13.06D). Le NCI comprend plus de 43 000 concepts, organisés selon 20 sous-domaines appelés Kind, tel « Abnormal Cell Kind » qui regroupe les éléments d'anatomo-cyto-patologie. Associées à ces concepts, on retrouve des précisions comme le terme préféré (preferred term), des synonymes, des définitions, et d'autres informations complémentaires. Le NCI possède plus de 90 types de relations définies entre les concepts comme par exemple disease_has_abnormal_cell pour qualifier un rapport entre une pathologie et un type de cellule. Aujourd'hui, le NCI possède plus de 200 000 relations entre ses concepts. Ainsi, le NCI comporte à la fois des entités pré-coordonnées (c'est-à-dire une entité composée d'éléments associés lors de la conception du thésaurus, par exemple « Breast Carcinoma » qui est codé C4872) et des notions pouvant être post-coordonnées grâce aux relations (le terme « Breast Carcinoma » est par exemple relié par disease_has_primary_anatomic_site à « Breast »). Cette prise en charge des termes pré-et post-coordonnés fait du NCI fait du NCI une ressource pour la construction d'un pivot permettant d'intégrer différentes terminologies diagnostiques en cancérologie. Il permet en effet de représenter aussi bien des terminologies utilisant des termes pré-coordonnés (comme par exemple la CIM-10) que des terminologies nécessitant une postcoordination (comme par exemple la CIM-O3), et donc de mettre en relation ces différents éléments.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1.3">Le NCI Metathesaurus</head><p>Le NCI Metathesaurus est un système utilisé dans le spectre de la cancérologie qui regroupe plus de 75 terminologies biomédicales différentes <ref type="bibr">[12]</ref>. Il a été élaboré par le National Cancer Institute américain à partir du Metathesaurus de l'UMLS enrichi par d'autres terminologies biomédicales spécifiques à la cancérologie. On y retrouve 4 millions de termes représentant 2 millions de concepts biomédicaux. Ces termes sont reliés entre eux par plus de 22 millions de relations, présentes dans les différentes terminologies. Les différents termes et codes des différentes terminologies représentant un même concept sont codés dans le NCI Metathesaurus sous un code unique : le Concept Unique Identifier (CUI). A chaque concept est également rattaché l'ensemble des informations complémentaires (définitions, synonymes…) présents initialement dans les terminologies. Enfin, les concepts sont catégorisés par au moins un type sémantique parmi les 133 possibles.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.2">Mapping entre la CIM-O3 et le NCI par le CUI</head><p>Les codes de la CIM-O3 ont été mappés aux codes du NCI par correspondance exacte de leur(s) CUI(s). Ainsi, le mapping a été effectué à partir de la liste des CUIs des codes de la CIM-O3. Pour chacun de ces codes, on a recherché le ou les codes du NCI appartenant au même CUI (Figure <ref type="figure" target="#fig_1">2</ref>).      L'analyse des mappings 1-0 a montré des lacunes dues à la différence de granularité entre les deux terminologies. Ainsi, on retrouve des concepts fins au sein de la CIM-O3 qui ne retrouvent pas de correspondance aussi spécifique au sein du NCI. Par exemple, le code CIM-O3 C02.0 -« Dorsal surface of tongue, NOS » -codant la surface dorsale de la langue ne retrouve pas le même degré de précision au sein du NCI. Dans ce dernier, le concept de langue (C12422 -« Tongue ») est une feuille, sans concept fils. Par ailleurs, certains mappings 1-0 ne devraient pas l'être car des concepts apparemment synonymes n'appartiennent pas à un même CUI dans le NCI Metathesaurus (problème de « missed synonymy » fréquent dans ce type de large graphe <ref type="bibr" target="#b11">[13]</ref>). Par exemple, le code CIM-O3 C42.0 ayant pour terme préféré « Blood » n'est pas mappé au code NCI C12434 ayant pour terme préféré « Blood » car ils sont dans deux CUIs distincts : respectivement, CL429748 et C0005767.  Pour la plupart des mappings 1-0, la granularité du NCI est insuffisante. Il faudra donc envisager l'ajout de nouveaux codes pour pouvoir représenter les codes CIM-O3 plus fins. Il faudra également traiter les cas dus à la « missed-synonymy ». Par ailleurs, il reste quelques cas isolés de défaut de mapping ne pouvant pas être corrigés automatiquement et pour lesquels une correction manuelle devra être réalisée. Ce travail de mapping des concepts de la CIM-O3 vers le NCI s'inscrit dans le cadre d'un projet plus large, dont l'objectif est de permettre l'intégration de différentes terminologies diagnostiques en cancérologie. Afin de garantir l'exactitude des mappings obtenus, une évaluation de l'ensemble des résultats sera réalisée par des médecins. Ces mappings validés serviront de jeux de données pour l'évaluation des règles de sélection des mapping multiples. D'autre part, nous avons identifié un certain nombre de mappings de la forme n-1, à savoir la convergence de plusieurs codes CIM-O3 vers un même code NCI. Par exemple, les codes CIM-O3 8041/3 -« Small cell carcinoma, NOS » et 8042/3 -« Oat cell carcinoma » sont mappés à l'unique code NCI C3915 qui inclut ces deux notions. Ce type de cardinalité n'a pas été pris en compte dans l'analyse qualitative car l'objectif de l'étude était de réaliser un mapping de la CIM-O3 vers le NCI. Cependant, dans un objectif d'intégration des différentes terminologies d'intérêt tout en préservant leur granularité, il est indispensable de traiter ce cas de figure. La prise en compte de ces situations ainsi que le traitement des mappings 1-0 conduiront à l'ajout de termes dans un ensemble basé sur le NCI permettant d'intégrer des terminologies diagnostiques. Peu de travaux se sont intéressés à l'évaluation des mappings des terminologies diagnostiques à partir du NCI Metathesaurus. Notre travail vise à identifier des mapping uniques et exacts de la CIM-O3 vers le NCI, ce qui diffère de l'objectif principal de l'étude de Burgun et Bodenreider <ref type="bibr" target="#b8">[9]</ref> qui cherchait à évaluer la cohérence de la représentation des tumeurs entre ces deux terminologies. Considérant que seuls des termes post-coordonnés existent dans la CIM-O3, nous ne cherchons pas ici à reconstruire les termes pré-coordonnés associant topographie et morphologie pour les mapper vers le NCI. Les résultats du mapping des termes post coordonnés de la CIM-O3 vers le NCI sont cependant similaires à la précédente étude, les différences observées étant dues aux évolutions du NCI Metathesaurus. Le travail de Burgun et Bodenreider <ref type="bibr" target="#b8">[9]</ref> s'inscrit dans une perspective d'évaluation de la qualité des terminologies et reste orienté vers l'audit alors que nous cherchons à représenter les connaissances de la CIM-O3 dans une terminologie qui nous permettra, à terme, de mettre en correspondance ses concepts avec d'autres terminologies de cancérologie. Dans cette optique, nous vérifierons que les combinaisons CIM-O3 topographie + morphologie utilisées pour coder des données réelles dans un registre des cancers peuvent être mis en relation avec des termes pré-coordonnés du NCI.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5">Discussion</head></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="6">Conclusion</head><p>Le mapping code à code de la CIM-O3 vers le NCI par l'intermédiaire du NCI Metathesaurus révèle des mappings exacts, des mappings multiples et permet d'identifier les termes absents dans le NCI. L'analyse qualitative a mis en évidence des causes fréquentes aux mappings multiples, ce qui permettra la construction et l'application de règles de correction afin d'obtenir une intégration complète de la CIM-O3 avec le NCI. La confrontation du résultat de cette intégration à des données réelles d'un registre permettra d'identifier l'absence éventuelle de termes pré-coordonnés dans le NCI.</p></div><figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_0"><head>Figure 1 :</head><label>1</label><figDesc>Figure 1 : Eléments permettant la construction d'un code CIM-O3, exemple du glioblastome (code morphologique 9440/3) d'un hémisphère cérébral (code topographique C71.0)</figDesc><graphic coords="3,106.44,561.96,388.63,60.76" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_1"><head>Figure 2 :</head><label>2</label><figDesc>Figure 2 : Principe du mapping des codes de la CIM-O3 avec les codes du NCI par l'intermédiaire des CUI dans le NCI Metathesaurus</figDesc><graphic coords="4,110.48,653.86,381.73,100.99" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_2"><head>Figure 3 :</head><label>3</label><figDesc>Figure 3 :</figDesc><graphic coords="6,134.04,23.53,333.59,270.64" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_3"><head>Figure 4 :</head><label>4</label><figDesc>Figure 4 : Exemples de mappings 1-n de codes CIM-O3 avec le NCI</figDesc><graphic coords="6,55.94,704.18,490.46,51.17" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_4"><head>Figure 5 :</head><label>5</label><figDesc>Figure 5 : Exemple de différence de granularité entre la CIM-O3 et le NCI</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_5"><head>Figure 6 :</head><label>6</label><figDesc>Figure 6 : Exemple de mapping multiple due à la pré-coordination dans le NCI</figDesc><graphic coords="7,23.63,548.83,554.92,170.50" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_6"><head>L</head><label></label><figDesc>'utilisation du NCI Metathesaurus a permis de retrouver une majorité de correspondances 1-1 entre la CIM-O3 et le NCI. Cependant, plus de 30% des mappings obtenus sont soit 1-n soit 1-0. Le NCI Metathesaurus ne peut donc pas être utilisé directement pour obtenir un mapping code à code exact de la CIM-O3 vers le NCI. Un travail complémentaire doit ainsi être mené pour parvenir à cet objectif. L'analyse qualitative a permis de mettre en évidence les causes de mappings multiples ou d'absence de mapping dans le but de proposer des solutions ultérieurement. En présence de mappings 1-n, des règles de correction automatiques pourront être définies afin de déterminer la correspondance correcte et d'exclure les autres. Dans cette optique, une approche simple sera de comparer le terme préféré du code CIM-O3 avec les termes des codes NCI associés. Dans la figure6, on voit que le mapping entre le code 8260/3 « Papillary adenocarcinoma, NOS » et le code NCI C2853 « Papillary Adenocarcinoma » est correct puisque les deux termes sont équivalents tandis que celui entre 8260/3 et C6975 « Papillary Renal Cell Carcinoma » est faux. En effet, le terme NCI étant pré-coordonné, il décrit l'organe où se situe le carcinome alors que cette information n'est pas présente dans le code CIM-O3 auquel il est mappé. En considérant les termes associés aux codes NCI, on déterminera automatiquement que le mapping correct est vers C2853. Des méthodes de désambiguïsation par l'intermédiaire de la catégorisation sémantique, comme dans [14], pourraient également être appliquées. Comme l'illustre la figure 7, cela permettrait de résoudre des cas comme celui du code CIM-O3 C38.0 (« Heart » catégorisé par le type sémantique « Body Part, Organ, or Organ Component ») qui est mappé aux codes NCI C12727 (« Heart », également catégorisé par « Body Part, Organ, or Organ Component ») et C4570 (« Malignant Endocardial Neoplasm », catégorisé par le type sémantique « Neoplastic Process »). En filtrant les mappings suivant la catégorisation sémantique, on pourrait écarter automatiquement le deuxième mapping.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_7"><head>Figure 7 :</head><label>7</label><figDesc>Figure 7 : Exemple de désambiguïsation grâce aux types sémantiques</figDesc><graphic coords="8,115.86,715.46,370.79,54.36" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_0"><head></head><label></label><figDesc>3.3 Analyse du mapping code à code entre la CIM-O3 et le NCI Une analyse qualitative des mappings 1-n et 1-0 a été effectuée pour identifier des motifs de mapping multiple ou d'absence de mapping et tenter de les grouper par type d'erreur. Cette analyse a été réalisée manuellement afin de mettre en évidence des inexactitudes, des erreurs et des carences de mapping pouvant être résolues, afin de disposer d'un meilleur mapping de la CIM-O3 vers le NCI.</figDesc><table><row><cell>4 Résultats</cell><cell></cell></row><row><cell cols="3">4.1 Mapping entre la CIM-O3 et le NCI par le CUI</cell></row><row><cell>Tableau 1 :</cell><cell cols="2">Récapitulatif du mapping des codes CIM-O3 aux codes NCI par cardinalité du</cell></row><row><cell></cell><cell cols="2">mapping obtenu</cell></row><row><cell></cell><cell>Type de mapping</cell><cell>Nombre (pourcentage)</cell></row><row><cell></cell><cell>Mapping 1-1</cell><cell>1008 (67,2%)</cell></row><row><cell></cell><cell>Mapping 1-n</cell><cell>253 (16,9%)</cell></row><row><cell></cell><cell>Mapping 1-0</cell><cell>239 (15,9%)</cell></row></table><note>Le NCI Metathesaurus contient 3634 termes distincts issus de la CIM-O3, codés par 1500 codes CIM-O3 distincts, dont 1091 codes correspondant à des termes de morphologie et 409 codes correspondant à des termes de topographie. L'utilisation des CUI du NCI Metathesaurus permet de mettre en relation 1261 codes CIM-O3 avec 1670 codes du NCI (Figure3). En distinguant le type de code CIM-O3, 963 des 1091 codes morphologiques (soit 88,3%) et 298 des 409 codes topographiques (soit 72,9%) trouvent une correspondance avec un terme du NCI par l'intermédiaire du NCI Metathesaurus. Ainsi, 239 codes de la CIM-O3 (sur les 1500 présents dans le NCI Metathesaurus) ne sont pas mappés à un code NCI (soit 15,9%), correspondant aux mappings de cardinalité 1-0 (Tableau 1). Un exemple de ce type de cardinalité est le code C02.0 codant « Dorsal surface of tongue ».</note></figure>
		</body>
		<back>
			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<analytic>
		<title level="a" type="main">A review of the empirical evidence of the value of structuring and coding of clinical information within electronic health records for direct patient care</title>
		<author>
			<persName><forename type="first">D1</forename><surname>Kalra</surname></persName>
		</author>
		<author>
			<persName><forename type="first">B</forename><surname>Fernando</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Z</forename><surname>Morrison</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Sheikh</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Inform Prim Care</title>
		<imprint>
			<biblScope unit="volume">20</biblScope>
			<biblScope unit="issue">3</biblScope>
			<biblScope unit="page" from="171" to="180" />
			<date type="published" when="2012">2012</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b1">
	<monogr>
		<title level="m" type="main">Cancer registration: principles and methods</title>
		<author>
			<persName><forename type="first">O</forename><forename type="middle">M</forename><surname>Jensen</surname></persName>
		</author>
		<author>
			<persName><forename type="first">D</forename><forename type="middle">M</forename><surname>Parkin</surname></persName>
		</author>
		<author>
			<persName><forename type="first">R</forename><surname>Maclennan</surname></persName>
		</author>
		<author>
			<persName><forename type="first">C</forename><forename type="middle">S</forename><surname>Muir</surname></persName>
		</author>
		<author>
			<persName><forename type="first">R</forename><forename type="middle">G</forename><surname>Skeet</surname></persName>
		</author>
		<imprint>
			<date type="published" when="1991">1991</date>
			<publisher>IARC</publisher>
			<biblScope unit="volume">95</biblScope>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b2">
	<analytic>
		<title level="a" type="main">The Unified Medical Language System</title>
		<author>
			<persName><forename type="first">D</forename><forename type="middle">A</forename><surname>Lindberg</surname></persName>
		</author>
		<author>
			<persName><forename type="first">B</forename><forename type="middle">L</forename><surname>Humphries</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><forename type="middle">T</forename><surname>Mccray</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Methods Inf Med</title>
		<imprint>
			<biblScope unit="volume">32</biblScope>
			<biblScope unit="issue">4</biblScope>
			<biblScope unit="page" from="281" to="291" />
			<date type="published" when="1993">1993</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<analytic>
		<title level="a" type="main">Tools for mapping and merging ontologies</title>
		<author>
			<persName><forename type="first">N</forename><forename type="middle">F</forename><surname>Noy</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Handbook on Ontologies</title>
				<editor>
			<persName><forename type="first">S</forename><surname>Staab</surname></persName>
		</editor>
		<editor>
			<persName><forename type="first">R</forename><surname>Studer</surname></persName>
		</editor>
		<imprint>
			<publisher>Springer-Verlag</publisher>
			<date type="published" when="2004">2004</date>
			<biblScope unit="page" from="365" to="384" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b4">
	<analytic>
		<title level="a" type="main">A survey of schema-based matching approaches</title>
		<author>
			<persName><forename type="first">P</forename><surname>Shvaiko</surname></persName>
		</author>
		<author>
			<persName><forename type="first">J</forename><surname>Euzenat</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Journal on Data Semantics</title>
		<imprint>
			<biblScope unit="volume">4</biblScope>
			<date type="published" when="2005">2005</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b5">
	<analytic>
		<title level="a" type="main">Utilizing the UMLS for semantic mapping between terminologies</title>
		<author>
			<persName><forename type="first">K</forename><forename type="middle">W</forename><surname>Fung</surname></persName>
		</author>
		<author>
			<persName><forename type="first">O</forename><surname>Bodenreider</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">AMIA Annu Symp Proc</title>
		<imprint>
			<biblScope unit="page" from="266" to="270" />
			<date type="published" when="2005">2005</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b6">
	<analytic>
		<title level="a" type="main">Comparing drug-class membership in ATC and NDF-RT</title>
		<author>
			<persName><forename type="first">F</forename><surname>Mougin</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Burgun</surname></persName>
		</author>
		<author>
			<persName><forename type="first">O</forename><surname>Bodenreider</surname></persName>
		</author>
		<idno>-4503-0781-9</idno>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the 2nd ACM SIGHIT International Health Informatics Symposium</title>
				<meeting>the 2nd ACM SIGHIT International Health Informatics Symposium</meeting>
		<imprint>
			<publisher>ISBN</publisher>
			<date type="published" when="2012">2012</date>
			<biblScope unit="page" from="437" to="443" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b7">
	<analytic>
		<title level="a" type="main">Experience in Aligning Anatomical Ontologies</title>
		<author>
			<persName><forename type="first">S</forename><surname>Zhang</surname></persName>
		</author>
		<author>
			<persName><forename type="first">O</forename><surname>Bodenreider</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Int J Semant Web Inf Syst</title>
		<imprint>
			<biblScope unit="volume">3</biblScope>
			<biblScope unit="issue">2</biblScope>
			<biblScope unit="page" from="1" to="26" />
			<date type="published" when="2007">2007</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b8">
	<analytic>
		<title level="a" type="main">Issues in integrating epidemiology and research information in oncology: experience with ICD-O3 and the NCI Thesaurus</title>
		<author>
			<persName><forename type="first">A</forename><surname>Burgun</surname></persName>
		</author>
		<author>
			<persName><forename type="first">O</forename><surname>Bodenreider</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">AMIA Annu Symp Proc</title>
		<imprint>
			<biblScope unit="page" from="85" to="89" />
			<date type="published" when="2007">2007</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b9">
	<monogr>
		<author>
			<persName><forename type="first">A</forename><surname>Fritz</surname></persName>
		</author>
		<author>
			<persName><forename type="first">C</forename><surname>Percy</surname></persName>
		</author>
		<author>
			<persName><forename type="first">A</forename><surname>Jack</surname></persName>
		</author>
		<author>
			<persName><forename type="first">K</forename><surname>Shanmugaratnam</surname></persName>
		</author>
		<author>
			<persName><forename type="first">L</forename><surname>Sobin</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><surname>Parkin</surname></persName>
		</author>
		<title level="m">International classification of diseases for oncology</title>
				<meeting><address><addrLine>Geneva</addrLine></address></meeting>
		<imprint>
			<publisher>World Health Organization</publisher>
			<date type="published" when="2000">2000</date>
		</imprint>
	</monogr>
	<note>3 rd ed</note>
</biblStruct>

<biblStruct xml:id="b10">
	<analytic>
		<title level="a" type="main">The National Cancer Institute&apos;s Thesaurus and Ontology</title>
		<author>
			<persName><forename type="first">J</forename><surname>Golbeck</surname></persName>
		</author>
		<author>
			<persName><forename type="first">G</forename><surname>Fragoso</surname></persName>
		</author>
		<author>
			<persName><forename type="first">F</forename><forename type="middle">W</forename><surname>Hartel</surname></persName>
		</author>
		<author>
			<persName><forename type="first">J</forename><surname>Hendler</surname></persName>
		</author>
		<author>
			<persName><forename type="first">J</forename><surname>Oberthaler</surname></persName>
		</author>
		<author>
			<persName><forename type="first">B</forename><surname>Parsia</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">J Web Semantics</title>
		<imprint>
			<biblScope unit="page" from="75" to="80" />
			<date type="published" when="2003">2003</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b11">
	<analytic>
		<title level="a" type="main">Discovering Missed Synonymy in a Large Concept-Oriented Metathesaurus</title>
		<author>
			<persName><forename type="first">W</forename><surname>Hole</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><surname>Srinivasan</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">AMIA Annu Symp Proc</title>
		<imprint>
			<biblScope unit="page" from="354" to="358" />
			<date type="published" when="2003">2003</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b12">
	<analytic>
		<title level="a" type="main">Improving the mapping between MedDRA and SNOMED CT</title>
		<author>
			<persName><forename type="first">F</forename><surname>Mougin</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><surname>Dupuch</surname></persName>
		</author>
		<author>
			<persName><forename type="first">N</forename><surname>Grabar</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Artificial Intelligence in Medicine</title>
				<editor>
			<persName><forename type="first">M</forename><surname>Peleg</surname></persName>
		</editor>
		<editor>
			<persName><forename type="first">N</forename><surname>Lavrač</surname></persName>
		</editor>
		<editor>
			<persName><forename type="first">C</forename><surname>Combi</surname></persName>
		</editor>
		<meeting><address><addrLine>Berlin Heidelberg</addrLine></address></meeting>
		<imprint>
			<publisher>Springer</publisher>
			<date type="published" when="2011">2011</date>
			<biblScope unit="volume">6747</biblScope>
			<biblScope unit="page" from="220" to="224" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b13">
	<monogr>
		<title level="m">Adresse de correspondance Equipe de Recherche en Informatique Appliquée à la Santé ISPED -Université de Bordeaux 146 Rue Léo Saignat 33076 Bordeaux berenice</title>
				<imprint/>
	</monogr>
	<note>brechat@isped.u-bordeaux2</note>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
