Improving quality of Colon Capsule Endoscopy: Steps toward clinical implementation

Maria Magdalena Buijs

Publikation: AfhandlingPh.d.-afhandling

61 Downloads (Pure)

Abstract

Introduktion: Kamerapillen til tyktarmen, eller Colon Capsule Endoscopy (CCE) blev introduceret i 2006, som en mindre invasiv diagnostisk undersøgelse af tyk- og endetarm. Retningslinjen fra European Society of Gastrointestinal Endoscopy (ESGE) accepterer brug af CCE til patienter, der ikke kan medvirke til koloskopi, samt efter inkomplet koloskopi. Vores forskningsgruppe har lavet studier på CCE siden 2015. Vores forskningsprojekter har fokuseret på at finde polypper, især adenomer, og tarmkræft. Da de fleste colorektale cancere udvikler sig fra adenomer, er det vigtigt at finde og fjerne disse. Risikoen for kræft øges med adenomets størrelse. Derfor bliver store adenomer (≥ 1 cm) set som høj-risiko polypper. De nuværende retningslinjer tilråder en kontrolkoloskopi efter man har fjernet store adenomer. En nyligt publiceret meta-analyse nævner, at CCE har en sensitivitet på 87 % og specificitet på 95 % for detektion af store polypper. Denne vurdering er baseret på at koloskopi er ’gold standard’, således at
polypper der kun er set med CCE er vurderet til at være falsk positive, mens de muligvis kunne have været falsk negative ved koloskopi. Selvom CCE virker som en god undersøgelse til at finde polypper, er der en del udfordringer, der skal være løst inden brugen kan udbredes yderligere. Denne afhandling handler om variabilitet, som bruges til vurdering af en undersøgelses kvalitet. Hvordan måler man polypstørrelse ved koloskopi og CCE? Finder
man de samme polypper, når forskellige læger kigger på CCE videoer, og når de samme læger vurderer de samme videoer flere gange? Er det muligt at bruge kunstlig intelligens til at vurdere CCE billederne, for at mindske variabilitet og øge konsistens af vurderingen? Denne afhandling giver et resumé på relevant
litteratur, samt en resumé af de fem artikler der er inkluderet i denne afhandling:


Studie I: Estimering af polypstørrelse på store kolorektale polypper, blev undersøgt ved to forskellige koloskopier, for at vurdere interobserver variabilitet i den nuværende daglige praksis. Den første koloskopi blev lavet af almindelige endoskopister, mens den anden koloskopi blev lavet af en ekspert endoskopist der brugte en instrument med kendt diameter, til at vurdere polypstørrelser. De estimerede polypstørrelser blev efterfølgende sammenlignet med polypstørrelsen vurderet ved patolog. Studiet viste en variation på maksimalt 17 mm mellem den første koloskopi og patologisk størrelse, ved den anden koloskopi var der en variation på maksimalt 9 mm i forhold til patologisk størrelse. Denne studie indikerer at estimering af polypstørrelse af store polypper er upræcis, selvom man er en ekspert endoskopist, og at man skal være kritisk på hvilke kliniske beslutninger man baserer på polypstørrelser.


Studie II: CCE videoer blev læst af tre eksperter og to begyndere, for at analysere variabiliteten i deres vurderinger. Eksperternes enighed var moderat på antal sete polypper og detektion af store polypper; og begyndere var ligeledes moderat enig med eksperterne. Intraobserver enighed blandt eksperter var fremragende for antal af polypper, samt for opdagelse af store polypper ved en af eksperterne. Begyndere opnåede kun dårlig eller moderat intraobserver enighed for polypdetektion. Intra- og interobserver enighed på udtømningskvalitet var dårlig eller moderat ved alle. Denne studie viser en fremragende ntraobserver
og acceptabel interobserver enighed ved eksperter, men at der især er udfordringer med at vurdere udtømningskvalitet hos både eksperter og begyndere. Study III: Polypper opdaget ved CCE og koloskopi blev matchet, med henblik på at sammenligne polypper
mellem de to undersøgelser, og for at finde polypperne der er blevet set flere gange ved CCE. En algoritme blev udviklet der kan matche polypper baseret på størrelse, morfologi og lokalisation. Efterfølgende har man analyseret de matchede polypper, og set at polypstørrelse blev overvurderet ved både koloskopi og CCE i forhold til den gold standard’ som er måling ved patologen. Ved de mindste polypper (≤ 5 mm), blev størrelse overvurderet med 135 %. De store polypper (≥ 10 mm) blev ikke overestimeret ved CCE, men underestimeret ved koloskopi. Man så signifikant flere stilkede polypper ved CCE, og mindre flade polypper
sammenlignet med koloskopi. Baseret på denne studie skal man være forsigtig med at bruge de nuværende CCE polyp størrelser, til at basere kliniske beslutninger på, især når det handler om de mindste polypper.


Study IV: Som beskrevet i studie II, kan vurderingen af udtømningskvalitet være en udfordring. Derfor blev der udviklet en algoritme, der er trænet til at skelne mellem beskidte og rene billeder, til at vurdere udtømningskvalitet ved CCE. Algoritmen er baseret på en vurdering af den enkelte pixel i et CCE billede,
som enten beskidt eller rent. Efterfølgende bliver der lavet en vurdering af udtømningskvaliteten af hele billedet, og derefter af hele videoen. Algoritmen blev sammenlignet med en anden algoritme, der vurderede renhed baseret på fordeling af farverne i billedets pixels. Begge algoritmer blev sammenlignet med
gennemsnittet fra de fire læger der havde deltaget i studie II, for at se hvordan algoritmerne vurderede udtømningskvalitet i forhold til læger. Farve-algoritmen var ikke sensitiv for at genkende dårlig udtømning, som er det vigtigste formål med klassifikation af udtømningskvalitet. Det nye algoritme, der var trænet til at vurdere renhed af den enkelte pixel, var i 47 % af videoer enig med lægerne, og i endnu 41 % kun en klasse fra lægernes vurdering. En store udfordring i dette studie er, at der ikke er en tydelig ”gold standard” til at vurdere udtømningskvalitet af hele CCE videoer. Alligevel ser der ud til at den nye algoritme kan bidrage til vurdering af udtømningskvalitet, eventuelt med hjælp fra en ekspertgruppe, der stiller tydelige tærskler for de forskellige grader af udtømningskvalitet. Tilføjelsen af CCE lokalisation til algoritmen, kan sandsynligvis forbedre vurderingen af udtømningskvalitet, da man så kan vurdere udtømningen i hver segment. Algoritmen kan også præsentere udtømningskvaliteten som en procentdel af ’rene’ billeder i forhold til alle billeder, for at give en nemt forståelig vurdering i den daglige praksis.


Studie V: En af de ting der vil gøre CCE billigere og nemmere at implementere, er en algoritme der pålideligt analyserer om der er polypper, samt hvor mange polypper der er tale om. Der blev udviklet en såkaldt convolutional neural network (CNN), der efterligner den menneskelige hjerne. Den blev oplært i at
genkende polypper ved CCE. CNN kunne genkende polypper i enkelte CCE billeder med en akkurathed på 98.0 %, sensitivitet på 98.1 % og specificitet på 96.3 %. Det var meget bedre end alle andre publicerede CNNs på nuværende tidspunkt. Sandsynligvis kan CNNen forbedres yderligere, når den trænes med flere
billeder og videoer. Ideelt skal sensitivitet for polypperne være 100%, for ikke at overse polypper. Man kan dog argumentere for, at så længe at CNN har en højere sensitivitet for polypper end en menneskelig ekspert, at man har opnået en acceptabelt niveau for uafhængig polypdetektion ved kunstig intelligens i CCE.


Diskussion og konklusioner: Denne afhandling viser at der er en stor variation i vurdering af polypstørrelse af store polypper ved koloskopi, og en acceptabelt variabilitet i ekspert vurderinger af CCE videoer. Udtømningskvalitet havde den dårligste interobserver enighed, og kan muligvis forbedres ved brug af
kunstig intelligens. Kunstig intelligens virker også lovende for polypdetektion ved CCE videoer, men er nødt til at blive valideret som mindst lige så godt som menneskelige eksperter, inden det kan blive implementeret i dagligpraksis. Det er dog vigtig at huske, at kunstig intelligens er stærkt afhængig af kvalitet og mængde af information, der er brugt til at træne algoritmerne. Det betyder at de algoritmer der er udviklet kan fortsæt forbedres, når man tilføjer data til databasen, samt at algoritmer kan rettes til baseret på nye udviklinger i computerteknik. Brugen af kunstig intelligens til at vurdere CCE videoer, som første
led, vil mindske hvor meget tid lægerne skal bruge til at vurdere CCE videoer, da de kun skal se på billeder algoritmen har selekteret. Ulempen vil være at der kan blive overset patologi, som algoritmen ikke er trænet til at genkende. Ydermere giver det en afhængighed af kunstig intelligens, hvor læger måske ikke længere er vant til at se på CCE videoer, og muligvis ikke selvstændig kan vurdere dem i fremtiden. Den største udfordring er dog de etiske og lovlige følger, hvis algoritmen overser relevant patologi. Er så computertekniker, læger eller en tredje part som sygehuset ansvarlig for denne fejl? En anden udfordring ved CCE, er hvilke kliniske konsekvenser bestemte resultater skal have. Ved CCE bliver der opdaget mange flere polypper end ved koloskopi, og man ved at 6-24% af polypper bliver overset ved koloskopi. Det betyder at det er muligt at en polyp er set flere gange ved CCE, og at der er en chance for at man faktisk ikke kan genfinde polyppen ved koloskopi. Vores tredje studie tyder også på at
polypstørrelse sandsynligvis bliver overestimeret, især ved de mindste polypper. En 7 mm CCE polyp, kunne faktisk være 3 mm ved koloskopi. Det er vigtig at tage sensitivitet af koloskopi for polypdetektion med, når man laver retningslinjer for CCE. Hvis man ikke kan genfinde CCE polypperne ved koloskopi, vil
man så lave en ny koloskopi, eller skal patienten bare fortsætter med det almindelig screeningsforløb? En af begrundelser for at implementere CCE, er at mindske antal af koloskopier, som nok ikke bliver opnået hvis man skal forsøge at genfinde alle CCE polypper. Derfor er det vigtigt at selektere de patienter hvor det
er sandsynligt at genfinde CCE polypper, til en koloskopi. En ekstra komplicerende faktor, er hvad man skal gøre ved screeningsdeltagere, som i princippet er raske borgere, med en lidt øget risiko for at have store polypper og cancer end gennemsnittet af befolkning. Ved screeningsdeltagere skal det afvejes om risiko for komplikationer ved koloskopi, er acceptabelt i forhold til fordel ved at få fjernet polypperne. Den kliniske information man kan basere retningslinjer på, er antal og størrelse af polypper ved CCE. Da langt de fleste små (≤ 5 mm) polypper er hyperplastiske, og derfor ufarlige, kunne man godt forsvare ikke at få fjernet de små polypper i raske borgere. Retningslinjer fra ESGE nævner da også en størrelse på 6 mm
som grænsen for koloskopi. Som tidligere nævnt har vi i studie III fundet, at det er sandsynligt at polypper bliver meget overestimeret ved CCE. Størrelsen målt ved patolog kunne være 4-5 mm mindre end ved CCE. Det betyder at en 9 mm CCE polyp godt kan være ≤ 5 mm i virkeligheden. Vores forskningsgruppe bruger på nuværende tidspunkt en grænse på 10 mm eller / og mindst 3 polypper for en henvisning til koloskopi. En anden mulighed vil være at lave en kontrol-CCE for at se hvordan små (< 10 mm) polypper udvikler sig. Der er flere studier der tyder på at risiko på kræft er meget lille i små polypper, og at kun 6 % af dem
udvikler sig til store adenomer ved kontrol-undersøgelse efter 1-3 år. Kunne det være bedre for patienterne at lave en kontrol-undersøgelse, end at risikere komplikationer af polypfjernelse? Hvis man bruger CCE til at kontrollere polypperne efter et par år, kunne man sandsynligvis nedsætte antallet af lavede koloskopier,
samt antal af tilhørende komplikationer. Risikoen ved en dårlig udtømningskvalitet, er at polypperne kan blive overset. Grænsen for hvornår udtømningen ved CCE er uacceptabelt, skal fastlægges, så man kan sammenligne resultaterne mellem
forskellige sygehuser og lande. Derfor kunne man bruge den nye CC-CLEAR klassifikation, som forhåbentlig kan implementeres i vores udtømningsalgoritme.

OriginalsprogEngelsk
Bevilgende institution
  • Syddansk Universitet
Vejledere/rådgivere
  • Baatrup, Gunnar, Vejleder
  • Steele, Robert, Vejleder
  • Kobæk Larsen, Morten, Vejleder
Eksterne samarbejdspartnere
Dato for forsvar7. apr. 2022
Udgiver
DOI
StatusUdgivet - 21. feb. 2022

Note vedr. afhandling

Den fulde afhandling kan læses på SDUs bibliotek.

Fingeraftryk

Dyk ned i forskningsemnerne om 'Improving quality of Colon Capsule Endoscopy: Steps toward clinical implementation'. Sammen danner de et unikt fingeraftryk.

Citationsformater