Abstract
Bakterier er allestedsnærværende organismer; de findes alle steder, hvor liv er muligt. Særlige bakterier er i stand til at fungere med meget varierende livsformer og de kan for eksempel kategoriseres som værtsassocierede eller fritlevende. Derfor er disse organismer nødt til at besidde et stort og varierede genomisk arsenal for at kunne tåle forholdende i forskellige miljøer. For at undersøge det genetiske repertoire som muligvis er associeret med en given livsform, har vi udviklet to tilgange til emnet. Begge metoder kombinerer evolutionær sekvensanalyse med statistiske lærermetoder (Random Forest med egenskabsbaserede valg, modelmodificering og hårdførhedsanalyse).
Til at begynde med ledte vi efter homologe gen-sæt, der skulle kunne adskille aktinobakterielle patogenitetklasser. Vi indbefatter 240 aktinobakterier inddelt i fire patogenitetklasser: humane patogener (HP), bredspektrede patogener (BP), opportunistiske patogener (OP), og ikke-patogenetiske (IP). Faktisk fandt vi homologe gen-sæt, som adskiller patogener fra ikke-patogenetiske. Vi viser desuden et tydeligt grænseskel i at differentiere opportunistiske patogener fra både ikke-patogener og patogener. Humane patogener bør heller ikke adskilles fra bakterier, der er opfattet som bredspektrede patogener baseret på kun et lille sæt ortologe gener alene, da mange humane patogener muligvis også rammer en bred vifte af pattedyr uden at have været annoteret således.
Endelig, for at forenkle identifikationen af genomiske egenskaber, der muligvis påvirker bakteriers tilpasning til en bestemt placering, introducerer vi LifeStyle-Specific-Islands (LiSSI). LiSSIs udviklingsface er en udvidelse af vores tidligere fremgangsmåde. Vores strategi sigter kort fortalt efter, at identificere bevarede kontinuerlige homologisekvenser (øer) i genomer, samt at identificere de mest diskriminerende øer for hver livsform. For at illustrere de hovedsagelige funktioner ekspanderede vi vores research fra kun at indebære patogenitetklasser til at inkludere tolerance til atmosfærisk oxygen (aerobe, anaerobe, fakultative) og habitat (jord og akvatisk). Dybest set fandt vi ud af, at øer lader til at bære mindre vægt i klassificeringspræstationen. Det ser ud til at geners orden er dårligt bevarede blandt bakteriearter, hvilket måske gør individuelle gener mere egnede til at klassificere.
Som konklusion illustrerer vi, at selv i den mest post-genome æra og trods næste generations sekvenseringsteknologi er vores evne til effektivt at komme med konklusioner fra virkelighedens verden, som for eksempel patogenetisk klassificering meget begrænset. Ydermere introducerer LiSSI, en bioinformatisk pipeline til at identificere signaturgener eller –øer (bevarede, kontinuerlige homologisekvenser) der adskiller bakterielle livsformer.
Til at begynde med ledte vi efter homologe gen-sæt, der skulle kunne adskille aktinobakterielle patogenitetklasser. Vi indbefatter 240 aktinobakterier inddelt i fire patogenitetklasser: humane patogener (HP), bredspektrede patogener (BP), opportunistiske patogener (OP), og ikke-patogenetiske (IP). Faktisk fandt vi homologe gen-sæt, som adskiller patogener fra ikke-patogenetiske. Vi viser desuden et tydeligt grænseskel i at differentiere opportunistiske patogener fra både ikke-patogener og patogener. Humane patogener bør heller ikke adskilles fra bakterier, der er opfattet som bredspektrede patogener baseret på kun et lille sæt ortologe gener alene, da mange humane patogener muligvis også rammer en bred vifte af pattedyr uden at have været annoteret således.
Endelig, for at forenkle identifikationen af genomiske egenskaber, der muligvis påvirker bakteriers tilpasning til en bestemt placering, introducerer vi LifeStyle-Specific-Islands (LiSSI). LiSSIs udviklingsface er en udvidelse af vores tidligere fremgangsmåde. Vores strategi sigter kort fortalt efter, at identificere bevarede kontinuerlige homologisekvenser (øer) i genomer, samt at identificere de mest diskriminerende øer for hver livsform. For at illustrere de hovedsagelige funktioner ekspanderede vi vores research fra kun at indebære patogenitetklasser til at inkludere tolerance til atmosfærisk oxygen (aerobe, anaerobe, fakultative) og habitat (jord og akvatisk). Dybest set fandt vi ud af, at øer lader til at bære mindre vægt i klassificeringspræstationen. Det ser ud til at geners orden er dårligt bevarede blandt bakteriearter, hvilket måske gør individuelle gener mere egnede til at klassificere.
Som konklusion illustrerer vi, at selv i den mest post-genome æra og trods næste generations sekvenseringsteknologi er vores evne til effektivt at komme med konklusioner fra virkelighedens verden, som for eksempel patogenetisk klassificering meget begrænset. Ydermere introducerer LiSSI, en bioinformatisk pipeline til at identificere signaturgener eller –øer (bevarede, kontinuerlige homologisekvenser) der adskiller bakterielle livsformer.
| Originalsprog | Engelsk |
|---|---|
| Bevilgende institution |
|
| Vejledere/rådgivere |
|
| Udgivelsessted | Odense |
| Udgiver | |
| Status | Udgivet - jun. 2016 |