Samenvatting
Next-generation sequencing (NGS) heeft zich snel gevestigd als de huidige standaard in de genetische analyse. Deze omschakeling van microarray naar NGS vereist nieuwe statistische strategieën om de onderzoeksvragen aan te pakken. Ten eerste, NGS data bestaat uit discrete waarnemingen, meestal gekenmerkt door overdispersie en een overvloed aan nullen, gemeten over een groot aantal genomische eenheden. Chromatine immunoprecipitatie sequencing (ChIP-Seq) is primair gericht op het ontdekken van de onderliggende (latente) patroon van 'verrijking': meer in het bijzonder, de interacties tussen genen (of bredere gebieden van het genoom) en eiwitten coderen mogelijkerwijze het mechanisme van de regelgeving onder verschillende omstandigheden.
Een andere interessante probleemstelling omvat de clustering van deze waarnemingen in groepen die praktische relevantie en interpreteerbaarheid hebben. Aangezien genen of genetische regio’s mogelijkerwijs deelnemen aan verscheidene biologisch functies, is het redelijk om een enkele genomische eenheid mogelijkerwijze aan meerdere van deze clusters toe te wijzen.
Veel van deze complexe processen kunnen ook worden beschreven door stelsels van differentiaalvergelijkingen (ODE). Dit zijn wiskundige voorstellingen van de veranderingen van het systeem door de tijd, bestuurd door parameters waarin we geïnteresseerd zijn.
In dit proefschrift, pakken we de bovengenoemde taken en onderzoeksvragen aan, gebruikmakend van verschillende statistische strategieën, zoals modelgebaseerde clustering, grafische modellen, penalized smoothing en regressie. Wij stellen uitbreidingen van bestaande benaderingen voor om de bovenstaande processes beter te beschrijven en we werking hierbij binnen het Bayesiaanse paradigme, met de nadruk op de integratie van structurele afhankelijkheden - zowel in ruimte als tijd - van de data die tot onze beschikking staan.
Een andere interessante probleemstelling omvat de clustering van deze waarnemingen in groepen die praktische relevantie en interpreteerbaarheid hebben. Aangezien genen of genetische regio’s mogelijkerwijs deelnemen aan verscheidene biologisch functies, is het redelijk om een enkele genomische eenheid mogelijkerwijze aan meerdere van deze clusters toe te wijzen.
Veel van deze complexe processen kunnen ook worden beschreven door stelsels van differentiaalvergelijkingen (ODE). Dit zijn wiskundige voorstellingen van de veranderingen van het systeem door de tijd, bestuurd door parameters waarin we geïnteresseerd zijn.
In dit proefschrift, pakken we de bovengenoemde taken en onderzoeksvragen aan, gebruikmakend van verschillende statistische strategieën, zoals modelgebaseerde clustering, grafische modellen, penalized smoothing en regressie. Wij stellen uitbreidingen van bestaande benaderingen voor om de bovenstaande processes beter te beschrijven en we werking hierbij binnen het Bayesiaanse paradigme, met de nadruk op de integratie van structurele afhankelijkheden - zowel in ruimte als tijd - van de data die tot onze beschikking staan.
Originele taal-2 | English |
---|---|
Kwalificatie | Doctor of Philosophy |
Toekennende instantie |
|
Begeleider(s)/adviseur |
|
Datum van toekenning | 10-jun.-2016 |
Plaats van publicatie | [Groningen] |
Uitgever | |
Gedrukte ISBN's | 978-90-367-8960-8 |
Elektronische ISBN's | 978-90-367-8959-2 |
Status | Published - 2016 |