TY - THES ID - 2991351 TI - Normalizing microarray data : estimating absolute expression levels AU - Engelen, Kristof AU - Katholieke Universiteit Leuven PY - 2005 SN - 9056826697 PB - Heverlee Katholieke Universiteit Leuven. Faculteit Ingenieurswetenschappen DB - UniCat KW - 681.3*J3 <043> KW - Academic collection KW - Life and medical sciences (Computer applications)--Dissertaties KW - Theses KW - 681.3*J3 <043> Life and medical sciences (Computer applications)--Dissertaties UR - https://www.unicat.be/uniCat?func=search&query=sysid:2991351 AB - Normalisatie van microroosterdata: schatten van absolute expressiewaardes Microroosters zijn een relatief complexe technologie, die toelaten de mRNA-expressieniveaus van duizenden genen tegelijkertijd te meten. Normalisatie van de metingen is de eerste stap in de analyse van microroosterdata. De bedoeling ervan is het verwijderen van consistente en systematische bronnen van variatie, zodat metingen van verschillende microroosters en biologische condities onderling vergeleken kunnen worden. Normalisatie van de data heeft een substantiële invloed op de resultaten van alle daaropvolgende analyses en de biologische interpretatie ervan. Gedurende de voorbije jaren zijn verscheidene methodes voor de normalisatie van microroosterdata ontwikkeld die als standaard kunnen beschouwd worden. Hoewel sommige van deze aanpakken inherent werken met absolute intensiteiten, is het verwerken van microroosterdata grotendeels gebaseerd op het berekenen van log-ratio’svan de gemeten intensiteiten. Daarnaast vertonen deze normalisatietechnieken weinig interesse in de onderliggende oorzaken van de geobserveerde systematische en willekeurige variaties van de gemeten intensiteiten. De normalisatiestrategieën die in deze thesis uitgewerkt zijn, zijn anders in opzet. De achterliggende idee is om rekening te houden met de fysische en biologische realiteit van het proces en om het normalisatieprobleem aan te pakken vertrekkende van absolute intensiteiten. De gemeten intensiteiten worden gemodelleerd op een fysisch en experimenteel betekenisvolle manier, om het zodoende mogelijk te maken om absolute waarden van genexpressie te schatten, in plaats van beperkt te zijn door de relatieve aard van intensiteitsratio’s. Initieel onderzoek bestond uit de evaluatie van procedures voor microroosternormalisatie steunend op ANOVA-modellen, en een vergelijkende studie met op ratio’s gebaseerde technieken. Verder onderzoek was gericht op de ontwikkeling van generische (toepasbaar op elk experimenteel design) ANOVA-modellen voor normalisatie van microroosterdata. Deze aanpak vertoonde echter verschillende tekortkomingen en daarom werd een geheel nieuwe methode ontwikkeld gebaseerd op een fysisch gemotiveerd calibratiemodel. Externe controles zijn een centraal onderdeel van deze methode aangezien ze toelaten de parameters van het calibratiemodel te schatten, dewelke op hun beurt kunnen gebruikt worden om absolute expressiewaarden voor de overige genen te berekenen. Normalizing microarray data: estimating absolute expression levels The microarray platform is a relatively complex technology that permits the simultaneous assessment of mRNA expression levels of thousands of genes in a single hybridization assay. Normalization of spotted microarray measurements, the first step in a microarray analysis trajectory, aims at removing consistent and systematic sources of variations to allow mutual comparison of measurements acquired from different slides and experimental settings. Data normalization largely influences the results of all subsequent analyses and the biological interpretation of these results, and is therefore a crucial phase in the analysis of microarray data. Over the past years, the field of microarray analysis finally seems to have adapted a few generally applied methodologies for data normalization. Although some approaches inherently work with absolute intensities, in general, normalization of spotted microarrays largely revolves around the calculation of the log-ratios of the measured intensities. Moreover, these techniques generally show little interest in the underlying causes of the observed systematic and random variation in microarray data. The normalization methods we pursue in this thesis differ in spirit from standard log-ratio approaches. The basic premise is to acknowledge the physical and biological reality of the process and address the normalization problem starting fromunits of absolute intensities. These measured intensities are to be modelled as a function of systematic sources of variation in a physically and experimentally meaningful way, and should allow for the calculation of an absolute value of expression instead of being limited to the relative nature of intensity ratios. During the initial research stage, the use of ANOVA for microarray normalization, at the time the only available method that allowed for calculation of absolute expression values, was evaluated and compared to ratio based approaches. Based on these results, further research was conducted towards the development and deployment of generic (applicable to any experimental setup) ANOVA models for microarray normalization. ANOVA approaches nevertheless suffer from several shortcomings. To circumvent these issues we developed a novel normalizing method for spotted microarray data, using external control spikes to fit a calibration model. External control spikes serve to estimate the model parameters. The obtained parameters values are then employed to estimate absolute levels of expression for the remaining genes. We illustrate the workings and principles of this method by applying it to a publicly available benchmark data set. ER -