Die hier vorliegenden Ergebnisse umfassen Untersuchungen zur Qualität der Imputation mit Hilfe der Programme FImpute und findhap. Hierfür wurde ausgehend von den Ergebnissen eines SNP-Chips mittlerer Dichte (Illumina BovineSNP50) auf eine hohe SNP-Dichte (Illumina BovineHD) imputiert. Dabei wurde die Imputationsgenauigkeit beider Programme mit Bezug auf mögliche Unterschiede zwischen Tieren und im Hinblick auf spezifische chromosomale Gegebenheiten untersucht. Als Einflussfaktoren wurden der Anteil HD-genotypisierter männlicher Vorfahren und die unterschiedliche chromosomale SNP-Abdeckung betrachtet. Dafür wurden zusätzlich die Chip-Annotationen der beiden verwendeten SNP-Markersets analysiert und auf vier verschiedene Aspekte der chromosomenweiten Abdeckung untersucht. Außerdem wurde die Eignung beider Programme für eine Anwendung zur Genotypenaufbereitung unter Routinebedingungen geprüft, bei der die Vollständigkeit der imputierten Genotypen und der Bedarf an technischen Ressourcen im Vordergrund standen.
Es konnte gezeigt werden, dass sowohl chromosomale Gegebenheiten als auch unterschiedliche Gegebenheiten auf der Tierebene zu unterschiedlichen Imputationsgenauigkeiten führen können. Das Programm findhap zeigte in beiderlei Hinsicht einen deutlicheren Einfluss der Gegebenheiten auf den Imputationserfolg im Vergleich zum Programm FImpute. Mit FImpute wurde zudem durchweg höhere Imputationsgenauigkeiten erreicht.
The aim of this study was to investigate imputation quality from two widely used imputation software packages (FImpute and findhap) in imputing from 50k to HD. Three different aspects with respect to imputation quality were investigated: (1) differences between software programs, (2) differences in the number of HD-genotyped ancestors for four different groups of animals and (3) differences in marker coverage between chromosomes. For this purpose the Illumina chip annotations of two 50k chips (BovineSNP50 v1 and v2) and the HD chip (BovineHD) were examined to find large physical gaps between adjacent SNPs or areas on the chromosome with a low marker density. After that, both programs were tested under routine conditions to assess the completeness of imputation and the amount of computational resources required.
It turned out that imputation quality is influenced by differences between chromosomes and by differences between groups of animals with respect to the degree of HD genotyped ancestors in the reference population. Both differences had a greater impact on the performance of findhap as compared to FImpute. Furthermore using FImpute resulted in higher imputation accuracy in the considered categories of this study.