Márcio Aarestrup Arbex

Título



Clusterização de Grupos Contemporâneos com Tamanho Reduzido para as Avaliações Genéticas de Rebanhos Leiteiros

Orientador(es)



Nelson Francisco Favilla Ebecken e Cláudio Napolis Costa

Resumo



As avaliações genéticas de bovinos leiteiros utilizam, na maioria, estruturas definidas como grupos contemporâneos para comparação dos desempenhos entre grupos através dos efeitos ‘rebanho-estação-controle’. Adaptando este efeito como fixo pode-se minimizar a tendência ao erro nas avaliações genéticas, mas requer um número mínimo de observações por grupo contemporâneo para, simultaneamente, maximizar o efeito do número de observações e minimizar o erro residual e a variância do erro de predição. Mais de dois milhões de registros foram disponibilizados pela Associação Brasileira dos Criadores de Bovinos da Raça Holandesa distribuídos em 1816 rebanhos, com base na produção de 104138 vacas ao parto entre 1985 a 2008, filhas de 4267 touros, para avaliar os efeitos da clusterização em grupos contemporâneos com pequenos rebanhos baseados na similaridade de seus ambientes de produção. As análises dos principais componentes foram utilizadas para sumarizar onze variáveis descritivas em seis autovetores que explicaram 93,28% da variação total dos dados. Quatro diferentes abordagens foram aplicadas para grupos de rebanhos tendo pelo menos 3, 5, 10 ou 15 observações por grupo contemporâneo. Baseados no processo de clusterização hierárquica, somente rebanhos sem o número requerido de observações por grupo contemporâneo foram usadas no processo de clusterização. Os resultados foram comparados com a quantidade de grupos contemporâneos antes da clusterização e entre os outros conjuntos abordados.

Abstract



Genetic evaluations of dairy cattle use structures defined as contemporary groups for comparison of performance between groups through the 'herd-station-test day’ effects. Fitting this effect as fixed may minimize prediction bias, but requires a minimum number of observations per contemporary groups to simultaneously maximize the effective number of observations and minimize the residual error and prediction error variance. Most 2 million test-day records from the Associação Brasileira dos Criadores de Bovinos da Raça Holandesa distributed in 1816 herds based on the production of 104,138 cows calving from 1985 through 2008, daughters of 4267 sires, were used to evaluate the effect of clustering contemporary groups from small herds based on the similarity of their production environments. Principal component analysis was used to summarize eleven descriptive variables in six eigenvectors that explained 93,28%  of the total variation. Four different approaches were built having at least 3, 5, 10, or 15 observations per contemporary group. Based on the process of hierarchical clustering, only herds without the required number of observations per contemporary groups were used in the clustering process. The results were compared with the amount of contemporary groups before clustering and among the other data sets.

Print