George Oliveira Ainsworth Jr.
Resumo
Este trabalho apresenta uma implementação em paralelo do método de Arnoldi/Lanczos com reinício implícito para a solução de problemas de autovalor discretizados pelo método dos elementos finitos. O método de Arnoldi/Lanczos utiliza um esquema de reinício implícito para melhorar a convergência da faixa do espectro desejada, controlando a ortogonalidade da base do subespaço de Krylov. A implementação é voltada para arquiteturas de memória distribuída, visando a utilização de clusters de pc’s. Na solução em paralelo empregou-se uma estratégia de subdomínio por subdomínio e dois tipos de particionamentos de malha são utilizados: particionamento sem sobreposição e particionamento com sobreposição de domínios. Para o armazenamento dos coeficientes foi utilizado estruturas de dados comprimidas no formato CSRC e CSRC/CSR. Discute-se a paralelização das operações de álgebra linear computacional presentes nos métodos baseados no subespaço de Krylov e no esquema de reinício implícito. Para comprovar a eficiência e aplicabilidade da implementação, mostram-se exemplos numéricos envolvendo problemas simétricos e não-simétricos.
Abstract
This work presents a parallel implementation of the implicitly restarted Arnoldi/Lanczos method for the solution of eigenproblems approximated by the finite element method. The implicitly restarted Arnoldi/Lanczos uses a restart scheme in order to improve the convergence of the desired portion of the spectrum, maintaining the orthogonality of the Krylov basis. The presented implementation is suitable to be used in distributed memory architectures, specially pc’s clusters. In the parallel solution, the subdomain by subdomain approach was implemented and overlapping and non-overlapping mesh partitions were used. Compressed data structures in the formats CSRC and CSRC/CSR were used to store the global matrices coefficients. The parallelization of the operations of numerical linear algebra presented in both Krylov and implicitly restarted methods are discussed. In order to point out the efficiency and applicability of the proposed algorithms, numerical examples are shown.