Events > Probability and Statistics Seminar

Abordagem Bayesiana à Selecção de Variáveis e Comparação de Modelos: Uma Aplicação à Medicina

25/10/2002 Friday 25th October 2002, 14:00 (Room P3.31, Mathematics Building)  More
Maria Antónia Amaral Turkman, DEIO/CEA - Faculdade de Ciências da Universidade de Lisboa

O problema da selecção do melhor conjunto de covariáveis pode ser visto na perspectiva de um problema de selecção de modelos. Recentemente tem havido investigação intensa sobre o problema de selecção de variáveis, particularmente em modelos lineares generalizados. Veja-se referências, por exemplo, em Dellaportas et al. (2000). Embora não haja nenhum método que se possa aconselhar como sendo o melhor, há vários métodos que devido à facilidade de implementação têm recebido mais atenção. Um desses métodos, o método de Carlin and Chib (1995), faz uso de pseudo-priors para obter uma estimativa da probabilidade a posteriori de cada modelo, seleccionando-se o modelo que tenha maior probabilidade a posteriori. Este método pode ser implementado no WinBUGS, mas o seu sucesso depende bastante de uma boa selecção de pseudo-priors que permita grande eficiência no método de amostragem. Dificuldades surgem na sua aplicação quando o número de modelos em consideração é elevado, situação que aparece com frequência em problemas de selecção de variáveis. Outro método bastante utilizado, de fácil implementação, e que tem dado resultados, é baseado numa pesquisa estocástica e conhecido pela sigla SSVS (Stochastic Search Variable Selection). Foi inicialmente proposto por George and McCullog (1993) para modelos de regressão linear e mais tarde por George et al. (1996) e para modelos lineares generalizados. Estes métodos serão aqui brevemente discutidos a par com um método informal de pesquisa manual (SIMD) baseado na minimização de medidas de divergência adequadamente definidas. Será feita uma comparação dos métodos referidos através da sua aplicação a um conjunto de dados na identificação de factores de risco que são responsáveis pela ocorrência precoce de doenças vasculares.