Métodos Bayesianos

Construção de tábuas de mortalidade de inválidos por meio de modelos estatísticos bayesianos

Autor(es) e Instituição: 
Aloísio Joaquim Freitas Ribeiro, UFMG
Edna Afonso Reis, UFMG
Joana Barbabela Barbosa, UFMG
Apresentador: 
Edna Afonso Reis

Este trabalho teve como objetivo a construção de tábuas de mortalidade de inválidos dos segurados de clientela urbana do Regime Geral da Previdência Social. Assumindo que o número de mortes em cada idade segue uma distribuição de Poisson, as taxas de mortalidade por idade simples foram graduadas por meio de métodos estatísticos bayesianos, pelo modelo paramétrico de Gompertz-Makehan, utilizando inferência estatística bayesiana. Foram construídas tábuas de mortalidade para homens e mulheres e intervalos de credibilidade para os parâmetros e componentes do modelo, bem como para as taxas de mortalidade e funções da tábua. Uma aplicação foi feita calculando-se uma anuidade e o passivo atuarial.

COMBINAÇÃO BAYESIANA DE MODELOS DE PREVISÃO SAZONAL

Autor(es) e Instituição: 
Kelly Christina da Silva Matos - UFRN
Paulo Sergio Lúcio - UFRN
Kaline Juliana Silva do Nascimento - UFRN
Mariana Barbosa da Silva - UFRN
Apresentador: 
Kelly Christina da Silva Matos

Neste trabalho desenvolver-se-á um modelo Bayesiano de previsão combinada para a realização de prognósticos climáticos em escala sazonal. O modelo é construído baseando-se na idéia inicialmente proposta por Granger (1980), adotada por Bunn (1985) e aprimorada por Wilcox et al. (1990) e Li et al. (2001), entre outros pesquisadores em diversas áreas das ciências. Desta forma, previsões pontuais, as melhores em termos de determinada métrica de concordância e eficiência, são combinadas linearmente (combinação convexa), para a obtenção das melhores projeções no tempo dos modelos estocásticos ajustados. O controle de qualidade das previsões deve ser feito através da análise dos resíduos e da avaliação do percentual de redução da variância não-explicada da modelagem combinada em relação à previsão individualizada.

Resumo estendido: 

Estimação Bayesiana dos parâmetros da Teoria de Resposta ao Item

Autor(es) e Instituição: 
Wesley de Jesus Silva
Euler Rodrigues de Alencar
Cibele Queiroz da Silva
Apresentador: 
Wesley de Jesus Silva

Este trabalho envolve o estudo de modelos de teoria de resposta ao item, de processos markovianos em estados contínuos e inferência bayesiana à estimação dos parâmetros da Teoria de Resposta ao Item (TRI).
Na literatura, há diversas formas de estimação dos parâmetros da TRI. O enfoque é dado à estimação bayesiana desses parâmetros, mais especificamente aos métodos bayesianos de estimação utilizando técnicas de Monte Carlo via Cadeias de Markov (MCMC). Serão utilizados algoritmos tradicionais, tais como o amostrador de Gibbs e o método de Metropolis-Hasting, a fim de simular uma amostra da distribuição a posteriori e assim obter as estimativas dos parâmetros de interesse.
Em geral, interessa-se estimar tanto os parâmetros de habilidades quanto os parâmetros dos itens. Porém, o objetivo é obter apenas estimativas dos parâmetros dos itens, e um enfoque maior será dado ao modelo de respostas binárias com dois parâmetros.

Resumo estendido: 

Utilização de modelos de mistura com correlação espacial no mapeamento do risco de mortalidade por câncer de pulmão no sul do Brasil

Autor(es) e Instituição: 
Márcia Helena Barbian
Renato Martins Assunção
Marcelo Azevedo Costa
Apresentador: 
Márcia Helena Barbian

Nesse trabalho, será abordado um método semiparamétrico que utiliza campos aleatórios markovianos ocultos. A função \textit{a priori} assume um modelo de mistura correlacionado espacialmente. Utiliza-se o algoritmo de Monte Carlo via Cadeias de Markov com saltos reversíveis para obter-se aproximações para as distribuições \textit{a posteriori} dos parâmetros. Como ilustração da metodologia estudada, foi analisada a taxa de mortalidade por câncer de traquéia, brônquios e pulmões nos estados de São Paulo, Paraná, Santa Catarina e Rio Grande do Sul no ano de 2007. Além disso, procedeu-se a simulação de dados, para avaliar o desempenho do modelo e para compará-lo com a metodologia paramétrica comumente aplicada.

Trabalho completo: 

Modelo Partição Produto com "Clusters'' Correlacionados

Autor(es) e Instituição: 
Jacqueline Alves Ferreira
Rosangela Helena Loschi
Marcelo Azevedo Costa
Apresentador: 
Jacqueline Alves Ferreira

Identificar pontos de mudança é extremamente útil em diversas áreas de conhecimento, como por exemplo, economia, engenharia, hidrologia, medicina, meteorologia entre outras. Neste trabalho, esse problema será tratado do ponto de vista bayesiano, através de uma extensão do Modelo Partição Produto (MPP). Apesar do MPP ser amplamente utilizado na literatura para análise de dados sequenciais, em geral, é feita a suposição de que os parâmetros comuns que indexam as observações nos diferentes blocos ou "clusters" são independentes. Esta dissertação propõe um modelo tipo partição produto, o qual inova por assumir que estes parâmetros comuns são correlacionados. Esta correlação é introduzida no modelo através da distribuição a priori para tais parâmetros, baseada na idéia de processos de Markov. Especificamente, considerar-se-á a identificação de pontos de mudança na média da distribuição normal, cuja variância é considerada desconhecida, porém fixa ao longo do tempo. O modelo proposto é avaliado no contexto de dados sequenciais e os resultados obtidos são comparados com os resultados do MPP original Barry & Hartigan (1993), e a extensão do MPP proposta por Monteiro, Loschi & Assunção (2008).

Binary response state space models with Scale Mixture of Normal Links

Autor(es) e Instituição: 
Renata Souza Bueno
Carlos A. Abanto Valle
Apresentador: 
Renata Souza Bueno

Observation-driven state space models with scale mixture of normal links are presented for binary time series as a robust alternative to the usual normal setup which is commonly used in the literature. We develop an efficient Markov chain Monte Carlo (MCMC) estimation procedure for the proposed state space models. An application using the (aggregated) Tokyo rainfall data set (Knorr-Held, 1999) is analised.

Resumo estendido: 

Efeito de prioris objetivas, estratificação da população e tamanho amostral sobre a performance dos parâmetros de desempenho de testes diagnósticos para modelos identificáveis e não identificáveis, considerando a ausência de padrão ouro

Autor(es) e Instituição: 
Gilberto de Araujo Pereira-UFTM/UFSCAR
Francisco Louzada-Neto-UFSCAR
Luis Ernesto Bueno Salasar-UFSCAR
José Galvão Leite-UFSCAR
Hélio de Moraes-Souza-UFTM
Márcia Maria Ferreira-Silva-UFTM
Valdirene de Fátima Barbosa-UNIUBE
Apresentador: 
Gilberto de Araujo Pereira

O primeiro objetivo foi avaliar, a partir de estudo de simulação, o efeito de três diferentes prioris objetivas e diferentes tamanhos amostrais sobre a probabilidade de cobertura e amplitude dos intervalos de credibilidade e o segundo foi avaliar foi avaliar o efeito dessas mesmas prioris objetivas, da técnica de estratificação da população e de diferentes tamanhos amostrais sobre a performance dos parâmetros de desempenho de múltiplos testes diagnósticos na ausência de padrão ouro, considerando dois e seis testes e duas estruturas para o modelo: primeira, o modelo de Hui e Walter com diferentes taxas de prevalências mas com sensibildades e especificidades semelhantes entre os estratos e segunda, uma extensão a este modelo considerando todos os parâmetros tais como taxas de prevalências, sensibilidades e especificidades diferentes entre os estratos, ambas estruturas consideramos quatro diferentes tamanhos de amostras (n=[50, 100, 500, 1000]) e três diferentes configurações para a taxas de prevalências nos estratos. No primeiro estudo observamos de forma geral, comportamento semelhante dos intervalos de credibilidade USUAL para qualquer valor de theta no intervalo [0,1]$ e amostras grandes (n > 500) para as três prioris, mas para amostras menores $(n < 200) a priori de Jeffreyes apresentou melhor desempenho nos limites de theta e pior nos valores intermediários. No segundo estudo, observamos para o modelo com dois testes e estrutura sem estratificação da população que o aumento do tamanho amostral aumenta a acurácia das estimativas. Considerando o modelo com estrutura estratificada (V=3) quando somente as taxas de prevalências são diferentes entre os estratos, encontramos estimativas mais precisas mesmo para amostras menores. Enquanto que para o segundo modelo, com prevalências, sensibilidades e especificidades diferentes entre os estratos encontramos estimativas mais precisas para amostras maiores, sendo a sensibildade mais acurada nos estratos com maior prevalência e a especificidade nos estratos com menor taxa de prevalência. Para todos os casos particulares a priori de Jeffreys apresentou melhor performance. Concluímos portanto que, para grandes amostras (n> 500) a segunda estrutura de modelo parece ser uma boa alternativa para avaliar a performance de múltiplos testes diagnósticos na ausência de padrão ouro a partir da priori de Jeffreys, principalmente por este estar mais próximo da realiadade do que a primeira (suposição do modelo de Hui e Walter), no entanto, devemos tomar muito cuidado naqueles estratos com taxa de prevalência próximas de 0 ou 1. Para amostras menores (n< 200) sugerimos o uso de prioris informativas. Taxas de prevalências próximas de 50% temos boas estimativas para qualquer tamanho amostral e modelos (dois ou seis testes e estratificado ou não estratificado).

Avaliação do Modelo Total de Sucessos (MTS) para Regressão Logística com Erros de Classificação utilizando Distribuições a Priori Normais

Autor(es) e Instituição: 
Magda Carvalho Pires, Departamento de Estatística - UFMG
Danilo Garbazza Vieira, Departamento de Estatística - UFMG
Roberto da Costa Quinino, Departamento de Estatística - UFMG
Apresentador: 
Magda Carvalho Pires

Sob o enfoque bayesiano, considera-se o modelo logístico em que a variável resposta está sujeita a erros de classificação. Visando minimizar o impacto desses na estimação dos coeficientes da regressão, propõe-se realizar classificações repetidas e independentes dos elementos amostrais e incorporar ao modelo o número total de sucessos obtidos nessas avaliações. O modelo proposto utiliza diferentes distribuições a priori Normais independentes para os coeficientes de regressão e distribuições a priori independentes Betas para os erros de classificação. Para o processo de inferência a posteriori, utiliza-se abordagem de dados aumentados, Gibbs Sampler e o método de rejeição adaptativo com Metropolis. Comparando-se os resultados obtidos com aqueles em que não há erros de classificação, o MTS apresenta resultados mais satisfatórios na medida em que a distribuição a priori dos erros de classificação e dos coeficientes de regressão é mais informativa e o número de classificações repetidas é maior. Como esperado, os resultados utilizando classificações repetidas são mais satisfatórios que aqueles quando se utiliza apenas uma classificação do elemento.

Modelos espaço-temporais bayesianos para respostas na família exponencial: uma aplicação a dados de chuva na Austrália

Autor(es) e Instituição: 
Ana Carolina Carioca da Costa - DME/UFRJ
Nícia Custódio Hansen - IBGE
Marina Silva Paez - DME/UFRJ
Flávia Maria Pinto Ferreira Landim - DME/UFRJ
Apresentador: 
Ana Carolina Carioca da Costa

Dados provenientes de diversas áreas tais como ciências ambientais, epidemiologia, agricultura, sociologia, etc. são caracterizados pela variabilidade no espaço e no tempo. Em particular, processos ambientais são, em sua maioria, contínuos no tempo e no espaço, variando assim de forma suave em ambas as dimensões. Em geral, é assumido que as observações são normalmente distribuídas, o que na prática raramente ocorre. Neste trabalho, a suposição de normalidade é relaxada e são propostos modelos espaço-temporais para respostas na família exponencial, levando em consideração a dependência tempo e espaço. Considere um conjunto de períodos de tempo discreto, t = 1,...,T, em que para cada t observa-se a variável aleatória Y em um conjunto de N locais no espaço. Suponha que Y tenha distribuição f(.) pertencente à família exponencial com uma determinada média. Suponha também que uma função dessa média possa ser modelada através de uma equação de regressão, em que os coeficientes da regressão são dinâmicos no tempo e variam suavemente no espaço seguindo um processo gaussiano. Essa metodologia é aplicada para modelar as quantidades trimestrais de chuva de 1900 a 2002 ao longo de 34 estações pluviométricas na Austrália. O interesse é não apenas estimar os parâmetros do modelo, mas também fazer previsões no tempo e interpolação no espaço. O procedimento de inferência é feito sob o enfoque bayesiano e o interesse é desenvolver uma metodologia de estimação através dos métodos de Monte Carlo via cadeias de Markov. Em uma primeira etapa, dados simulados a partir dos modelos propostos foram utilizados para a validação do algoritmo.

Resumo estendido: 

Modelo Longitudinal Multinível com estrutura Hankel para a Teoria da Resposta ao Item

Autor(es) e Instituição: 
Caio L. N. Azevedo, Departamento de Estatística, IMECC, Unicamp
Jean-Paul Fox, Departamento de Metodologia em pesquisa e Análise de dados, University of Twente
Dalton F. Andrade, Departamento de Informática e Estatística, INE,UFSC
Apresentador: 
Caio L. N. Azevedo

A Teoria da Resposta ao Item (TRI) é um conjunto de modelos que visam mensurar características latentes de indivíduos através de instrumentos de medida adequados para esse fim. Tal mensuração é feita através da probabilidade dos indivíduos obterem algum escore em cada um dos itens (questões) que compões o instrumento de medida. Uma situação bastante comum consiste em acompanhar estudantes ao longo dos anos (séries escolares) a fim de medir a evolução do conhecimento dos mesmos em alguma área de interesse, por exemplo, em Matemática. Isto pode ser feito, por exemplo, aplicando-se uma prova ao final de cada ano letivo. Tal estrutura caracteriza um estudo longitudinal no contexto da TRI. Neste caso, espera-se que os traços latentes dos mesmos indivíduos apresentem alguma estrutura de dependência (correlação) entre si. O principal objetivo do presente trabalho é o de propor um modelo da TRI que incorpore tal estrutura longitudinal através de uma abordagem multinível. Neste caso, consideramos que as medidas (provas) feitas nos mesmos indivíduos estão encaixadas (agrupadas) em cada um destes. Assim, através de um modelo multinível, contemplamos possíveis estruturas de dependência. Mais especificamente, exploramos a estrutura de covariância de Hankel heterocedástica sob normalidade dos traços latentes. A estrutura Hankel permite não só termos variâncias diferentes como também correlações diferentes entre os traços latentes. Á única restrição dessa estrutura é a de que as covariâncias são as mesmas. A abordagem desenvolvida permitiu a implementação de um algoritmo de Gibbs para a estimação bayesiana dos parâmetros do modelo. Estudos de simulação indicaram que o método de estimação proposto recupera apropriadamente os parâmetros do modelo. Além disso, a metodologia proposta foi utilizada na análise de um conjunto de dados longitudinais reais na área da educação. Os resultados indicaram a existência de correlações positivas entre os traços latentes dos estudantes.

Divulgar conteúdo