Teoria

Métodos Bayesianos para Estimação em Modelos de Regressão Beta

Autor(es) e Instituição: 
Mariana Albi de Oliveira Souza - UFRJ
Helio dos Santos Migon - UFRJ
Cibele Queiroz da Silva - UNB
Apresentador: 
Mariana Albi de Oliveira Souza

Modelos de regressão são amplamente utilizados em diversas áreas de conhecimento pois contemplam situações em que a resposta de interesse depende de um conjunto de variáveis explicativas. Em particular, modelos lineares normais são os mais comumente utilizados na literatura, porém nem sempre são adequados por não contemplarem situações tais como assimetria, domínios limitados, etc.

Como alternativa a estes modelos, trataremos do modelo de regressão beta. Neste, assumiremos respostas contínuas restritas ao intervalo (0,1) modeladas através de distribuições beta cujas médias dependem de variáveis explicativas através de uma função de ligação. Além de acomodar assimetrias devido a flexibilidade desta família de distribuições, este modelo é especialmente interessante para análise de taxas, percentuais e proporções.

Abordaremos tal modelo através de uma perspectiva Bayesiana, apresentando diferentes métodos de estimação e comparando os resultados. Em particular, estimativas serão obtidas tanto através de estratégias numéricas, com a utilização de métodos de Monte Carlo via cadeias de Markov, quanto através de aproximações analíticas, com a utilização do INLA (Integrated Nested Laplace Approximation) e da estimação Linear de Bayes.

Exemplos com dados simulados e dados reais serão apresentados com o intuito de ilustrar os métodos.

Resumo estendido: 

Resíduos de Pearson melhorados em modelos de regressão beta

Autor(es) e Instituição: 
Tatiana Anholeto
Mônica Carneiro Sandoval
Denise Aparecida Botter
Apresentador: 
Mônica Carneiro Sandoval

Neste trabalho, desenvolvemos correções para resíduos de Pearson no modelo de regressão beta (Ferrari e Cribari-Neto, Journal of Applied Statistics, 2004) e propomos resíduos de Pearson melhorados de forma que a média e a variância dos resíduos melhorados estejam mais próximas de zero e de um, respectivamente. O trabalho foi baseado nos artigos de Cox e Snell (Journal of the Royal Statistical Society B, 1968), Cordeiro (Statistics and Probability Letters, 2004) e de Simas e Cordeiro (Journal of Statistical Computation and Simulation, 2009). Um estudo de simulação foi realizado, utilizando-se o método de Monte Carlo, para investigarmos o efeito da correção na média, variância e coeficientes de assimetria e curtose dos resíduos de Pearson não-melhorados e melhorados. Além disso, procuramos verificar a proximidade das distribuições dos resíduos abordados à distribuição normal padrão.

Resumo estendido: 

Aproximações Determinísticas para Distribuições a Posteriori Marginais

Apresentador/Autor: 
Thiago Guerrera Martins
Resumo: 

Um dos grandes desafios em estatística Bayesiana é obter, quando não há solução analítica disponível, aproximações para distribuições a posteriori marginais de forma precisa e eficiente. Nessa dissertação é feita uma revisão na literatura de métodos determinísticos para este fim em um contexto geral, e mostra-se que ainda há modelos de importância atual que são melhor estimados ao utilizar estes métodos em vez dos baseados em simulação. O método Integrated Nested Laplace Approximations (INLA), aplicado na importante classe de modelos que envolvem Campos Aleatórios Markovianos Gaussianos (CAMG), é descrito e, através de exemplificação, uma discussão qualitativa sobre o método é apresentada. Foi proposta a utilização do INLA para realização de inferência em modelos dinâmicos Bayesianos para processos pontuais espaço-temporais ao invés da abordagem usual que utiliza Markov Chain Monte Carlo (MCMC). Por fim, é apresentada uma importante extensão do INLA, onde a dependência entre o conjunto de dados e o campo latente, da forma como apresentada na descrição do INLA, é generalizada.

Comparação entre medidas clássicas e robustas para identificação de outliers em regressão.

Autor(es) e Instituição: 
Gabriela Isabel Limoeiro Alves
Verônica Maria Cadena Lima
Apresentador: 
Gabriela Isabel Limoeiro Alves

A técnica da análise de regressão linear não está completa sem o estudo dos resíduos para a identificação de possíveis outliers e de alguns outros diagnósticos. Outliers estão presentes em praticamente todos os conjuntos de dados, em qualquer domínio de aplicação. Pesquisas realizadas com grandes quantidades de observações tornam mais difíceis sua detectação visual. O objetivo desse trabalho é comparar as medidas clássicas com as medidas robustas para identificação de outliers. Entre as medidas clássicas foram consideradas: Leverage, DFBeta DFFit, Cook, Covratio e a distância de Malahanobis. As medidas robustas consideradas foram Elipsóide de Volume Mínimo e Covariância de Determinante Mínimo. Através da análise de vários conjuntos de dados, os resultados revelaram que as medidas robustas, que utilizam estimadores que “resistem” a uma proporção de dados contaminados, mostraram-se mais eficientes na identificação de outliers.

Resumo estendido: 

NOVOS PROCEDIMENTOS BAYESIANOS PARA TESTE DE HIPÓTESES BASEADOS EM AGRUPAMENTOS DE PROBABILIDADES

Autor(es) e Instituição: 
Cristiano de Carvalho Santos
Rosangela Helena Loschi
Apresentador: 
Cristiano de Carvalho Santos

O Teste de Jeffreys e o Teste de Significância Bayesiano Completo (FBST), são procedimentos bayesianos usuais para testes de hipóteses. O FBST foi introduzido na literatura com o objetivo de evitar o paradoxo de Jeffreys-Lindley, que pode ocorrer ao utilizar o Teste de Jeffreys para testar hipóteses precisas. Estudos anteriores tem mostrado que estes procedimentos podem, eventualmente, conduzir a decisões diferentes. Neste trabalho propõe-se dois novos procedimentos para teste cuja idéia central é obter uma medida de evidência sobre a hipótese nula que assuma valores intermediários entre as duas medidas existentes. Os procedimentos propostos são baseados nos agrupamentos de probabilidades linear e logarítmico. Propomos também um critério para definir o ponto de corte de forma a tornar comparáveis os resultados obtidos com os procedimentos considerados. Para comparar os procedimentos bayesianos usuais e os propostos, foi realizado um estudo de simulação Monte Carlo em situações em que consideramos dados gerados com distribuição exponencial, em que testamos se o parâmetro da exponencial é igual a valor arbitrário, e dados gerados com distribuição normal assimétrica, no qual testamos se parâmetro de assimetria é igual zero. Apresentamos resultados obtidos em uma aplicação a dados reais de séries de retorno de quatro mercados importantes da América Latina (MERVAL, IBOVESPA, IPSA e IPyC). Nesse caso consideramos que os dados tem distribuição normal assimétrica padrão e testamos se o parâmetro de assimetria é zero, ou seja, testamos se os dados tem distribuição normal padrão.

Matriz de covariâncias de estimadores de máxima verossimilhança corrigidos pelo viés de ordem $n^{-1}$ em modelos lineares generalizados com dispersão desconhecida

Autor(es) e Instituição: 
Alexsandro Bezerra Cavalcanti - UFCG
Denise Aparecida Botter - USP
Apresentador: 
Alexsandro Bezerra Cavalcanti

Neste trabalho obtemos uma fórmula para a matriz de covariâncias de segunda ordem dos estimadores de máxima verossimilhança corrigidos pelo viés de primeira ordem em modelos lineares generalizados com parâmetro de dispersão desconhecido porém o mesmo para todas as observações.

Resumo estendido: 

Modelos lineares com efeitos mistos com erros elípticos nas variáveis

Autor(es) e Instituição: 
Marco Riquelme, Universidade de São Paulo, São Paulo, Brasil
Heleno Bolfarine, Universidade de São Paulo, São Paulo, Brasil
Manuel Galea, Pontificia Universidad Católica de Chile, Santiago, Chile
Apresentador: 
Marco Riquelme

Neste trabalho é desenvolvido o método estimação do escore corrigido para o modelo linear misto com erros de medição nas varíaveis. Especificamente estudamos o caso quando a distribuição dos erros de medição pertencem na classe de distribuições de contornos elípticos. Se apresentam também resultados assintóticos dos estimadores obtidos e o desempenho do método proposto é estudado através de simulações.

Resumo estendido: 

Inferência em famílias estendidas de distribuições normais

Autor(es) e Instituição: 
Gustavo Henrique Mitraud Assis Rocha
Rosangela Helena Loschi
Reinaldo Boris Arellano-Valle
Apresentador: 
Gustavo Henrique Mitraud Assis Rocha

Neste trabalho há revisões sobre as famílias de distribuições normais assimétricas (Azzalini, 1985), normais bimodais (Arellano-Valle et al., 2008) e normais bimodais assimétricas (Elal-Oliveiro et al., 2009). Serão considerados os estimadores via método dos momentos, de máxima verossimilhança, as distribuições a posteriori e as densidades preditivas. Em cada uma das famílias consideradas serão estabelecidas condições para a existência de estimadores de máxima verossimilhança para os parâmetros. Serão construídos os algoritmos EM para cada um deles. Estudos Monte Carlo serão feitos em dados simulados para verificar a qualidade dos estimadores de máxima verossimilhança e dos estimadores bayesianos esperança e moda a posteriori. Outro estudo Monte Carlo é realizado para averiguar as mudanças no comportamento dos estimadores bayesianos quando se altera a variabilidade a priori de cada um dos parâmetros. Por fim, serão realizadas inferências nos dados de fronteira de Azzalini. Em relação à inferência nota-se que tanto as distribuições a posteriori quanto os estimadores de máxima verossimilhança para os parâmetros de assimetria e forma da família normal bimodal assimétrica podem ser obtidos considerando famílias mais simples. Na análise dos dados de fronteira de Azzalini observa-se que os dados podem ser considerados como vindos de uma distribuição normal bimodal assimétrica padrão, uma vez que, considerando os resultados obtidos, as distribuições obtidas parecem se adequar bem aos dados e fornece resultados similares ao encontrado na literatura usando modelos menos parcimoniosos.

Modelos para Dados de Contagem com Estrutura Temporal

Apresentador/Autor: 
João Batista de Morais Pereira
Resumo: 

Neste estudo, discutimos a aplicação de modelos da classe dos modelos lineares dinâmicos generalizados (MLDG) e o modelo Poisson autoregressivo (PAR) na modelagem de séries temporais de contagens. Entre os modelos discutidos, consideramos modelos de sobredispersão, modelos com estrutura sazonal e modelos de mistura para dados de contagem inflacionados de zeros. Nosso interesse é verificar as vantagens e desvantagens entre as diferentes modelagens e que informações cada uma destas pode revelar a respeito do processo sob estudo. Todo o procedimento de inferência é feito sob o enfoque bayesiano, isto é, atribuímos uma distribuição a priori para os parâmetros de interesse de cada modelo a fim de obter a distribuição a posteriori, que, em nosso caso, não é conhecida. Métodos de Monte Carlo via cadeias de Markov (MCMC na sigla em inglês) são utilizados para obter amostras desta distribuição. Em modelos dinâmicos, obter amostras da distribuição a posteriori dos parâmetros de interesse exige certa cautela. Há diferentes propostas na literatura sugerindo diferentes maneiras de se obter amostras destes parâmetros. Entre as mais recentes está o CUBS (do inglês Conjugate Updating Backward Sampling), proposto por Ravines (2007). Neste trabalho, também temos interesse em discutir esta metodologia aplicada na estimação de parâmetros de modelos dinâmicos para séries temporais de contagens e investigar o seu desempenho.

Distribuição Skew Normal: Aproximações, Generalizações e Aplicações

Autor(es) e Instituição: 
Murilo Coutinho Silva
Pushpa Narayan Rathie
Apresentador: 
Murilo Coutinho Silva

Esse trabalho trata sobre distribuições assimétricas advindas da distribuição Normal, além de formas gerais para qualquer distribuição. Utilizando-se de fórmulas de assimetrização como a de Azzalini (1986) e a de Fernández e Steel (1998) compomos distribuições assimétricas para a Normal. Esse trabalho propõe também generalizações para as fórmulas de assimetrização. Além disso, nesse artigo utilizaremos uma aproximação da distribuição Normal por uma distribuição inversível, proposta em "On a new Invertible Generalized Logistic Distribution Approximation to Normal Distribution" de Pushpa N. Rathie e Prabhata K. Swamee para aproximar a distribuição Skew-Normal em expressões bem definidas. Neste trabalho muitas propriedades são desenvolvidas para todas as generalizações propostas como médias, variâncias, geratrizes de momentos, estimadores, entropias, etc... Além de toda a teoria desenvolvida neste trabalho, algumas aplicações com dados reais também estão presentes.

Divulgar conteúdo