Modelos Lineares, MLG e outros modelos não-lineares

Principais tipos de resíduos utilizados na análise de diagnóstico em MLG com aplicações para os modelos: Poisson, ZIP e ZINB.

Apresentador/Autor: 
Francisco William Pereira Marciano
Resumo: 

Neste trabalho será abordado uma aplicação do Modelo Poisson padrão e dos Modelos Inflacionados de Zeros para dados de contagem, Zero Inflated Poisson - ZIP e Zero Inflated Negative Binomial - ZINB, utilizando-se as técnicas dos MLG’s através de um conjunto de dados reais, onde algumas alterações foram implementadas no conjunto de dados a fim de aplicar os modelos supracitados. Após a realização dos ajustes uma análise de diagnóstico é discutida para verificar possíveis transgressões aos ajustes dos modelos considerados juntamente com a análise gráfica para verificar a adequabilidade dos modelos em questão em relação a variável de interesse no estudo, o número de abelhas que coletam polens no decorrer do dia.

Modelos de regressão para distribuições ZAIG com dados longitudinais: algumas técnicas de diagnóstico

Autor(es) e Instituição: 
Maria Kelly Venezuela - Insper Instituto de Ensino e Pesquisa
Rinaldo Artes - Insper Instituto de Ensino e Pesquisa
Apresentador: 
Maria Kelly Venezuela

A distribuição ZAIG (Zero-adjusted inverse gaussian) é uma distribuição de probabilidade não-negativa e semi-contínua, com probabilidade positiva de assumir o valor zero e que, para valores maiores de zero, comporta-se como uma distribuição normal inversa (Jong & Heller, Generalized Linear Models for Insurance Data, 2008, University Press). Ela tem um grande potencial de aplicabilidade na área financeira, no estudo de perdas devido a não pagamento de dívidas (perda zero indicando o pagamento integral do compromisso) e na área médica, por exemplo, em situações em que se pretende dosar a concentração de uma substância que pode ou não estar presente no sangue. No caso de estudos transversais, a estimação de modelos de regressão para variáveis respostas ZAIG pode ser feita por meio da biblioteca GAMLSS criada para a plataforma R (www.r-project.org).
No presente trabalho, são desenvolvidas técnicas diagnósticas para modelos de regressão para parâmetros de distribuições multivariadas com distribuições marginais ZAIG, estimados por meio de funções de estimação análogas às funções de estimação de independência propostas por Liang & Zeger (Biometrika, 1986). As técnicas de diagnóstico baseiam-se no trabalho de Venezuela (Tese de Doutorado, 2008, IME-USP), que considera equações de estimação para modelos de regressão para dados longitudinais, entretanto, definidas apenas para variáveis respostas continuas. Algumas dessas técnicas são estendidas para o caso em que há mistura de uma distribuição discreta com uma contínua, como é o caso da distribuição ZAIG.
Por fim, será apresentada uma aplicação a um banco de dados real para análise da taxa de mortalidade no trânsito em municípios da região sudeste no período de 2000 a 2002.

Resumo estendido: 

Uma aplicação do modelo GAMLSS paramétrico a dados de seguro de saúde

Autor(es) e Instituição: 
Gustavo H. A. Pereira
Jalmar M. F. Carrasco
Apresentador: 
Gustavo H. A. Pereira

Modelos aditivos generalizados para locação, escala e forma (GAMLSS) é uma ampla classe de modelos proposta por Rigby e Stasinopoulos (Journal of the Royal Statistics Society: Series C, 54, 2005). Diversas outras famílias de modelos de regressão são casos particulares de um modelo GAMLSS, como por exemplo os modelos lineares generalizados, os modelos lineares mistos e os modelos aditivos generalizados. Assim, o GAMLSS permite a inclusão em um mesmo modelo de termos fixos paramétricos e não paramétricos e a inclusão de fatores aleatórios. Além disso, eles podem ser utilizados para modelar distribuições que não pertencem à família exponencial e ainda possibilitam o ajuste de todos os parâmetros da distribuição da variável resposta em função de variáveis preditoras. Neste trabalho, apresentamos uma aplicação a dados de seguro de saúde da também extensa subclasse desses modelos denominada GAMLSS paramétrico. Os resultados sugerem que esses modelos podem ser úteis em situações em que o ajuste obtido com a utilização dos modelos lineares generalizados não é satisfatório.

Resumo estendido: 

Avaliar o método de Shannon e sua aplicação no processamento de imagens funcionais por ressonância magnética.

Autor(es) e Instituição: 
Alessandra Lima de Oliveira
Marcus Pinto da Costa da Rocha
Valcir João da Cunha Farias
Apresentador: 
Alessandra Lima de Oliveira

Este trabalho tem como objetivo avaliar as funcionalidades do método de Shannon e sua aplicação no processamento de imagens funcionais por ressonância magnética (FMRI), Já que, este método trabalha com análise de sinais, baseada em uma medida de informação dependente do tempo, já o Modelo Linear Geral (General Linear Model), em FMRI, modela as variações das séries temporais em termos da combinação linear de matrizes referência. A partir dessa abordagem, analisam-se os resultados desses métodos, no qual serão comparados, e verificar-se-á, dentre os quais, a importância de cada método (entropia de Shannon e GLM) no processo de FMRI, para ajudar na interpretação visual das imagens.

Influence assessment in an heteroscedastic errors-in-variables model

Autor(es) e Instituição: 
Mário de Castro (USP)
Manuel Galea (PUC-Santiago)
Apresentador: 
Mário de Castro

The main goal of this work is to consider influence assessment in models with error-prone observations and variances of the measurement errors changing across observations. The techniques enable to identify potential influential elements and also to quantify the effects of perturbations in these elements on some results of interest. The approach is illustrated with data from the WHO MONICA Project on cardiovascular disease.

Modelagem do crescimento de clones de Eucalyptus via modelo de Chapman-Richards com diferentes distribuições simétricas

Autor(es) e Instituição: 
Luiz Medeiros de Araujo Lima Filho - UFRPE
José Antônio Aleixo da Silva - UFRPE
Gauss Moutinho Cordeiro - UFRPE
Rinaldo Luiz Caraciolo Ferreira
Apresentador: 
Luiz Medeiros de Araujo Lima Filho

O Pólo Gesseiro do Araripe em Pernambuco é um grande consumidor de madeira para produção de gesso. Devido à grande necessidade de se buscar uma alternativa econômica e ambiental para a região é de interesse obter uma produção sustentável para o Eucalyptus ssp, uma vez que esta é um gênero de rápido crescimento e grande versatilidade. No planejamento do manejo florestal sustentado uma variável é de extrema importância: o crescimento. Sua modelagem é fundamental na prognose da produtividade, qualidade do local e dinâmica de populações. Geralmente, as curvas de crescimento são estudadas por meio de modelos não-lineares desenvolvidos empiricamente para relacionar, por exemplo, circunferência e idade. Um modelo não-linear bastante utilizado na prática para modelar curvas de crescimento é o modelo de Chapman-Richards. Em estudos deste tipo, em geral, assume-se que os erros seguem distribuição normal. Contudo, a modelagem sob a suposição de erros com distribuição normal é bastante sensível a valores atípicos que por ventura possam ocorrer, podendo distorcer as estimativas dos parâmetros. Uma alternativa para corrigir esse problema é adotar distribuições mais robustas que a distribuição normal. Desta forma, a classe de modelos simétricos se torna uma alternativa viável para corrigir tal problema. Com a expectativa de obter melhores estimativas de crescimento de Eucalyptus ssp, aplicaram-se ao modelo de Chapman-Richards as seguintes distribuições: normal, t de Student, Cauchy, exponencial potência e logística II que apresentou a distribuição Cauchy com melhores estimativas de crescimento em circunferência de Eucalyptus ssp no Pólo Gesseiro de Pernambuco.

Resumo estendido: 

Modelo de Regressão Beta com Erro de Medida

Autor(es) e Instituição: 
Hugo Henrique Kegler dos Santos - UFSCar
Carlos Alberto Ribeiro Diniz - UFSCar
José Galvão Leite - UFSCar
Apresentador: 
Hugo Henrique Kegler dos Santos

Instituições financeiras tem necessidade de determinar a proporção de gasto no cheque especial de futuros clientes. Uma variável explicativa importante para determinar essa proporção é a renda do cliente, que não é conhecida. Neste trabalho, propomos o modelo de regressão beta com erro de medida para estimar a média dessa proporção para um futuro cliente. Uma renda presumida, ou seja, uma renda do cliente medida com erro é considerada no modelo.

Resumo estendido: 

Probabilidades de Ocorrência de Violência Sofrida por Adolescentes do Município de Parauapebas do Estado do Pará por Gênero.

Autor(es) e Instituição: 
Cássio Pinho dos Reis
Rodrigo Valente Torres
Adrilayne dos Reis Araújo
Silvia dos Santos de Almeida
Apresentador: 
Cássio Pinho dos Reis

O objetivo deste trabalho é gerar um modelo logístico capaz de prever a probabilidade de um adolescente do município de Parauapebas no Estado do Pará sofrer alguma violência e comparar essas probabilidades entre homens e mulheres. Para tanto, utiliza-se as técnicas estatísticas de análise exploratória de dados para descrever as variáveis utilizadas no modelo e a regressão logística múltipla. De acordo com a análise exploratória dos dados, destaca-se que a maioria dos adolescentes não possuem deficiência, praticam esportes e não frequêntam festas. Enquanto que a maioria das adolescentes, não possuem deficiência, não frequêntam cinemas e dormem sozinhas. Além disso, a partir da técnica da regressão logística, observa-se que se um adolescente possuir alguma deficiência, ele tem 23 vezes a mais de chance de sofrer alguma violência do que outro adolescente que não possui deficiência e que apresenta as mesmas características. Enquanto que para as mulheres, esse valor sobe para 27 vezes a mais. E que a maior probabilidade de um adolescente do município de Parauapebas sofrer alguma violência (96,31%), é se for uma mulher, se frequentar cinemas, possuir alguma deficiência e se não dorme sozinha.

A fast implementation of generalized linear mixed models for correlated binary data

Autor(es) e Instituição: 
Victor Hugo Lachos, UNICAMP
Clécio da Silva Ferreira, UFJF
Apresentador: 
Clécio da Silva Ferreira

We propose a new EM algorithm for computing the maximum likelihood
for generalized linear mixed probit-normal models for correlated binary data.
In contrast with recent developments (Tan et al., 2007; Meza et al., 2009), this
algorithm used closed-form expressions at the E step, as opposed to Monte
Carlo simulation. Our proposed algorithm rely on formulas for the mean and
variance of a truncated multinormal distribution, and can be computed using
available formula. A real data set from the childrens wheeze study is analyzed
to illustrate the proposed method and for comparison with existing methods.

Trabalho completo: 

O Problema da Estimação no Modelo de Calibração Linear com Erro nas Variáveis

Autor(es) e Instituição: 
Cássio Pinho dos Reis
Silvia dos Santos de Almeida
Apresentador: 
Cássio Pinho dos Reis

A exigência de um melhor controle dos procedimentos de mensuração, quando se trata de produtos florestais tem se intensificado, levando pesquisadores a buscar novas técnicas para se obter melhores resultados. Quando se trata de medições de produtos florestais, é necessário o auxílio de instrumentos de medições, porém, comumente os erros de mensuração estão presentes quando se utilizam estes instrumentos. Desta forma, o objetivo deste trabalho é modelar características de árvores típicas da floresta amazônica, via modelos de calibração linear, comparando os estimadores para os modelos desenvolvidos a partir do erro quadrático médio. Para tanto, utilizam-se medidas do diâmetro da altura do peito (X) e do volume (Y) de árvores Quaruba, árvore típica da região amazônica e tem importância fundamental para a economia da região e para o manejo florestal. Durante a fase inicial da calibração, pôde-se verificar, que a presença de erros de medida, na variável independente (X), isto é, no diâmetro da altura do peito das árvores, influenciaram diretamente na precisão dos modelos obtidos. Na segunda etapa do processo de calibração, foram utilizados três estimadores: inverso com mínimos quadrados, clássico consistente e clássico com mínimos quadrados. O estimador inverso com mínimos quadrados apresentou o melhor desempenho que os outros estimadores.

Divulgar conteúdo