Modelos Lineares, MLG e outros modelos não-lineares

Estimação de máxima verossimilhança do modelo de regressão Poisson Generalizado Inflacionado de Zeros

Autor(es) e Instituição: 
Flávia Maria Ravagnani Neves Cintra, ICMC-USP / Faag
Marinho Gomes de Andrade Filho, ICMC-USP
Mário de Castro Andrade Filho, ICMC-USP
Apresentador: 
Flávia Maria Ravagnani Neves Cintra

O modelo de regressão Poisson Generalizado foi proposto por Famoye et al. (2004) para ajustar dados em que a variância amostral é maior (ou menor) que a média amostral e o modelo de regressão Poisson Generalizado Inflacionado de zeros (ZIGP), abordado em
Famoye & Singh (2006) e Czado et al. (2007), foi proposto para ajustar dados com superdispersão (ou subdispersão) e inflacionados de zeros, ou seja dados com ocorrência
de zeros maior que o esperado no modelo Poisson Generalizado.
Como a distribuição ZIGP não pertence à família exponencial, o modelo de regressão não é um modelo linear generalizado (MLG). Portanto, os resultados assintóticos válidos para um MLG não se aplicam para a regressão ZIGP. Através de simulações vamos verificar que o estimador de máxima verossimilhança no modelo ZIGP é assintoticamente normal.

Resumo estendido: 

Modelos de Regressão para Dados de Contagem com Distribuição Zero-Modificada

Autor(es) e Instituição: 
Katiane S. Conceição (DEs - UFSCar)
Marinho G. Andrade (ICMC - USP)
Francisco Louzada-Neto (DEs - UFSCar)
Apresentador: 
Francisco Louzada-Neto

A análise de dados de contagem ocupam um importante lugar na estatística aplicada uma vez que muitos fenômenos ocorridos na natureza são expressos como tais dados. Entretanto, cautela na suposição da distribuição de probabilidade que rege o fenômeno aleatório é necessária pois, muitas vezes a discrepância de interesse é a classe de contagem de zeros. O objetivo principal deste trabalho é apresentar modelos de regressão na família de distribuição zero-modificada de forma a acomodar dados inflacionados, deflacionados ou com ausência de zeros. Desta forma o modelo proposto torna-se bastante flexível para tratar diferentes aplicações de modelos de regressão para dados de contagem. A abordagem clássica do problema de inferência são apresentados.

Resumo estendido: 

Asymptotic properties for a general extreme-value regression model

Autor(es) e Instituição: 
Wagner Barreto de Souza
Klaus Leite Pinto Vasconcellos
Apresentador: 
Wagner Barreto de Souza

In this thesis we introduce a general extreme-value regression model and derive Cox and Snell's (1968) general formulae for second-order biases of maximum likelihood estimates (MLEs) of the parameters. We present formulae which can be computed by means of weighted linear regressions. Furthermore, we give the skewness of order n^{-1/2} of the MLEs of the parameters by using Bowman and Shenton's (1998) formula. Special cases of this model and a simulation study with results obtained with use of Cox and Snell's (1968) formulae are presented. A practical use of this model and of the derived formulae for bias correction is also presented.

A Generalized Species-Area Relationship for Estimating Species Diversity: The Poisson Distribution Case

Autor(es) e Instituição: 
Katiane S. Conceição - UFScar
Rubiane Maria Pires - UFSCar
Francisco Louzada-Neto - UFSCar
Marinho G. Andrade - ICMC/USP
Carlos Alberto Ribeiro Diniz - UFScar
Apresentador: 
Rubiane Maria Pires

The species diversity is related to several factors, such as the mutation, interaction, competition and the amount of available resources for survival, amongst others. Besides, species diversity is related to the size of the habitat area (species-area relationship). A major problem in ecology is to identify the best function that models this relationship. The main idea of the paper is to propose a generalized species-area relationship that has as particular cases relations proposed earlier, including ones that consider the effects of minimum area and upper asymptote. The proposed model is suitable for areas of different scales (small, intermediate and large) and considers a Poisson (discrete) probability distribution for the species diversity. The advantage of our formulation is to lead to a unique function for species-area relationship, which takes into account both effects of minimum area and asymptotic behavior of the growth curve for large areas, providing a unique algorithm for fitting different dataset, and choosing the best model in the light of the data. The applicability of our approach was tested via a simulation study conducted in order to determine if the AIC and BIC selection criteria are suitable to decide for the best model to be considered for describing the species-area relationship. We also consider applications to a set of artificial data and a set of real data from of the diversity of fish in 70 lakes of different sites. In both cases our proposed extension overcome its particular cases.

Resumo estendido: 

UMA APLICAÇÃO DOS MODELOS LINEARES GENERALIZADOS HIERÁRQUICOS DUPLOS EM DADOS LONGITUDINAIS DE CONTAGEM COM EXCESSO DE ZEROS

Autor(es) e Instituição: 
NÍVEA BISPO DA SILVA - UNICAMP
ROSEMEIRE L. FIACCONE - UFBA
LEILA D. A. F. AMORIM
Apresentador: 
NÍVEA BISPO DA SILVA

Neste trabalho foi proposta uma aplicação dos modelos lineares generalizados hierárquicos duplos para dados longitudinais de contagem com excesso de zeros. Em diversas áreas do conhecimento é comum modelar respostas do tipo contagem, contudo, na maioria das vezes a estrutura deste tipo de resposta apresenta problemas de extra-variabilidade ou excesso de zeros. O modelo clássico de regressão para modelar contagens é o de Poisson, pois ele é frequentemente útil em descrever a média, contudo, subestima a variância dos dados quando o mesmo apresenta super-dispersão, e a não consideração deste problema pode resultar em estimação incorreta dos erros-padrão, e consequentemente uma avaliação incorreta da significância dos parâmetros da regressão individual. Uma solução é estender o modelo clássico de regressão, utilizando, por exemplo, estimadores sanduíche, ou ainda adicionando um parâmetro de dispersão no modelo. Outra opção é trabalhar com o modelo Binomial negativo. Existem na literatura diversas metodologias que lidam com o problema de excesso de zeros, dentre elas estão o modelo ZIP e o modelo “Hurdle”. Contudo, tais modelos apresentam limitações de uso para dados de contagem com estrutura longitudinal e/ou de cluster. Assim, aplicamos aos dados a classe de modelos proposta por Lee & Nelder, onde efeitos aleatórios podem ser especificados em ambos os componentes do modelo (média e dispersão). Resultados preliminares indicam que a adição do componente de dispersão é necessária, refletindo assim no impacto sobre as estimativas dos parâmetros no modelo com tal componente.

Resumo estendido: 

ANÁLISE DE REGRESSÃO SOBRE A MEDIDA UMBILICAL EM RELAÇÃO A LESÕES MUSCO-ESQUELÉTICAS EM PUÉRPERAS

Autor(es) e Instituição: 
Samuel V. M. de Macedo, UFPE
Claudia R.O. de Lima, UFPE
Caroline W. S. Ferreira, UFPE
Apresentador: 
Samuel Victor Medeiros de Macêdo

A gravidez envolve diversas mudanças físicas e fisiológicas na mulher. Dentre as mudanças físicas destacam-se as adaptações posturais para manter o equilíbrio antigravitacional, visto que o crescimento uterino e o desenvolvimento das mamas fazem com que a distribuição da massa corpórea concentre-se na região anterior do tronco. Ao término dos nove meses, o abdômen pode encontrar-se inchado, pendente e com tônus diminuído podendo os Músculos Retos Abdominais (MRA) estarem afastados na linha média (linha Alba) o que é chamado de Diástase dos Músculos Retos Abdominais (DMRA).
O objetivo de nossa pesquisa é estudar e propor um ajuste para modelar uma relação entre a medida umbilical conferida pelo paquímetro em relação às demais variáveis que foram colhidas na pesquisa.

Resumo estendido: 

Modelo para Mortalidade Infantil no Brasil via Modelos Lineares Generalizados

Autor(es) e Instituição: 
Carlos Sérgio Araújo dos Santos, IFPB
Alisson de Oliveira SilvA, UFPB
Joseilme Fernandes Gouveia, UFPI
Gauss Moutinho Cordeiro, UFRPE
Apresentador: 
Carlos Sérgio Araújo dos Santos

A Taxa de Mortalidade Infantil (TMI), reflete, de maneira geral, os níveis de saúde e de desenvolvimento socioeconômico de uma determinada região. Observa-se uma disparidade expressiva nas TMI entre os estados brasileiros. Esse fato tem provocado o interesse de diversos pesquisadores na busca dos determinantes dessas desigualdades. Assim, a utilização da teoria dos Modelos Lineares Generalizados (MLG), torna-se um ferramental importante para modelagem dessas taxas. Os MLG’s são uma classe de modelos de regressão em que a regressão linear com a variável resposta normalmente distribuída é um caso particular. São formados por um componente aleatório, que possui distribuição pertencente à família exponencial, um componente sistemático, linearizados por uma função de ligação. Serão utilizadas para modelar a TMI, indicadores socioeconômicos. Os programas utilizados para o ajuste do banco de dados foram desenvolvidos no software R na versão 2.8.0. O modelo Normal Inverso com função de ligação logarítimica foi o modelo que melhor ajustou-se aos dados. Pretende-se com esse estudo realizar previsões dessas taxas e, consequentemente, subsidiar o planejamento dos gestores em saúde a adotar políticas públicas nas áreas de saúde materna e infantil nos estados brasileiros.

Resumo estendido: 

Modelos Simétricos Transformados não lineares com aplicação na estimativa volumétrica em Híbrido de Eucalyptus tereticornis no Pólo Gesseiro do Araripe - PE

Autor(es) e Instituição: 
Carlos Sérgio Araújo dos Santos, IFPB
José Antonio Aleixo da Silva, UFRPE
Gauss Moutinho Cordeiro, UFRPE
Joseilme Fernandes Gouveia, UFPI
Alisson de Oliveira Silva, UFPB
Apresentador: 
Carlos Sérgio Araújo dos Santos

A vegetação da Caatinga vem sofrendo grande degradação de suas várias espécies vegetais devido à desordenada exploração da biomassa renovável para energia, principalmente, na região do Pólo Gesseiro do Araripe, em Pernambuco. Como medida alternativa, econômica e ambientalmente viável, tem-se o manejo sustentado de povoamentos florestais nativos ou o reflorestamento com florestas de rápido crescimento com destaque para os Eucalyptus, por conta de sua versatilidade. Baseado neste contexto, realizar uma modelagem do volume de eucaliptos é fundamental para estimar a viabilidade do plantio dessas árvores para fins energéticos na região do Polo Gesseiro do Araripe. A modelagem do volume de hibridos de Eucalyptus tereticornis, foi realizada por meio dos Modelos Simétricos Transformados Não-Lineares que consideram uma família de transformações para variável resposta, tal que as variáveis aleatórias transformadas podem ser tratadas como independentemente distribuídas seguindo uma família de distribuições simétricas e uma função de ligação não linear. O modelo não-linear utilizado para explicar os dados foi o modelo de Schumacher-Hall. Diante dos resultados obtidos se conclui que o modelo transformado com erros t-Student com dois graus de liberdade foi o que melhor ajustou os dados.

Resumo estendido: 

Modelo de Regressão para Estimar a Vida Útil da Lâmpada Halógena

Autor(es) e Instituição: 
Glauce da Silva Guerra, Universidade Federal de Pernambuco
Hélio G. de Souza Júnior, Universidade Federal de Pernambuco
Apresentador: 
Glauce da Silva Guerra

Análise de modelos de regressão é uma técnica estatística para investigar e modelar a relação
entre variáveis. Aplicações de regressão são bastante utilizadas e ocorrem em diversos domínios, incluindo a engenharia, ciências físicas e químicas, ciências políticas e econômicas entre outras. A distribuição Gama é muito utilizada para descrever dados de contínuos e positivos. Em situações em que se tem uma variável resposta com dados de contínuos positivos deseja-se estudar a relação com variáveis explicativas, pode-se utilizar o modelo de regressão da família gama, que pertence à classe especial de modelos lineares generalizados. O trabalho proposto tem como objetivo ajustar um modelo de regressão que explique a vida útil de uma lâmpada através algumas características, tais como, potência, fluxo luminoso e outras características geométricas da mesma. Foram propostos inicialmente alguns modelos de regressão, assim foram feitas análises, investigações sobre a adequação de algumas suposições. Após esta investigação foi proposto um modelo, dado como ideal, com base nas suposições feitas pela modelagem.

Resumo estendido: 

Modelagem de Equacões Estruturais Multinível: Um Estudo de Simulação

Autor(es) e Instituição: 
Leila Denise A. F. Amorim, Departamento de Estatística, IM-UFBA
Rosemeire L. Fiaccone, Departamento de Estatística, IM-UFBA
Lia Terezinha L. P. de Moraes, Departamento de Estatística, IM-UFBA
Nelson Fernandes de Oliveira, Universidade Estadual de Feira de Santana-BA
Silvano Barbosa de Oliveira, Secretaria de Vigilância em Saúde, Ministério da Saúde
Apresentador: 
Leila Denise A. F. Amorim

Dados com estruturas hierárquicas são muito comuns em vários estudos e podem causar problemas nas análises tradicionais porque a usual suposição de que as variáveis aleatórias são independentes e identicamente distribuídas é violada. Dadas as vantagens associadas à modelagem de equações estruturais em geral, tentativas têm sido feitas para incorporar dados correlacionados nesse tipo de metodologia. É evidente que os modelos de equações estruturais e os modelos lineares multiníveis sozinhos não são capazes de capturar relações complexas que existem intra e entre-grupos, o que resultou na proposta de combinação dessas duas metodologias, denominada modelos de equações estruturais multiníveis. Este trabalho objetiva uma avaliação mais ampla do que a existente na literatura atual do procedimento de estimação dos modelos de equações estruturais multiníveis para respostas contínuas através da condução de estudos Monte Carlo, que foram realizados no software MPlus. Resultados referentes à avaliação de AFC, sem considerar a estrutura multinível dos dados, apontam para aumento do viés, sobretudo dos componentes da variância, à medida que o coeficiente de correlação intraclasse (ICC) aumenta e o número de clusters diminui. No ajuste da AFC multinível o viés associado às cargas fatoriais e às variâncias residuais é desprezível para as diversas combinações de grau de dependência e estrutura de agregação dos dados na modelagem do componente intra-grupos. No entanto, a modelagem do componente entre-grupos aponta para estimadores com alto grau de viés, que é reduzido com o aumento do ICC e do número de clusters. Certamente os modelos de equações estruturais multiníveis podem contribuir com o aumento do poder e flexibilidade na análise de dados em conglomerados hierárquicos, permitindo a incorporação de erros de medida. No entanto, este tipo de metodologia ainda requer a disponibilidade de dados para um número grande de clusters. A performance desta metodologia também depende da complexidade do modelo. O ajuste de modelos com alto grau de complexidade, sobretudo com respeito às relações causais e ao número de indicadores, depende de desenvolvimentos teóricos futuros. Projeto com financiamento FAPESB, Termo de Outorga n.0082/2006.

Divulgar conteúdo