Modelos Lineares, MLG e outros modelos não-lineares

RISCO RELATIVO ESPACIAL EM ESTUDOS CASO-CONTROLE COM RESPOSTA MULTINOMIAL

Autor(es) e Instituição: 
Liciana Vaz de Arruda Silveira - Depto. Bioestatística/IB/UNESP-SP
Ana Carolina Cintra Nunes Mafra - epiGeo/FCM/UNICAMP-SP
Ricardo Carlos Cordeiro- epiGeo/FCM/UNICAMP-SP
Luciana B. Nucci- epiGeo/FCM/UNICAMP-SP
Celso Stephan - epiGeo/FCM/UNICAMP-SP
Apresentador: 
Liciana Vaz de Arruda Silveira

Todo este desenvolvimento foi feito para estudos onde a resposta é binomial (casos e controles). Porém, existem circunstâncias onde se deseja categorizar a resposta de interesse em mais do que dois grupos, exigindo assim uma abordagem multinomial.
Nos últimos anos muitos estudos epidemiológicos do tipo caso-controle têm utilizado o formato multinomial em suas análises Quando aplicável, a categorização dos casos em mais níveis de resposta enriquece a análise e traz informações discriminadas para cada tipo específico de caso.
Os modelos multinomiais podem ser ajustados de diversas maneiras e pode-se averiguar se a resposta é nominal ou ordinal e enquadrar o estudo no formato mais adequado, porém Mafra et. al ressaltam a importância de conduzir as análises de estudos do tipo caso-controle comparando cada tipo de caso com os controles, para assim poder ter medidas de risco.
Neste trabalho, define-se o risco relativo espacial de forma bivariada, permitindo a inclusão de outras covariáveis na análise e mostra-se a maneira de estimar tal risco através de modelos aditivos generalizados e obter áreas de significância por meio de simulações de Monte Carlo.

Resumo estendido: 

Modelos não lineares heteroscedásticos para dados correlacionados

Autor(es) e Instituição: 
Cibele M. Russo Noveli, Universidade de São Paulo
Gilberto A. Paula, Universidade de São Paulo
Francisco José A. Cysneiros, Universidade Federal de Pernambuco
Reiko Aoki, Universidade de São Paulo
Apresentador: 
Cibele Maria Russo Noveli

Neste trabalho analisamos modelos não lineares elípticos com efeitos mistos supondo possíveis estruturas heteroscedásticas e/ou autoregressivas para analisar dados correlacionados. Esses modelos representam uma generalização dos modelos desenvolvidos em Russo et al. [2009. Influence diagnostics in nonlinear mixed-effects elliptical models. {\it Computational Statistics and Data Analysis} 53, 4143-4156] e fornecem alternativas importantes para a modelagem de dados longitudinais não lineares, já que introduzem a correlação intragrupo e permitem a obtenção de estimativas robustas contra observações aberrantes e pouco sensíveis a perturbações. Como ilustração numérica consideramos os dados farmacocinéticos de concentração de indomethacin previamente analisados em Bocheng \& Xuping [2001. Influence analysis in nonlinear models with random effects. {\it Applied Mathematics - A Journal of Chinese Universities} 16, 35-44].

Um alerta sobre o uso de amostras pequenas na regressão logística.

Apresentador: 
Rodrigo Coster

A regressão logística está cada dia mais presente nas pesquisas, porém, sabe-se que seus estimadores só possuem boas propriedades se o tamanho de amostra for grande. Entretanto, nem sempre o tamanho amostral utilizado nos estudos é o ideal. Uma regra de bolso para o tamanho amostral amplamente conhecida é de que se deve ter pelo menos dez eventos (sucessos ou fracassos, dependo do que for mais raro) para cada variável independente do modelo. Entretanto, o estudo de simulação a partir do qual esta regra foi elaborada, bem como todos os estudos de simulação encontrados em levantamento bibliográfico realizado, verificou o desempenho da regressão logística apenas para estimar os coeficientes do modelo e não as razões de chances. Através de um estudo simulado de três cenários, mostramos o quão perigoso é usar amostras pequenas para estimar a razão de chance, além de alternativas para o cálculo do tamanho de amostra mínimo para cada caso. Concluímos que as regras utilizadas levando em conta a estimação dos coeficientes não garantem boas propriedades na estimação das razões de chances. Em nossas simulações, encontramos vícios maiores na estimação da razão de chance do que do respectivo coeficiente do modelo. Também entre as conclusões, chamamos atenção para os casos de separação e destacamos que variáveis contínuas são preferíveis à variáveis categóricas.

Resumo estendido: 

A Correlated Binomial Regression Model

Autor(es) e Instituição: 
Carlos A. R. Diniz - UFSCar - DEs
Rubiane M. Pires - UFSCar - DEs
José G. Leite - UFSCar - DEs
Apresentador: 
Carlos A. R. Diniz

A Corporation is a company that owns other companies outstanding stock. In business matters, a Corporation is a defaul company if, at least, one of its subsidiary is on default. The statistical interest is, in a speci fic period of time, to determine the default probability for the Corporation given that the subsidiaries of this Corporation are correlated. Therefore, the model must address the issue of covariation between the companies inside the Corporation. In this paper a correlated binomial regression model CBR(ni; pi; \pho_i) is proposed. The developed methodology permits the covariance structure to be incorporated into the model and the behaviour of the response variable is modelled as a function of exogenous variables available for the Corporations and the revenues for each company inside the Corporation. The data augmentation scheme is used in order to overcome the complexity of the mixture likelihood. MCMC methods are applied to estimate the posterior marginal for the regression coeffcients, consequentely for the probabilities of success pi, and for the correlation coeffcients \pho_i.

Estimation in a Generalized Correlated Binomial Model

Autor(es) e Instituição: 
Rubiane Maria Pires - UFSCar
Carlos Alberto Ribeiro Diniz - UFSCar
José Galvão Leite - UFSCar
Apresentador: 
Rubiane Maria Pires

A generalized correlated binomial model, which considers different correlations for the Bernoulli trails, is proposed. The maximum likelihood estimators for the parameters are obtained by direct maximization of the likelihood function using the Monte Carlo approach. To illustrate the proposed model we use a transgenic soybean dataset. Nonparametric bootstrap method is used to find confidence interval for the model parameters.

Correção de Viés para os Modelos Não-Lineares da Família de Locação e Escala

Autor(es) e Instituição: 
Jaciane do Carmo Ribeiro
Edson Marcos Leal Soares Ramos
Lourdes Coral Contreras Montenegro
Apresentador: 
Jaciane do Carmo Ribeiro

Este trabalho tem como objetivo obter expressões matriciais para os vieses de primeira ordem dos Estimadores de Máxima Verossimilhança (EMV) dos parâmetros dos modelos não-lineares da família de locação e escala, assim como os vieses de primeira ordem dos EMV dos parâmetros de algumas distribuições importantes da família de locação e escala, tais como, distribuições Normal, Logística, Valor Extremo, Cauchy e t-Student; a partir desses vieses, obter os EMV corrigidos. Para a obtenção dos vieses, utiliza-se a correção de viés obtida por Cox e Snell (1968). Resultados de simulações de Monte Carlo são utilizados com a finalidade de verificar o comportamento dos EMV dos parâmetros dos modelos não-lineares da família de locação e escala, a partir das distribuições Normal e Logística em relação aos seus EMV corrigidos. Finalmente, observa-se que, no geral, a correção utilizada reduz efetivamente os vieses das estimativas de máxima verossimilhança, produzindo estimativas mais próximas dos verdadeiros valores dos parâmetros da família de locação e escala que as estimativas não-corrigidas.

Flexible Modeling of Random Effects in Linear Mixed Models

Autor(es) e Instituição: 
Clécio da Silva Ferreira, UFJF
Celso R. B. Cabral, UFAM
Víctor Hugo Lachos Dávila, UNICAMP
Apresentador: 
Clécio da Silva Ferreira

Flexible modelling of random effects in linear mixed models has
attracted some attention recently. Following Verbeke and Lesaffre
(1996), we propose the use of finite skew-normal mixtures which
includes the finite normal mixtures as a special case and provides
flexibility in capturing a broad range of non-normal behavior,
controlled by a tuning parameter that controls the skewness of the
mixture components. Likelihood based inference is adopted since the
marginal likelihood may be expressed in closed form and an EM
algorithm for maximum likelihood estimation is developed which
results in an analytically tractable maximization step. In addition,
we offer a general information-based method for obtaining the
asymptotic covariance matrix of maximum likelihood estimates.
Numerical results on simulated and real data sets
are provided to demonstrate the usefulness of the proposed methodology.

Resumo estendido: 

Estimação e Diagnóstico em Modelos Birnbaum-Saunders Skew-Normal

Apresentador/Autor: 
Lúcia Rolim Santana
Resumo: 

A classe de modelos Birnbaum-Saunders (BS) surgiu em problemas de fadiga dos materiais (que é um dano estrutural que ocorre quando um material é exposto a estresse e tensão). Nos últimos tempos, este modelo tem sido aplicado em áreas fora do contexto de fadiga dos materiais e engenharia, como por exemplo, em ciências da saúde, ambiental, florestal, demográficas, atuarial, financeira, entre outras. Tendo em vista que a distribuição BS tem a propriedade de descrever processos de degradação acumulativa. Neste trabalho, apresentamos um estudo do modelo BS baseado na distribuição skew-normal. Como subproduto consideramos o modelo de regressão linear log-Birnbaum-Saunders (log-BS). Para obter as estimativas de máxima verossimilhança usamos o algoritmo EM. Além disso, apresentamos um estudo de análise de influência global e local, através da metodologia de Zhu e Lee (2001) para dados incompletos. Ilustramos a metodologia proposta com dados encontrados na literatura.

Equações de Estimação Generalizadas (GEE): Aplicação em estudo sobre mortalidade neonatal em gemelares de Porto Alegre, RS (1995-2007).

Autor(es) e Instituição: 
Marilyn Agranonik
Suzi Alves Camey
Apresentador: 
Marilyn Agranonik

Em estudos com gêmeos e trigêmeos é esperado que exista correlação entre os dados dos irmãos. Desse modo, modelos de regressão tradicionais, como GLM, podem levar à inferências incorretas, uma vez que a suposição de independência entre os sujeitos não é mais satisfeita. Para solucionar este problema, Zeger e Liang propuseram uma classe de Equações de Estimação Generalizadas (GEE) que incluem uma estrutura de correlação de trabalho na estimação dos parâmetros do modelo. Ainda hoje, poucos estudos utilizam esta metodologia. Este trabalho apresenta o GEE, através de aplicação na análise de dados de mortalidade neonatal em gemelares. Foram utilizados dados de gêmeos e trigêmeos provenientes do SIM e do SINASC, nos quais todas as crianças que constituem o par ou o trio nasceram vivas em Porto Alegre, com peso superior a 500g entre 1995 e 2007. Verificou-se associação de fatores perinatais, como peso ao nascer e índice de Apgar, com o desfecho. Comparando resultados obtidos no GEE com os do GLM foram encontradas pequenas diferenças nas estimativas pontuais dos parâmetros do modelo. Entretanto, ao comparar erros padrões, as diferenças foram maiores, interferindo na significância de uma das variáveis (tipo de hospital). Maiores diferenças entre os modelos não foram encontradas, provavelmente porque o tamanho da amostra utilizado era grande. Desse modo, recomenda-se a utilização do GEE quando houver agrupamento de indivíduos, já que este modelo considera a correlação entre sujeitos do mesmo grupo e está implementado nos programas estatísticos.

Diagnóstico baseado na influência local conforme para os modelos de regressão Birnbuam-Saunders e senh-normal

Autor(es) e Instituição: 
José Iraponil Costa Lima
Michelli Karinne Barros da Silva
Apresentador: 
José Iraponil Costa Lima

Em nosso trabalho, estudamos a influência local mediante a curvatura normal conforme, proposta por Poon & Poon (1999), e aplicamos a mesma sobre os modelos de regressão log-Birnbaum-Saunders(com dados censurados) e senh-normal. Até meados da década de 1980, as técnicas de diagnóstico baseavam-se em análise de resíduos. Posteriormente, Cook(1986) propôs uma metodologia inovadora denominada influência local, sendo capaz de avaliar, por meio de uma medida apropriada de influência, a estabilidade das estimativas fornecidas por um modelo estatístico adotado mediante pequenas perturbações nos dados ou no próprio modelo. O método de influência local baseia-se em conceitos da geometria diferencial, em particular o de curvatura normal, para estudar o comportamento local de uma superfície chamada gráfico de influência. Mais precisamente, Cook (1986) sugere que examinemos as direções em que a curvatura normal é máxima, pois a partir dessas identificamos observações potencialmente influentes sob o esquema de perturbação no qual sujeitamos o modelo. Porém, Poon & Poon(1999) chamam atenção para o fato de que a curvatura normal pode assumir qualquer valor real e não é invariante sob uma mudança uniforme de escala, ocasionando perda de objetividade no julgamento da grandeza da curvatura. Com o objetivo de solucionar essa problemática e, conseqüentemente, aperfeiçoar o método de influência local, os mesmos propõem que façamos uso da curvatura normal conforme que está relacionada com a curvatura normal, mas assume valores em um intervalo limitado da reta real e é invariante sob uma classe de reparametrizações denominadas reparametrizações conforme. A curvatura normal conforme combinada com suas propriedades nos dão suporte para construirmos valores de referência que permitem julgarmos, de forma objetiva, a grandeza dessa curvatura. A distribuição Birnbaum-Saundres(BS), desenvolvida por Birnbaum-Saundres(1969a), relaciona o tempo até a ocorrência de falha com uma quantidade de dano acumulativo que supomos seguir uma distribuição normal. Atualmente, a distribuição BS tem sido amplamente aplicada em análise de tempo de vida de materiais, particularmente em processo de fadiga. Uma relação existente em a distribuição BS sob uma transformação logarítmica e a distribuição senh-normal(SN), desenvolvida por Rieck & Neldeman (1991), motivou a inclusão desta última no presente trabalho. Ademais, a distribuição senh-normal é uma distribuição simétrica que possui curtose maior ou menor do que a distribuição normal. Portanto, a mesma é uma alternativa ao modelo normal. A dissertação apresenta cinco capítulos. No primeiro, introduzimos algumas noções de análise de sobrevivência, pois a variável que segue uma distribuição BS trata-se de uma distribuição de tempo de vida. No Capítulo 2, apresentamos a distribuição (BS), a distribuição senh-normal(SN) e suas propriedades, assim como o modelo de regressão log-Birnbaum-Saunders com dados censurados. No terceiro capítulo, apresentamos a definição de curvatura normal conforme combinada com suas propriedades e a técnica de influência local por meio da curvatura normal conforme. No quarto, aplicamos essa técnica sobre o modelo de regressão log-Birnbaum-Saunders com dados censurados; ponderação de casos, perturbação na resposta e perturbação na variável explicativa foram os esquemas de perturbação considerados. Além disso, incluímos um exemplo ilustrativo onde dados reais são analisados, proporcionando uma comparação entre a nossa análise e a feita por Leiva, Barros, Paula & Galea(2007). No último capítulo, aplicamos a técnica de influência local sobre os modelos de regressão lineares com erro senh-normal; dois esquemas de perturbação são considerados. Assim como no Capítulo 4, analisamos um conjunto de dados reais, anteriormente estudado por Poon & Poon(1999) sob a hipótese de erros normais, proporcionando uma comparação entre as análises.

Divulgar conteúdo