Ciências Exatas e da Terra
Regressão Logito-Normal
Neste trabalho propomos o modelo de regressão logito-normal, uma alternativa ao modelo de regressão beta, com a variável resposta também restrita ao intervalo (0, 1) e seguindo distribuição logito-normal. A média e a variância da distribuição logito-normal não possuem formas fechadas e, por esta razão, tais parâmetros são determinados através de funções dos parâmetros da distribuição Normal μ e σ2 Estimação por máxima verossimilhança é utilizada para estimar os coeficientes da regressão.
The Kumaraswamy-Generalized Gamma Distribution with Application in Survival Analysis
Based on the Kumaraswamy distribution (Jones, 2009), we study the so-called Kum-generalized gamma distribution that is capable of modeling bathtub-shaped hazard rate functions. The beauty and importance of this distribution lies in its ability to model monotone and non-monotone failure rate functions, which are quite common in lifetime data analysis and reliability. The new distribution has a number of well-known lifetime special sub-models such as the exponentiated generalized gamma, exponentiated Weibull, exponentiated generalized half-normal, exponentiated gamma, generalized Rayleigh, among several others. Some mathematical properties of the Kum-generalized gamma distribution are studied. We obtain two infinite sum representations for the moments and for the moment generating function. We calculate the density of the order statistics and two expansions for their moments. The method of maximum likelihood is used for estimating the model parameters and the observed information matrix is derived. Two real data sets are analyzed with this distribution.
Estudo das Matrizes de Covariância de Modelos Bayesianos com Interação Espaço-Temporal
Nesse trabalho estudamos as matrizes de covariância de modelos bayesianos com efeitos de interação espaço-temporal. Knorr-Held(2000) introduziu os possíveis tipos de efeitos aleatórios espaciais e temporais em modelos bayesianos e atribuimos a eles distribuições a priori comumente utilizadas. Possíveis efeitos aleatórios espaço-temporais foram construídos a partir da interação entre um efeito temporal e um espacial. As matrizes de covariância a priori para os modelos com interação espaço-tempo foram calculadas e escritas na forma de produto de Kronecker entre as matrizes de covariância a priori dos efeitos temporal e espacial. Utilizamos estes resultados para classificar os modelos em relação ao tipo de efeito aleatório e, dessa forma, conseguimos visualizar mais claramente o efeito de cada tipo de interação possível, relacionando as matrizes de covariância a priori com as estruturas de dependência espacial e/ou temporal envolvidas nos modelos estudados. Como exemplo, apresentamos o estudo das matrizes de covariância a priori de dois modelos específicos, Martínez-Beneito et al.(2008) e Assunção et al.(2001), cada um envolvendo um tipo diferente de interação espaço-tempo no efeito aleatório, e fazemos suas interpretações dentro do contexto estudado.
The Beta Burr XII Distribution with Applications to Lifetime Data
For the first time, a five-parameter distribution, so-called the beta Burr XII distribution, is defined and investigated. The new distribution contains as special sub-models some well-known distributions discussed in the literature, such as the logistic, Weibull and Burr XII distributions, among several others. We derive its moment generating function. As a special case, we obtain the moment generating function of the Burr XII distribution, which seems to be a new result. Moments, mean deviations, Bonferroni and Lorenz curves and reliability are provided. We derive two representations for the moments of the order statistics. The method of maximum likelihood is proposed for estimating the model parameters. We obtain the observed information matrix. An application to a real data set demonstrates that the new distribution can provide a better fit than other classical models. We hope that this generalization may attract wider applications in reliability, biology and lifetime data analysis.
Estimação de Medidas de Risco Utilizando Teoria de Valores Extremos
Muitas empresas e investidores hoje visam utilizar técnicas cada vez mais precisas com o objetivo de calcular, de forma mais eficiente, uma medida de risco que possa auxiliá-los no gerenciamento do risco de mercado ao qual podem estar expostos.
O trabalho, neste contexto, traz a estimação do Valor em Risco, uma medida de risco muito utilizada no mercado através da abordagem econométrica juntamente com Teoria de Valores Extremos, utilizando "Excessos threshold", que visam utilizar uma maior informação dos dados para a estimação desta medida.
São apresentadas as estimações, testes, comentários e conclusões sobre qual abordagem é mais adequada em períodos de instabilidade ou em condições normais de mercado.
Comparação de duas abordagens para análise de curvas de crescimento com variáveis latentes: Avaliação do PIB Baiano
Nas últimas décadas ocorreram avanços consideráveis no desenvolvimento de novas e poderosas metodologias para o estudo de dados longitudinais, com ênfase na avaliação das mudanças ao longo do tempo. Dentre estas metodologias destacam-se modelagem das curvas de crescimento com variáveis latentes, modelagem multinível, modelos de mistura generalizados, equações de estimação generalizadas e a modelagem exploratória do crescimento. As similaridades e diferenças entre essas metodologias tornam importante o entendimento do papel de cada uma delas na análise de dados e a discussão de suas particularidades. O objetivo deste trabalho é comparar e discutir duas abordagens metodológicas para análise de curvas de crescimento ao longo do tempo: os modelos multiníveis (MM) e os modelos de curva de crescimento com variáveis latentes (LGC). Para ilustrar os dois métodos, foram modelados dados, na forma de índices, do Produto Interno Bruto (PIB) para 415 municípios do Estado da Bahia no período entre 1999 e 2007. Os resultados obtidos pelas duas abordagens apontam para estimativas bem próximas. Discussão a respeito das limitações e vantagens de cada uma das metodologias é realizada. Devido aos mais recentes desenvolvimentos teóricos, no entanto, a distinção entre MMs e LGCs tem se tornado tênue, sendo que as duas metodologias tendem a convergir em um curto espaço de tempo.
Pesquisa com financiamento da FAPESB (Termo Outorga n° APR 0434/2008)
A Bayesian Analysis for the Block & Basu Bivariate Exponential Distribution: An Example of Application.
In this work, we introduce a Bayesian Analysis for the Block &
Basu bivariate exponential distribution using Markov Chain Monte
Carlo (MCMC) methods and considering lifetimes in presence of
covariates and censored data. Posterior summaries of interest are
obtained using the popular WinBUGS software. An numerical illustration
is introduced considering a medical data set related to the
recurrence times of infection for kidney patients.
Aplicação de árvores de contexto probabilísticas para classificação de textos do Corpus Histórico do Português Tycho Brahe
O Corpus Histórico do Português Tycho Brahe é um corpus eletrônico anotado, composto de textos em português escritos por autores nascidos entre 1435 e 1845 e está disponível para pesquisadores, gratuitamente, para fins acadêmicos e pedagógicos. Ele é desenvolvido junto ao projeto temático Padrões Rítmicos, Fixação de Parâmetros & Mudança Linguística.
O trabalho consiste na modelagem probabilística do Corpus Histórico e utilizamos árvores de sufixo probabilísticas que foram introduzidas por Rissanem em 1983, no caso de árvores finitas. Em seu trabalho ele não apenas introduz o modelo como também propõe um algoritmo para estimar as árvores de contexto dada uma amostra. Em seu artigo ele apresenta uma prova da consistência (fraca) do algoritmo no caso de uma árvore fixa. Em nosso trabalho, generalizamos este resultado para o caso de uma árvore probabilística ilimitada.
Recentemente, árvores de sufixo probabilísticas se tornaram populares na literatura estatística com o nome de variable length Markov chains utilizado por Buhlman e Wyner (1999). Eles provaram a consistência de uma variante do algoritmo de contexto para árvores finitas permitindo que a altura da árvore crescesse com o tamanho da amostra. Árvores probabilísticas ilimitadas definem uma interessante família de cadeias estocásticas de ordem infinita em um alfabeto finito. A idéia é que para cada passado, apenas um sufixo finito do passado (sequência finita de símbolos), chamada de contexto é suficiente para predizer o próximo símbolo. Esses sufixos podem ser representados por uma árvore enumerável completa de contextos finitos na qual existe uma probabilidade de transição associada a cada contexto.
Agradecemos o apoio da FAPEMIG na realização do projeto.
Estratégias Exploratórias em Estudos Longitudinais
Estudos longitudinais são importantes, pois fornecem informações sobre as variações globais e individuais ao longo do tempo (Diggle at al, 2002), sendo também conhecidos como estudos de medidas repetidas, envolvendo situações nas quais a variável resposta é mensurada múltiplas vezes em cada unidade de análise. A análise exploratória para dados longitudinais compreende técnicas que permitem visualizar padrões nos dados. O objetivo deste trabalho é sumarizar técnicas gráficas para avaliação de padrões em estudos longitudinais, bem como estratégias para identificação da estrutura de covariância destes dados. Os métodos sumarizados são ilustrados através da análise de dados referentes a uma aplicação usando dados do Produto Interno Bruto (PIB) de 415 municípios baianos entre 1999 e 2007 (intervalo de tempo constante) e a uma segunda aplicação a respeito do crescimento infantil, mensurado por indicador antropométrico, avaliado em 312 crianças nascidas na maternidade em Mutuípe, na Bahia (intervalo de tempo não constante). Os resultados encontrados indicam que o perfil médio do Índice Produto Interno Bruto (Índice PIB) parece linear ao longo do tempo além de apresentar um ligeiro crescimento do índice dos municípios ao longo do tempo. Para o estudo do crescimento infantil em Mutuípe, os perfis individuais e médio não apresentam linearidade ao longo do tempo. O variograma obtido para exploração da estrutura de covariância indica a inexistência de erro de medição, bem como certa variabilidade nos dados indicando a necessidade da inclusão de um termo aleatório no modelo. Ressalta-se que as técnicas exploratórias para dados longitudinais são de extrema importância para a visualização de padrões nos dados e, portanto, devem ser utilizadas antes da formulação de qualquer modelo estatístico.
Pesquisa com financiamento da FAPESB (Termo Outorga n° APR 0434/2008)
The Complementary Exponential Power Lifetime Model
In this paper we propose a new lifetime distribution which can handle bathtub-shaped, unimodal, increasing and decreasing hazard rate functions. The model has three parameters and generalizes the exponential power distribution proposed by Smith & Bain (1975) by inclusion of an additional shape parameter. Maximum likelihood estimation procedure is discussed. A small-scale simulation study examine the performance of the likelihood ratio statistics under small and moderate sized samples. Three real data sets illustrate the methodology.