Inferência Estatística
INFERÊNCIA EM REGRESSÕES LINEARES HETEROSCEDÁSTICAS: UMA AVALIAÇÃO NUMÉRICA
É prática comum em estudos empíricos a realização de inferências sobre os parâmetros que indexam o modelo linear de regressão com base no estimador de mínimos quadrados ordinários (EMQO) mesmo quando se suspeita da presença de heteroscedasticidade. Nesse caso, utilizam-se estimativas assintoticamente válidas das variâncias dos estimadores no processo inferencial. Na presente dissertação, nós utilizamos integração numérica para avaliar os desempenhos de testes quase-t realizados segundo essa estratégia. Nós propomos ainda um novo estimador consistente de variâncias e covariâncias, denotado por HC4m. Esse estimador é uma versão modicada do estimador HC4. Nós propomos ainda uma versão modicada do estimador HC5: HC5m. A evidência numérica sugere que testes baseados nos estimadores propostos são tipicamente mais conáveis que testes baseados em estimadores alternativos.
CORREÇÃO DE VIÉS E DE BARTLETT EM MODELOS EM SÉRIES DE POTÊNCIA NÃO-LINEARES GENERALIZADOS
Esta dissertação tem dois objetivos. O primeiro é a obtenção da correção de viés de segunda ordem dos estimadores de máxima verossimilhança na classe dos Modelos em Série de Potência Não-Lineares Generalizados, considerando o parâmetro de dispersão conhecido, via Cox & Snell (1968) e bootstrap (Efron, 1979). O segundo objetivo é a obtenção da correção de Bartlett à estatística da razão de verossimilhanças nesta classe de modelos. Desenvolvemos estudos de simulação para avaliar e comparar numericamente o comportamento dos estimadores de máxima verossimilhança, bem como o de suas versões corrigidas, em amostras finitas. Adicionalmente, avaliamos numericamente o desempenho dos testes da razão de verossimilhanças e suas versões corrigidas em relação ao tamanho e poder em amostras finitas. Por fim, realizamos uma aplicação empírica.
An adaptation of Q-Qplot for adjustment of Archimedean copulas
We propose a graphic method to the copulas tting adapted from QQplot denominated
Kendall Plot. This method is more complete than the QQplot due to the addition of
condence bands to the Kendall Plot. The reduction of the data dimension to a onedimensional
random variable, called BIPIT, which carries information about dependency
data structure, allows the utilization of the QQplot adaptation for testing dependency
structures.
Keywords: Copula, BIPIT, Q-Qplot, Kendall Plot, Statistical hypothesis testing.
Distribuição beta inflacionada truncada
O estudo de taxas, razões e proporções é comum em diversas áreas do conhecimento. A distribuição beta ou a distribuição beta inflacionada (Ospina e Ferrari, Statistical Papers, 2010) podem ser escolhas razoáveis na maioria das situações práticas. Contudo, estas distribuições não são indicadas para o ajuste de variáveis que não podem assumir valores no intervalo aberto (0; c), 0 < c < 1. Para o ajuste destas variáveis, introduzimos, neste trabalho, a distribuição beta inflacionada truncada. A distribuição proposta é uma mistura de uma distribuição beta com suporte no intervalo (c; 1) e uma distribuição trinomial que assume os valores zero, um e c. Obtemos os momentos desta distribuição, o vetor escore, a matriz de informação de Fisher e discutimos a estimação pontual e intervalar de seus parâmetros. Estudamos, também, as propriedades dos estimadores sugeridos por meio de simulações de Monte Carlo e realizamos uma aplicação a dados reais.
Surveillance to detect emerging space-time clusters
The interest is on monitoring incoming space-time events to detect an emergent space-time cluster as early as possible. Assume that point process events are continuously recorded in space and time. In a certain unknown moment, a small localized cluster of increased intensity starts to emerge. Its location is also unknown. The aim is to let an alarm to go off as soon as possible after its emergence but avoiding that it goes off unnecessarily. The alarm system should also provide an estimate of the cluster location. In addition to that, the alarm system should take into account the purely spatial and the purely temporal heterogeneity, which are not specified by the user. A space-time surveillance system with these characteristics using a martingale approach to derive the surveillance system properties is proposed. The average run length for the situation when there are clusters present in the data is appropriately defined and the method is illustrated in practice. The algorithm is implemented in a freely available stand-alone software and it is also a feature in a freely available GIS system.
A modified signed likelihood ratio test in elliptical structural models
In this paper we deal with the issue of performing accurate testing inference on a scalar parameter of interest in structural errors-in-variables models. The error terms are allowed to follow a multivariate distribution in the class of the elliptical distributions, which has the multivariate normal distribution as special case. We derive a modified signed likelihood ratio statistic that follows a standard normal distribution with a high degree of accuracy. Our Monte Carlo results show that the modified test is much less size distorted than its unmodified counterpart. An application is presented.
Sensitivity Analysis for Incomplete Continuous Data
In studies with missing data, statisticians typically identify the model via necessarily untestable assumptions and then perform sensitivity analyses to assess their effect on the conclusions. Both the parameterization and the identification of the model play an important role in translating the assumptions to non-statisticians and, consequently, in obtaining relevant information from experts or historical data. Specifically for continuous data, much of the earlier work has been developed under the assumption of normality and/or with hard-to-interpret sensitivity parameters. We derive a simple approach for estimating means, standard deviations and correlations that avoids parametric distributional assumptions for the outcomes. Adopting a pattern-mixture model parameterization, we use non-identifiable means, standard deviations, correlations or functions thereof as sensitivity parameters, which are more easily elicited.
The use of quasi U-statistics for undergraduate performance assessment
We propose new methodologies to assess Undergraduate performance dissimilarities. Emphasis is given to the sector of High School education from which the College student comes - private or public. Due to the complex structure of Undergraduate courses, the overall performance of a student is not based upon its GPA (Grade Point Average). The sample consists of all undergraduate students entering Unicamp at years 2000-2005 as follows. For each student a vector is formed by his/her grades in each course taken: multiple scores are considered whenever fail/pass grades happen. These vectors are then used in pairwise comparisons of common courses grades between all individuals that entered college in the same year taking into account the entrance rank. These forms a generalized U-statistic based on the classical signed rank kernel. We apply the decomposability of these quasi U-statistics (Pinheiro et al., 2009, 2010) to define average distance measures within and between groups. A test statistic for a homogeneity test among groups can be developed and asymptotic normality under mild conditions can be proved for the test statistic under the null hypothesis.
Defuzzificação Probabilística em Conjuntos Fuzzy do Tipo 2
A defuzzificação é parte integrante de qualquer Sistema Difuso (Fuzzy) cuja saída deve ser inferida como um valor crisp ao invés de um conjunto difuso. Vários métodos foram propostos para efetuar tal procedimento, sendo que um deles, desenvolvido por Yager (1993), trata de transformar o conjunto inferido na saída do sistema em uma distribuição de probabilidades e então, calcular a esperança desta distribuição.
O presente estudo tem por objetivo utilizar tal abordagem em conjuntos fuzzy do tipo 2, onde os graus da função de pertinência principal são, eles próprios, conjuntos fuzzy. Serão discutidas as vantagens e desvantagens desta nova abordagem e serão feitas sugestões para trabalhos futuros.
Palavras-chave: Sistemas Fuzzy, Conjuntos Fuzzy do Tipo 2, Defuzzificação, Teoria das Probabilidades.