Ciências Exatas e da Terra
Modelos de Regressão para Dados de Contagem com Distribuição Zero-Modificada
A análise de dados de contagem ocupam um importante lugar na estatística aplicada uma vez que muitos fenômenos ocorridos na natureza são expressos como tais dados. Entretanto, cautela na suposição da distribuição de probabilidade que rege o fenômeno aleatório é necessária pois, muitas vezes a discrepância de interesse é a classe de contagem de zeros. O objetivo principal deste trabalho é apresentar modelos de regressão na família de distribuição zero-modificada de forma a acomodar dados inflacionados, deflacionados ou com ausência de zeros. Desta forma o modelo proposto torna-se bastante flexível para tratar diferentes aplicações de modelos de regressão para dados de contagem. A abordagem clássica do problema de inferência são apresentados.
Wavelet Estimator in Nonparametric Regression to improve Least Squares Estimation
A nonparametric regression with a wavelet estimator is proposed to correct undesired effects
(bias) that, in general, can not be handle in functional or stochastical models of Least Squares method. An application was carried out with real data from Global Positioning System to correct the multipath effect from signal reflection. Improviments of up to 99% was reached in root mean squared error of the residuals.
A Utilização de testes de proporção para analisar habilidades geométricas.
Este trabalho propõe-se analisar, discutir e verificar o que os discentes um determinado curso de pedagogia sabem sobre geometria espacial e saber se os discentes possuem habilidade verbal e visual ao se deparar com uma figura, verificando-se isso através de testes de proporções. Segundo Holfer (1981), citado por Viana (2000) existem cinco habilidades geométricas: visual, verbal, gráfica, lógica e aplicações. A discussão do trabalho queda-se apenas nas habilidades visual, já que a própria geometria e uma disciplina extremamente visual e na verbal em que se refere ao uso de palavras que designam os conceitos. Adicionalmente realizam-se testes estatísticos para verificar se a proporção de acertos é igual à proporção de erros em que relacionaram questões tridimensionais com objetos do cotidiano. Realizam-se também testes para verificar se a proporção de acertos dos discentes do período diurno era igual à proporção de acertos dos discentes do período noturno, para as figuras relacionadas. Conclui-se que nem todos possuem habilidades verbal e visual e que para algumas figuras a proporção de acerto é igual a de erros.
Robust Estimation of Context Trees (Simulations)
We consider m independent samples (strings) where each sample come from one of two possible Variable Memory Markov Chain with context tree T or T', respectively. Each sample is generated from tree T with probability p or tree T' with probability (1-p), 1/2 < p <1, that is, we consider the mixture model p T + (1-p) T', 1/2 < p <1. We propose a robust procedure to estimate T. Our procedure is based on a robust function applied to the rate entropy between two trees. We show that the proposed procedure is robust and we show four scenarios simulation.
The Beta Moyal: An Useful Skew Distribution
For the first time, we propose a so-called beta Moyal distribution,
which generalizes the Moyal distribution, and study its properties.
We derive expansions for the cumulative distribution function as
a weighted power series of the Moyal cumulative distribution.
We provide a comprehensive mathematical treatment of the new model and derive
expansions for its moments, moment generating function, mean deviations,
density function of the order statistics and their moments. We discuss maximum
likelihood estimation of the model parameters. We illustrate the
superiority of the new distribution as compared to the beta normal,
skew-normal and Moyal distributions by means of two real data sets.
CRITÉRIOS DE INFORMAÇÃO DE AKAIKE VERSUS BAYESIANO: ANÁLISE COMPARATIVA
Um modelo é a representação simplificada de algum problema ou situação da vida real destinado
a ilustrar certos aspectos do problema sem se ater a todos os detalhes. Não raro, mais de
um modelo pode descrever um mesmo fenômeno, haja vista que cada pesquisador tem a liberdade
de modelar o fenômeno seguindo a metodologia que julgar mais adequada. Aqui a seleção do
“melhor” modelo torna-se então evidente.
Burnham e Anderson (2004), enfatizam a importância de selecionar modelos baseando-se em
princípios científicos. Dentre as diversas metodologias utilizadas para este fim, neste trabalho realizamos
uma análise comparativa dos critérios de informação de Akaike (AIC), Akaike Corrigido
(AICc) e Bayesiano (BIC), quanto a sua performance na seleção de modelos. Tais critérios são
comparados via simulação em modelos normais e em modelos de séries temporais.
Estatística Básica via MySQL para Pesquisas On-Line
A Internet tem se tornado cada vez mais acessível aos usuários empresariais e domésticos, crescendo a uma taxa de 14% ao ano, atingindo 1 bilhão de usuários em 2005. Além disso, a Avaliação Institucional é uma questão em evidência no Brasil desde 1977, quando o Ensino Superior começou a ser avaliado pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) no âmbito de pós-graduação. Desde então, vem passando por diversas reformulações como, por exemplo, a criação do Sistema Nacional de Avaliação da Educação Superior (SINAES) em 2003. Nesse contexto, desenvolvemos um Sistema computacional on-line inédito e aplicado a Avaliação Institucional (Louzada-Neto e Ara-Souza, 2010). A metodologia aplicada no sistema apresenta algumas características importantes como rapidez, praticidade, menor custo operacional, segurança e garantia total de anonimato dos respondentes.
ESTIMAÇÃO DA IDADE MEDIANA DE ROCHAS VULCÂNICAS ATRAVÉS DO MÉTODO DA MÁXIMA VEROSSIMILHANÇA
Quando uma amostragem é realizada de uma população descrita por uma função f(xi; θ) o conhecimento de θ (parâmetro) descreve a distribuição da população. Uma vez especificada a distribuição da população pode se determinar vários aspectos de interesse na população, ou seja, se diz ter o conhecimento da população inteira, por isso é natural que se busque métodos para encontrar bons estimadores para θ, isto é um bom estimador pontual.
Neste trabalho será descrito o desenvolvimento da aplicação do Método da Máxima Verossimilhança para se encontrar estimadores para parâmetro θ. Por outro lado sabe-se que uma estimativa pontual de um parâmetro não contém informação sobre a precisão do valor obtido, uma vez que essas estimativas variam de amostra para amostra, logo será apresentada uma forma mais completa de abordar tal questão, que será a construção de estimativas na forma de intervalos e conhecer a probabilidade de o intervalo conter o verdadeiro valor do parâmetro. Na aplicação do método estimaremos a idade mediana, em milhões de anos, de rochas vulcânicas apartir de uma amostra de 1804 rochas coletadas na região norte do Estado do Rio Grande do Norte.
Palavras Chave: Método da Máxima Verossimilhança, idade de rochas vulcânicas, mediana.
Asymptotic properties for a general extreme-value regression model
In this thesis we introduce a general extreme-value regression model and derive Cox and Snell's (1968) general formulae for second-order biases of maximum likelihood estimates (MLEs) of the parameters. We present formulae which can be computed by means of weighted linear regressions. Furthermore, we give the skewness of order n^{-1/2} of the MLEs of the parameters by using Bowman and Shenton's (1998) formula. Special cases of this model and a simulation study with results obtained with use of Cox and Snell's (1968) formulae are presented. A practical use of this model and of the derived formulae for bias correction is also presented.
Extensions of the Piecewise Exponential Model
In this paper we present full semi-parametric Bayesian approaches for modeling
survival data using the piecewise exponential model (PEM). We assume that the time
grid needed to fit the PEM is a random quantity and propose a flexible class of prior
distributions for modeling jointly the time grid and its corresponding failure rates.
The mechanism used to model the randomness of the time grid of the PEM has several
advantages over other approaches that have been proposed to address the problem. The
resultant model includes other models established in the literature as special cases and
provides a flexible framework for survival data modeling. Properties of the model are
discussed and the use of the proposed methodology is exemplified through the analysis
of the survival times of patients diagnosed with brain cancer in Windhan-CT, USA,
obtained from the SEER (Surveillance, Epidemiology and End Results) database .