Iniciação Científica
Teste de Dickey-Fuller Robusto Baseado nos Ranks Para Séries Temporais com Observações Atípicas
Este trabalho investiga a probabilidade de rejeitar a hipótese nula, H_0: I(1), quando o teste de Dickey-Fuller (DF) é aplicado em processos autorregressivos (AR) na presença de outliers aditivos. Em particular, o teste de Dickey-Fuller, baseado nos postos (ranks), é sugerido como metodologia alternativa para testar raízes unitárias em séries temporais com outliers do tipo aditivo. Os resultados empíricos e teóricos dão suporte do uso da metodologia proposta para aplicação prática. A série do número de moscas, analisadas em Wei (1994), é considerada neste estudo para explicar o uso do teste proposto.
Principais tipos de resíduos utilizados na análise de diagnóstico em MLG com aplicações para os modelos: Poisson, ZIP e ZINB.
Neste trabalho será abordado uma aplicação do Modelo Poisson padrão e dos Modelos Inflacionados de Zeros para dados de contagem, Zero Inflated Poisson - ZIP e Zero Inflated Negative Binomial - ZINB, utilizando-se as técnicas dos MLG’s através de um conjunto de dados reais, onde algumas alterações foram implementadas no conjunto de dados a fim de aplicar os modelos supracitados. Após a realização dos ajustes uma análise de diagnóstico é discutida para verificar possíveis transgressões aos ajustes dos modelos considerados juntamente com a análise gráfica para verificar a adequabilidade dos modelos em questão em relação a variável de interesse no estudo, o número de abelhas que coletam polens no decorrer do dia.
Modelagem de Retornos Climatológicos via Modelos GARCH
Neste trabalho serão apresentados os aspectos teóricos e práticos de uma classe de modelos heteroscedásticos condicionais, mais conhecidos como modelos da família GARCH (generalized autoregressive conditional heteroscedasticity). A proposta é verificar se tais modelos, largamente utilizado em cenários financeiros, podem ser também utilizados no âmbito meteorológico, trazendo resultados satisfatórios, consistentes e representativos para previsões de volatilidade a curto prazo de variáveis que caracterizam o clima. Serão feitos dois enfoques de estimação: frequentista e bayesiano, apresentando suas aplicabilidades e verificando qual dentre as diferentes combinações de modelos melhor se ajusta à cada uma de seis séries de retornos de extremos climáticos fornecidas pelo Instituto Nacional de Meteorologia (INMET). Salienta-se aqui o forte uso de recursos computacionais na construção dos algoritmos necessários para a modelagem estatística, todos programados em R, devido à inexistência de ferramentas específicas em pacotes de tal linguagem. Palavras-chave: Autoregressive Conditional Heteroskedasticity, Generalized Autoregressive Conditional Heteroskedasticity, Extremos Climáticos, Inferência Bayesiana, métodos MCMC.
Comparação de funções de regressão com abordagem não paramétrica
A comparação de duas ou mais funções de regressão é um assunto bastante discutido. Os métodos clássicos utilizam modelos paramétricos para a função de regressão e comparam os parâmetros resultantes dos modelos. A desvantagem desta abordagem e que ela exige a especificação de um modelo matemático, que nem sempre e possível obter. Em estudos recentes têm sido propostos vários testes para igualdade de funções de regressão usando método do Núcleo Estimador. O nosso trabalho e baseado no método proposto por Dette e Neumeyer (2001), no qual os autores desenvolveram um teste bootstrap baseado na diferença entre um estimador não paramétrico de variância na amostra combinada, e uma combinação convexa dos estimadores não paramétricos das variâncias das amostras individuais. Porém a escolha da janela, h, é um ponto fundamental para se obter uma boa estimativa da função de regressão de interesse. A opção por valores inadequados podem obscurecer a relação das variáveis do modelo e, consequentemente prejudicar a qualidade do ajuste. Assim, o objetivo principal deste trabalho e testar o efeito da escolha da janela na comparação de funções de regressão. A motivação para este trabalho se situa no fato de que, ao estudarmos a literatura sobre a comparação de curvas de regressão, não encontramos um método automático para a seleção do parâmetro de suavização. Para ilustrar o impacto da escola do parâmetro de suavização utilizamos dados de homicídios de algumas cidades da região metropolitana de Belo Horizonte.
Redes Bayesianas: uma introdução aplicada a credit soring
A Inteligência Artificial, segundo Tafner et al. (1995), é uma área catalisadora do desejo humano de reproduzir inteligência em mecanismos não-biológicos; constitui-se em um conjunto de técnicas de programação para resolver problemas. Ela procura imitar as formas de resolução de problemas do mesmo modo que o homem o faz. Além disso, a Inteligência Artificial é uma área interdisciplinar dentro das Ciências Exatas, sendo explorada com maior intensidade pelas áreas de Ciências da Computação e Engenharia Elétrica, com o auxílio de metodologia e pensamento estatístico. Segundo Mitchel, citado por Rezende (2004, p.93), entre os métodos estatísticos, destaca-se o aprendizado Bayesiano, que utiliza um modelo probabilístico baseado no conhecimento prévio do problema, o qual é combinado com exemplos de treinamento para determinar a probabilidade final de uma hipótese. Assim, as Redes Bayesianas são uma abordagem interpretativa e analítica para o raciocínio probabilista e tem sido utilizada recentemente em diversas áreas como, por exemplo, estimação de risco operacional, diagnóstico médico, credit scoring, projeto de jogos computacionais, imputação de dados, entre outras. Desta forma, a técnica de Redes Bayesianas é um método de modelagem e de decisão, sendo alternativo às técnicas comumente utilizadas como, por exemplo, Regressão Logística e Análise Discriminante. Esse trabalho de conclusão de curso, desenvolvido de julho a dezembro de 2008, tem a finalidade de apresentar de forma clara e objetiva fundamentos básicos da técnica de Redes Bayesianas, realizar sua aplicação em exemplos, alguns deles envolvendo dados reais, e apresentar os resultados de um estudo de simulação que compara a capacidade preditiva das Redes Bayesianas com um procedimento padrão, comumente utilizado na modelagem de dados com respostas dicotômicas.
Algoritmo Gené́tico com parâmetros fixos versus parâmetros variáveis: um estudo comparativo
Neste trabalho comparamos os resultados obtidos da simulação de dois algoritmos, a saber: o algoritmo genético clássico e a versão modificada do mesmo proposta no artigo dos professores André G. C. Pereira e Viviane S. M. Campos do Departamento de Matemática da UFRN. Nesta proposta permite-se que as probabilidades de cruzamento e mutação variem dentro de determinadas condições.
Generalizações e Extensões de algumas Distribuições Simétricas
A família de distribuições simétricas com suporte na reta real tem grande aplicabilidade
na modelagem estatstica. Esta família forma uma classe geral de distribuições com a
mesma simetria que a distribuição normal padrão. As distribuições Cauchy, Logística
tipos I e II, generalizações e extensões de algumas distribuições simétricas, entre outras,
pertencem a esta classe.
A classe de distribuições simétricas tem recebido crescente atenção na literatura
estatística , nos ultimos anos, pois ela assume para os erros, distribuições com caudas
mais pesadas do que a normal, afim de reduzir a influência de pontos aberrantes.
Existem ainda varias generalizações e extensões da distribuicão normal pertencente a
classe simétrica. A importância desses modelos e que
dependendo da situação, precisamos de modelos mais sensíveis a massa de dados ou
de modelos mais robustos para não detectar pontos aberrantes ou out-line.
O objetivo deste trabalho é portanto generalizar algumas distribuições conhecidas
pertencentes a essa classe e desta forma poder avaliar seu comportamento de modo a
identificar situações de modelagem mais específicas para o conjunto de dados.
Uma interpretação frequentista alternativa dos intervalos de tolerância
Resumo: Neste trabalho, foi proposta uma forma alternativa de interpretar intervalos de tolerância, baseando-se apenas na mudança do espaço amostral. Este estudo foi motivado pelo fato de Hoel (1976) somente sugerir tal interpretação, não entrando, entretanto, em maiores detalhes. Ao propor uma interpretação frequentista alternativa para o intervalo de tolerância, o trabalho em questão procurou um melhor entendimento para o assunto abordado. Para se demonstrar que esta interpretação alternativa é valida, recorreu-se ao teorema ergódico.
Palavras-chave: intervalos de tolerância, teorema ergódico, interpretação alternativa.
ESTUDO DE MODELO DE SÉRIES TEMPORAIS PARA DADOS DE AÇÕES
Neste trabalho é apresentado um estudo do modelo de Média Móvel Exponencialmente Ponderada, EWMA. Este modelo tem sido amplamente utilizado em aplicações para dados de séries temporais, em particular, em séries financeiras. São apresentadas algumas características do modelo e uma aplicação. Para isso, foi utilizada a série de dados referentes ao período de dezembro de 1999 a janeiro de 2009 sobre o preço diário de fechamento do lote de ações da empresa Votorantim Celulose e Papel, obtidos no site da BMF Bovespa. No período em estudo, a Votorantim ainda operava na Bolsa de Valores de São Paulo sob o código de negociação VCPA4. As estimativas do modelo são obtidas de modo a minimizar o erro quadrático médio (EQM). São apresentados, ainda, gráficos envolvendo resíduos para uma análise de ajuste do modelo. O modelo EWMA é muito popular em estudos com séries temporais por ser de fácil entendimento, ter rápida aplicação e por apresentar um resultado com erro aceitável. Assim, era esperada uma boa previsão da volatilidade da série para posterior comparação com a volatilidade dos valores originais. Com base neste estudo podem ser tomadas decisões de compra, manutenção ou venda das ações em questão, para que se consiga a maior rentabilidade possível de uma aplicação financeira.
Estimação do Pass-Through Cambial no Brasil referente aos Índices de Preços ao Consumidor
Este trabalho consiste em ajustar um modelo VAR para as séries de índices de preço ao consumidor, que são: Índice de preços de Matéria-Prima, Índice de preços de Bens Intermediários, Índice de preços de Bens Finais, Produto Interno Bruto Brasileiro, Taxa de Câmbio e Preços Externos. Sendo que o VAR ajustado terá 3 séries como variáveis endógenas, que serão os Índices de Materia-prima, de Bens Intermediários e de Bens Finais e também terá variáveis exógenas que serão as séries PIB, Taxa de Câmbio e Preços Externos. Antes de mais nada precisa-se averiguar se estas são séries estacionárias ou não. Para isso se faz o teste aumentativo da Raiz Unitária de Dickey-Fuller.
Depois de resolvida a questão da estacionaridade é preciso verificar se estas são cointegradas. Isto é resolvido realizando o teste de cointegração de Jonhasen.Após achar um número apropriado de defasagens para o modelo escolhido, é necessário verificar a adequabilidade deste modelo através da realização de testes diagnósticos.Se os dois maiores problemas em modelagem persistirem, tal como a hetercedasticidade ou autocorrelação serial, e não tiver como reverter este problema é necessário escolher um outro VAR para este banco de dados.