Ciências Exatas e da Terra
Modelamento e Fundo de Participação dos Municípios
MODELAMENTO DO FUNDO DE PARTICIPAÇÃO DOS MUNICÍPIOS POR SÉRIES TEMPORAIS
Maura da Silva Costa Furtado1 Joaquim Carlos B. Queiroz2 e Paula Daniele Mesquita Ferreira3
Resumo
Este trabalho tem por objetivo, apresentar modelos para o ajustamento e previsão que expliquem a evolução do Fundo de Participação dos Municípios brasileiros, a partir da análise de séries temporais. Foram utilizadas séries do Fundo de Participação dos Municípios no período de janeiro de 1994 à dezembro de 2006 para as regiões Norte, Nordeste, Centro-Oeste, Sudeste e Sul, além da série para o Estado do Pará. Para apresentar uma visão básica sobre Fundo de Participação dos Municípios, veremos alguns conceitos importantes, relacionados com este problema, bem como o histórico e a composição do Fundo de Participação dos Municípios (FPM). Os resultados mostraram que a região nordeste apresenta maior volume de recursos do FPM e a região Centro-oeste, com menos Estados, dispõe dos menores recursos. Uma particularidade apresentada pelas séries refere-se à forma muito parecida das mesmas mudando somente quanto aos valores. Isso levou a modelos similares, ou seja, com mesmo número de parâmetros e mesmo número de diferenciações. Os modelos ajustados conseguiram erros de previsões com base no erro percentual médio absoluto (MAPE) em torno de 5%.
Palavras-chave: Modelos ARIMA, Previsão e Fundo de Participação dos Municípios (FPM).
Abstract
This paper aims to present models for the prediction and adjustment to explain the evolution of the Participation Fund of the Brazilian municipalities, from the time series analysis. It was used series of Municipalities Participation Fund from January 1994 to December 2006 for the North, Northeast, Midwest, Southeast and South, in addition to the series for the state of Para to provide a basic insight into Fund Participation of the municipalities, we will see some important concepts related to this problem as well as the history and composition of the Municipal Participation Fund (FPM). The results showed that the Northeast has a higher volume of resources from MPF and the Midwest region, with fewer states have the fewest resources. A peculiarity presented by the series refers to very much like the same changing only on the figures. This led to similar models, ie with same number of parameters and same number of differentiations. The adjusted models were able to errors of predictions based on mean absolute percentage error (MAPE) of around 5%.
Keywords: ARIMA models, forecasting and the Municipal Participation Fund (FPM)
__________________
1Mestranda em Estatística pela Universidade Federal do Pará, Pós graduada em Docência no Ensino Superior pela UCAM/RJ, Graduada em Estatística pela Universidade Federal do Pará, Professora da Faculdade de Castanhal FCAT/PA e Assessora da Comissão Própria de Avaliação (CPA) da FCAT. maura_scfurtado@hotmail.com
2 Prof. Associado II da Faculdade de Estatística da Universidade Federal do Pará. joaquim@ufpa.br
3Graduada em Estatística pela Universidade Federal do Pará.
Modelo de Regressão Exponencial com Longa-duração: Uma Aplicação
A análise de sobrevivência consiste numa coleção de procedimentos usados para descrever e analisar dados relacionados ao tempo. Um complicador presente neste tipo de análise é a presença de observações censuradas ou observação parcial da resposta. Motivados pelos dados referente ao estudo dos tempos de internação de pacientes viciados em heroína (ver Kleinbaum (1995)), um estudo nesta área foi realizado. Ao analisar os dados, nos deparamos com a presença de longa-duração, além da presença de covariáveis. Para modelagem dos dados, usamos do modelo proposto por Berkson & Gage (1952). Assim, conseguimos incorporar a heterogeneidade da
população, através de um parâmetro de longa-duração. Além disso, utilizamos do modelo exponencial com regressão no parâmetro de escala para incorporar, além da longa-duração, as covariáveis em estudo.
Palavras-chave: Análise de Sobrevivência, longa-duração, regressão, exponencial.
Algorithms for estimation of variable length Markov Chains and applications
There are many studies in the field of linguistics where the interest is to analyze the differences between Brazilian Portuguese and European Portuguese (henceforth BP and EP respectively). Both the BP on EP, have the same words set in their structure (lexicon). However, these languages have different syntaxes and different prosodies. The key point of this process of differentiation, is related to the question of finding
estimation methods. To better understand this theoretical context, we discuss here some basic concepts of variable length Markov chains, as well as a simulation study to find evidence whether to use BIC or AIC as the selection criteria of models to tune the pruning constant of the algorithm Context (Rissanen (1983); Buhlman and Wyner (1999)).
A Bayesian Skew-Normal Independent Mixture Measurement Error Model
The traditional regression model with measurement errors assumes normal distributions for the error terms and unobserved latent covariate. These assumptions are not appropriate when asymmetry, outliers, and multi-modality occur simultaneously. We propose a model that presents robustness against violations of these assumptions, assuming that the distribution of the covariate belongs to a highly flexible family of distributions, defined as a finite mixture of skew-normal independent distributions. The model can be applied in many practical situations such as comparative calibration of instruments, where the bias and precision of measurements made using some instruments are
evaluated based on measurements made by a reference one. The main goals are (i) develop algorithms for Bayesian estimation of the parameters of the proposed model; (ii) investigate, through simulation, the performance of the model selection criterion DIC (Deviance Information Criterion) as a suitable method to choose between the different considered models, including the determination of the number of component mixtures and (iii) apply the proposed methodology by considering the analysis of simulated and real data sets.
Comparação de assinaturas de amostras em Árvores Probabilísticas de Contexto
Em Galves, Galves, Garcia e Leonardi (2009) é introduzido o
critério do menor maximizador (smallest maximizer criterion) para
estimar uma Árvore Probabilística de Contexto (PCT). Este critério seleciona a árvore na classe das campeãs estimadas pelo BIC, para cada valor da constante de
penalização do modelo. Este algoritmo é chamado de G3L.
Dada uma amostra X_1,...,X_n, C_x é uma sequencia de
constantes de penalização que caracteriza esta amostra no seguinte
sentido:
1.Em amostras da mesma PCT, as sequencias de constantes de penalização geradas pelo G3L não diferem muito umas das
outras.
2.Em amostras de duas árvores diferentes as sequencias de constantes de penalização geradas pelo G3L são diferentes.
Estamos propondo um teste bootstrap, baseado na assinatura da
amostra, para decidir se duas amostras foram geradas a partir da
mesma árvore de contexto probabilística ou não.
Comparação entre os Dados de Pressão Atmosférica e Temperatura do Ar do BNDO/DHN e das Reanálises-2/NCEP para a Área Marítima Costeira do Brasil
Neste trabalho, foram analisados e confrontados, através do teste t-Student, dados médios mensais de pressão atmosférica (hPa) e temperatura do ar (ºC) oriundos do Banco Nacional de Dados Oceanográficos (BNDO), mantido pela Diretoria de Hidrografia e Navegação (DHN), e das Reanálises-2 do National Centers for Environmental Prediction (NCEP) para a área marítima costeira do Brasil. Os resultados indicam que ambas as fontes conseguem representar quantitativamente os padrões de pressão atmosférica na área de interesse, incluindo sua variabilidade sazonal. No entanto, as Reanálises-2 subestimam a temperatura do ar em todas as subáreas consideradas.
Um Estudo do Modelo de Risco Logístico Generalizado Dependente do Tempo com Fragilidade
Neste trabalho apresentamos o modelo de risco logístico generalizado dependente do tempo (GTDL) com fragilidade. Utilizando dados gerados calculamos a probabilidade de cobertura para diferentes porcentagem de observações censuradas e tamanho de amostra. Também calculamos a inflação da variância para os parâmetros que medem o efeito do tempo e da covariável quando estimamos o parâmetro da fragilidade dos dados.
Uma Nova Abordagem Para Análise De Dependência Bivariada
Nesta dissertação descrevemos e implementamos procedimentos para estimação não paramétrica da cópula e da função de Sibuya, e também procedimentos para análise de dependência bivariada baseado no comportamento de suas curvas de nível. Além disso, descrevemos e implementamos o procedimento chi-plot assim como um procedimento para a análise de dependência bivariada com presença de censura na amostra. Particularmente, propomos uma maneira de usá-lo em uma análise de correlação local. O desempenho dos procedimentos propostos são ilustrados e avaliados em casos de estruturas de correlação simples, mas também em esquemas de correlação mais complexa.
An Alternative Class of Multivariate Scale Mixtures of Skew-Normal Distributions
The normal distribution is a routine assumption for the analysis of real data, but it may be unrealistic specially when the data present strong skewness, as well as heavy tails. Following Branco & Dey (2001) and Arellano-Valle et al. (2007), this article develops a new class of multivariate scale mixtures of skew-normal distributions which includes the skew-normal (and the normal) distribution as a special case. The main advantage of these class of distributions is that they have a nice hierarchical representation that allows the implementation of Markov chain Monte Carlo (MCMC) methods to simulate samples from the joint posterior distribution. Analytical forms of the densities are obtained and distributional properties of the proposed class are also studied. In order to examine the robust aspects of this flexible class, against outlying and influential observations, we present a Bayesian case deletion influence diagnostics based on the Kullback-Leibler divergence. Results obtained from simulated and real data sets are reported illustrating the usefulness of the proposed methodology.
Comparação de métodos de estimação em modelos logísticos multiníveis para dados longitudinais: Um estudo de simulação.
O desenvolvimento de métodos estatísticos para análise de dados obtidos em situações em que as observações são dependentes tem apresentado crescimento relevante nas últimas décadas e, em especial, na análise de dados provenientes de estudos longitudinais. No contexto dos modelos multiníveis lineares generalizados (GLMM), a estimação pode ser realizada sob dois enfoques: métodos de aproximação da verossimilhança ou por integração numérica (Hox, 2002). Esse trabalho objetiva comparar a performance dos métodos de estimação disponíveis no software R para o ajuste de modelos logísticos multiníveis na análise de dados longitudinais. Para isto foram conduzidos estudos de simulação, considerando-se diferentes graus de dependência, número de observações repetidas e número de indivíduos. Resultados dos estudos de simulação apontam para diferenças mais acentuadas de performance dos métodos (em termos de vício, variabilidade dos estimadores e probabilidade de cobertura) em situações com reduzido número de mensurações ao longo do tempo e alto coeficiente de correlação intraclasse. Neste caso, alguns métodos produziram estimativas menos viesadas, enquanto outros foram mais acurados. No entanto, o aumento conjunto do número de indivíduos sob estudo e do número de medidas repetidas apontam que a performance destes métodos de estimação tendem a ser muito similares. Neste caso, a escolha do método a ser utilizado no ajuste do modelo logístico multinível dependerá da disponibilidade em software estatístico.
Projeto com financiamento FAPESB, Termo de Outorga nº.0082/2006.