Iniciação Científica

Medidas do Valor Preditivo de Modelos de Classificação Aplicados a Dados de Crédito

Autor(es) e Instituição: 
Paulo Henrique Ferreira da Silva
Francisco Louzada Neto
Apresentador: 
Paulo Henrique Ferreira da Silva

Para diminuir o risco de decisões errôneas na concessão de crédito a clientes, métodos estatísticos têm sido empregados para descrever a habilidade de modelos de classificação. A qualidade da previsão de um modelo de classificação pode ser avaliada a partir de medidas, como sensibilidade, especificidade, valores de predição positivo e negativo e acurácia, bem como através de coeficientes de correlação (Matthews e correlação aproximada) e medidas teóricas de informação (medida de informação mútua). Neste trabalho de iniciação científica, realizamos um estudo de simulação com o objetivo de comparar as técnicas estatísticas de regressão logística com seleção de amostra state-dependent e regressão logística usual (Hosmer & Lemeshow, 1989), por meio de tais medidas de desempenho. Também ilustramos os procedimentos apresentados em um conjunto de dados reais (dados financeiros extraídos de uma carteira de um banco).

AÇÕES DO MERCADO FINACEIRO: UM ESTUDO VIA MODELOS DE SÉRIES TEMPORAIS

Autor(es) e Instituição: 
Caroline Poli Espanhol; Universidade Presbiteriana Mackenzie
Celia Mendes Carvalho Lopes; Universidade Presbiteriana Mackenzie
Apresentador: 
Celia Mendes Carvalho Lopes

Neste trabalho, busca-se encontrar e ajustar um modelo de séries temporais que se ajuste satisfatoriamente aos dados da série financeira dos valores das ações da Petrobrás, possibilitando, assim, um estudo do comportamento e dos fatores relevantes da série e a previsão de dados futuros da mesma. Após um tratamento e ajuste dos dados, um levantamento de acontecimentos e fatos importantes foi realizado, para identificar possíveis causas das repentinas mudanças na conduta dos dados, variações essas identificadas graficamente. Foram selecionados para estudo dois modelos: GARCH, um modelo não-linear, e EWMA, um modelo de média móvel exponencialmente ponderada. Ambos foram modelados e a análise da eficiência do ajuste da série foi realizada por método gráfico, utilizando análise de resíduos, com gráficos de dispersão e de autocorrelação. O estudo identificou que um dos modelos apresentava um melhor ajuste para a série de dados em estudo do que o outro, sendo então realizada a previsão para alguns próximos valores da série temporal a partir deste modelo, que apresenta uma maior capacidade de absorção das componentes das séries, como a volatilidade, nas suas modelagens; e também pelo seu histórico de melhores ajustes em séries temporais financeiras.

Modelagem de Retornos Climatológicos via Modelos GARCH

Apresentador/Autor: 
Gabriel Fonseca Sarmanho
Resumo: 

Neste trabalho serão apresentados os aspectos teóricos e práticos de uma classe de modelos heteroscedásticos condicionais, mais conhecidos como modelos da família GARCH (generalized autoregressive conditional heteroscedasticity). A proposta é verificar se tais modelos, largamente utilizado em cenários financeiros, podem ser também utilizados no âmbito meteorológico, trazendo resultados satisfatórios, consistentes e representativos para previsões de volatilidade a curto prazo de variáveis que caracterizam o clima. Serão feitos dois enfoques de estimação: frequentista e bayesiano, apresentando suas aplicabilidades e verificando qual dentre as diferentes combinações de modelos melhor se ajusta à cada uma de seis séries de retornos de extremos climáticos fornecidas pelo Instituto Nacional de Meteorologia (INMET). Salienta-se aqui o forte uso de recursos computacionais na construção dos algoritmos necessários para a modelagem estatística, todos programados em R, devido à inexistência de ferramentas específicas em pacotes de tal linguagem. Palavras-chave: Autoregressive Conditional Heteroskedasticity, Generalized Autoregressive Conditional Heteroskedasticity, Extremos Climáticos, Inferência Bayesiana, métodos MCMC.

Comparações Múltiplas de Médias em Modelos Paramétricos Através de Contrastes Gerais, Restrições Lógicas e Correlações

Autor(es) e Instituição: 
Gabriel Bahia Caldas
Gilênio Borges Fernandes
Apresentador: 
Gabriel Bahia Caldas

A ANOVA, efeitos fixos, assume o modelo Y = X + , sendo X uma matriz n x p do delineamento,  um vetor p x 1 de parâmetros e  um vetor n x 1 de variáveis aleatórias geralmente assumidas  ~ NIID(0, 2), para testar a hipótese H0: µ1 = µ2 = ... = µk = µ, contra a alternativa Ha: i ≠ j para algum par i ≠ j sendo µi a média de Y na i-ésima população ou grupo. A rejeição de H0 implica na necessidade de testar H1, H2, ..., Hs hipóteses num mesmo conjunto de dados, através de estatísticas de teste T1, T2, ..., Ts, ou seja, fazer comparações múltiplas. Vários procedimentos conhecidos como Tukey(1951), Duncan(1953, 1955), SNK(1939, 1952), REGWQ(1959,1960,1975), Bonferoni(1966), Scheffé(1953), etc., tem sido usados por muitos anos para este propósito. Alguns destes procedimentos não mantêm a taxa de erro experimental constante e outros têm baixo poder ou só são válidos para dados normais, com variância de Y homogênea nos grupos e, pelo menos parcialmente balanceados. Recentemente vem sendo desenvolvido o enfoque da aplicação de testes t múltiplos (Shaffer, 1986, Westfall & Young, 1993, Westfall, 1997), que usa a hipótese linear geral H0: C= em funções estimáveis, restrições lógica, covariâncias entre as funções e valores-p estimados por simulação e ajustados conforme o método de Bonferroni, aperfeiçoado. O objetivo do presente estudo foi comparar através de simulação, a performance dos procedimentos de comparações múltiplas de médias baseados em testes t múltiplos com o procedimento clássico de Tukey, considerando-se várias configurações de médias na hipótese alternativa, incluindo algumas hipóteses nulas parciais.

Resumo estendido: 

CONFECÇÃO DE UMA LIVRARIA EM R PARA MODELOS LINEARES

Autor(es) e Instituição: 
Raquel de Souza Borges Ferreira, UFJF
Clécio da Silva Ferreira, UFJF
Apresentador: 
Clécio da Silva Ferreira

O objetivo geral deste projeto de Iniciação Científica é desenvolver uma rotina de programação para o software R para os modelos de misturas de escalas normais assimétricas, desenvolvido em Ferreira (2008), atualmente desenvolvidos na linguagem de Matlab®. A livraria em R tornará acessíveis aos usuários os modelos SSMN, englobando o processo de estimação via algoritmo EM, estimação do erro padrão através da matriz de informação de Fisher observada, gráficos de diagnóstico dos casos estudados, entre outros. Com o oferecimento da livraria em R-Gui, os modelos desenvolvidos aqui contribuirão em muito para a aplicação e pesquisa na área de modelagem e ajuste de dados.

Distribuição Skew Normal: Aproximações, Generalizações e Aplicações

Autor(es) e Instituição: 
Murilo Coutinho Silva
Pushpa Narayan Rathie
Apresentador: 
Murilo Coutinho Silva

Esse trabalho trata sobre distribuições assimétricas advindas da distribuição Normal, além de formas gerais para qualquer distribuição. Utilizando-se de fórmulas de assimetrização como a de Azzalini (1986) e a de Fernández e Steel (1998) compomos distribuições assimétricas para a Normal. Esse trabalho propõe também generalizações para as fórmulas de assimetrização. Além disso, nesse artigo utilizaremos uma aproximação da distribuição Normal por uma distribuição inversível, proposta em "On a new Invertible Generalized Logistic Distribution Approximation to Normal Distribution" de Pushpa N. Rathie e Prabhata K. Swamee para aproximar a distribuição Skew-Normal em expressões bem definidas. Neste trabalho muitas propriedades são desenvolvidas para todas as generalizações propostas como médias, variâncias, geratrizes de momentos, estimadores, entropias, etc... Além de toda a teoria desenvolvida neste trabalho, algumas aplicações com dados reais também estão presentes.

Modelos Compartimentais Determinísticos e Estocásticos: Modelagem de Epidemias

Autor(es) e Instituição: 
Márcio Augusto Diniz
Luiz Koodi Hotta
Apresentador: 
Márcio Augusto Diniz

A modelagem matemática de epidemias é de grande importância para os estudos epidemiológicos por possibilitar um melhor entendimento do desenvolvimento de epidemias e a busca por medidas eficientes de prevenção ou erradicação da doença. Este projeto teve por objetivo estudar a utilização de modelos epidemiológicos SEIR na modelagem de doenças de transmissão direta. O modelo SEIR consiste em um sistema de equações integro-diferenciais que considera uma população fechada sendo dividida em quatros compartimentos: Suscetíveis, Expostos, Infectantes, Recuperados. Um modelo do tipo SEIR foi aplicado a epidemia de Febre Hemorrágica Ebola que ocorreu no Congo no ano de 1995. Neste projeto, tanto a abordagem determinística como a estocástica foram consideradas, sendo obtidos os estimadores de Mínimos Quadrados e Bayesiano pelo métodos MCMC. Através do modelo é possível ter uma melhor compreensão da epidemia, por exemplo, considerar o efeito das medidas de controle no tamanho da epidemia.

Introdução ao Controle Estatístico de Processo on-line

Autor(es) e Instituição: 
Caroline Godoy
Francisco Louzada Neto
Apresentador: 
Caroline Godoy

Neste Trabalho pretende-se apresentar de maneira geral algumas técnicas de Controle Estatístico de Processo (CEP), usadas no monitoramento de sistemas produtivos ao longo do tempo, bem como a sua aplicação em alguns exemplos artificiais, que fazem parte de contextos reais. O estudo sobre essas técnicas estatísticas será distribuído de tal maneira que sejam abordados durante o trabalho: a teoria das técnicas estudadas, os diferentes contextos em que podem ser aplicadas e a sua implementação on-line, utilizando recursos computacionais. A aplicação no sistema é realizada de tal sorte que viabiliza praticidade e eficácia na geração de gráficos para o CEP. Serão apresentados também os códigos desenvolvidos no software livre denominado R, versão 2.5.1, além de uma seqüência de passos para o uso do sistema on-line aqui desenvolvido.

Métodos de estimação para riscos competitivos

Autor(es) e Instituição: 
Agatha Sacramento Rodrigues
Adriano Polpo
Teresa C. M. Dias
Apresentador: 
Agatha Sacramento Rodrigues

O problema de confiabilidade de sistemas vem sendo tratado há muito tempo. Cada vez mais se torna importante garantir o funcionamento destes sistemas. Neste trabalho estudamos a teoria de riscos competitivos (especificamente, problemas com dois fatores de risco), através da comparação de três métodos de estimação. São eles: frequentista paramétrico, o estimador de Kaplan-Meier e Bayesiano paramétrico; em que no caso paramétrico utilizamos o modelo Weibull para estimar a função de sobrevivência. Devido à complexidade matemática da distribuição a posteriori do método Bayesiano, recorreu-se ao algoritmo de Metropolis Hasting. As comparações foram realizadas através de simulação de vários conjuntos de dados, com diferentes tamanhos amostrais. As métricas de comparação utilizadas foram: erro quadrático médio (EQM) e erro máximo absoluto (EMA) dos estimadores em relação à verdadeira distribuição. Os resultados das comparações mostraram que o estimador de Kaplan-Meier foi o de pior desempenho e as estimativas paramétricas pelo método frequentista e Bayesiano foram equivalentes.

Um Estudo Sobre Confiabilidade de Redes

Autor(es) e Instituição: 
Taíse Ferraz Lyra - Escola Nacional de Ciências Estatísticas
Carla Silva Oliveira - Escola Nacional de Ciências Estatísticas
Apresentador: 
Taíse Ferraz Lyra

Na literatura, existem algumas maneiras de se calcular a confiabilidade de
uma rede modelada por um grafo. Neste trabalho, é exibida a medida de confiabilidade
que considera os vértices confiáveis e as arestas não-confiáveis e são apresentadas
algumas medidas de centralidade de vértices que podem auxiliar na identificação de
situações onde a inserção de uma aresta pode aumentar a confiabilidade da rede.

Divulgar conteúdo