Teoria
Functional parameter estimation in partial differential equations
In this work we present a methodology of estimation of functional parameters that appear in models that are described by partial differential equations. We will focus on the following model: $$f\frac{\partial^2 u }{\partial t^2}+g\frac{\partial u }{\partial t}+hu=\frac{\partial }{\partial x}\left[{\mathcal{K}}\frac{\partial u}{\partial x}\right],$$ where the parameters $f,g,h$ and ${\mathcal{K}}$ are real valued functions of the real variable $x.$ We assume we know $N$ functions $v_1(x,t),...,v_N(x,t)$ that satisfy, for each $i$, $1\le i\le N,$ $v_i=u_i+\epsilon_i,$ where $u_i$ is a solution of the PDE and $\epsilon_i$ is small amplitude i.i.d. noise.
Monotonicidade em Testes de Hipóteses
A maioria dos textos na literatura de testes de hipóteses trata de critérios de otimalidade para um determinado problema de decisão. No entanto, existem, em menor quantidade, alguns textos sobre os problemas de se realizar testes de hipóteses simultâneos e sobre a concordância lógica de suas soluções ótimas.
Algo que se espera de testes de hipóteses simultâneos é que, se uma hipótese $H$ implica uma hipótese $H^\prime$, então é desejável que a rejeição da hipótese $H^\prime$ necessariamente implique na rejeição da hipótese $H$, para uma mesma amostra observada. Essa propriedade é chamada aqui de monotonicidade.
A fim de estudar essa propriedade sob um ponto de vista mais geral, neste trabalho é definida a noção de classe de testes de hipóteses, que estende a função teste para uma sigma-álgebra de possíveis hipóteses nulas, e introduzida uma definição de monotonicidade.
Também é mostrado, por meio de alguns exemplos simples, que, para um nível de significância fixado, a classe de testes Razão de Verossimilhanças Generalizada (RVG) não apresenta monotonicidade, ao contrário de testes formulados sob a perspectiva bayesiana, como o teste de Bayes baseado em probabilidades a posteriori e o FBST.
Por fim, são verificadas, sob a teoria da decisão, quando possível, condições suficientes para que uma classe de testes de hipóteses tenha monotonicidade.
Análise de influência na regressão em cristas
Modelos de Regressão em Cristas apresentam características próprias e problemas específicos. São geralmente utilizados para contornar o problema da multicolinearidade, consequência da existência de relações lineares entre as variáveis explicativas.
No presente trabalho, apresentaremos inicialmente medidas de influência específicas para o contexto de regressão em cristas. Posteriormente, serão analisadas medidas de influência local. Finalmente, os procedimentos descritos serão aplicados a um conjunto de dados reais.
Construção de delineamentos D-ótimos exatos para a equação de Michaelis-Menten
Neste trabalho foi abordada a construção de delineamentos experimentais ótimos exatos quando resposta de interesse pode ser modelada pela equação de Michaelis-Menten. Foi suposta a situação em que o pesquisador deseja maximizar a informação obtida sobre os parâmetros do modelo e, portanto, foi utilizado o critério de D-otimalidade. Para a busca dos delineamentos ótimos, foram utilizados os algoritmos genético e {\it{exchange}}. Além disso, três abordagens para o delineamento em situações não lineares foram consideradas: localmente ótima, Bayesiana e maximin. Como resultado, observou-se que o delineamento D-ótimo exato para o modelo depende do valor de apenas um dos parâmetros, a constante de Michaelis-Menten. De acordo com o valor desta constante, foram obtidas regiões em que cada abordagem foi mais eficiente que as demais. Por fim, foi verificado que as abordagens localmente ótima e Bayesina apresentam valores de D-eficiência muito similares e, em oposição a elas, a abordagem maximin foi menos atrativa para este caso, inviabilizando sua aplicação.
Estimadores Lineares Bayesianos em Amostragem de População Finita
Este trabalho apresenta uma metodologia Bayesiana, livre de distribuição, baseada em estimadores lineares, para previsão em populações finitas. Temos particular interesse nesta abordagem, pois baseia-se em uma modelagem robusta, no sentido que caracteriza-se a meio caminho entre duas ideias extremas: de um lado os procedimentos de aleatorização e de outro modelos de superpopulação. Dentro da perspectiva de amostragem de população finita, trabalhamos em alguns contextos possíveis. Em populações associadas aos mais frequentes desenhos amostrais, destacamos questões como permutabilidade e eliciação de informações a priori, além de estabelecer condições para obter estimadores associados a amostragem clássica. Para populações com observações caracterizadas por modelos na família exponencial, comparamos algumas distribuições preditivas, presentes na literatura, fornecidas pelas abordagens Bayesiana e clássica. Os resultados obtidos exploram propriedades frequentistas e mostram que distribuições preditivas, que levam em consideração a incerteza inerente ao procedimento de estimação (o que caracteriza o paradigma Bayesiano), apresentam-se mais eficientes que distribuições fornecidas pela metodologia clássica, resultantes de práticas do tipo plug-in do parâmetro estimado. Teremos ainda interesse em modelos que caracterizam pequenos domínios. Neste sentido, propomos o uso de um procedimento de inferência baseado em métodos de simulação estocástica, em particular métodos de Monte Carlo via cadeias de Markov, com a restrição de elaboração de uma distribuição proposta via método linear de Bayes. Uma aplicação a dados reais de proficiência de estudantes será apresentada.
Regressão logística binária com resposta pertencente a família exponencial
Em diversas situações a variável resposta binária tem uma distribuição discreta ou contínua. Nesse trabalho apresentamos a metodologia proposta por Suissa e Blais (1995) para o contexto da família exponencial. Apresentamos a construção e o desenvolvimento dos modelos para alguns casos particulares, incorporando a informação sobre a distribuição original da variável resposta. Fazemos vários estudos de simulação comparando o modelo de regressão logística com a informação da distribuição de origem e o modelo de regressão logística usual. Assumindo uma distribuição corretamente especificada, a incorporação desta informação sobre a variável resposta no modelo produz estimativas de máxima verossimilhança mais eficientes. Como aplicação fazemos um estudo com dados artificiais onde aplicamos o modelo de regressão logística com resposta pertencente a família exponencial comparando com o modelo de regressão logística usual. Consideramos os modelos normal, log-normal e exponencial.
Testes de hipóteses em eleições majoritárias
O problema de inferência sobre uma proporção, amplamente divulgado na literatura estatística, ocupa papel central no desenvolvimento das várias teorias de Inferência Estatística e, invariavelmente, é objeto de investigação e discussão em estudos comparativos entre as diferentes escolas de Inferência. Ademais, a estimação de proporções, bem como teste de hipóteses para proporções, é de grande importância para as diversas áreas do conhecimento, constituindo um método quantitativo simples e universal. Nesse trabalho, é feito um estudo comparativo entre as abordagens clássica e bayesiana do problema de testar as hipóteses de ocorrência ou não de 2º turno em um cenário típico de eleição majoritária (maioria absoluta) em dois turnos no Brasil.
Uso da distribuição geométrica para modelagem de dados de contagem com excesso de zeros em finanças
Em finanças, dados de contagem com excesso de zeros, como por exemplo a variável resposta "tempo em dias entre o pagamento da fatura do cartão e seu vencimento" pode ser modelado segundo uma distribuição geométrica. Em geral, dados financeiros dessa natureza apresentam uma grande quantidade de zeros observados, pois a grande maioria dos clientes efetuam o pagamento dentro do prazo de vencimento. Nesse trabalho fazemos um estudo com dados virtuais de finanças com excesso de zeros em que analisamos o desempenho do modelo logístico e do modelo logístico com resposta geométrica. Aspectos sobre probabilidade de cobertura de ambos os modelos são abordados.
Respostas dicotômicas oriundas da distribuição Gaussiana com estrutura heteroscedástica multiplicativa
A regressão logística binária é indicada quando a variável resposta de interesse é dicotômica, isto é, quando a variável resposta assume apenas dois valores possíveis. Porém, em muitas situações práticas pode ocorrer que a variável resposta binária tenha uma distribuição original pertencente a alguma classe de distribuições, sejam elas discretas ou contínuas. Em outras palavras, a variável resposta tem uma distribuição original que não a de Bernoulli e, por algum motivo, tal variável foi posteriormente dicotomizada considerando um ponto de corte C arbitrário. Nesse sentido a regressão logística pode incorporar a informação sobre a distribuição original da variável resposta no ajuste do modelo logístico usual. Nesse trabalho assumimos que a variável resposta binária seja oriunda da distribuição normal em uma estrutura heteroscedástica.
Determinação de LGD através de Modelos Estatísticos
No contexto de perda de crédito nos portfólios, a quantidade LGD é a proporção do total exposto que será perdido se o default ocorrer. Quatro modelos utilizados para o cálculo de recuperação, definido como 1-LGD, estão presentes na literatura: modelo normal, log-normal, logit-normal e regressão beta. Neste trabalho a variável LGD é modelada usando a regressão beta generalizada. Estimação classica e bayesiana são utilizadas na estimação dos parâmetros do modelo.