Modelos Lineares, MLG e outros modelos não-lineares
RELAÇÃO ENTRE A OCORRÊNCIA DE TUBERCULOSE E UM CONJUNTO DE FATORES SÓCIOECONÔMICOS, DEMOGRÁFICOS E DE SAÚDE DA POPULAÇÃO BRASILEIRA USANDO A PNAD 2003.
A tuberculose (TB) é uma doença infecciosa crônica que acompanha a espécie humana desde os primórdios da civilização, mas que, ainda hoje, permanece como a maior causa de morte por doença infecciosa em adultos no mundo, principalmente nos países em desenvolvimento. Neste trabalho, utilizando dados provenientes da Pesquisa Nacional por Amostra de Domicílios (PNAD) de 2003 realizada pelo IBGE, foram identificados alguns fatores sócioeconômicos, demográficos e de saúde que explicam a chance de ocorrência de tuberculose para os residentes em domicílios particulares permanentes no Brasil em 2003. Para a identificação de tais fatores foi ajustado um modelo de regressão logística binária, incorporando as informações do desenho amostral da pesquisa, onde o desfecho do modelo indica se a pessoa teve ou não tuberculose. Para explicar o referido desfecho, foi considerado inicialmente um conjunto de 14 variáveis: sexo, faixa etária, cor/raça, escolaridade, rendimento domiciliar per capita, morbidade auto-referida (diabetes, artrite ou reumatismo, bronquite ou asma, insuficiência renal crônica, depressão), tipo do domicílio, material predominante nas paredes, material predominante no telhado, banheiro ou sanitário no domicílio ou propriedade, água canalizada de rede geral, coleta de lixo, localização do domicílio e densidade domiciliar. Utilizando o teste t-student verificou-se que as variáveis sexo, faixa etária, cor/raça, morbidade auto-referida e material predominante nas paredes apresentam efeito estatisticamente significativo. Os resultados deste estudo podem contribuir de forma relevante para o planejamento de políticas públicas que visem à prevenção, controle e tratamento da tuberculose na população brasileira.
Estimação no Modelo de Calibração Linear Clássico
Este projeto se justifica devido a necessidade de se mostrar os estimadores no modelo de calibração linear, cuja literatura apresenta uma grande polêmica sobre qual dos estimadores pontuais, clássico ou inverso, é melhor para estimar e também, sobre qual o melhor critério para compará-los. Para isso foi estudado um banco de dados com 32 amostras de uma importante árvore da região amazônica chamada Vochysia maxima Oucke (Quaruba), onde foi aplicada a técnica estatística de Calibração Linear Clássica a fim de se estimar o diâmetro dessas árvores a partir do seu volume e por fim realizar a comparação dos estimadores da calibração linear, clássico e inverso, por meio de suas propriedades estatísticas, verificando qual deles é o melhor para estimação. Portanto, este trabalho, vem contribuir nos estudos sobre estes estimadores.
Resíduos de Pearson melhorados em modelos de regressão beta
Neste trabalho, desenvolvemos correções para resíduos de Pearson no modelo de regressão beta (Ferrari e Cribari-Neto, Journal of Applied Statistics, 2004) e propomos resíduos de Pearson melhorados de forma que a média e a variância dos resíduos melhorados estejam mais próximas de zero e de um, respectivamente. O trabalho foi baseado nos artigos de Cox e Snell (Journal of the Royal Statistical Society B, 1968), Cordeiro (Statistics and Probability Letters, 2004) e de Simas e Cordeiro (Journal of Statistical Computation and Simulation, 2009). Um estudo de simulação foi realizado, utilizando-se o método de Monte Carlo, para investigarmos o efeito da correção na média, variância e coeficientes de assimetria e curtose dos resíduos de Pearson não-melhorados e melhorados. Além disso, procuramos verificar a proximidade das distribuições dos resíduos abordados à distribuição normal padrão.
Associação entre os Delitos Registrados na RGV: Uma Aplicação do Modelo GLARMA Poisson
Neste trabalho é utilizado o modelo GLARMA Poisson para
descrever os delitos comumentes registrados na Região da Grande Vitória,
ES, Brasil, pelo CIODES.Com base no trabalho de Davis et al. (1999),
que provém uma revisão de modelos para séries temporais com distribuição de Poisson, procedimentos de identicação e análise residual do
modelo GLARMA são considerados.Os resultados do ajuste indicaram
que o modelo GLARMA é bastante apropriado para modelar os dados
observados.
Comparação entre medidas clássicas e robustas para identificação de outliers em regressão.
A técnica da análise de regressão linear não está completa sem o estudo dos resíduos para a identificação de possíveis outliers e de alguns outros diagnósticos. Outliers estão presentes em praticamente todos os conjuntos de dados, em qualquer domínio de aplicação. Pesquisas realizadas com grandes quantidades de observações tornam mais difíceis sua detectação visual. O objetivo desse trabalho é comparar as medidas clássicas com as medidas robustas para identificação de outliers. Entre as medidas clássicas foram consideradas: Leverage, DFBeta DFFit, Cook, Covratio e a distância de Malahanobis. As medidas robustas consideradas foram Elipsóide de Volume Mínimo e Covariância de Determinante Mínimo. Através da análise de vários conjuntos de dados, os resultados revelaram que as medidas robustas, que utilizam estimadores que “resistem” a uma proporção de dados contaminados, mostraram-se mais eficientes na identificação de outliers.
Método bootstrap aplicado à modelos lineares generalizados em experimentação agronômica
Neste trabalho, explora-se o método bootstrap aplicado a um modelo linear generalizado com a finalidade de estimar o erro padrão das estimativas dos parâmetros do modelo. Numa aplicação de um experimento de conservação de sementes, são comparados os resultados obtidos via bootstrap com aqueles produzidos pela teoria clássica.
UMA ESTIMATIVA DO IMPACTO DOS GASTOS COM PROGRAMAS ASSISTENCIAS NA ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL
Este artigo tem como objetivo avaliar o impacto dos gastos em programas
assistenciais na eleição presidencial de 2006. Esta avaliação é realizada considerando dois tipos de modelos de regressão: linear e beta. Utilizamos o modelo de regressão linear para explicar o número de votos válidos do presidente Lula no segundo turno da eleição de 2006 e modelo de regressão beta para explicar diferença entre as proporções de votos válidos do presidente Lula nos segundos turnos das eleições de 2006 e 2002 e
também sua proporção de votos válidos no segundo turno da eleição de 2006. Comparando os gastos nos programas assistenciais em 2006 e 2002, nota-se que em 2006 o gasto em tais programas foi muito maior do que em 2002. Nós estimamos que este aumento acarretou um aumento médio na votação do presidente de aproximadamente 7% no segundo turno da eleição presidencial de 2006.
Matriz de covariâncias de estimadores de máxima verossimilhança corrigidos pelo viés de ordem $n^{-1}$ em modelos lineares generalizados com dispersão desconhecida
Neste trabalho obtemos uma fórmula para a matriz de covariâncias de segunda ordem dos estimadores de máxima verossimilhança corrigidos pelo viés de primeira ordem em modelos lineares generalizados com parâmetro de dispersão desconhecido porém o mesmo para todas as observações.
Tendências da incidência e da mortalidade do câncer de mama feminino no município de São Paulo
Introdução: A cada ano, são diagnosticados mais de um milhão de novos casos de câncer de mama em mulheres no mundo. Os países mais desenvolvidos apresentam as maiores incidências, enquanto mortalidade é maior entre os países em desenvolvimento. No Brasil, as incidências mais elevadas se localizam nas regiões Sul e Sudeste. Nos últimos cinco anos, a incidência de câncer de mama aumentou cerca de 30% nos países do ocidente, porém, a partir do ano 2000, observa-se ligeiro decréscimo na incidência. A investigação simultânea sobre a incidência e a mortalidade pode fornecer informações sobre a etiologia da doença, e a análise dos efeitos da idade, período e da coorte facilita a compreensão dos mecanismos responsáveis pela variação nas tendências. Objetivos: Analisar as tendências da incidência e da mortalidade por câncer de mama feminino no município de São Paulo, segundo os efeitos da idade, período e coorte. Métodos: Foram analisadas a incidência no período de 1997 a 2005, e a mortalidade no período de 1982 a 2005. Os dados foram obtidos no Registro de Câncer de Base Populacional de São Paulo, no Sistema de Mortalidade do Ministério da Saúde (SIM-MS) e no Instituto Brasileiro Geografia e Estatística (IBGE). Os efeitos da idade, do período e da coorte na tendência dos coeficientes de incidência e mortalidade foram analisados pelo modelo de regressão de Poisson. Resultados: As tendências da incidência e da mortalidade aumentam com a idade, porém esse efeito é maior na mortalidade, sobretudo entre as mulheres com idade a partir dos 50 anos. O efeito do período apresentou tendência crescente para a incidência no período entre 2003 e 2005, que coincide com o início dos mutirões de mamografia no município de São Paulo. Para a mortalidade, a tendência foi decrescente no mesmo período. O efeito da coorte apresentou tendência decrescente a partir das coortes mais antigas, estável na maioria das gerações intermediárias, e decrescente nas coortes mais recentes tanto para incidência quanto para mortalidade. Conclusão: O padrão observado no município de São Paulo é semelhante ao observado em países mais desenvolvidos como Estados Unidos, Austrália e Reino Unido. Palavras-chave: câncer de mama, incidência, mortalidade, tendência, modelos de idade-período-coorte.
Medidas do Valor Preditivo de Modelos de Classificação Aplicados a Dados de Crédito
Para diminuir o risco de decisões errôneas na concessão de crédito a clientes, métodos estatísticos têm sido empregados para descrever a habilidade de modelos de classificação. A qualidade da previsão de um modelo de classificação pode ser avaliada a partir de medidas, como sensibilidade, especificidade, valores de predição positivo e negativo e acurácia, bem como através de coeficientes de correlação (Matthews e correlação aproximada) e medidas teóricas de informação (medida de informação mútua). Neste trabalho de iniciação científica, realizamos um estudo de simulação com o objetivo de comparar as técnicas estatísticas de regressão logística com seleção de amostra state-dependent e regressão logística usual (Hosmer & Lemeshow, 1989), por meio de tais medidas de desempenho. Também ilustramos os procedimentos apresentados em um conjunto de dados reais (dados financeiros extraídos de uma carteira de um banco).