Análise Exploratória de Dados

A regra dos três números para o cálculo de uma medida de correlação robusta

Autor(es) e Instituição: 
Gustavo H. Esteves, Departamento de Estatística - Centro de Ciências e Tecnologia - Universidade Estadual da Paraíba
Diana Maia, Departamento de Estatística - Centro de Ciências e Tecnologia - Universidade Estadual da Paraíba
Apresentador: 
Gustavo H. Esteves

Um dos problemas mais comuns na Estatística é o cálculo de uma medida de correlação robusta, isto é, uma medida que não seja influenciada por pontos discrepantes (outliers) presentes no conjunto de dados. Neste trabalho é apresentado um método, baseado na técnica de leave one out da teoria de discriminadores lineares, que ataca este problema e define uma regra, chamada aqui de regra dos três números, que usa a informação do mínimo, da média (ou mediana) e do máximo entre n valores de correlação linear de Pearson, onde n é o número de observações da amostra, para estimar um valor de correlação robusto.

Resumo estendido: 

Estatística Básica via MySQL para Pesquisas On-Line

Autor(es) e Instituição: 
Gabriel Ramos Guerreiro (UFSCar)
Anderson Luiz Ara-Souza (UFSCar)
Francisco Louzada Neto (UFSCar)
Apresentador: 
Gabriel Ramos Guerreiro

A Internet tem se tornado cada vez mais acessível aos usuários empresariais e domésticos, crescendo a uma taxa de 14% ao ano, atingindo 1 bilhão de usuários em 2005. Além disso, a Avaliação Institucional é uma questão em evidência no Brasil desde 1977, quando o Ensino Superior começou a ser avaliado pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) no âmbito de pós-graduação. Desde então, vem passando por diversas reformulações como, por exemplo, a criação do Sistema Nacional de Avaliação da Educação Superior (SINAES) em 2003. Nesse contexto, desenvolvemos um Sistema computacional on-line inédito e aplicado a Avaliação Institucional (Louzada-Neto e Ara-Souza, 2010). A metodologia aplicada no sistema apresenta algumas características importantes como rapidez, praticidade, menor custo operacional, segurança e garantia total de anonimato dos respondentes.

TESTE DE PITMAN-MORGAN APLICADO EM ESTUDOS DE BIOEQUIVALÊNCIA

Autor(es) e Instituição: 
Natalia Teixeira Fernandes/ UFMG
Arminda Lucia Siqueira/ UFMG
Paula Rocha Chellini/ Centro de Pesquisa de Biotecnologia
Apresentador: 
Natália Teixeira Fernandes

Em tese um medicamento genérico pode substituir o medicamento referência sem interferir no tratamento do paciente. Para ser vendido, o genérico precisa ser aprovado em um estudo de bioequivalência que deve ser conduzido com rigor científico e ético, seguindo uma metodologia específica. Como esse estudo é mais simples do que as pesquisas necessárias para o lançamento de um novo fármaco, os medicamentos genéricos tem um custo inferior ao medicamento referência. No Brasil, tal estudo é normatizado e fiscalizado pela ANVISA, que adota a bioequivalência média. Além da comparação das médias das duas formulações, também é importante comparar as variabilidades entre as formulações. Se elas forem diferentes, a equivalência média não implica que as duas formulações são terapeuticamente equivalentes. Neste caso, há dúvidas com relação à eficácia e segurança da formulação teste. Além disso, a igualdade de variância é uma suposição do modelo estatístico utilizado. O teste de Pitman-Morgan é o mais utilizado para verificar a igualdade de variância. Para sua implementação, uma macro do software livre R foi construída e aplicada a 42 estudos reais. Investigamos a eficácia da transformação dos dados quanto à igualdade de variâncias e o impacto que a violação do pressuposto da igualdade de variância tem sobre as conclusões de bioequivalência dos medicamentos. A metodologia do teste Pitman-Morgan e alguns resultados referentes aos 42 estudos analisados serão apresentados nesse trabalho. As conclusões obtidas poderiam ser validadas de forma mais confiável através de um estudo de simulação.

Perfil Socioeconômico e Cultural dos Visitantes dos Museus Fluminenses e Paulistas: Uma Análise Comparativa.

Autor(es) e Instituição: 
Camila Pereira Koehler (ENCE)
José Matias de Lima (ENCE)
Leandro Lins Marina (Fundação Cesgranrio)
Apresentador: 
Camila Pereira Koehler

Atualmente ganha relevância as questões sobre a relação entre demanda cultural e inserção da cultura na sociedade contemporânea e os museus, como ambientes que possibilitam intensa interação social, fazem parte da grande rede de instâncias culturais que trazem benefícios para a melhoria de vida de indivíduos e ou grupos. Neste trabalho são apresentados os resultados obtidos no projeto de iniciação científica que tinha por objetivo principal identificar o perfil socioeconômico dos visitantes dos museus fluminenses e paulistas, a partir das informações obtidas das pesquisas realizadas pelo Observatório de Museus e Centros Culturais, OMCC nos anos 2005 e 2006/2007. Apesar de existirem algumas diferenças no perfil socioeconômico e cultural entre os visitantes dos museus de ambos estados, percebe-se que o comportamento das variáveis investigadas na pesquisa é muito semelhante. Os visitantes dos museus paulistanos têm 2,2 vezes mais chances de serem freqüentadores habituais de museus e centros culturais. Observa-se também que as chances estimadas do visitante investigado ser um freqüentador de museus e centros culturais cresce com o nível de escolaridade dos visitantes.Visitantes pós-graduados têm, aproximadamente, três vezes mais chances de serem freqüentadores assíduos em relação aos que detêm nível de escolaridade correspondente ao ensino fundamental completo.

Palavras Chave: Demanda Cultural; Museus; Amostragem sistemática; Perfil socioeconômico; Regressão logística.

Resumo estendido: 

Aperfeiçoamento do ensino de probabilidade e de estatísitica para professores do ensino fundamental

Autor(es) e Instituição: 
Ana Luiza de Freitas Kessler - UFSM
Luciane Flores Jacobi - UFSM
Leandro Duarte Radin - UFSM
Apresentador: 
Luciane Flores Jacobi

Esse trabalho tem por objetivo apresentar resultados do projeto no qual foi desenvolvida uma metodologia de ensino-aprendizagem em probabilidade e estatística, com o intuito de promover o aperfeiçoamento desses profissionais. A teoria e a aplicação de probabilidade e estatística estão sendo abordadas através de minicursos e apostilas desenvolvidas especificamente para esse fim, utilizando atividades que envolveram brincadeiras e jogos. O projeto “Ações de aprimoramento em estatística para professores de matemática do ensino fundamental” foi desenvolvido/executado no Departamento de Estatística do Centro de Ciências Naturais e Exatas (CCNE) da Universidade Federal de Santa Maria (UFSM) no ano de 2009. Primeiramente, foi realizada uma pesquisa sobre os conteúdos Estatísticos previstos nos Parâmetros Curriculares Nacionais (PCNs) (Brasil, 1997 e 1998) para 1º e 2º ciclos do Ensino Fundamental. Num segundo momento, foi feita a pesquisa dos conteúdos estatísticos envolvidos nas atividades de livros acadêmicos de Estatística, para produzir um material de conhecimento mínimo para os professores, já que a grande maioria dos profissionais que atua nos primeiros anos do ensino fundamental não teve ou não tem acesso a este tipo de material. Concluindo, pode-se observar que a produção de materiais para os educadores do ensino básico, e a capacitação dos mesmos através de cursos, minicursos e oficinas contribui para que os professores sintam-se preparados e motivados para planejar suas aulas envolvendo os conteúdos de estatística.

Resumo estendido: 

APLICAÇÃO DA ANÁLISE MULTIVARIADA DE AGRUPAMENTO NO ESTUDO DA PRODUÇÃO DE FRUTICULTURA, NA REGIÃO ADMINISTRATIVA DE PRESIDENTE PRUDENTE – SP, NO ANO DE 2008

Autor(es) e Instituição: 
Suelen Umbelino da Silva - FCT/UNESP
Antônio Assiz de Carvalho Filho - FCT/UNESP
Eduardo Cardoso de Oliveira - UEL
Ricardo Firetti - APTA/PP
Apresentador: 
Suelen Umbelino da Silva - FCT/UNESP

A Região Administrativa de Presidente Prudente, situada no extremo oeste do Estado de São Paulo, é a quarta maior em extensão territorial, com seus 23.952 km², ocupando 9,6% do território paulista, sobre os quais se localizam 53 municípios. A indústria regional baseia-se na produção de alimentícios, bebidas, líquidos alcoólicos, vinagre e frigoríficos.
Esse trabalho procura caracterizar as fruticulturas por município, ao passo que analisa como a dispersão ou a concentração de determinada prática de fruticultura em determinada localidade pode explicar a ausência ou presença de outras fruticulturas na mesma, e dessa forma, conceber visibilidade ao comportamento das produções consideradas e as possíveis deficiências ou possibilidades de produção para os municípios, fazendo-o através da técnica multivariada de tratamento e análise de dados.
Verifica-se na região do Oeste Paulista, a estagnação das atividades agropecuárias, principalmente das lavouras tradicionais, provocando a descapitalização e expropriação dos pequenos produtores rurais, a atividade frutícola pode ser vista como o escape impulsor para tais carências e meio de levar a região a uma condição de maior “presença de mercado” no que tange a agricultura.
Dentre as vantagens do desenvolvimento da atividade em pequenas unidades produtivas está a possibilidade de absorção da mão-de-obra familiar e geração de empregos temporários e/ou permanentes. Outro aspecto que pode ser ressaltado consiste no elevado rendimento médio gerado pela fruticultura em pequenas extensões territoriais.

Resumo estendido: 

A UTILIZAÇÃO DE TÉCNICAS DESCRITIVAS NO ESTUDO DA PRODUÇÃO DE OLERÍCOLAS NA REGIÃO ADMINISTRATIVA DE ARAÇATUBA

Autor(es) e Instituição: 
Maiara Carlosmagno da Silva - FCT/UNESP
Antônio Assiz de Carvalho Filho - FCT/UNESP
Eduardo Cardoso de Oliveira - UEL
Ricardo Firetti - APTA/PP
Apresentador: 
Maiara Carlosmagno da Silva - FCT/UNESP

A Região Administrativa de Araçatuba localiza-se no noroeste do Estado de São Paulo, com mais de 722 mil habitantes, em 2008, a região abrigava 1,8% da população do Estado. Dos 43 municípios da região, que ocupam 23.952 km², o que representa 7,5% do território paulista, 4 concentravam mais de 55% to total da população regional, nesse ano, e são: Araçatuba, com 181 mil hab., Birigui, com 104 mil hab., Penápolis e Andradina, ambas com 57 mil hab.
O termo OLERICULTURA é derivado do latim: olus (=hortaliça) e colere (=cultivar) e, portanto, é utilizado para designar o cultivo de certas plantas de consistência herbácea, geralmente de ciclo curto e tratos culturais intensivos, cujas partes comestíveis são diretamente utilizadas na alimentação humana, sem exigir industrialização prévia.
A classificação mais usada é a que se baseia no agrupamento de produtos de acordo com a parte vegetal mais utilizada economicamente. Assim, segundo esta classificação, existem três grupos de olerícolas:
1- Olerícolas folhosos - que também possuem flor ou haste;
2- Olerícolas de frutos;
3- Olerícolas de raiz, bulbo, tubérculo ou rizoma.
Nota-se que a olericultura necessita de muita mão-de-obra e conseqüentemente gera empregos, portanto há uma necessidade de conhecer o perfil dos municípios que produzem olerícolas na Região Administrativa de Araçatuba.
A produção de olerícolas no agronegócio tem a sua importância e esse estudo irá analisar, através de técnicas descritivas, o seu comportamento relacionando-a com a escala da população rural.

Resumo estendido: 

Análise do Comportamento Apresentado pelas Pressões Longitudinais Registradas a Jusante de Válvulas de Eclusas

Autor(es) e Instituição: 
Camila Cristina Lopes
Simone Maffini Cerezer
Marcelo Giulian Marques
Apresentador: 
Camila Cristina Lopes

Estudos de modelagem hidráulica permitem obter informações que subsidiam os processos de implantação e operação dos empreendimentos hidráulicos, de maneira a agilizar as decisões e permitir a criação de normas de dimensionamento seguras, minimizando os custos. Para isto é necessário que se tenha um conhecimento adequado dos processos físicos que condicionam os sistemas hidráulicos, o qual é atingido com o emprego de técnicas de medição e análise de informações adequadas. A complexidade das condições de contorno e das leis que regem os fenômenos envolvidos quando da implantação de estruturas hidráulicas faz com que os estudos devam ser executados baseados em dados obtidos em modelos reduzidos ou em protótipos, exigindo a utilização de técnicas modernas de medição e análise, de maneira a permitir a visualização do fenômeno e fornecer subsídios para uma generalização do mesmo. Desta forma, o objetivo deste trabalho consiste na análise da distribuição das pressões longitudinais registradas a jusante de comportas tipo Tainter invertida, tal qual utilizado nos sistemas de enchimento e esvaziamento de eclusas de navegação. Os resultados encontrados, considerando a abertura da comporta de 10% para diferentes vazões, a partir da análise da função de autocorrelação indicaram que as séries analisadas apresentaram um comportamento não aleatório ao longo do tempo, havendo, uma correlação temporal entre as observações de uma mesma série. A análise dos dados de pressão considerando outras aberturas da comporta permitirá concluir para quais condições de escoamento ocorrem às situações mais críticas de cavitação.

Resumo estendido: 

Comparação entre os Dados de Pressão Atmosférica e Temperatura do Ar do BNDO/DHN e das Reanálises-2/NCEP para a Área Marítima Costeira do Brasil

Autor(es) e Instituição: 
Natália Santana Paiva / Universidade Federal Fluminense
Silvia Regina Santos da Silva / Centro de Hidrografia da Marinha
Fernanda Batista Silva / Centro de Hidrografia da Marinha
Apresentador: 
Natália Santana Paiva

Neste trabalho, foram analisados e confrontados, através do teste t-Student, dados médios mensais de pressão atmosférica (hPa) e temperatura do ar (ºC) oriundos do Banco Nacional de Dados Oceanográficos (BNDO), mantido pela Diretoria de Hidrografia e Navegação (DHN), e das Reanálises-2 do National Centers for Environmental Prediction (NCEP) para a área marítima costeira do Brasil. Os resultados indicam que ambas as fontes conseguem representar quantitativamente os padrões de pressão atmosférica na área de interesse, incluindo sua variabilidade sazonal. No entanto, as Reanálises-2 subestimam a temperatura do ar em todas as subáreas consideradas.

Resumo estendido: 

Estratégias Exploratórias em Estudos Longitudinais

Autor(es) e Instituição: 
Ana Clara Paixão Campos, Iniciação Científica (Cnpq) – IM/UFBA
Leila Denise A.F. Amorim, Departamento de Estatística – IM/UFBA
Lia Terezinha L.Pde Moraes, Departamento de Estatística – IM/UFBA
Rosemeire L. Fiaccone, Departamento de Estatística – IM/UFBA
Ana Marlúcia Assis, Escola de Nutrição - UFBA
Apresentador: 
Ana Clara Paixão Campos

Estudos longitudinais são importantes, pois fornecem informações sobre as variações globais e individuais ao longo do tempo (Diggle at al, 2002), sendo também conhecidos como estudos de medidas repetidas, envolvendo situações nas quais a variável resposta é mensurada múltiplas vezes em cada unidade de análise. A análise exploratória para dados longitudinais compreende técnicas que permitem visualizar padrões nos dados. O objetivo deste trabalho é sumarizar técnicas gráficas para avaliação de padrões em estudos longitudinais, bem como estratégias para identificação da estrutura de covariância destes dados. Os métodos sumarizados são ilustrados através da análise de dados referentes a uma aplicação usando dados do Produto Interno Bruto (PIB) de 415 municípios baianos entre 1999 e 2007 (intervalo de tempo constante) e a uma segunda aplicação a respeito do crescimento infantil, mensurado por indicador antropométrico, avaliado em 312 crianças nascidas na maternidade em Mutuípe, na Bahia (intervalo de tempo não constante). Os resultados encontrados indicam que o perfil médio do Índice Produto Interno Bruto (Índice PIB) parece linear ao longo do tempo além de apresentar um ligeiro crescimento do índice dos municípios ao longo do tempo. Para o estudo do crescimento infantil em Mutuípe, os perfis individuais e médio não apresentam linearidade ao longo do tempo. O variograma obtido para exploração da estrutura de covariância indica a inexistência de erro de medição, bem como certa variabilidade nos dados indicando a necessidade da inclusão de um termo aleatório no modelo. Ressalta-se que as técnicas exploratórias para dados longitudinais são de extrema importância para a visualização de padrões nos dados e, portanto, devem ser utilizadas antes da formulação de qualquer modelo estatístico.

Pesquisa com financiamento da FAPESB (Termo Outorga n° APR 0434/2008)

Divulgar conteúdo