Comparação de assinaturas de amostras em Árvores Probabilísticas de Contexto

Autor(es) e Instituição: 
Diego Leal, UFMG
Marina Lobato, UFMG
Denise Duarte, UFMG
Apresentador: 
Denise Duarte

Em Galves, Galves, Garcia e Leonardi (2009) é introduzido o
critério do menor maximizador (smallest maximizer criterion) para
estimar uma Árvore Probabilística de Contexto (PCT). Este critério seleciona a árvore na classe das campeãs estimadas pelo BIC, para cada valor da constante de
penalização do modelo. Este algoritmo é chamado de G3L.

Dada uma amostra X_1,...,X_n, C_x é uma sequencia de
constantes de penalização que caracteriza esta amostra no seguinte
sentido:
1.Em amostras da mesma PCT, as sequencias de constantes de penalização geradas pelo G3L não diferem muito umas das
outras.
2.Em amostras de duas árvores diferentes as sequencias de constantes de penalização geradas pelo G3L são diferentes.

Estamos propondo um teste bootstrap, baseado na assinatura da
amostra, para decidir se duas amostras foram geradas a partir da
mesma árvore de contexto probabilística ou não.

Resumo estendido: