Professional Documents
Culture Documents
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/268418651
Article
CITATIONS READS
0 10
3 authors, including:
SEE PROFILE
All content following this page was uploaded by Eniuce Menezes Souza on 28 January 2015.
1
O dendograma ilustra as junes ou divises realizadas em
diferentes nveis do mtodo de agrupamento.
As varincias e covarincias so dadas dengue (A), esquistossomose (B), meningite
por: (C), hepatite (D), sfilis congnita (E),
Var( Y i) = wi' wi , i = 1,K , p leptospirose (F), tracoma (G), coqueluche (H),
Cov( Y i,Y k ) = w wk , i , k = 1,K , p
' leishmaniose tegumentar americana (I) e
i
acidentes com animais peonhentos (J).
Os componentes principais so as
combinaes lineares no correlacionadas
4.1.1. Agrupamento
Y1,...,Yp cujas varincias so as maiores
possveis..
Como os itens pesquisados no podem
O primeiro componente principal a
ser representados por medidas, estes foram
combinao linear w1' X com a maior comparados com base na presena (1) ou
varincia. A varincia Var ( Y 1) = Var ( w1' X ) ausncia (0) de certas caractersticas,
pode ser alterada multiplicando wi por alguma introduzindo uma varivel binria. As
constante. Mas, para que a varincia no seja caractersticas selecionadas so:
alterada, interessante que os vetores de x1 uma doena infecciosa;
coeficientes tenham comprimento unitrio, ou x2 A doena causada por vrus;
seja, w1' w1 = 1 . x3 A doena causada por bactrias;
O segundo componente principal a x4 A doena causada por protozorios;
combinao linear w'2 X que maximiza a x5 A doena causada por verme parasita;
varincia Var( Y 2) = Var( w'2 X ) sujeito as x6 A transmisso ocorre por mosquitos;
x7 Possui uma vacina de preveno;
condies w2 w2 = 1 e Cov( Y 1,Y 2) = Cov( w1' ,w'2 ) = 0 .
'
x8 uma doena epidmica;
Assim, o i-simo componente x9 uma doena endmica;
principal a combinao linear wi' X que x10 transmitida por contato humano;
maximiza a varincia Var( Y i ) = Var( wi' X ) x11 Pode levar a morte;
sujeito as condies wi' wi = 1 e x12 Tem tratamento especfico;
x13 disseminada nas fezes;
Cov( Y i,Y k ) = Cov( wi , wk ) = 0 , para k < i [2].
' '
principal igual a k (1 + K + p ) .
F 1 0 1 0 0 0 0 1 0 0 1 1 0 1
G 1 0 1 0 0 1 0 1 0 1 0 1 0 0
H 1 0 1 0 0 0 1 1 0 1 1 1 0 0
I 1 0 0 1 0 1 0 1 1 0 1 1 0 0
J 0 0 0 0 0 0 0 0 0 0 1 1 0 0
4. APLICAES
As distncias entre as doenas listadas
Nessa seo so apresentadas duas na tabela 1 so mostradas na tabela 2.
aplicaes relacionadas com a Sade e
Segurana Pblica. Tabela 2 Distncias entre as doenas pesquisadas
A B C D E F G H I J
A 0 7 6 6 7 4 6 7 5 6
4.1. Sade
B 7 0 9 7 6 5 9 8 6 5
C 6 9 0 4 3 4 4 3 5 6
Nesta aplicao foram utilizados D 6 7 4 0 5 6 6 3 5 6
dados de sade registrados pela vigilncia E 7 6 3 5 0 3 3 2 6 3
epidemiolgica no municpio de Presidente F 4 5 4 6 3 0 4 3 5 4
Prudente (estado de SP) de 01/01/2000 a G 6 9 4 6 3 4 0 3 5 6
H 7 8 3 3 2 3 3 0 6 5
31/07/2004. Os dados foram fornecidos pela
I 5 6 5 5 6 5 5 6 0 5
Secretaria Municipal de Sade de Presidente J 6 5 6 6 3 4 6 5 5 0
Prudente. As doenas pesquisadas foram:
A partir dos dados de distncia entre grupos, ou seja, onde cortar o dendograma.
as doenas ilustrados na tabela 2, foram Um mtodo utilizado est relacionado com a
utilizados os mtodos de ligao simples e avaliao do coeficiente de fuso, isto , o
completa. A figura 1 ilustra o dendograma da valor numrico (distncia ou semelhana) para
ligao simples obtido pelo software o qual vrios casos se unem para formar um
MINITAB. grupo. Quando a diviso de um novo grupo
no introduz alteraes significativas no
Similaridade coeficiente de fuso, pode-se tomar essa
38,25 partio como sendo tima.
A figura 3 ilustra o coeficiente de
58,83
fuso para a ligao simples e completa.
79,42
16
14 ligao simples
12
Distncia
10 ligao co mpleta
100,00 8
Esq. Deng. Leis. Hep. Men. Sif . Coq. Trac. Lep. Ac. 6
Observaes 4
2
Figura 1 Dendograma da ligao simples 0
9 8 7 6 5 4 3 2 1
Grupos
Observando a figura 1 pode-se
verificar que as observaes foram agrupadas Figura 3 Coeficiente de fuso
de acordo com a distncia mnima, isto , com
o maior grau de similaridade (no mnimo Para analisar a figura 3 necessrio
38,25%). Isto pode ser confirmado pelo verificar a partir de qual grupo a curva
primeiro grupo formado: sfilis e coqueluche. torna-se quase paralela a um dos eixos (nesse
Isso j era esperado, pois na matriz de caso ao eixo horizontal), pois quando isso
distncias essa duas doenas apresentavam o ocorre tem-se um nmero timo de grupos
menor valor (distncia 2), confirmando o alto para determinado conjunto de dados. Para a
grau de similaridade. ligao completa o coeficiente de fuso traz
Em contrapartida, a figura 2 ilustra o alteraes mais significativas at o terceiro
dendograma da ligao completa. grupo, portanto o nmero de grupos
escolhidos poderia ser 5. J para a ligao
Similaridade simples essa anlise um pouco mais
0,00 complexa, talvez nesse caso a escolha tima
fosse 4.
33,33
3
Scree Plot
populacional total. Alm disso, pode-se 2
verificar, analisando a tabela 4, que o terceiro, 1
0
quarto e quinto componentes principais trazem
0 1 2 3 4 5 6
uma contribuio de apenas 2,9%, 0,9% e Nmero de componentes
0,1% respectivamente.
O primeiro componente principal Figura 4 Scree Plot
(aproximadamente) uma soma de pesos iguais,
pois todas as variveis tm praticamente o Observando a figura 4 pode-se
mesmo peso. J a segunda componente perceber que a variao passa a ser menor
principal contrasta os anos de 2000 e 2001 depois do segundo componente principal.
Mas, essa variao passa a ser realmente
pequena depois do terceiro componente furtos e roubos, leses corporais culposas em
principal. Portanto, trs componentes acidentes de trnsito, estelionato e fraudes
principais seriam suficientes. diversas (variveis c1, c2, c3, c7 e c9)
apresentam uma maior similaridade entre si.
4.2. Segurana Posteriormente, homicdios dolosos
consumados e armas de fogo (variveis c5 e
As anlises de agrupamento e c9), so agrupados com 97,72% de
componentes principais tambm foram similaridade, pois, geralmente, os homicdios
aplicadas em dados de Segurana Pblica de so realizados utilizando armas de fogo. Com
Presidente Prudente e Regio, totalizando 20 quase o mesmo grau de similaridade
municpios. As observaes utilizadas foram (97,62%), as variveis relacionadas com o
coletadas mensalmente durante 3 anos: 2001, leses corporais dolosas e atos infracionais
2002 e 2003. Tais dados foram obtidos no (variveis c4 e c10) so agrupadas. Este
Centro de Assinalao Criminal da Delegacia resultado tambm bastante coerente, pois, os
Seccional de Presidente Prudente. atos infracionais realizados por menores de 18
anos, geralmente, envolvem leses corporais.
4.2.1. Agrupamento Alm disso, importante notar que a
similaridade destas duas variveis com
Os crimes registrados nos distritos homicdio e armas (variveis c5 e c9) menor,
policiais foram classificados em 10 variveis: pois, o nmero de menores de 18 anos que
c1 - Furtos simples e qualificado; portam armas ou cometem homicdios tambm
c 2 - Roubo; bem menor.
c3 - Furto e roubo de veculos; A figura 6 apresenta o dendrograma
c4 - Leses corporais dolosas; de similaridade utilizando a ligao completa
c5 - Homicdios dolosos consumados; para as 10 variveis utilizadas.
c 6 - Armas de fogo apreendidas; Similaridade
g p
98,20 0,3
0,25 ligao simples
Distncia
7
As duas autoras agradecem a FAPESP
pelo auxlio financeiro prestado mediante
Autovalores
4
bolsa de doutorado (Processos: 03/12771-0 e
3 03/12770-3)
2
0
REFERNCIAS
1 2 3 4 5 6 7 8 9 10
Nmero de Componentes