Professional Documents
Culture Documents
1. Para cada uma das funes booleanas seguintes apresente uma rvore de deciso
que as representem:
a) A B
b) (A B) (C D)
2. Construa o conjunto completo de rvores de deciso a partir dos dados seguintes:
A1
0
1
0
1
A2
1
0
0
1
Y
0
1
0
1
A2
1
0
0
1
A3
1
1
0
1
Y
1
1
0
0
Classe
+
+
+
A2
0
0
0
1
1
1
0
0
0
1
1
1
Y
1
0
1
0
0
1
1
0
1
1
1
1
a)
b)
c)
d)
possvel obter uma hiptese sem nenhum erro a partir destes dados?
Qual ser a entropia mdia se escolhermos o atributo A1?
E se escolhermos A2?
Qual a rvore obtida, tendo em conta que se as folhas no puderem ser
uniformes, se escolhe como valor a classe mais comum?
e) Essa rvore poderia ainda ser simplificada?
6. Imagine que quer utilizar o algoritmo ID3 para aprender uma funo e que lhe so
apresentados um conjunto de exemplos e de contra-exemplos:
A1
0
1
1
0
1
0
A2
1
0
1
0
0
1
A3
1
1
1
0
0
0
A4
0
0
0
1
1
1
A5
0
0
1
1
0
0
Nota
4.0
4.0
4.0
3.7
3.7
3.7
3.7
3.7
3.5
3.5
3.5
3.5
Ranking
top-10
top-10
top-20
top-10
top-20
top-30
top-30
top-10
top-20
top-10
top-30
top-30
Publicou
sim
no
no
sim
no
sim
no
no
sim
no
sim
no
Recomendao
boa
boa
normal
boa
boa
boa
boa
boa
normal
normal
normal
boa
Classe
A
A
A
A
R
A
R
R
R
R
R
R
Apresente a rvore de deciso completa que seria produzida pelo algoritmo ID3.
8. Considere o problema de esperar ou no esperar por uma mesa num restaurante. O
objectivo aprender uma definio para o objectivo Esperar ,sendo essa definio
expressa sob a forma de uma rvore de deciso. Existem os seguintes atributos
para descrever as situaes exemplo:
Alternativa: existe ou no um restaurante na vizinhana que seja uma alternativa.
Bar: O restaurante tem ou no tem um bar.
Sexta/Sbado: Se esse dia uma sexta ou um sbado.
Fome: estamos ou no com fome.
Clientes: Quantas pessoas esto no restaurante (nenhuma, algumas, cheio)
Preo: Trs preos possveis: ($, $$, $$$)
Chuva: Est a chover l fora ou no.
Reserva: Foi feita uma reserva ou no.
Tipo: O tipo de restaurante: (francs, italiano, tailands e hamburgueria
Estimativa do tempo de espera: (0-10 minutos, 10-30, 30-60, >60).
Alter Bar Sexta Fome Clientes Preo Chuva Reserva
Sim No No Sim Alguns
$$$
No
Sim
Cheio
No
No Sim No No Alguns
Cheio
Sim No Sim No
Tipo
0-10
Sim
No
Tailands 30-60
No
No
No
Hamburg
0-10
Sim
No
No
Tailands 10-30
Sim
Cheio
$$$
No
Sim
Francs
>60
No
$$
Sim
Sim
Italiano
0-10
Sim
No Sim No No Nenhuns
Sim
No
Hamburg
0-10
No
No No No Sim Alguns
$$
Sim
Sim
Tailands
0-10
Sim
No Sim Sim No
Cheio
Sim
No
Hamburg
>60
No
Cheio
$$$
No
Sim
Italiano
10-30
No
No No No No Nenhuns
No
No
Tailands
0-10
No
No
No
Hamburg 30-60
Sim
Sim No No Sim
Cheio
Francs
TmpEsp Esperar
c.
Cabelo
Castanho
Louro
Louro
Louro
Louro
Ruivo
Castanho
Ruivo
Ruivo
Castanho
Pele
Morena
Morena
Morena
Branca
Branca
Branca
Branca
Morena
Morena
Branca
LooSolar
No
No
Sim
Sim
No
Sim
No
No
Sim
Sim
Queimadura
Sem
ligeira
Sem
Sem
grave
grave
Sem
ligeira
ligeira
Sem
B
0
1
0
1
C
0
0
0
1
Y
0
1
1
0
Qual a rvore de deciso escolhida pelo algoritmo ID3? No existir outra rvore
que envolva testar menos atributos (e possivelmente com menor profundidade)
capaz de representar correctamente os dados? Qual a justificao que encontra
para que o ID3 no devolva essa rvore?
13. Considere os dados apresentados na quadrcula abaixo, descritos por dois atributos
(eixos x e y, com valores inteiros entre 0 e 8) e classificados em 3 classes,
representadas por quadrados, cruzes ou crculos. Usando o algoritmo ID3
estendido para fazer testes binrios sobre atributos numricos, construa a rvore
de deciso de forma a classificar correctamente os dados.
14. A tabela de dados seguinte baseia-se no livro do Tolkien O senhor dos anis. A
tabela apresenta informao sobre um conjunto de pessoas/entidades que
aparecem nesse livro.
Nome
Raa
Peso
Senhor-do-anel
Classe
Frodo
Hobbit
Leve
Sim
Bom
Rosie
Hobbit
Leve
No
Bom
Bilbo
Hobbit
Leve
Sim
Bom
Gollum
Hobbit
Leve
Sim
Mau
Faramir
Humano
Mdio
No
Bom
Aragorn
Humano
Mdio
No
Bom
Wormtongue
Humano
Mdio
No
Mau
Celeborn
Elves
Leve
No
Bom
Galadriel
Elves
Leve
Sim
Bom
Sharku
Orc
Pesado
No
Mau
Cada entidade possui trs atributos (Raa, Peso, Senhor-anel) e classificado como
sendo Bom ou Mau (i.e., se quer ou no quer matar o Frodo). O atributo "Senhoranel" indica se a pessoa/entidade alguma vez possuiu o anel mgico. Aplique o
algoritmo ID3 aos dados na tabela, tendo em conta que os ns folhas so classificados
com a classe maioritria. No entanto, introduza, uma pequena variao na qual se
expandem os ns apenas quando resultar numa melhoria do ganho.
15. Considere o seguinte conjunto de dados, onde Y corresponde ao atributo classe.
Vamos considerar formas de poda da rvore de deciso produzida pelo ID3 que no
envolvem o uso de um conjunto de teste.
V
0
0
1
1
1
W
0
1
0
1
1
X
0
0
0
0
1
Y
0
1
1
0
0
a) Apresente a rvore de deciso que seria construda pelo ID3, sem poda.
b) Uma possvel forma de podar a rvore consiste em, comeando pelo n raiz da
rvore, podar a subrvore com origem num n se o ganho de informao (ou
outro critrio dado) associado a esse n for inferior a uma pequena quantidade .
Este tipo de poda chamada poda descendente (top-down pruning). Qual a
rvore de deciso retornada aplicando este tipo de poda com =0.0001? Qual o
erro produzido por essa rvore podada para o conjunto de treino dado (% de
exemplos mal classificados)?
c) Outra forma possvel de podar a rvore consiste em, comeando pelos ns pais de
folhas da rvore, podar subrvores com origem num n se o ganho de informao
(ou outro critrio dado) for inferior a uma pequena quantidade . Segundo este
mtodo, nenhum antepassado de um n com alto ganho de informao podado.
Este tipo de poda chamada poda ascendente (bottom-up pruning). Qual a
rvore de deciso retornada aplicando este tipo de poda com =0.0001? Qual o
erro produzido por essa rvore podada para o conjunto de treino dado (% de
exemplos mal classificados)?
d) iscuta as possveis vantagens e desvantagens destes dois tipos de poda, tendo em
conta por exemplo a complexidade computacional envolvida e a preciso da
classificao.