You are on page 1of 13

Weka

Coleo de algoritmos de aprendizado de mquina


implementado em Java
Tanto API como aplicativo!!!

Open source software


Framework para o desenvolvimento de algoritmos Tutorial e a Biblioteca encontrados em: http://www.cs.waikato.ac.nz/ml/weka/

Mtodos de aprendizado suportados

Aprendizagem Supervisionada
decision tree inducers rule learners naive Bayes decision tables locally weighted regression support vector machines instance-based learners logistic regression voted perceptrons neural networks

E ainda ...

Aprendizagem No Supervisionada
Cobweb EM

Meta Aprendizagem
bagging boosting stacking

Filtros
Transformao dos Dados Seleo de Atributos Entre outros ...

Mais ainda ...


Ferramentas de Visualizao dos Dados Algoritmos de Associao Experimenter

Preparando os dados

O weka l os dados no formato .arff


Uma lista de todas as instncias, onde o valor dos atributos so separados por vrgula mais um cabealho

Ex(weather.arff):
@relation weather %Nome do arquivo @attribute outlook {sunny, overcast, rainy} @attribute temperature real %Atributo e tipo @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} @data %Incio dos dados sunny,85,85,FALSE,no overcast,83,86,FALSE,yes

Instalando o software
1. Crie um diretrio chamada Weka na raiz da sua rea
h:\weka

2.Copiando os arquivos:
http://www.cin.ufpe.br/~igcf/weka weka.jar weather.arff soybean.arff

3.Certifique-se de que os dados foram salvos no formato correto.

Executando o software

Inicialize o ambiente jdk1.2.2


menu: programs\Linguagens\Java\JDK1.2.2

Execute no diretrio h:\weka


java jar weka.jar

Obs:
Pode usar validao cruzada Pode salvar os resultados (API)

Weka: Aprendizado de rvores de deciso


Dados do tempo Algoritmo weka.classifier.j48.J48

>75

<=75

J48 - Parametros
Binary Splits criao de rvores binrias nimMunObj numero mnimo de instancias em folhas Reduced Error Pruning poda atravs de conjunto de validao

NumFolds especifica o tamanho do conjunto de validao

Unprunned no usar poda Default poda

confidenceFactor???

...

Aprendizado de rvores de deciso


J48 pruned tree -----------------outlook = sunny | humidity <= 75: yes (2.0) | humidity > 75: no (3.0) outlook = overcast: yes (4.0) outlook = rainy | windy = TRUE: no (2.0) | windy = FALSE: yes (3.0) Number of Leaves Size of the tree : : 5 8

Exerccio
Abrir o arquivo soybean.arff Variar parmetros do J48 e observar o que acontece ...

IBk

Parametros:
Distance weigth Knn Window size

Consideraes

Facilidade de uso
fcil fazer experimentos distintos rapidamente

Extensibilidade Algumas implementaes no contem parmetros importantes Performance deteriorada no uso de grandes conjuntos de dados
Weka requer muita memria;

Documentao no cobre todas as tcnicas disponveis

You might also like