Professional Documents
Culture Documents
Minerao de Dados
Voc j pensou em construir seu
diferencial como profissional?
Solange Rezende
Universidade de So Paulo
Departamento de Cincias de Computao
Laboratrio de Inteligncia Computacional
ICMC, USP 1
sor wikimedia2
sor 3
sor 4
sor 5
Quantos de ns j no utilizamos um
dispositivo eletrnico para fazer uma
compra que nos foi sugerido por ele?
7
sor
Ambiente contemporneo
Mundo Conectado
Ambientes estruturados e
e no estruturados
Pluralidade de ideias/gostos Ambiente colaborativo
11
sor 11
Observe aMotivao
imagem e identifique
um nmero...
12
sor 12
O Caso WalMart
sor 13
13
Casos Clssicos
Apostadores que
gastam entre US$
100 a 500:
Representam 30% da
clientela
Contribuem com 80%
das receitas
Cassino Harrahs
(Guizzo, 2001)
16 milhes de clientes! Estratgias de
marketing para este
Qual o perfil de cliente
proporciona maior
filo mais rentvel
lucratividade? dobrou o
faturamento
Empresa varejista Conseguiram
utiliza os dados das detectar um padro
compras dos clientes de compra de
para criar campanhas mulheres que
de marketing pr estavam grvidas e
ativas. enviar a elas ofertas
para gestantes.
sor 16
Volume de Dados e Informao no
Mundo Conectado
1999 a 2002
Crescimento 90% dos dados so
de 30% a cada No Estruturados
ano.
Universidade da
California 2003
O volume de 2013:
informaes em 4.4 ZB
todo o mundo
ocuparia cerca de 2020:
44 ZB
295 trilhes
de Mega
Bytes
Universidade da
California 2011
O que fazer nesse cenrio
Big Data
de Big Data?
Volume
Velocidade
Variedade
Veracidade
Valor
sor 18
Os sistemas
computacionais
armazenam quantidades
cada vez maiores de
dados.
Esse volume de dados
uma valiosa fonte de
conhecimento.
A quantidade e
complexidade dos dados
impossibilitam a
explorao manual desse
conhecimento.
Necessidade de tcnicas
automticas para extrair
padres dos dados
armazenados. 19
sor 19
Aprender a partir do que temos!
Grande foco de
diferena entre
Minerao de Dados
estruturados e no
estruturados
Avaliao do conhecimento
extrado
o O conhecimento extrado representa o
conhecimento do especialista?
o De que maneira o conhecimento do
especialista difere do conhecimento
extrado?
o Em que parte o conhecimento do especialista est correto?
o Pode-se ter uma quantidade enorme de padres que podem
no ser importantes, relevantes ou interessantes aos usurios
o interessante fornecer uma quantidade razovel de padres
ao usurio para ser avaliado
Desenvolver tcnicas de apoio para fornecer padres mais interessantes
Envolve tcnicas de visualizao dos padres
26
Processo de Minerao de Dados
Utilizao do conhecimento
Base de
Conhecimento
Sistema Inteligente
27
O que voc est fazendo
hoje pra aumentar suas
chances de sucesso
profissional? Qual o seu
diferencial?
Fator Humano como
diferencial: 2Cs
sor 28
Na sociedade do
Conhecimento
Repense os
limites do
possvel!
Humanos
Dominados
pelas
Mquinas/Tecnologias?
30
sor 30
Humanos
Construindo
Futuro Digital
Aprendizado de Mquina/
Minerao de Dados/Cincia de
dados!
31
sor 31
E agora?
Voc tem um
PLANO
de
sor 32
Algumas fontes
Referncias Gerais pra voc comear
33
sor 33
Algumas Ferramentas
Python:
Bibliotecas Python: Faa muito com pouco
Anaconda Swiss Army Knife !
Python: Grinding Tools!
Orange uma ferramenta para visualizao e anlise de dados tanto para iniciantes
quanto para especialistas (http://orange.biolab.si/download/)
34
sor 34
KEEL (Knowledge Extraction based on
Evolutionary Learning) is an open source
(GPLv3) Java software tool
O SAS Viya Data Mining and Machine
Learning um ambiente escalvel,
aberto, de anlises avanadas
KNIME - Konstanz Inoformation Miner
https://www.knime.org/
Torch - Topic Hierarchies
http://sites.labic.icmc.usp.br/torch/
Text Categorization Tool API
(implementada em Java) - para
representaes usando Redes
Site LABIC Software and Application Tools
labic.icmc.usp.br
35
sor 35
Onde voc quer chegar?
Programa pro-lder fala de 4
Pilares para jovens despertar
potencial para alcanar
coisas grandes na vida:
Autoconhecimento
Oportunidades
Planejamento
Ao
36
As pessoas valem pelo o que elas
so capazes de fazer e no por
aquilo que elas conhecem. Algumas
pessoas sabem tudo, mas no
conseguem transformar isso em
nada.
Beto Sicupira
Solange Rezende
solange@icmc.usp.br
LABIC-ICMC-USP
sor 37
Referncias Gerais
Algumas Referncias
Fayyad, U. M. ; Piatetsky-Shapiro, G.; Smyth, P.; Uthurusamy, R.
Advances in Knowledge Discovery and Minerao de Dados, MIT Press,
1996.
Witten, I. H.; Frank, E. Minerao de Dados: Practical Machine Learning
Tools and Techniques with Java Implementations, Morgan Kaufmann,
1999.
http://www.cs.waikato.ac.nz/~ml/weka/book.html
Pyle, D. Data Preparation for Minerao de Dados, Morgan Kaufmann
Publhishers, 1999.
Thuraisingham, B. Minerao de Dados: Technologies, Techniques, and
Trends, CLR Press LLC, 1999.
Rezende, S. O; Sistemas Inteligentes: Fundamentos e Aplicaes; Ed
Manole 2003.
Han, J., Kamber, M., and Pei, J. Data Mining: Concepts and Techniques.
The Morgan Kaufmann Series in Data Management Systems. Elsevier,
2011.
Tan, P.-N., Steinbach, M., and Kumar, V. Introduction to Data Mining.
Addison-Wesley, 2005.
Faceli, K,; Lorena, A. C.; Gama, J.; Carvalho, A. C. P. L. F.; Inteligncia
Artificial: Uma abordagem de aprendizado de mquina, Editora LTC, 2012.
38
sor 38
Agradecimentos
Ao CCMC e minha equipe...
39
sor 39