Mineria de Datos PDF

Introduccin a Minera de Datos,
Metodologas y
Tcnicas de Minera de datos
Jose Aguilar
CEMISID, Escuela de Sistemas
Facultad de Ingeniera
Universidad de Los Andes
Mrida, Venezuela
Definiciones iniciales
Datos: hechos o medidas que describen caractersticas de
objetos, eventos o personas, es la materia prima de la que se
obtendr la informacin.
Informacin: Datos analizados y presentados en forma

adecuada, de inters para un observador en un momento
determinado.
Conocimiento: informacin procesada para emitir juicios que

llevan a conclusiones.
Meta Conocimiento: Reglas que permiten obtener

conocimiento.
Principales caractersticas de la informacin
Significado (semntica):
Qu quiere decir?
Del significado extrado de una informacin, cada individuo evala
las consecuencias posibles y adeca sus actitudes y acciones de
manera acorde a las consecuencias previsibles que se deducen del
significado de la informacin.
Importancia (relativa al receptor):

Trata sobre alguna cuestin importante?
La importancia de la informacin para un receptor, se referir a en
qu grado cambia la actitud o la conducta de los individuos.
.
Principales caractersticas de la informacin
Vigencia (en la dimensin espacio-tiempo):

Es actual o desfasada?
En la prctica la vigencia de una informacin es difcil de evaluar,
ya que en general acceder a una informacin no permite conocer
de inmediato si dicha informacin tiene o no vigencia.
.
Validez (relativa al emisor):
El emisor es fiable? Puede entregar informacin no vlida?
Valor (receptor):
Cun til resulta para el destinatario la informacin?
.
.
Situacin actual
La revolucin digital ha permitido que la captura de datos sea
fcil, y su almacenamiento tenga un costo casi nulo.
Enormes cantidades de datos son recogidas y almacenadas

en BD en la vida diaria.
Resultado: Para analizar estas enormes cantidades de datos,

las herramientas tradicionales de gestin de datos y las
herramientas estadsticas no son adecuadas.
Definiciones iniciales
Conocimiento: Modelo vs. Patrn
Hand, Mannila y Smyth
Modelo: Habla de todo el conjunto de datos
Patrn: Habla de una regin particular de datos.

Datos y Modelos => Conocimiento
Los datos se obtienen de: Modelos descriptivos:
Bases de datos identifican patrones que
explican o resumen los datos:
(relacionales, espaciales,
temporales, Reglas de asociacin
documentales, Clustering:
multimedia, etc) Modelos predictivos: estiman
valores de variables de inters
World Wide Web
(a predecir) a partir de valores
de otras variables
Regresin
Clasificacin
Situacin actual
Los datos por s solos no producen beneficio
directo.
Su verdadero valor consiste en poder extraer
informacin til para la toma de decisiones
Tradicionalmente se analizaban datos con la

ayuda de tcnicas estadsticas (resumiendo y
generando informes) o validando modelos
sugeridos manualmente por los expertos.
Situacin actual
Estos procesos son irrealizables a medida que
aumenta el tamao de los datos.
Bases de datos con un n de registros del

orden de 109 y 103 de dimensin, son
fenmenos relativamente comunes.
La tecnologa informtica puede automatizar

este proceso.
Minera de datos
Una visin simplificada de la minera
de datos
Datos Minera de datos Modelos
Los modelos son el producto de la minera de datos...

...y dan soporte a las estrategias de decisin que se tomen
Qu es la Minera de Datos?
La minera de datos tiene como propsito la

identificacin de un conocimiento obtenido a
partir de las bases de datos que aporten hacia la
toma de decisin.
Minera de datos es la exploracin y anlisis de

grandes cantidades de datos con el objeto de
encontrar patrones y reglas significativas
(conocimiento)
Es un mecanismo de explotacin que consiste
en la bsqueda de informacin valiosa en
grandes volmenes de datos.
Ligada a las bodegas de datos (informacin

histrica) con la cual los algoritmos de minera
de datos obtienen informacin necesaria para
la toma de decisiones.
Anlisis de grandes volmenes de datos para encontrar
relaciones no triviales, y para resumirlos de manera que sean
entendibles y tiles.
Hand, Mannila y Smyth
Extraccin de patrones y modelos interesantes,

potencialmente tiles y datos en base de datos de gran
tamao.
Hand
Data Mining (Minera de datos)
Proceso de extraer conocimiento util y comprensible, previamente
desconocido, desde grandes cantidades de datos almacenados en
distintos formatos (Witten and Frank, 2000)
Knowledge Discovery in Databases KDD (Descubrimiento

de Conocimiento en Bases de Datos)
Proceso no trivial de identificar patrones vlidos, novedosos,
potencialmente tiles y, en ltima instancia, comprensibles, a partir de
los datos (Fayyad y col. 1996)
Minera de datos
Proceso de utilizar datos crudos para inferir
importantes relaciones entre ellos
Coleccin de tcnicas poderosas para analizar

grandes volmenes de datos
No existe un solo enfoque para minera de datos sino

un conjunto de tcnicas que se pueden utilizar de
manera independiente o en combinacin
Lo que no es la minera de datos
Bsqueda de un nmero de telfono en el directorio

telefnico
Usar un motor de bsqueda en Internet para obtener

informacin acerca de "Amazon
La fuerza bruta crujido de datos a granel
La presentacin de los datos de diferentes maneras
Una tarea intensiva de base de datos

Qu si es Data Mining?
Una palabra de moda para

una clase de tcnicas que
encuentran patrones en los
datos
Un conjunto de tcnicas que

se encuentran las relaciones
que anteriormente no han
sido descubiertos
La minera de datos es un campo
multidisciplinario
Inteligencia
Artificial Estadstica
(Machine
Learning)
Bases de
Datos Minera de datos Ciencias de
la informacin
Graficacin y Otras
visualizacin disciplinas
Estadstica vs Minera de datos
Estadistica Mineria de datos
Construccin Mayor libertad en la construccin,

Ceido a premisas y teoremas
de modelos interpretable
Test de la razn de la
Bsqueda Metaheursticos
verosimilitud
Transparencia Ms complicados de interpretar Ms claros y sencillos
Validacin No S
Minera de Datos vs. Estadstica
Adems, en minera de datos tenemos:
1.- Mayor volumen de datos (diferencia fundamental)
2.- Mayor complejidad de los datos (miles de atributos o

dimensiones).
4.- nfasis est en buscar modelos ms que en verificar un

modelo fijo.
OLAP vs Minera de datos
OLAP Minera de datos
Cul es la proporcin media de Cul es la mejor prediccin para

accidentes entre fumadores y no accidentes?
fumadores?
Cul es la factura telefnica media de mis Dejara X la compaia? Qu factores
clientes y de los que han dejado la afectan a los abandonados?
compaia?
Cunto es la compra media diaria de Cules son los patrones de compra
tarjetas robadas y legtimas? asociados con el fraude de tarjetas?
OLAP proporciona una muy buena vista de lo que est

sucediendo, pero no se puede predecir lo que va a suceder
en el futuro o por qu est sucediendo
Mtodos Descriptivos
Encontrar patrones interpretable que describen
los datos.
Mtodos de Prediccin
Utilizar algunas variables para predecir los
valores desconocidos o futuros de otras
variables.
La minera de datos se puede dividir en:
Minera de datos predictiva (mdp): usa

primordialmente tcnicas estadsticas.
Minera de datos para descubrimiento de

conocimiento (mddc): usa principalmente
tcnicas de inteligencia artificial.
Tipos de aplicaciones de la
minera de datos
Clasificacin
Pronstico (Prediccin)
Asociacin
Agrupacin o segmentacin (Clustering)

Tipos de aplicaciones de la
minera de datos
Clasificacin [predictivo]
Clustering [descriptivo]
Descubrimiento Regla Asociacin [descriptivo]
Anlisis de dependencia de datos
correlacin y causalidad
Descubrimiento Patrones Secuenciales [descriptivo]
Anlisis de series de tiempo, asociaciones secuenciales
Regresin [predictivo]
Tendencia y Desviacin de deteccin [predictivo]
Filtros Colaborativos [predictivo]
Resumir
Descripcin de Conceptos-
Descripcin de caractersticas
descripcin discriminante
Clasificacin
Examinar las caractersticas de un nuevo
objeto y asignarle una clase o categora de
acuerdo a un conjunto de tales objetos
previamente definido
Ejemplos:
Clasificar aplicaciones a crdito como bajo, medio
y alto riesgo
Detectar reclamos fraudulentos de seguros
Pronstico
Predecir un valor futuro con base a valores
pasados
Ejemplos:
Predecir cunto efectivo requerir un cajero
automtico en un fin de semana
Asociacin
Determinar cosas u objetos que van juntos
Ejemplo:
Determinar que productos se adquieren
conjuntamente en un supermercado
Agrupacin o segmentacin
Dividir una poblacin en un nmero de grupos
ms homogneos
No depende de clases pre-definidas a

diferencia de clasificacin
Ejemplo:
Dividir la base de clientes de acuerdo con los
hbitos de consumo
ALGORITMOS DE APRENDIZAJE
1. SUPERVISADOS: predicen el valor de un atributo de un conjunto de

datos conocidos otros atributos.
Clasificacin, Prediccin
Ejemplos: Algoritmos genticos: Redes neuronales, rboles de

decisin, Regresin
2. NO SUPERVISADOS: descubren patrones y tendencias en los datos sin

tener ningn tipo de conocimiento previo acerca de cuales son los patrones
buscados
Clustering, Anlisis de enlace, Anlisis de frecuencia

Aprendizaje supervisado
El proceso de modelado se realiza sobre un conjunto de

ejemplos formado por entradas al sistema y la respuesta
que debera dar para cada entrada.
Aprendizaje no supervisado
Todo el proceso de modelado se lleva a cabo sobre un
conjunto de ejemplos formado tan slo por entradas al
sistema.
No se tiene informacin sobre las categoras de

esos ejemplos.
Por lo tanto, en este caso, el sistema tiene que ser

capaz de reconocer patrones para poder etiquetar
las nuevas entradas.
Aprendizaje supervisado Aprendizaje no

supervisado
x2 x2
x1 x1
Social network analysis

Minera de Secuencia de Datos
Buscar Similitud en serie temporal de datos
Regresin y Anlisis de Tendencias en series temporales de

datos
Minera Patrn Secuencial en secuencias simblicas
Clasificacin de Secuencia
Alineacin de secuencias biolgicas
36
Minera de Grfos y Redes
Minera de Patrn de Grfo
Modelado estadstico de Redes
Agrupacin y clasificacin de grafos y redes
homogneas
Agrupacin, clasificacin de las Redes heterogneos
Descubrimiento, clases, y Prediccin de Enlace en
Redes de Informacin
Bsqueda de Similitud en Redes de Informacin:
Evolucin de las redes de informacin social
37
Mineria en otras clases de Datos
Minera de Datos Espaciales
Minera espacio-temporal y Object ivos en movimiento
Minera Cyber-fsico de datos del sistema: salud, control de trfico areo,

simulacin de inundaciones
Minera de datos multimedia
Minera de datos de texto
Minera de datos Web
Minera de datos Streams

38
Importante
La promesa de Data Mining es encontrar los patrones
Simplemente el hallazgo de los patrones no es

suficiente
Debemos ser capaces de entender los patrones,

responder a ellos, actuar sobre ellos,
El ciclo de data mining
Identificar
un problema
Medir los Usar data mining para

resultados transformar los datos
en informacin
Actuar basndonos
en la informacin
Esquema bsico: Minera de datos
Datos Iniciales
.log
KDD Knowledge Discovery in
Databases
La minera de datos se encuadra dentro de un proceso
mucho mayor conocido como KDD (Knowledge Discovery from
Databases)
Fases del proceso iterativo e interactivo
1. Integracin y recopilacin de datos
2. Seleccin, limpieza y transformacin
3. Minera de datos
4. Evaluacin e interpretacin
5. Difusin y uso
El Proceso de KDD
INTERPRETACIN Y EVALUACIN
DATA MINING Conocimiento
CODIFICACIN Modelos
LIMPIEZA Datos Transformados
SELECCIN Datos Procesados
Datos objetivo
Datos
KDD
Fase 1
Integracin y recopilacin de datos
Decisiones estratgicas basadas en el anlisis, la planificacin y
la prediccin: datos en varios departamentos
Cada fuente de datos distintos formatos de registro, diferentes
grados de agregacin, diferentes claves primarias, ....
Integracin de mltiples bases de datos: almacenes de datos
(data warehousing)
Almacn de datos aconsejable cuando el volumen de
informacin es grande. No estrictamente necesario (archivos de
texto, hojas de clculo, ...)
Fase 2
Seleccin, limpieza y transformacin
Calidad del conocimiento descubierto depende (adems del algoritmo de
minera) de la calidad de los datos analizados
Presencia de datos que no se ajustan al comportamiento general de los datos
(outliers)
Presencia de datos perdidos (missing values)
Seleccin de variables relevantes (feature subset selection)
Seleccin de casos aleatoria en bases de datos de tamao ingente
Construccin de nuevas variables que faciliten el proceso de minera de datos
Discretizacin de variables continuas
Fase 3
Minera de datos
Modelos descriptivos
Reglas de asociacin
Clustering
Modelos predictivos
Regresin: regresin lineal, regresin logstica
Clasificacin supervisada: clasificadores Bayesianos,
redes neuronales, rboles de clasificacin, induccin de
reglas, K-NN, combinacin de clasificadores
Fase 4
Evaluacin e interpretacin
Tcnicas de evaluacin: validacin simple (training + test),
validacin cruzada con k-fold, bootstrap
Reglas de asociacin: cobertura (soporte), confianza
Clustering: variabilidad intra y entre
Regresin: error cuadrtico medio
Clasificacin supervisada: porcentaje de bien clasificados, matriz
de confusin, anlisis ROC
Modelos precisos, comprensibles (inteligibles) e interesantes
(tiles y novedosos)
Fase 5
Difusin y uso
Difusin: necesario distribuir, comunicar a los posibles
usuarios, integrarlo en el know-how de la organizacin
Medir la evolucin del modelo a lo largo del tiempo
(patrones tipo pueden cambiar)
Modelo debe cada cierto tiempo de ser:
Reevaluado
Reentrenado
Reconstruido
CRISP-DM
El proceso de extraccin de datos debe ser fiable y repetible

por personas con pocos conocimientos de minera de datos
CRISP-DM proporciona un marco uniforme para

directores
documentacin de la experiencia
CRISP-DM es flexible para tener en cuenta las diferencias

Diferentes problemas de negocio
Datos diferentes
Fases en CRISP-
CRISP-DM
Problemas
Conocimiento del dominio de la

aplicacin y objetivos del proceso de
descubrimiento de conocimiento ?
Qu hacer cuando no se conoce la organizacin, el

problema, o los procesos a estudiar?
Metodologa ULA
Esta metodologa surge de la necesidad de conducir de

manera adecuada un proyecto de MD, donde adems, se
integra un gua detallada de lo que se debe hacer en cada
etapa del proceso de KDD, para llenar algunos vacos que
presentan otras metodologas a la hora de enfrentarse con
organizaciones, que no conocen los problemas que se
presentan, y que podra aportar la MD para la mejora de la
misma.
Esta metodologa permite identificar y conceptualizar la
solucin de un problema desde la perspectiva del desarrollo
de aplicaciones basadas en MD, para un proceso de cualquier
institucin/empresa
Metodologa ULA
Todas las fases y actividades propuestas pretenden abarcar todo el
dominio de conocimiento que puede encontrarse en una
organizacin.
Sin embargo, en funcin de los expertos disponibles y del tiempo
previsto de desarrollo, no todas las actividades propuestas en cada
fase podran desarrollarse en su totalidad.
Metodologa ULA
Elementos que conforman cada etapa de las fases de la

metodologa.
Fase 1: Conocimiento de la Organizacin
Esta fase tiene como finalidad realizar un proceso de ingeniera de

conocimiento, orientado a organizaciones/empresas, de las cuales no se conoce
o se tiene poca informacin del (de los) problema(s), o los procesos a estudiar.
Se enfoca en identificar y conceptualizar la solucin de un problema, desde la
perspectiva del desarrollo de aplicaciones basadas en MD.
Fase 1: Conocimiento de la Organizacin
1. Conocimiento de la Organizacin
2. Descripcin general de la
problemtica organizacional
3. Anlisis de factibilidad y seleccin del

proceso
4.Anlisis para caracterizar las posibles

tareas de Minera de Datos (MD)
5. Formalizacin del problema

Etapa 1: Conocimiento de la Organizacin
Conocer la organizacin/empresa, sus

1. Objetivo
objetivos, procesos, objetos y actores
2. Protocolo de la Fase:
Descripcin de los elementos de la institucin/empresa y sus

caractersticas. Objetivos, Procesos , Objetos y Actores.
Descripcin de las relaciones entre estos elementos.
Organizacin de estos elementos.

Etapa 2: Descripcin general del problema
Conocer los procesos sobre los cuales se puede

1. Objetivo
enfocar el proyecto de minera de datos.
Familiarizacin con los procesos sobre los cuales se puede realizar la ingeniera
de conocimiento
Identificacin de la fuente de conocimiento
Familiarizacin con los ambientes computacionales donde se encuentran los

datos a ser utilizados en cada proceso.
Etapa 3: Anlisis de factibilidad y
seleccin del proceso
1. Objetivo Analizar los procesos con la informacin

proporcionada/recogida.
Revisin de los procesos propuestos por los expertos
Disponibilidad del experto o grupo de expertos
Anlisis de las fuentes de informacin sobre los procesos

Etapa 4: Anlisis para caracterizar las
posibles tareas de Minera de Datos
Caracterizar las posibles tareas de minera de datos a realizar en

el(los) proceso(s) seleccionado(s) en la fase anterior (objetivos,
1. Objetivo
requerimientos, factibilidad, etc.), con la finalidad de escoger las
tareas de MD de inters a desarrollar.
Seleccin y descripcin de los actores.

Descripcin de los escenarios actuales y posibles escenarios futuros de la
institucin/empresa.
Especificacin de los requerimientos para los posibles escenarios futuros (donde se
puedan aplicar tarea(s) de MD)
Elaboracin de los casos de uso para los requerimientos funcionales
Etapa 5: Formalizacin del Problema
1. Objetivo Definir el(los) problema(s) formales de MD.
Desarrollo de un informe, con la conceptualizacin del

2. Protocolo de la proceso a estudiar, la caracterizacin de sus
fase problemticas operacionales y del uso de la MD en
dicho proceso.
Caso de Estudio: Empresa Petrolera
Fase 1: Conocimiento de la organizacin:

Se trata de una empresa que se encarga de la exploracin, extraccin, produccin,
mejoramiento y comercializacin de crudo extrapesado.
Fase 2: Caracterizacin de los procesos de la organizacin
La cadena de valor de la empresa se muestra en la siguiente figura, donde el proceso
principal objeto de estudio se concentra en la tercera etapa de la cadena de valor.
Fase 3: Seleccin del Proceso Criterios CDU DCU

Se estudi cada uno de los Importancia para la organizacin 5 5
subproceso (objetivos, actividades, Propsito de la MD 5 5
productos, etc.), y se obtuvo la Interacciones entre procesos 2 4
interaccin entre ellos. Procesos dependientes 5 3
Importancia de la calidad del
4 4
En la tabla se ilustra este proceso de producto
priorizacin y seleccin, Seguridad Industrial 4 5
considerando slo los dos procesos Replicabilidad de la herramienta
5 4
que resultaron mejor ponderados desarrollada
en este caso de estudio. Cantidad de Expertos 5 5
Fuentes de informacin 5 5
Confidencialidad de la
3 3
informacin
Qu informacin se recoge del
5 5
proceso para ser almacenada?
Con que frecuencia se recoge la
4 4
informacin almacenada
Qu herramientas se cuentan,
para recolectar y manipular la 4 4
informacin?
Fase 4: Anlisis para caracterizar las posibles tareas de Minera de Datos (MD)
Descripcin del escenario actual
Resultados que se Actor(es) asociado(s) Variables Asociadas Actividades que se

obtienen realizan
Gasoil directo Expertos asociados Tren de precalentamiento: Carga del crudo.
(SRGO), nafta al proceso temperatura de la carga. Precalentamiento
pesada y residuo Ingenieros de Desaladores: tiempo para del crudo diluido.
atmosfrica. Procesos el asentamiento y Desalado.
Operadores separacin del agua del Precalentamiento
Unidad de petrleo, presin. del crudo
destilacin Hornos de crudo: desalado.
atmosfrica temperatura Generacin de
Columna de crudo: cortes de crudo en
presin, temperatura, rata la columna.
de vapor de
despojamiento.
Descripcin del escenario futuro
Resultados que Actor(es) Variables Actividades de Funcionalidades

se desean asociado(s) Asociadas MD que se nuevas
obtener realizaran
Prediccin de Expertos Presin, Prediccin Prediccin de las
la calidad del asociados al temperatura de caractersticas del
producto, para proceso tope y rata de producto, segn las
optimizar el Operadores vapor de condiciones de
proceso Columna de despojamiento de funcionamiento de la
crudo la columna de torre de crudo.
crudo. Ayudar a optimizar el
proceso de produccin,
generando informacin
para orientar a los
actores en la toma de
decisiones con la
prediccin (es)
resultante(s).
Fase 2: Preparacion de los Datos
Para aplicar MD sobre un problema en especfico, es necesario
contar con un historial de datos asociado al problema en estudio.
Esto conlleva realizar distintas operaciones con los datos, con la

finalidad de acondicionarlos para desarrollar un modelo de MD.
Por lo tanto, en esta fase se plantea realizar la preparacin de los
datos, que sern utilizados para el desarrollo de la herramienta de
MD.
Para realizar tareas de MD es necesario tener los datos integrados

en una sola vista, que denominaremos vista minable la cual est
compuesta por una tabla con todas las variables del proceso y los
datos a considerar en el estudio de MD.
En particular, para realizar este proceso nosotros definimos dos tipos de vista
minable:
Vista Minable conceptual (VMC): describe en detalle cada una de las variables
a ser tomadas en cuenta para la tarea de MD, para cada escenario futuro
seleccionado. La misma est compuesta por todas las variables de inters, y
algunos campos adicionales de importancia para realizar el proceso de
tratamiento de datos.
Vista Minable operativa (VMO): Es el resultado de cargar los datos del

historial y de realizar la etapa de tratamiento de datos, con la informacin de
la VMC.
Tanto en la VMC, como en la VMO, se identifican ciertas variables llamadas

variables objetivo. Estas variables se detectan una vez planteado el
escenario futuro y la tarea de MD a realizar. Dichas variables son las que
permitirn la consecucin de los objetivos de MD, ya que las mismas son
las que se desean predecir, clasificar, calcular, inferir, en otras palabras, es
la que deseamos obtener con la tarea de MD.
Etapas que conforman la fase 2.
Caracterizacin de los datos del
Dominio de la aplicacin
Objetivos
Ubicar y comprender los datos asociados a el(los) escenario(s) futuro(s)
Construccion de una VMC que tenga las variables de interes para el caso de
estudio
Construccion de una VMO
Definicion de la(s) variable(s) objetivo(s) en la vista minable operativa
Productos principales
Caractersticas de los repositorios donde se encuentran los datos
VMC
VMO
Descripcin de la(s) variable(s) objetivo(s)

Protocolo de la etapa
Comprensin de la fuente de datos de entrada:
Comprensin de los datos asociados a las variables
Determinacin de los repositorios de datos
Construccin de la VMC:
Realizar un primer filtrado..
Establecer las relaciones entre las variables
seleccionadas (dependencia entre variables,
redundancia, variables que son producto de frmulas).
Extender la VMC
Protocolo de la etapa
Construccin de la VMO:
Si se encuentran en diferentes repositorios, ubicarlos
Observar la organizacin en la que estn dispuestos los datos en cada
repositorio, y como se almacenan
Definir una estrategia para unificar los datos en un solo repositorio (escoger
una herramienta, puede ser un lenguaje de procesamiento matemtico).
Integrar los formatos.
Crear la VMO resultante de la integracin de los datos asociados a las
variables escogidas en la VMC (fusin de tablas, integracin de bases de
datos, entre otros).
Definir las variables objetivo:
Identificar a qu conclusiones puede llegar el experto humano teniendo en
cuenta las entradas
Observar el objetivo en el escenario futuro seleccionado e identificar Cul
de las variables llevan a dicho objetivo?
Escoger la(s) variable(s) objetivo(s)
Tratamiento de datos
Objetivos
Esta etapa se centra en generar datos de
calidad, es decir datos sin anomalas, sin
inconsistencias de formato, sin capturas
errneas, sin campos vacos; aplicando
mtodos de limpieza, transformacin y
reduccin sobre la vista minable operativa.
Productos principales
VMO
Limpieza:
Estudiar la representacin de cada una de las
variables.
Buscar anomalas de representacin.
Definir alguna estrategia de limpieza para
erradicar dichas anomalas y obtener data
consistente.
Escoger las herramientas tecnolgicas para
realizar las operaciones de limpieza de datos
definidas.
Transformacin:
Estudiar las representaciones de cada una de las variables

Identificar las representaciones que se puedan transformar en otra representacin ms
conveniente o fcil de utilizar a la hora de aplicar la tarea de MD, como por ejemplo, cambiar las
unidades de las variables para trabajar con un nico sistema de medicin. Otro ejemplo puede ser
cambiar las unidades de medicin de las variables.
Ordenar dichas transformaciones que se desean aplicar en una tabla, para observar las
equivalencias.
Aplicar la transformacin con un software seleccionado
Identificar las variables que potencialmente se pueden normalizar, un ejemplo de ello es
normalizar los valores de las variables en un rango que no sea muy grande (por ejemplo un
nmero de 0 a 1).
Definir la funcin(es) de normalizacin para cada una de las variables seleccionadas en el paso
anterior y ordenarla en tablas.
Aplicar la funcin(es) de normalizacin en las variables seleccionada
Describir en tablas cada una de las transformaciones y normalizaciones realizadas.
Reduccin:
Realizar anlisis estadsticos para reducir variables que

posean una alta relacin lineal, como por ejemplo un
anlisis de correlacin.
De ser necesario, combinar variables por un mtodo
seleccionado, tal como el PCA (del ingls Principal
Component Analysis) que es considerado tambin un
mtodo para reduccin de variables.
Identificar las posibles variables que se pueden reducir.
Justificar la reduccin de las mismas
Construir la nueva vista minable con las nuevas variables
reducidas
Fase 3: Desarrollo de herramientas de
MD
Esta fase busca generar una herramienta de software que permita utilizar el
modelo de MD, en los escenarios futuros donde se identificaron su
potencial uso. El producto principal de esta fase es la aplicacin de MD
como tal, y el modelo de MD.
Tcnicas de Minera de datos:
rboles de decisin,
Reglas de asociacin,
Redes Neuronales Artificiales,
Las tablas de decisin

Arboles de decisin
Los rboles de decisin son unos de los

algoritmos clasificadores ms conocidos y
usados en las tareas de Data Mining, ya que
son una forma de representacin sencilla
para clasificar instancias.
RBOLES DE DECISION
rboles de decisin son particiones secunciales de un

conjunto de datos
Objetivo: Segmentar la poblacin para encontrar grupos

homogneos segn una cierta variable de respuesta. Esta
tcnica permite representar de forma grfica una serie de
reglas sobre la decisin que se debe tomar en la
asignacin de un determinado elemento a una clase o
valor de salida.
Tablas de decisin
Es la forma ms
simple y ms
rudimentaria para
representar la
salida de la
mquina de
aprendizaje.
Ejemplos
Criterios
Ejemplos Qu aprendo?
Ej Alt Bar Dia EdM Patr Prec EdD Tipo RES T ---> Espera
X1 S N N S Alg $$$ N Franc S 0-10 S
X2 S N N S llen $ N Jap S 10-15 N
X3 N S N N Alg $ N Hamb N 0 S
...
X12 S S S S llen $ N Hamb N 10 S
Jose Aguilar 82
RBOLES DE DECISION
Los rboles de decisin suelen ser empleados en tareas de clasificacin, y
tambin, aunque en menor medida, en tareas de prediccin
Ej. Acontecimientos relativos al hundimiento del Titanic

rbol de Decisin
Puede expresar cualquier funcin a partir de sus atributos de entrada.
Un rbol de decisin es consistente para cualquier conjunto de

entrenamiento, cuando hay un camino a una hoja para uno o varios
ejemplos
Basado en la idea de tablas de la verdad:
Es una estrategia de
aprendizaje inductivo
J. Aguilar
Arboles de decisin
transformaciones
rbol de Decisin
Para nuestro ejemplo inicial:
Patrn?
SN TiempoEspera?
S Alternativa? Hambre N
Reservacin? Viernes/Sbado? S Alternat
Bar S N S S Llueve?
SN N S
Jose Aguilar
86
rbol de Decisin
Idea: escoger atributo "ms significativo" como raz del (sub)-rbol
Cmo?
Si hay + y - ejemplos escoger atributo que mejor los divida (mayor discriminante)
Si hay particiones con + y -, buscar un 2do atributo para seguir partiendo
Macroalgoritmo AD(ejemplos, atributos)

Si ejemplos no vacios entonces
Si ejemplos clasificados entonces
regresar (clasificacin)
de lo contrario
mejor: escoger_atributo(atributos, ejemplos)
arbol: un nuevo rbol de decisin con mejor como raz
por cada valor Vi de mejor
Subejemplos:ejemplos con mejor=Vi
Subarbol: AD(Subejemplos, atributos)
Arbol: actualizar(nueva rama con etiqueta Vi y Subarbol)
Regresa(arbol)
Escoger un atributo
aprender reglas (clases)
Patrn es una mejor escogencia que Tipo?
Patrn? Tipo?
Lleno Francs
Nada Algo China Italiana
Basado en concepto de contenido de informacin
Parte de Info( p, n) p log 2 ( p ) n log 2 (n)

Es una medida de la entropa (grado de desorden) de los ejemplos
n: numero de ejemplos - p: numero de ejemplos +
Escoger un atributo
aprender reglas (clases)
Patrn es una mejor escogencia que Tipo?
Patrn? Tipo?
Nada Algo Lleno Francs

China Italiana
Escoger atributo A con mas grande IG (ganancia en informacin)
Donde:
I es entropa de los ejemplos:
p n
y IG ( A) I ( , ) restov:( A)
posibles valores de A
pn pn p y n ? ver siguiente lamina
i i
p n p p n n
I( , ) log 2 log 2
pn pn pn pn pn pn
v
p i n i p ni
resto(A) I( i , )
i 1 p n pi n i p i n i
Arbol de Decisin y Lgica de Predicado
Ei
Donde Ei es el porcentaje
Quin es pi? pi puede ser pi
Ei Ei de ejemplos clasificados
como + por el valor
v del atributo A
Una Formula general para escoger a los atributos:
Como hay que elegir el atributo con mayor informacin (menor entropa),
otra posibilidad es calcular una funcin de merito (FM)
FM(A) i 1 ri inf o(pi , n i )

v
pi % ejemplos clasificados como + en la rama i

pi ni
ri
pn
90
Arbol de Decisin y Lgica de Predicado
r espera(r) => Patrn(r, algo) O (Patrn(r, full) Y NoHambre(r) Y
tipo(r, francs)) O (Patrn(r, full) Y NoHambre(r) Y tipo(r,
hamburguesa)) O (Patrn(r, full) Y NoHambre(r) Y tipo(r,
Japones) Y viernes/Sabado(r) )
Patrn?
NS Hambre?
Nada Algo
lleno Uso de operadores:
Tipo? N Para unir ramas O
No Si Para seguir una rama Y
S N Viernes/Sbado? S
Frances Hamburgesa
Italiano N Japones S
No Si
91
Construccin de rboles de decisin
Se completa el rbol completando cada rama hasta cumplir un cierto compromiso:
Nmero mnimo de elementos de un

hoja.
Cobertura: Mnimo nmero (o
porcentaje) de casos posibles
cubiertos correctamente de la BD.
Precisin: Error de clasificacin
menor de un umbral puesto. Por
ejemplo: precisin del 80%. Significa,
que pararemos en esa hoja cuando el
nmero de clases clasificadas
correctamente sea mayor o igual al
80%.
Podado de un rbol
Cmo decidir si desea donde N es el nmero de
reemplazar un nodo interno con muestras, f = E / N es el
porcentaje de error observado, y
una hoja?
q es la tasa de error. Al igual que
antes, esto conduce a un lmite
Imaginemos que la verdadera superior de confianza para q.
probabilidad de error en el nodo es q, Ahora usamos ese lmite superior
y que las N instancias son generados de confianza como una
por un proceso de Bernoulli con estimacin (pesimista) para la tasa
parmetro q , de la que E son los de error e en el nodo:
errores. El intervalo de confianza
viene dado por:
Podado de un rbol
None: E = 2, N = 6, y por lo que f = 0,33. e = 0,47. tasa
de error de formacin es del 33%, se utilizar la
estimacin pesimista del 47%.
Half: E = 1, N = 2, e = 0.72.
Full: Tiene el mismo valor de e como el primero.
El siguiente paso es combinar las estimaciones de

error para estos tres hojas en la relacin entre el
nmero de ejemplos que se refieren, 6: 2: 6, lo que
conduce a una estimacin de error combinado de
0,51.
Health plan contribution: f = 5/14. e = 0.46. Debido a
que este es menor que el error de estimacin
combinada de los tres nios, ellos se podan.
Working hours per week: La estimacin de error para
la primera, con E = 1 y N = 2, es e = 0,72, y para el
segundo es e = 0,46. La combinacin de estos, 2 : 14,
conduce a un valor que es mayor que la estimacin del
error para el nodo de horas de trabajo, por lo que el
subrbol se poda y se sustituye por un nodo hoja.
Deduccin de reglas rudimentarias
Evaluando los atributos de los datos

Modelizacin estadstica
Datos de tiempo
probabilidades
Modelizacin estadstica
para un dia dado
Probabilidad de que sea si: 2/9 x 3/9 x 3/9 x 3/9 x 9/14 = 0.0053
Probabilidad de que sea no: 3/5 x 1/5 x 4/5 x 3/5 x 5/14 = 0.0206
Normalizacin
REGLAS DE ASOCIACION
Nos permite predecir patrones de comportamientos futuros
sobre ocurrencias simultaneas de valores de variables. Tcnica
no supervisada
Una asociacin entre dos atributos ocurre cuando la

frecuencia con la que se dan dos o ms valores determinados
de cada uno conjuntamente es relativamente alta.
Las reglas de asociacin intentan descubrir asociaciones o

conexiones entre objetos.
ConsecuenciaAntecedente 1 Antecedente 2 Antecedente m.
Ejemplo, en un supermercado se analiza si los paales y las compotas

se compran conjuntamente.
REGLAS DE ASOCIACION: ejemplo
Gestin estante del supermercado.
Objetivo: Identificar los elementos que se compran

juntos por bastante muchos clientes.
Enfoque: Procesar los datos de punto de venta

recogidos con escneres de cdigo de barras para
encontrar dependencias entre elementos.
Una regla clsica

Si un cliente compra paales y leche, entonces es muy
probable que compre compotas.
Reglas de Asociacin
Pueden predecir cualquier atributo, no

solo la clase, o predecir
combinaciones de atributos.
La cobertura de una regla de

asociacin es el nmero de instancias
para las cuales ella predice
correctamente (soporte).
La precisin (confianza) es el nmero

de instancias que predice
correctamente, expresado como una
proporcin de todas las instancias a las
que se aplica.
Reglas de Asociacin
se utilizan para descubrir hechos que ocurren en

comn dentro de un determinado conjunto de
datos
Por ejemplo, en la tabla anterior con la regla:

If temperature = cool then humidity = normal
Otra regla es:

If windy = false and play = no then outlook = sunny
and humidity = high
Reglas de Asociacin
Items con cobertura mayor o igual a 2

Reglas de Asociacin
Las reglas se obtienen a partir de los itemsets

humidity = normal, windy = false, play = yes
Esto nos lleva a las 7 reglas potenciales:

If humidity = normal and windy = false play = yes 4/4
If humidity = normal and play = yes windy = false 4/6
If windy = false and play = yes humidity = normal 4/7
If humidity = normal windy = false and play = yes 4/6
If windy = false humidity = normal and play = yes 4/8
If play = yes humidity = normal and windy = false 4/9
If humidity=normal and windy=false and play=yes 4/12
Ejemplo de Reglas de Asociacin
Encontrar las asociaciones que se producen entre los diferentes sitios de la

pgina Web cuando los usuarios acceden a sta.
Preparacin Data
Generacin de Matriz
Algoritmo Apriori
Reglas de Asociacin
Reglas de Asociacin
XY
[/public/about.jsp ]---->/public/team.jsp
Soporte:
Soporte (X Y) = Probabilidad (X U Y)
Confianza:
Confianza (X Y) = Probabilidad (X / Y)
Reglas de Asociacin
Reglas de Asociacin
Preparacin de Data
Registro_Log
Registro_Paginas_Site
Registro_Sesion
Reglas de Asociacin
Generacin Matriz
Sesin / #
Pgina 1 2 3 4 5 .. pginas
1 0 1 0 1 0 .. 0
2 1 0 1 1 0 .. 0
3 1 1 0 1 0 .. 0
4 0 1 1 1 0 .. 0
5 1 0 0 0 0 .. 0
6 0 1 0 0 1 .. 0
: : : : : : .. 0
: : : : : : .. 0
# sesiones 0 1 0 1 0 .. 0
S1= (0+1+1+0+1+0++0)/# sesiones

Reglas de Asociacin
Algoritmo Apriori (matriz , soporte, confianza)
Usa conocimiento a priori de las propiedades de los tems (pginas) frecuentes que ya se
han encontrado.
Si un conjunto no puede pasar un test, todos sus sper conjuntos tambin fallarn el
mismo test
2 Sesin / Pgina 1 2 3 4 5 .. # pginas
1 1 0 1 0 1 0 .. 0
Candidatos antecedentes 2
3
1
1
0
1
1
0
1
1
0
0
..
..
0
(Sop > Soporte) 4 0 1 1 1 0 .. 0
5 1 0 0 0 0 .. 0
6 0 1 0 0 1 .. 0
: : : : : : .. 0
: : : : : : .. 0
# sesiones 0 1 0 1 0 .. 0
3 S1 S2 S5 Sn
12 Solo si conf(12) > confianza confianza=Prob (X / Y)
Confianza: hallar esa prob. Condicional desde

los nodos soportes que pasen un umbral
Reglas de clasificacin
Las reglas de clasificacin son una alternativa popular
a los rboles de decisin,
Por ejemplo:
Utilidad de una categora
Mide la calidad general de una particin
es una estimacin de la probabilidad de que el atributo ai tiene un

valor vij, en el grupo Cl
donde C1, C2,. . ., Ck son los k grupos; la suma exterior es de estos

grupos; las siguientes sumas interiores de los atributos ai , y sus posibles
valores vi1, vi2,. . . .
Generacin de reglas
Algunas reglas inducidas pueden

derivar de la construccin de un
rbol de decisin, siendo primero
generado el rbol de decisin y
despus trasladado a un conjunto
de reglas
Otros algoritmos se basan en el

uso de tcnicas de aprendizaje
con lgica de predicados (ILP,
Inductive Logic Programming).
(FOIL, FFOIL, CLINT, etc.)
RNA y Aprendizaje
INTRODUCCIN A LAS RNAs
CMO LA RED NEURONAL HUMANA ESTA
DISEADA?
CMO EL CEREBRO PROCESA LA INFORMACIN?
CON QU ALGORITMOS Y ARITMTICA EL CEREBRO
CALCULA?
CMO PUEDE EL CEREBRO IMAGINAR?
CMO PUEDE EL CEREBRO INVENTAR?
QU ES PENSAR?
QU ES SENTIR?
SISTEMA NERVIOSO
Red de Actuadore Respuest

Estimulo Receptores Neuronas
s a
J. AGUILAR 115
MODELO BIOLOGICO
SISTEMA NEURONAL
CONTROL CENTRALIZADO DE LAS

FUNCIONES BIOLOGICAS
CEREBRO ~ 100 MIL MILLONES DE NEURONAS

Y 10000 CONEXIONES POR NEURONA
J. AGUILAR 116
MODELO BIOLOGICO
NEURONAS: CELULAS VIVAS
CARACTERISTICAS:
ELEMENTOS SIMPLES INTERCONECTADOS
FUNCIONAMIENTO EN PARALELO, ASINCRNICA Y
NO ALGORTMICAMENTE
INTERACCIONES COMPLEJAS
J. AGUILAR 117
NEURONA
UNIDAD FUNDAMENTAL DEL SISTEMA
NERVIOSO ESPECIALIZADAS EN CIERTAS
TAREAS
PROCESADOR DE SEALES ELCTRICAS

(DESCARGAS EN EL CUERPO CELULAR) Y
BIOQUMICAS (NEUROTRANSMISORES)
RECIBE Y COMBINA SEALES DESDE

MUCHAS NEURONAS
J. AGUILAR 118
NEURONA
AXN: LINEA DE TRANSMISIN

DENDRITAS: ZONAS RECEPTORAS
SINAPSIS: EXCITADORAS E INHIBIDORAS
SEALES ELECTRICAS Y QUIMICAS
J. AGUILAR 119
SINAPSIS
UNIDAD FUNCIONAL QUE
INTERRELACIONA LAS NEURONAS
NEUROTRANSMISOR: GENERA
POLARIZACIN PARA LA MEMBRANA
POSTSINPTICA
POTENCIAL POSTSINPTICO:
PUEDE SER POSITIVO (EXCITACIN)
O NEGATIVO (INHIBICIN)
J. AGUILAR 120
REDES NEURONALES
MUCHAS CONEXIONES PARALELAS ENTRE
NEURONAS
MUCHAS CONEXIONES PROVEEN
MECANISMOS DE RETROALIMENTACIN
PARA LAS NEURONAS
ALGUNAS NEURONAS PUEDEN EXCITAR UNAS
NEURONAS MIENTRAS INHIBEN A OTRAS
J. AGUILAR 121
REDES NEURONALES
EJECUTAN UN PROGRAMA QUE ES

DISTRIBUIDO
TIENEN PARTES PRE-HECHAS Y

OTRAS QUE EVOLUCIONAN
J. AGUILAR 122
CAPACIDADES RED NEURONAL
Procesamiento paralelo
Adaptativa
Asociativa
Auto-organizacin
Generalizacin, clasificacin, extraccin y
optimizacin
J. AGUILAR 123
COMPARACION RED NEURONAL
Neurona Biolgica Neurona Artificial
Seales que llegan a la
sinapsis Entradas a la neurona
Carcter excitador o
inhibidor de la sinapsis de
entrada Pesos de entrada
Estimulo total de la Sumatoria de pesos por
neurona entradas
Activacin o no de la
neurona Funcin de activacin
Respuesta de la neurona Funcin de salida
J. AGUILAR 124
COMPARACION RED NEURONAL
Aspectos Computador Cerebro Humano
Unidades de CPUs 1011 neuronas

Clculo
Unidades de RAM y disco duro 1011 neuronas
Almacenamiento Y 1014 sinapsis
Ciclos Mherz 10-3 segundos
Banda Ancha Capacidad de 1014 conex.

transmisin (bits)/segundo
Actualizacin/seg. Capacidad de 1014

procesamiento
paralelo
COMO TRABAJA UNA NEURONA
ARTIFICIAL
J. AGUILAR 126
COMO TRABAJA UNA NEURONA ARTIFICIAL
X1, X2,.., Xn son las seales de entrada y cada una pasa a travs de un
peso W, llamado peso sinptico de la conexin, cuya funcin es anloga
a la de la funcin sinptica de la neurona biolgica
El nodo sumatorio acumula todas las seales de entrada multiplicadas

por los pesos y las pasa a la salida a travs de una funcin de activacin
o transferencia f(n), (b es el sesgo).
COMO TRABAJA UNA RED
NEURONAL
1. El conjunto de unidades de procesamiento
(neuronas formales).
2. El estado interno o de activacin de las

neuronas.
3. Las conexiones entre las neuronas.
4. Las conexiones con el ambiente.
J. AGUILAR 128
COMO TRABAJA UNA NEURONA
5. La regla de propagacin hi(t)= g(wij, xj(t))
Ej. hi(t)= j wijxj(t)
6. La funcin de activacin
ai(t)= fi(ai(t-1), hi(t))
7. La funcin de transicin o de salida

yi(t)=Fi(ai(t))
J. AGUILAR 129
APLICACIN DE TCNICAS COMPUTACIONALES EN EL ESTUDIO DE EFECTOS INTERPLACAS
Funcin de activacin
Funcin identidad o funcin lineal: Funcin lineal por tramos
Funcin escaln Funcin sigmoidal

COMO TRABAJA UNA RED DE
NEURONAS
8. La topologa o arquitectura de la red
conexin total (todas las neuronas interconectadas)

o conexin parcial (por ejemplo, las redes de
capas).
Realimentada o unidireccional
J. AGUILAR 131
Topologas de las RNA
Redes monocapa:
Redes con una sola capa.
Para unirse las neuronas crean conexiones laterales para conectar
con otras neuronas de la nica capa.
Redes multicapas:
Generalizacin de las anteriores donde existe un conjunto de capas
intermedias entre la entrada y la salida llamadas capas ocultas.
Pueden ser:
Propagacin hacia adelante
Propagacin hacia atrs
Redes recurrentes
Redes de alimentacin lateral
Redes Multicapas
Capa de Entrada: est constituida por los nodos de entrada, que reciben
directamente la informacin de las fuentes externas a la red.
Capas Ocultas: no tienen contacto con el exterior ya que se encuentran
ubicadas entre la capa de entrada y la capa de salida. La cantidad de capas
ocultas depender del problema en estudio y deben especificarse en la
arquitectura.
Capa de Salida: est constituida por los nodos que transfieren la
informacin a la salida de la red y de acuerdo al tipo de problema en
estudio se determinar el nmero de neuronas de salida.
Redes Multicapas
Redes recurrentes
Redes de alimentacin lateral

Aprendizaje
en las RNs
J. AGUILAR 135
APRENDIZAJE
El aprendizaje de una RNA se basa en un proceso que permite que la
red aprenda a comportarse segn unos objetivos especficos.
El aprendizaje le da la capacidad a la RNA de cambiar su

comportamiento, es decir su proceso de entrada-salida, como
resultado de los cambios en el medio.
En particular, las reglas de aprendizaje son procedimientos que se

siguen para ajustar los parmetros de la red a partir de un proceso de
estimulacin por el entorno de la red
La mayora de las veces consiste en determinar un conjunto de pesos
El aprendizaje es esencial para la mayora de las arquitecturas de RNA,

por lo que la eleccin de un algoritmo de aprendizaje es algo de gran
importancia en el diseo de una red.
APRENDIZAJE
Al finalizar la fase de entrenamiento/aprendizaje
de una RNA, se espera que la red haya aprendido
lo suficiente para resolver otro problema similar
satisfactoriamente.
No existe en la literatura una metodologa que

indique la manera de escoger el tipo o forma de
aprendizaje de la red para obtener resultados
ptimos.
Tipo de aprendizaje viene determinado por la

forma en que los parmetros se deben adaptar
J. AGUILAR 137
MEMORIAS ASOCIATIVAS
RN ALMACENAN INFORMACIN
APRENDIDA REFLEJADA EN SUS
PESOS
AL APLICARLE UNA ENTRADA LA

RNA RESPONDE CON UNA SALIDA
ASOCIADA A DICHA INFORMACIN
DE ENTRADA
ASOCIACIN ENTRADA/SALIDA
J. AGUILAR 138
APRENDIZAJE
MODIFICAR PESOS DE LAS

CONEXIONES DE LAS NEURONAS
(CREAR, DESTRUIR, MODIFICAR)
wij(t+1)=wij(t) + Dwij(t)
J. AGUILAR 139
APRENDIZAJE
Clasificacin de los Algoritmos de Aprendizaje basados en su

fundamentacin conceptual
APRENDIZAJE
A. PARADIGMAS DE APRENDIZAJE: Define como se
relaciona con su entorno. Se distinguen por el tipo
de retroalimentacin que se le ofrece al alumno.
supervisado: el crtico proporciona la salida correcta.
no supervisado, no se proporciona retroalimentacin en
absoluto.
Basado en recompensa: la crtica proporciona una evaluacin
de la calidad (el "premio") de lo hecho por el alumno.
J. AGUILAR 141
APRENDIZAJE
En los agentes se pueden usar todas
En el caso de mltiples agentes, los mtodos
supervisados no son fciles de aplicar
Mas usado los mtodos de recompensa.
Aprendizaje basado en recompensas puede ser
dividido en dos subconjuntos:
Mtodos de aprendizaje por refuerzo: estiman funciones
de valor
Mtodos estocsticos ,dtales como la computacin
evolutiva, recocido simulado.
J. AGUILAR 142
APRENDIZAJE
B. ALGORTMOS DE APRENDIZAJE: DEFINE

REGLAS DE APRENDIZAJE (MODIFICACIN
DE LOS PESOS)
CORRECCIN DE ERROR
BOLTZMAN
HEBBIANO
COMPETITIVO
EVOLUTIVO
J. AGUILAR 143
SUPERVISADO
Respuesta correcta para cada ejemplo dada
SE DAN DATOS DE ENTRADA Y SALIDA

OBJETIVO
SALIDA RED DEBE CONCORDAR CON LA

DESEADA
J. AGUILAR 144
SUPERVISADO
Entrada Salida
Red
Supervisor
Algoritmo
J. AGUILAR 145
CORRECCIN DE ERROR
CONOCIDO TAMBIEN COMO DESCENSO DE
GRADIENTE
Ek(t) = Dk(t) - Yk(t)

Dk: respuesta deseada
Yk: respuesta neurona k Yk=F(Xk)
Xk: entrada neurona k
D Wij(t)= a Ei(t) Xj(t)

a: taza de aprendizaje
J. AGUILAR 146
CORRECCIN DE ERROR
ALGORITMO
1. CALCULAR EDO. DE LA RED (Yi)

2. CALCULAR ERROR (Ei)
3. AJUSTAR PESOS
wij(t+1)=wij(t) + Dwij(t)
J. AGUILAR 147
J(0,1)
1
0
J(0,1)
1
0
Algoritmo de un RNA
1. Inicializacin de los pesos y umbral
2. Fase de entrenamiento
1. Presentacin de las entradas y salida deseada
2. Adaptacin de los pesos
3. Fase de Reconocimiento
1. Presentacin de una entrada dada
2. Salida reconocida
J. AGUILAR 150
NO SUPERVISADO
(AUTOORGANIZADO)
NO RECIBE INFORMACIN DE SU ENTORNO (Se

reciben patrones sin la respuesta deseada)
CON LOS DATOS SE BUSCAN CORRELACIONES O

REGULARIDADES EN EL CONJUNTO DE ENTRADAS:
EXTRAER RASGOS
AGRUPAR PATRONES SEGN SU SIMILITUD
MAPAS AUTOORGANIZADOS
J. AGUILAR 151
NO SUPERVISADO
(AUTOORGANIZADO)
Entrada Salida
Red
Algoritmo
J. AGUILAR 152
HEBBIANO
MS VIEJO
DOS O MAS NEURONAS ACTIVADAS

SIMULTANEAMENTE
=> REFORZAR LA CONEXIN ENTRE ELLAS
DWij = a Yi Yj
J. AGUILAR 153
REFORZADO
Recompensa ocasional
SUPERVISOR INDICA SI SALIDA SE AJUSTA A

LO DESEADO O NO (que bien o mal se esta
haciendo, no si es la salida deseada!!)
SUPERVISOR HACE PAPEL DE CRTICO MS
QUE DE MAESTRO (premio-castigo)
Accin ai
Agente Ambiente
Recomp. ri
EstadoJ. sAGUILAR
i+1
154
REFORZADO
J. AGUILAR 155
REFORZADO
Particularmente tiles en los mbitos en los que exista
informacin de reforzamiento (expresado como
penalizaciones o recompensas) proporcionada despus
de una secuencia de acciones realizadas en el
ambiente.
Mtodos comunes: Q-Learning y diferencia temporal-
(TD )
Q-Learning: aprende la utilidad de llevar a cabo acciones que
me lleven a ciertos estados,
TD aprender la utilidad de estar en ciertos estados.
J. AGUILAR 156
REFORZADO
Todos los mtodos de aprendizaje por refuerzo estn
inspirados en
frmulas de actualizacin de la utilidades esperadas
exploracin del espacio de estados.
La actualizacin es a menudo una suma ponderada de:
valor actual utilidad,
refuerzo obtenido al realizar una accin y
utilidad esperada por el siguiente estado alcanzado,
despus se realiza la accin.
J. AGUILAR 157
Algoritmo de un RNA
1. Presentacin de las entradas
2. Calculo de la salida actual
3. Adaptacin de los pesos
J. AGUILAR 158
Tareas de Aprendizaje
Aproximacin
Asociacin
Autoasociativa
Heteroasociativa
Clasificacin
Prediccin
Control planta:u(t),y(t) modelo:r(t),d(t) lim|d(t)-y(t)|=0
Filtraje
J. AGUILAR 159
Modelos Neuronales
Clasificacin por tipo de aprendizaje y arquitectura
Hbridos: RBF (RADIAL BASIC FUNCTION)
Supervisados
Realimentados : feed-propagation
Unidireccionales PERCEPTRON, M RN, BOLTZMAN, backpropagation
No supervisados
Realimentados: ART, HOPFIELD
Unidireccionales: KOHONEN
Reforzados 160
PERCEPTRN
1ER MODELO DE RED DE NEURONAS ARTIFICIALES (ROSEMBLATT
1958)
APRENDE PATRONES SENCILLOS (2 CLASES)
1 NEURONA
X1 W1
Wn
Xn
F(x)
1 Y=F(WiXi-)
-1
PERCEPTRN
REGIONES QUE INDICA A QUE PATRN

PERTENECE CADA CLASE SEPARADAS POR UN
HIPERPLANO
=> PATRONES SEPARABLES GEOMTRICAMENTE
=> DOS ENTRADAS LINEA RECTA X2=W1X1/W2+/W2
=> TRES ENTRADAS PLANO
NO RESUELVE OR-EXCLUSIVO
J. AGUILAR 162
PERCEPTRN
APRENDIZAJE: SUPERVISADO
ALGORTMO:
1. INICIAR PESO Y UMBRAL
2. PRESENTAR PAR ENTRADA-SALIDA
3. CALCULAR SALIDA ACTUAL
Y(t)
4. ADAPTAR LOS PESOS
Wi(t)=Wi(t)+a[d(t)-Y(t)]Xi(t)
HASTA QUE d(t)-y(t)2 valor pequeo
5. REGRESAR AL PASO 2
J. AGUILAR 163
Modelo de Redes Neuronales
Capa 1 Capa 2 Capa 3

Unidad
0 Bias 0
Capa 1 Capa 2 Capa 3

activacin unidad en capa
Matriz de pesos entre capa y capa

Negation:
0 1
1 0
Ejemplo de clasificacin no lineal: XOR/XNOR
, are binary (0 or 1).
x2
x2
x1
x1
AND 1.0
0 0 0
0 1 0
1 0 0
1 1 1
OR
-10
20 0 0 0
20 0 1 1
1 0 1
1 1 1
-30 10 -10
20 -20 20
20 -20 20
-30 -10
20
0 0 0 1 1
20 20
0 1 0 0 0
10
-20
20
1 0 0 0 0
-20 1 1 1 0 1
Clasificacin multi-clase
Peatn Carro Motocicleta Camin
Ser , , , etc.
peatn carro motocicleta

REDES BAYESIANAS
Redes Bayesianas
Las redes bayesianas son grafos dirigidos acclico
cuyos nodos representan variables aleatorias en
el sentido de Bayes
En el teorema de Bayes se expresa la probabilidad

condicional de un evento aleatorio A dado B en
trminos de la distribucin de probabilidad
condicional del evento B dado A y la distribucin de
probabilidad marginal de slo A. Pueden ser
cantidades observables, variables latentes, parmetros
desconocidos o hiptesis.
Redes Bayesianas
Las aristas representan dependencias condicionales
Los nodos que no se encuentran conectados

representan variables las cuales son condicionalmente
independientes de las otras.
Cada nodo tiene asociado una funcin de

probabilidad que toma como entrada un conjunto
particular de valores de las variables padres del nodo y
devuelve la probabilidad de la variable representada
por el nodo.
Haciendo predicciones con Redes
Bayesianas
Por ejemplo, considerar la

posibilidad de una
instancia con valores
perspectivas = lluvias,
temperatura = fro,
humedad = alto, y con
viento = true.
Bayesianas
Para calcular la probabilidad

para jugar = no, en la red da
probabilidad:
0.367 desde el nodo Play,

0.385 desde outlook,
desde temperature 0.429,
0.250 de humidity, y
0.167 de windy
Bayesianas
El producto es 0,0025. El
mismo clculo para el juego
= yes es 0.0077.
Sin embargo, estos no son la

respuesta final:
las probabilidades finales

deben sumar 1,
Bayesianas
En realidad, son las probabilidades
conjuntas Pr [play = no, E] y Pr
[play = yes, E] donde E
representada los valores de los
atributos de la instancia que llegan
a play.
Para obtener las probabilidades

condicionales Pr [play = no | E] y Pr
[play = yes | E], normalizar las
probabilidades conjuntas
dividindolas por su suma.
Esto da probabilidad 0,245 para
jugar = no y 0.755 para jugar = yes
Aprendizaje de Redes Bayesianas
El aprendizaje, en general, de redes bayesianas

consiste en inducir un modelo, estructura y
parmetros asociados, a partir de datos.
Este puede dividirse naturalmente en dos partes:

Aprendizaje estructural. Obtener la
estructura o topologa de la red.
Aprendizaje paramtrico. Dada la estructura,
obtener las probabilidades asociadas.
Manejo de Incertidumbre
Red bayesiana para el

manejo de incertidumbre
Caso juego: Segn la funcin MUE la mejor accin ser aquella en la cual la
razn dada entre la utilidad y la probabilidad de que el oponente obtenga
una mala jugada sea mxima.
Modelo Matemtico de Aprendizaje
Se tiene el siguiente rbol con 13 nodos
Red bayesiana en su estado de mxima

confusin
Segn accin del adversario sea buena o no, la rama debe ser premiada (o penalizada) y las
del resto de hermanos inversamente modificadas (aprendizaje reforzado)
Para actualizar las ramas se pueden usar los siguientes valores:

pobj= 6/10 se suma (resta) a la rama evaluada para premiar (castigar)
presto=2/10 se resta (suma) al resto de ramas para penalizar (premiar)
Aprendizaje Paramtrico
Nodos raices
Resto Nodos
Aprendizaje Estructural
Aprendizaje de Arboles
Aprendizaje NaiveBayes
Aprendizaje NaiveBayes
Las variables predictoras son condicionalmente independientes dada la

variable clase
t

Mineria de Datos PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Mineria de Datos PDF

Uploaded by

Copyright:

Available Formats

Introduccin a Minera de Datos,

Informacin: Datos analizados y presentados en forma

Conocimiento: informacin procesada para emitir juicios que

Meta Conocimiento: Reglas que permiten obtener

Importancia (relativa al receptor):

Vigencia (en la dimensin espacio-tiempo):

Enormes cantidades de datos son recogidas y almacenadas

Resultado: Para analizar estas enormes cantidades de datos,

Modelo: Habla de todo el conjunto de datos

Patrn: Habla de una regin particular de datos.

Tradicionalmente se analizaban datos con la

Bases de datos con un n de registros del

La tecnologa informtica puede automatizar

Datos Minera de datos Modelos

Los modelos son el producto de la minera de datos...

La minera de datos tiene como propsito la

Minera de datos es la exploracin y anlisis de

Ligada a las bodegas de datos (informacin

Extraccin de patrones y modelos interesantes,

Knowledge Discovery in Databases KDD (Descubrimiento

Coleccin de tcnicas poderosas para analizar

No existe un solo enfoque para minera de datos sino

Bsqueda de un nmero de telfono en el directorio

Usar un motor de bsqueda en Internet para obtener

La fuerza bruta crujido de datos a granel

La presentacin de los datos de diferentes maneras

Una tarea intensiva de base de datos

Una palabra de moda para

Un conjunto de tcnicas que

Estadistica Mineria de datos

Construccin Mayor libertad en la construccin,

Transparencia Ms complicados de interpretar Ms claros y sencillos

Adems, en minera de datos tenemos:

1.- Mayor volumen de datos (diferencia fundamental)

2.- Mayor complejidad de los datos (miles de atributos o

4.- nfasis est en buscar modelos ms que en verificar un

Cul es la proporcin media de Cul es la mejor prediccin para

OLAP proporciona una muy buena vista de lo que est

Minera de datos predictiva (mdp): usa

Minera de datos para descubrimiento de

Agrupacin o segmentacin (Clustering)

No depende de clases pre-definidas a

1. SUPERVISADOS: predicen el valor de un atributo de un conjunto de

Ejemplos: Algoritmos genticos: Redes neuronales, rboles de

2. NO SUPERVISADOS: descubren patrones y tendencias en los datos sin

Clustering, Anlisis de enlace, Anlisis de frecuencia

El proceso de modelado se realiza sobre un conjunto de

No se tiene informacin sobre las categoras de

Por lo tanto, en este caso, el sistema tiene que ser

Aprendizaje supervisado Aprendizaje no

Social network analysis

Regresin y Anlisis de Tendencias en series temporales de

Minera Patrn Secuencial en secuencias simblicas

Alineacin de secuencias biolgicas

Minera espacio-temporal y Object ivos en movimiento

Minera Cyber-fsico de datos del sistema: salud, control de trfico areo,

Minera de datos multimedia

Minera de datos de texto

Minera de datos Web

Minera de datos Streams

Simplemente el hallazgo de los patrones no es

Debemos ser capaces de entender los patrones,

Medir los Usar data mining para