You are on page 1of 43

INTRODUCCIÓN AL MACHINE

LEARNING
Preparado como parte de las Actividades por el LII Aniversario de la
Facultad de Ciencias Puras y Naturales
M.Sc. Aldo Ramiro Valdez Alvarado
Mayo de 2018
Índice
1 Inteligencia Artificial y ML
2 Big Data y ML
3 Data Science y ML
4 Definición de ML
5 Tipos de ML
6 Aprendizaje Supervisado
7 Aprendizaje No Supervisado
Google Trends…
1 Inteligencia Artificial y ML
La Inteligencia Artificial es la ciencia de construir
máquinas que…

… piensen … piensen
como humanos racionalmente

… actúen como … actúen


humanos racionalmente
En 1959, el científico de la IBM
Arthur Samuel escribió un
programa para jugar damas, para
mejorarlo hizo que el programa
jugara consigo mismo miles de
veces, el programa era capaz de
mejorar su rendimiento a través
de la experiencia, el programa
aprendió y nació el Machine
Learning.
2 Big Data y ML
• Actualmente existen almacenados
+2.7 Zetabytes, se esperan 35
Zetabytes para 2020
• En 2012 la información digital
alcanzó a nivel mundial 2.837
exabytes. Puestos en DVDs, la
torre sería de 400.000 Kms, más
que la distancia de la Tierra a la
Luna
• Google procesa más de 24
Petabytes/día, información
equivalente a varios miles de veces
la biblioteca del congreso de USA
Crecimiento Frecuencia Diferentes Exactitud
exponencial a la que se formatos y de los datos
de datos genera los estructuras y del
datos de los datos cálculo
3 Data Science y ML
La ciencia de datos (Data Science) es la ciencia
computacional de la extracción de conocimientos
significativos a partir de datos brutos y luego la comunicación
efectiva de esos conocimientos para generar valor. (Pierson,
2017)
4 Definición de ML
El aprendizaje automático o
Machine Learning es un método
científico que nos permite usar
los ordenadores y otros
dispositivos con capacidad
computacional para que
aprendan a extraer los patrones
y relaciones que hay en nuestros
datos por sí solos. Esos patrones
se pueden usar luego para
predecir comportamientos y en
la toma de decisiones.
El Aprendizaje Automático es un campo en la
Inteligencia Artificial, donde las máquinas pueden
"aprender" de sí mismas, sin ser explícitamente
programadas por los seres humanos. Analizando datos
pasados llamados "datos de entrenamiento", el modelo
de Aprendizaje Automático forma patrones y usa estos
patrones para aprender y hacer predicciones futuras.
"Se dice que un programa de computadora
aprende de la experiencia E con respecto a alguna
clase de tareas T y la medida de rendimiento P, si
su rendimiento en tareas en T, medido por P,
mejora con la experiencia E. “
Mitchell, 1997
Estadística

Biología Visualización

Machine
Ingeniería Learning Economía

Procesamien
Bases de
to de
Señales Datos
5 Tipos de ML
Aprendizaje Aprendizaje No Aprendizaje
Supervisado Supervisado Reforzado
• Modelos • Modelos • Un enfoque de la IA
Predictivos. Descriptivos. • Aprendizaje basado
• La máquina • La máquina en los hallazgos.
aprende entiende los datos. • La máquina
explícitamente. • La evaluación es aprende a como
• Predice el futuro a cualitativa o actuar en un
partir de datos indirecta. determinado
históricos. • No realiza entorno.
• Resuelve predicciones, • Maximiza los
problemas de encuentra algo hallazgos.
clasificación y específico.
regresión.
Variables Discretas

Clasificación Clustering

Aprendizaje Supervisado Aprendizaje No Supervisado

Reducción de la
Regresión Dimensión

Variables Continúas
6 Aprendizaje Supervisado
Aprendiendo un modelo, de datos etiquetados.
Datos de Entrenamiento: “ejemplos” x con “etiquetas” y.

(x 1 , y1), . . . , (x n , yn) / x i ∈ Rd

Clasificación: y es discreta. Para simplificar, y ∈ {−1, + 1 }

f : Rd −→ {−1, + 1 } f es llamada un clasificador binario.

Ejemplo: Aprobación de créditos si/no, spam/ham,


banana/naranja.
Característica 2

Característica 1
Característica 2

Característica 1
Límite de la decisión
Característica 2

Característica 1
Límite de la decisión

Algoritmos: SVM, árboles de decisión, redes neuronales,


K – nearest neighbors, naive bayes, entre otros.
Clasificación
Clasificación no lineal
Datos de Entrenamiento:“ejemplos” x con “etiquetas” y.

(x 1 , y1), . . . , (x n , yn) / x i ∈ Rd

Regresión: y es un valor real, y ∈ R

f : Rd → R f es llamado un regresor.
Ejemplo: cantidad de crédito, peso de una fruta.
7 Aprendizaje No Supervisado
Aprendiendo un modelo, de datos no etiquetados.
Datos de Entrenamiento: “ejemplos” x.

x 1 , . . . , x n , x i ∈ X ⊂ Rn

Clustering/segmentation:

f : Rd −→ {C 1 , . . . C k } (Conjunto de clusters).

Ejemplo: Encontrar clusters en la población, frutas, especies.


Característica 2

Característica 1
Característica 2

Característica 1
Característica 2

Característica 1
Algoritmos: K-means, gaussian mixtures, clustering jerárquico,
spectral clustering, entre otros.
Aldo Ramiro Valdez Alvarado
Licenciado en Informática
Máster en Dirección Estrategica en Tecnologías de la Información
Máster(c) en Business Intelligence y Big Data
Docente Titular de la Carrera de Informática de la UMSA
Docente de Postgrado en la UMSA y otras Universidades
Ex - Coordinador del Postgrado en Informática UMSA
Conferencista Nacional e Internacional

http://aldovaldezalvarado.blogspot.com/
https://www.linkedin.com/in/msc-aldo-valdez-alvarado-17464820
arvaldez@umsa.bo
aldo_valdez@hotmail.com

You might also like