David Allende Quintana
Lead Data Scientist Tottus Corporativo
Capacitador de Analítica aplicada
Consultor Analítico
Experiencia profesional: Banca, Telecomunicaciones, Consultoría
Ingeniero Estadístico con especialización en Inteligencia de Negocios
Educación Ejecutiva
UTEC
Reglas
1 pausas activa
Mantener silenciado al micrófono de todos
Las preguntas se realizan por el chat / en caso sea necesario se
habilita el micrófono
Educación Ejecutiva
UTEC
Contenido de la sesión
1. Introducción al Machine Learning e Inteligencia Artificial
2. Tipos de aprendizaje de un algoritmo de Machine Learning.
3. Ciclo de vida de un modelo de Machine Learning.
4. Tipos de datos.
5. Plataformas y lenguajes de programación para el Machine Learning.
Educación Ejecutiva
UTEC
1. INTRODUCCIÓN A ML E IA
Educación Ejecutiva
UTEC
La ciencia de datos es un campo multidisciplinario que
utiliza un conjunto de herramientas para extraer
conocimiento de los datos y respaldar la toma de
decisiones.
El aprendizaje de máquina y el aprendizaje profundo
se encuentran entre las principales herramientas de la
Ciencia de Datos.
(*) Libro: Managing Data Science - Kirill Dubovikov
¿QUÉ ES
MACHINE LEARNING?
“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.
SAS Institute
¿QUÉ ES
MACHINE LEARNING?
“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.
SAS Institute
¿QUÉ ES
INTELIGENCIA ARTIFICIAL?
Inteligencia Artificial
“Es la búsqueda de la construcción de máquinas que puedan razonar, aprender y actuar de manera inteligente”.
MIT Tecnology Review
Educación Ejecutiva
UTEC
¿QUÉ ES
MACHINE LEARNING?
“Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico”.
SAS Institute
Algunos algoritmos de Machine Learning
Capa de Capa Capa de
entrada oculta salida
No
Traf. Churner
Entrada 1 1 Offnet
1 >2h
Churner
2 Edad
Entrada 2
Salida <45
2 1 No
Factu Churner
Entrada 3 3 … >120
… m Churner
Entrada n n
Regresión Redes Neuronales Árbol de Decisión
“Un modelo es una “Los modelos son “A un modelo no se le exige absoluta
representación simplificada de errados pero útiles” veracidad, sino utilidad de acuerdo a
la realidad” los objetivos para los que fue creado”
¿QUÉ ES
MACHINE LEARNING?
Es una rama de la inteligencia artificial basada en la idea de que los sistemas pueden aprender de datos mediante
algoritmos, identificando patrones y tomando decisiones con mínima intervención humana. Surge como alternativa
en el mundo de Ciencia de Datos para complementar el aprendizaje estadístico.
Objetivos
Educación Ejecutiva
UTEC
Objetivos
Educación Ejecutiva
UTEC
Beneficios del Aprendizaje Automático
“Los modelos son
errados pero útiles”
Error Modelo = Varianza + Sesgo
Modelos Estadísticos Modelos ML
Educación Ejecutiva
UTEC
Aprendizaje Estadístico
Lujuriosos
Indiferentes
Ahorradores
Educación Ejecutiva
UTEC
2. TIPOS DE APRENDIZAJE DE
UN ALGORITMO DE ML
Modelos en la Ciencia de Datos
Modelo Método Datos
Supervisado Estructurados
(Predicen futuro) DWH, archivos planos
-Clasificación (Var categórica)
-Predicción (Var numérica)
No estructurados
Habla, texto, imágenes
No Supervisado
(Describen pasado)
-Clustering
-Reglas de asociación
-Análisis componentes principales
Educación Ejecutiva
UTEC
Los algoritmos tienen el rol de aprender de los
datos y predecir
Accede Aprendizaje Automático Conocimiento Negocio
Algoritmo Datos Patrones, Predicciones
tendencias
APRENDIZAJE SUPERVISADO APRENDIZAJE NO SUPERVISADO
Existe evidencia directa del problema de No existe evidencia directa del problema de
negocio y de las variables que puedan explicar negocio pero si contamos con variables que
el problema. puedan explicar el problema.
Ejemplo: Predecir la venta de un producto Ejemplo: Segmentación por preferencias
PROBLEMA DE NEGOCIO EN MINERÍA –
OPTIMIZACIÓN DEL PROCESO DE MOLIENDA
PROBLEMA DE NEGOCIO EN LA BANCA –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN LA BANCA –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN TELECOM –
CAMPAÑAS DE CRM
PROBLEMA DE NEGOCIO EN CONSUMO MASIVO–
PRONOSTICAR LA DEMANDA FUTURA
ALGORITMOS DE REGRESIÓN
Busca entender y explicar el problema.
APRENDIZAJE
SUPERVISADO Para “estimar los ingresos de un cliente” los puedo hacer a través
de un modelo de regresión lineal.
Ingreso
Ingreso
Ingreso Edad Años educación
Linear No linear relationship
ÁRBOLES DE DECISIÓN
Busca entender el problema y se enfoca en la precisión y acierto
del modelo con la realidad.
Para “clasificar a los churners de los no churners” lo puedo hacer a
través de un Random Forest.
𝑥
𝜑1 𝜑𝑀
No
Traf. Churner
Offnet …
>2h Churner
Edad
<45
No 𝑝𝜑1(𝑌 = 𝑐|𝑋 = 𝑥) 𝑝𝜑𝑚 (𝑌 = 𝑐|𝑋 = 𝑥)
Factu Churner
>120 𝛴
Churner
𝑝𝛹 (𝑌 = 𝑐|𝑋 = 𝑥)
Árbol de Decisión Random Forest
Modelo ensamblado de varios
árboles de decisión
3. CICLO DE VIDA DE UN
MODELO DE ML
Ciclo de vida de un proyecto de ML
1 DISEÑO
4 DESPLIEGUE
ORGANIZACIÓN
2
DATOS
3 DESARROLLO
MODELOS
Educación Ejecutiva Foundational Methodology for Data Science
(IBM White Paper, 2016)
UTEC
4. TIPOS DE DATOS
TIPOS DE VARIABLES Y ESCALAS DE MEDICIÓN
5. PLATAFORMAS Y LENGUAJES
DE PROGRAMACIÓN PARA EL ML
Python y R en el
mundo empresarial…
Educación Ejecutiva
UTEC