Guía de Algoritmos de Aprendizaje

Los algoritmos supervisados se utilizan para problemas de clasificación y regresión. Algunos de los algoritmos más comunes son la regresión logística y las máquinas de soporte vectorial para clasificación, y la regresión lineal y los árboles de regresión para regresión. La elección del algoritmo depende del tipo de problema, el tamaño de los datos y otros factores.

Cargado por

Sandra Patricia Barreto

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

95 vistas5 páginas

Guía de Algoritmos de Aprendizaje

Cargado por

Sandra Patricia Barreto

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 5

Algoritmos supervisados

Existen varios algoritmos supervisados utilizados para tareas de clasificación y regresión, y la elección del algoritmo
depende del tipo de problema, el tamaño del conjunto de datos y otros factores. Aquí te presento algunos de los algoritmos
supervisados más comunes:

Clasificación:
Regresión Logística:

Es un algoritmo que se utiliza para problemas de clasificación binaria y multiclase. Estima la probabilidad de que una
instancia pertenezca a una clase en particular.
Máquinas de Soporte Vectorial (SVM):

Puede ser utilizado tanto para problemas de clasificación como de regresión. Busca encontrar un hiperplano que mejor
separe las clases en el espacio de características.
Árboles de Decisión:

Divide el conjunto de datos en subconjuntos más pequeños en función de ciertos criterios y toma decisiones en cada nodo
para llegar a una clasificación final.
Random Forest:

Es una técnica de conjunto que utiliza múltiples árboles de decisión para realizar predicciones y reduce el sobreajuste que
podría ocurrir en un solo árbol.
Naive Bayes:

Basado en el teorema de Bayes, este algoritmo es especialmente útil para problemas de clasificación de texto y tiene
suposiciones "naive" sobre la independencia de las características.
K-Vecinos Más Cercanos (KNN):

Clasifica una instancia según la mayoría de votos de sus k vecinos más cercanos en el espacio de características.
Regresión:
Regresión Lineal:

Establece una relación lineal entre las variables de entrada y la variable de salida y se utiliza para problemas de regresión.
Regresión Ridge y Lasso:
Variantes de regresión lineal que incorporan términos de regularización para prevenir el sobreajuste y mejorar la
generalización del modelo.
Máquinas de Soporte Vectorial para Regresión (SVR):

Similar a SVM pero utilizado para problemas de regresión, busca encontrar un hiperplano que tenga la máxima cantidad
de puntos dentro de un margen.
Árboles de Regresión:

Similar a los árboles de decisión, pero utilizado para problemas de regresión, prediciendo un valor numérico en lugar de
una clase.
Redes Neuronales:

Modelos computacionales inspirados en la estructura y funcionamiento del cerebro, utilizados para problemas complejos y
grandes conjuntos de datos.
Gradient Boosting (por ejemplo, XGBoost, LightGBM):

Una técnica de conjunto que construye árboles de decisión de manera secuencial, corrigiendo los errores de los modelos
anteriores.
Estos son solo algunos ejemplos y hay muchos otros algoritmos y variantes disponibles. La elección del algoritmo
dependerá del tipo de tarea, la naturaleza de los datos y otros factores como la interpretabilidad del modelo, el tiempo de
entrenamiento y la capacidad de generalización. Experimentar con varios algoritmos y técnicas es crucial para encontrar el
enfoque más efectivo para un problema específico.

Los algoritmos no supervisados se utilizan para explorar y encontrar patrones en datos sin etiquetas. Aquí te presento
algunos de los algoritmos no supervisados más comunes:

Clustering:
K-Means:

Agrupa datos en k clústeres basándose en la similitud de características. Cada clúster tiene un centroide que representa el
"centro" del clúster.
Agrupamiento Jerárquico:

Crea una jerarquía de clústeres, ya sea de manera aglomerativa (fusionando clústeres) o divisiva (dividiendo clústeres).
DBSCAN (Density-Based Spatial Clustering of Applications with Noise):
Identifica regiones de alta densidad de puntos en el espacio de características y agrupa los puntos en esas regiones.
Mean Shift:

Mueve un kernel sobre el espacio de características en la dirección del aumento máximo de la densidad para encontrar
modas locales y agrupar datos.
Gaussian Mixture Model (GMM):

Modela el conjunto de datos como una mezcla de distribuciones gaussianas, asignando probabilidades a cada punto para
pertenecer a cada clúster.
Reducción de Dimensionalidad:
Análisis de Componentes Principales (PCA):

Transforma datos en un nuevo conjunto de dimensiones no correlacionadas (componentes principales) que capturan la
mayor varianza en los datos.
t-Distributed Stochastic Neighbor Embedding (t-SNE):

Reduce la dimensionalidad preservando las relaciones de similitud entre puntos en el espacio de características original,
especialmente útil para visualización.
Autoencoders:

Redes neuronales que aprenden representaciones de baja dimensión de los datos de entrada, útiles para la reducción de
dimensionalidad no lineal.
Asociación y Reglas de Asociación:
Apriori Algorithm:

Utilizado para descubrir reglas de asociación entre diferentes elementos en un conjunto de datos, especialmente en
minería de datos de transacciones.
Eclat Algorithm:

Similar al algoritmo Apriori, pero más eficiente en términos de tiempo y espacio.

Detección de Anomalías:
Isolation Forest:

Utiliza árboles de decisión aleatorios para aislar observaciones anómalas más rápidamente que los métodos basados en
distancias.
One-Class SVM:

Aprende a describir la mayoría de los datos como una clase y detecta anomalías como instancias que se desvían de esta
descripción.
Mapas Autoorganizados (SOM):
Self-Organizing Maps (SOM):
Algoritmo de aprendizaje no supervisado que produce una representación bidimensional de datos de alta dimensión,
organizando vecinos similares en el mapa.
Estos son solo algunos ejemplos de algoritmos no supervisados. La elección del algoritmo dependerá de la naturaleza
específica de tus datos y los objetivos de análisis. Es importante experimentar y entender cómo cada algoritmo se
comporta en tu conjunto de datos particular.

La evaluación de algoritmos supervisados implica medir su rendimiento en la tarea de predecir o clasificar datos cuando
se dispone de un conjunto de datos con etiquetas verdaderas. Aquí hay algunos pasos y métricas comunes para evaluar
algoritmos supervisados:

1. División de Datos:
Divide tu conjunto de datos en al menos dos partes: un conjunto de entrenamiento y un conjunto de prueba. Puedes
utilizar técnicas como la validación cruzada para obtener divisiones más robustas.
2. Entrenamiento del Modelo:
Entrena tu modelo con el conjunto de entrenamiento. Utiliza algoritmos supervisados como regresión lineal, regresión
logística, máquinas de soporte vectorial (SVM), árboles de decisión, entre otros, dependiendo de la tarea.
3. Métricas de Clasificación:
Para problemas de clasificación, utiliza métricas como:
Exactitud (Accuracy): Proporción de predicciones correctas.
Precisión (Precision): Proporción de verdaderos positivos entre la suma de verdaderos positivos y falsos positivos.
Recuperación (Recall o Sensibilidad): Proporción de verdaderos positivos entre la suma de verdaderos positivos y falsos
negativos.
F1 Score: Media armónica de precisión y recuperación.
Matriz de Confusión: Proporciona una visión detallada de los resultados de clasificación.
4. Métricas de Regresión:
Para problemas de regresión, utiliza métricas como:
Error Absoluto Medio (MAE): Media de las diferencias absolutas entre las predicciones y los valores reales.
Error Cuadrático Medio (MSE): Media de las diferencias cuadráticas entre las predicciones y los valores reales.
Raíz del Error Cuadrático Medio (RMSE): Raíz cuadrada del MSE.
Coeficiente de Determinación (R²): Proporción de la varianza en la variable dependiente que es predecible a partir de las
variables independientes.
5. Curvas ROC y AUC:
Para problemas de clasificación binaria, las curvas ROC y el área bajo la curva (AUC) son útiles para evaluar el
rendimiento del modelo en diferentes umbrales de clasificación.
6. Validación Cruzada:
Utiliza la validación cruzada para evaluar el rendimiento del modelo en múltiples particiones del conjunto de datos y
garantizar una evaluación robusta.
7. Análisis de Residuos:
En el caso de modelos de regresión, analiza los residuos para asegurarte de que no haya patrones sistemáticos de error.
8. Ajuste de Hiperparámetros:
Considera ajustar los hiperparámetros del modelo para mejorar su rendimiento. Utiliza técnicas como búsqueda en
cuadrícula (grid search) o búsqueda aleatoria.
9. Interpretación del Modelo:
Comprende la interpretación del modelo para asegurarte de que las predicciones sean comprensibles y alineadas con el
conocimiento del dominio.
10. Comparación con Otros Modelos:
Compara el rendimiento de tu modelo con otros algoritmos supervisados relevantes para la tarea.
11. Feedback de Usuarios o Expertos del Dominio:
Obtén feedback de usuarios o expertos del dominio para asegurarte de que el modelo sea útil y satisfaga las necesidades
del problema en cuestión.
La elección de métricas específicas dependerá del tipo de problema que estás abordando y del contexto de la aplicación.
Es importante seleccionar las métricas que sean más relevantes para la tarea y los objetivos específicos.

También podría gustarte

Conceptos Machine Learning
Aún no hay calificaciones
Conceptos Machine Learning
8 páginas
1 - Angela Arteaga
Aún no hay calificaciones
1 - Angela Arteaga
15 páginas
Inteligencia Artificial Módulo Básico
Aún no hay calificaciones
Inteligencia Artificial Módulo Básico
18 páginas
Guía de Algoritmos de Clasificación
Aún no hay calificaciones
Guía de Algoritmos de Clasificación
45 páginas
Aprenddedeeizaje Automatico o Machine Learning
Aún no hay calificaciones
Aprenddedeeizaje Automatico o Machine Learning
14 páginas
Teoria Machine Learning
Aún no hay calificaciones
Teoria Machine Learning
8 páginas
Pdfuni3 4
Aún no hay calificaciones
Pdfuni3 4
3 páginas
C4 AnalisisDatosYaprendizaAutomatico
Aún no hay calificaciones
C4 AnalisisDatosYaprendizaAutomatico
15 páginas
Aprendizaje Supervisado en Python
Aún no hay calificaciones
Aprendizaje Supervisado en Python
20 páginas
Informe Detallado Sobre Machine Learning
Aún no hay calificaciones
Informe Detallado Sobre Machine Learning
4 páginas
Trabajo Mineria Datos
Aún no hay calificaciones
Trabajo Mineria Datos
13 páginas
Apuntes Master Aprendizaje
Aún no hay calificaciones
Apuntes Master Aprendizaje
6 páginas
Tarea 3 Inteligencia Artifical Roger
Aún no hay calificaciones
Tarea 3 Inteligencia Artifical Roger
9 páginas
Tipos de Modelos ML
Aún no hay calificaciones
Tipos de Modelos ML
1 página
3 Tecnicas Supervisadas - MD
Aún no hay calificaciones
3 Tecnicas Supervisadas - MD
95 páginas
Estudio RP
Aún no hay calificaciones
Estudio RP
17 páginas
MACHINE
Aún no hay calificaciones
MACHINE
14 páginas
Super Visa Do
Aún no hay calificaciones
Super Visa Do
19 páginas
MCOM2 U2 A1 IIII
Aún no hay calificaciones
MCOM2 U2 A1 IIII
4 páginas
Informe Mineria de Datos N°5
Aún no hay calificaciones
Informe Mineria de Datos N°5
4 páginas
Machine Learning para Dummies
100% (1)
Machine Learning para Dummies
35 páginas
Modelos Supervisado y No Supervisados
Aún no hay calificaciones
Modelos Supervisado y No Supervisados
6 páginas
Machine Learning Avanzado Semana 1 y 2 (1) - Compressed
Aún no hay calificaciones
Machine Learning Avanzado Semana 1 y 2 (1) - Compressed
33 páginas
Algoritmos No Supervisados en IA
Aún no hay calificaciones
Algoritmos No Supervisados en IA
3 páginas
Soluciones y Aplicaciones de Machine y Deep Learning en La Actualidad (Fase 1)
Aún no hay calificaciones
Soluciones y Aplicaciones de Machine y Deep Learning en La Actualidad (Fase 1)
6 páginas
Técnicas de Análisis Predictivo de Datos
Aún no hay calificaciones
Técnicas de Análisis Predictivo de Datos
2 páginas
Checklist Proyectos ML
Aún no hay calificaciones
Checklist Proyectos ML
9 páginas
Guía Completa de Aprendizaje de Máquinas
Aún no hay calificaciones
Guía Completa de Aprendizaje de Máquinas
109 páginas
Algoritmos de Aprendizaje Supervisado ML
Aún no hay calificaciones
Algoritmos de Aprendizaje Supervisado ML
3 páginas
Que Es Datamining
Aún no hay calificaciones
Que Es Datamining
55 páginas
Aprendizaje Supervisado y No Supervisado
100% (1)
Aprendizaje Supervisado y No Supervisado
4 páginas
Aprendizaje Supervisado y No Supervisado
Aún no hay calificaciones
Aprendizaje Supervisado y No Supervisado
68 páginas
DIP Data Science - Supervised Methods S4
Aún no hay calificaciones
DIP Data Science - Supervised Methods S4
95 páginas
Clase 08 - Parte I - Modelos Analíticos para DS II
Aún no hay calificaciones
Clase 08 - Parte I - Modelos Analíticos para DS II
15 páginas
Algoritmos Supervisados y No Supervisados
Aún no hay calificaciones
Algoritmos Supervisados y No Supervisados
5 páginas
Resumen Apren Supervisado
Aún no hay calificaciones
Resumen Apren Supervisado
57 páginas
Curso de Ciencia de Datos: Aprendizaje Supervisado
Aún no hay calificaciones
Curso de Ciencia de Datos: Aprendizaje Supervisado
101 páginas
Analisis Predictivo
Aún no hay calificaciones
Analisis Predictivo
11 páginas
Que Es Datamining
Aún no hay calificaciones
Que Es Datamining
67 páginas
Idanae 1T21
Aún no hay calificaciones
Idanae 1T21
18 páginas
Tarea3 Grupo 202016908 84
Aún no hay calificaciones
Tarea3 Grupo 202016908 84
23 páginas
Trabajo Parcial Primer Corte
Aún no hay calificaciones
Trabajo Parcial Primer Corte
16 páginas
Big Data
Aún no hay calificaciones
Big Data
12 páginas
Tarea 3 Emel Pedrozo
Aún no hay calificaciones
Tarea 3 Emel Pedrozo
20 páginas
Clase 14 - Modelos Analíticos para DS II
Aún no hay calificaciones
Clase 14 - Modelos Analíticos para DS II
90 páginas
Tarea 3 Algoritmos de Aprendizaje. Emel Pedrozo
Aún no hay calificaciones
Tarea 3 Algoritmos de Aprendizaje. Emel Pedrozo
21 páginas
Train
Aún no hay calificaciones
Train
10 páginas
Separata 05
Aún no hay calificaciones
Separata 05
26 páginas
Glosario - 2023-11-08T131714.787
Aún no hay calificaciones
Glosario - 2023-11-08T131714.787
15 páginas
06c. Introducción Al Análisis Predictivo de Datos
Aún no hay calificaciones
06c. Introducción Al Análisis Predictivo de Datos
24 páginas
AnaliticaDeDatos Modulo4 TecnicasDeClasificacionSupervisedLearning
Aún no hay calificaciones
AnaliticaDeDatos Modulo4 TecnicasDeClasificacionSupervisedLearning
62 páginas
Tipos de Aprendizaje Automático y Sus Subtipos
Aún no hay calificaciones
Tipos de Aprendizaje Automático y Sus Subtipos
4 páginas
Aprendizaje Supervisado
Aún no hay calificaciones
Aprendizaje Supervisado
3 páginas
Modulo III
Aún no hay calificaciones
Modulo III
11 páginas
1 Tipos Modelo
Aún no hay calificaciones
1 Tipos Modelo
23 páginas
Aprendizaje Supervisado 0
Aún no hay calificaciones
Aprendizaje Supervisado 0
3 páginas
Tarea 2 Mineria de Datos
Aún no hay calificaciones
Tarea 2 Mineria de Datos
3 páginas
Deep Learning
Aún no hay calificaciones
Deep Learning
269 páginas
Regresión Lineal
Aún no hay calificaciones
Regresión Lineal
6 páginas
Regresion Lineal Simple y No Lineal
Aún no hay calificaciones
Regresion Lineal Simple y No Lineal
40 páginas
Analisis Numerico Taller
Aún no hay calificaciones
Analisis Numerico Taller
5 páginas
Administración y Pronostico de La Demanda
Aún no hay calificaciones
Administración y Pronostico de La Demanda
5 páginas
Optimización de Procesos Seis Sigma
Aún no hay calificaciones
Optimización de Procesos Seis Sigma
5 páginas
Recuperatorio Primer Parcial UBA 2c2021
Aún no hay calificaciones
Recuperatorio Primer Parcial UBA 2c2021
2 páginas
Diagramas de Dispersión y Correlación
Aún no hay calificaciones
Diagramas de Dispersión y Correlación
4 páginas
Act1 Snsa Anad
Aún no hay calificaciones
Act1 Snsa Anad
7 páginas
Coeficiente de Correlación: Guía Completa
Aún no hay calificaciones
Coeficiente de Correlación: Guía Completa
13 páginas
Taller - 2 Datos y Distrib Bivariadas
Aún no hay calificaciones
Taller - 2 Datos y Distrib Bivariadas
7 páginas
Regresion Lineal
Aún no hay calificaciones
Regresion Lineal
23 páginas
Articulo Infiltracion
Aún no hay calificaciones
Articulo Infiltracion
19 páginas
Metricas de Regresion
Aún no hay calificaciones
Metricas de Regresion
2 páginas
Examen Módulo Metodos Cuantitativos II MOSTRAR
Aún no hay calificaciones
Examen Módulo Metodos Cuantitativos II MOSTRAR
4 páginas
Ajuste Herschel Bulkley
Aún no hay calificaciones
Ajuste Herschel Bulkley
4 páginas
Análisis de Correlación y Regresión
Aún no hay calificaciones
Análisis de Correlación y Regresión
26 páginas
Manejo de La Información de La PyME
Aún no hay calificaciones
Manejo de La Información de La PyME
4 páginas
Ejercicios
100% (1)
Ejercicios
6 páginas
Análisis de Consumo de Petróleo
Aún no hay calificaciones
Análisis de Consumo de Petróleo
28 páginas
Regresión Lineal y Correlaciones
Aún no hay calificaciones
Regresión Lineal y Correlaciones
53 páginas
Suposiciones y Análisis en Regresión Lineal
Aún no hay calificaciones
Suposiciones y Análisis en Regresión Lineal
41 páginas
2 Ein6017 c4 Guiaejercicios 2
Aún no hay calificaciones
2 Ein6017 c4 Guiaejercicios 2
6 páginas
Brandon Daniel Contreras Rocha U1
Aún no hay calificaciones
Brandon Daniel Contreras Rocha U1
31 páginas
Ef Es-Bcrp G5 Alvia Castillo Olivia
Aún no hay calificaciones
Ef Es-Bcrp G5 Alvia Castillo Olivia
7 páginas
Practica VI Regresión y Correlación Ejercicios 2021
100% (1)
Practica VI Regresión y Correlación Ejercicios 2021
6 páginas
2.motivación y Habitos de Estudio
Aún no hay calificaciones
2.motivación y Habitos de Estudio
14 páginas
Regresión Lineal y Mínimos Cuadrados
Aún no hay calificaciones
Regresión Lineal y Mínimos Cuadrados
12 páginas
Taller de Anova Imprimir
20% (5)
Taller de Anova Imprimir
23 páginas
Módulo IV
Aún no hay calificaciones
Módulo IV
9 páginas