Este repositorio contiene dos mini-proyectos de aprendizaje supervisado aplicando técnicas de Machine Learning con Python. Cada ejercicio incluye un pipeline completo: exploración de datos, preprocesamiento, modelado, evaluación y visualización.
- Dataset: Video Game Sales
- Archivo:
regresion_videojuegos.py - Objetivo: Predecir la variable
Global_Salesa partir de características como elGenre,PlatformyYear.
- Eliminación de valores nulos
- Encoding de variables categóricas (
Platform,Genre) - Escalado de variables
- Entrenamiento con Regresión Lineal
- Métricas:
MSEyR² - Visualización de ventas reales vs. predichas
- Dataset: Heart Disease - UCI
- Archivo:
clasificacion_corazon.py - Objetivo: Clasificar si un paciente padece una enfermedad cardíaca (binaria).
- Conversión de la columna
numen variable binariatarget - Limpieza y selección de variables relevantes
- Codificación de variables categóricas (si las hay)
- Escalado de datos
- Modelo:
RandomForestClassifier - Métricas:
accuracy,precision,recall,f1-score - Visualización: matriz de confusión
- Python 3.8+
- Librerías necesarias:
pip install pandas matplotlib seaborn scikit-learn
python regresion_videojuegos.py
python clasificacion_corazon.py