0% found this document useful (0 votes)

55 views8 pages

Music Recommendation System with KNN & K-Means

The document outlines a mini project for building a music recommendation system using Python with machine learning algorithms such as K-Nearest Neighbors and K-Means clustering. It details the objectives, software requirements, and algorithms for preprocessing music data, implementing models, and generating recommendations based on user input. The project includes code snippets for data cleaning, model training, and a recommendation interface.

Uploaded by

rkaviya008

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

55 views8 pages

Music Recommendation System with KNN & K-Means

Uploaded by

rkaviya008

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE

(An autonomous Institution)

#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab

EX NO: 13 MINI PROJECT - BUILD A MUSIC RECOMMENDATION

DATE: SYSTEM USING KNN AND K-MEANS CLUSTERING
AIM:
To write a Python program to build a music recommendation system using machine learning
algorithms like Nearest Neighbors and K-Means clustering based on features such as language,
genre, artist, and mood.

OBJECTIVES:
 To preprocess and scale music feature data for effective similarity measurement.
 To implement Nearest Neighbors for recommending similar songs based on input features.
 To apply K-Means clustering to group similar songs and improve recommendation accuracy.
 To evaluate clustering quality using silhouette score and optimize the number of clusters.

SOFTWARE REQUIRED:
 Jupyter Notebook / Python environment
 Libraries: scikit-learn, pandas, numpy

DESCRIPTION (MAPPING THE THEORY):

A music recommendation system identifies songs similar to a user’s preference by measuring
proximity in feature space. Nearest Neighbors finds the closest songs based on feature similarity,
while K-Means clustering groups songs into clusters with similar attributes. Scaling features ensures
all attributes contribute equally to the distance metric. Evaluating cluster quality using silhouette
scores helps in selecting the optimal number of clusters for better recommendations.

ALGORITHM:
Step 1: Import necessary libraries
Step 2: Load the dataset containing music features like language, genre, artist, mood.
Step 3: Preprocess the data
 Handle missing values if any
 Encode categorical features (e.g., one-hot encoding or label encoding)
 Scale features using StandardScaler for uniformity
Step 4: Apply K-Means clustering
 Use the elbow method or silhouette score to determine optimal number of clusters
 Fit K-Means model to the scaled data
MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE
(An autonomous Institution)
#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab
Step 5: Evaluate clusters using silhouette score by adjust number of clusters if needed for better
cohesion and separation
Step 6: Implement Nearest Neighbors model by fit Nearest Neighbors to the scaled data to find
songs similar to input features
Step 7: Generate recommendations for a given song or user input, find nearest neighbors and
recommend those songs

PROGRAM:
data_cleaning.py
# data_cleaning.py
import pandas as pd

# Load the dataset

df = pd.read_csv("[Link]")

# Drop duplicates and nulls

df.drop_duplicates(inplace=True)
[Link](inplace=True)

# Clean artist names

df['artists'] = df['artists'].[Link]().[Link]()

# Normalize float columns

numeric_cols = ['valence', 'acousticness', 'danceability', 'duration_ms', 'energy',
'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo']

df[numeric_cols] = df[numeric_cols].astype(float)

# Scale tempo and loudness for uniformity

from [Link] import MinMaxScaler
scaler = MinMaxScaler()
df[['tempo', 'loudness']] = scaler.fit_transform(df[['tempo', 'loudness']])

# Save cleaned version

df.to_csv("cleaned_music_dataset.csv", index=False)
print("✅ Data cleaned and saved as 'cleaned_music_dataset.csv'")

train_model.py
# train_model.py
MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE
(An autonomous Institution)
#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab
import pandas as pd
import joblib
from [Link] import NearestNeighbors
from [Link] import StandardScaler
from [Link] import KMeans
from [Link] import silhouette_score

# Load cleaned dataset

df = pd.read_csv("cleaned_music_dataset.csv")

# Feature selection
features = ['valence', 'acousticness', 'danceability', 'energy',
'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo']

# Drop features with zero variance

features = [f for f in features if df[f].nunique() > 1]

print("✅ Using features:", features)

X = df[features]

# Normalize features
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Fit Nearest Neighbors model

model = NearestNeighbors(n_neighbors=6, metric='euclidean')
[Link](X_scaled)

# Evaluation using Silhouette Score (via KMeans clusters)

kmeans = KMeans(n_clusters=10, random_state=42, n_init=10)
[Link](X_scaled)
score = silhouette_score(X_scaled, kmeans.labels_)

print(f"\n✅ Model trained on {len(df)} songs.")

print(f"📈 Silhouette Score (clustering quality check): {score:.4f}")
print("\n📌 Example songs:\n", df[['name', 'artists']].head())

# Save model and assets

[Link](model, 'knn_model.pkl')
[Link](scaler, '[Link]')
[Link](df, 'music_df.pkl')
MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE
(An autonomous Institution)
#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab
# Optional: Save scaled dataset for future use
scaled_df = [Link](X_scaled, columns=features)
scaled_df['name'] = df['name']
scaled_df['artists'] = df['artists']
scaled_df.to_csv("scaled_music_dataset.csv", index=False)

print("\n💾 All assets saved: knn_model.pkl, [Link], music_df.pkl, scaled_music_dataset.csv")

[Link]
# [Link]
import joblib
import pandas as pd
import numpy as np

# Load saved models and data

model = [Link]('knn_model.pkl')
scaler = [Link]('[Link]')
df = [Link]('music_df.pkl')

# Define moods and genres manually (basic mock)

mood_map = {
"happy": {"valence": 0.9, "energy": 0.8},
"sad": {"valence": 0.2, "energy": 0.3},
"chill": {"valence": 0.5, "energy": 0.4},
"party": {"valence": 0.8, "energy": 0.9},
}

genre_keywords = {
"rock": ["rock", "metal", "grunge"],
"pop": ["pop", "dance", "electropop"],
"hiphop": ["hip hop", "rap", "trap"],
"jazz": ["jazz", "swing"],
"classical": ["classical", "symphony", "orchestra"]
}

# Helper to recommend similar songs by vector features

def recommend_by_vector(input_vector):
features = ['valence', 'acousticness', 'danceability', 'energy',
'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo']
input_df = [Link]([input_vector], columns=features)
input_scaled = [Link](input_df)

distances, indices = [Link](input_scaled)

MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE
(An autonomous Institution)
#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab
print("\n🎧 Recommended Songs:")
for i in indices[0][1:4]: # Top 3 excluding the first (closest)
print(f"- {[Link][i]['name']} by {[Link][i]['artists']}")

# Menu-driven CLI for recommendations

def recommend_menu():
print("\n🎶 Music Recommendation System")
print("1. Recommend by Artist")
print("2. Recommend by Mood")
print("3. Recommend by Genre")
print("4. Exit")

choice = input("Choose an option (1-4): ")

if choice == '1':
artist = input("🎤 Enter artist name: ").lower()
matches = df[df['artists'].[Link]().[Link](artist)]
if [Link]:
print("❌ No songs found for that artist.")
else:
songs = matches[['name', 'artists']].drop_duplicates().head(3)
print(f"\n🎧 Songs by {[Link]()}:")
for _, row in [Link]():
print(f"- {row['name']} by {row['artists']}")

elif choice == '2':

print("😊 Available moods: happy, sad, chill, party")
mood = input("Enter mood: ").lower()
if mood not in mood_map:
print("❌ Invalid mood.")
else:
mood_profile = mood_map[mood]
filtered = df[
(df['valence'] > mood_profile['valence'] - 0.2) &
(df['valence'] < mood_profile['valence'] + 0.2) &
(df['energy'] > mood_profile['energy'] - 0.2) &
(df['energy'] < mood_profile['energy'] + 0.2)
]
if [Link]:
print("❌ No songs matched the mood.")
else:
song = [Link](1).iloc[0]
vector = song[['valence', 'acousticness', 'danceability', 'energy',
MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE
(An autonomous Institution)
#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab
'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo']].values
recommend_by_vector(vector)

elif choice == '3':

print("🎼 Available genres: rock, pop, hiphop, jazz, classical")
genre = input("Enter genre: ").lower()
keywords = genre_keywords.get(genre, [])
if not keywords:
print("❌ Unknown genre.")
else:
found = df[df['name'].[Link]().[Link]('|'.join(keywords)) |
df['artists'].[Link]().[Link]('|'.join(keywords))]
if [Link]:
print("❌ No songs matched that genre.")
else:
song = [Link](1).iloc[0]
vector = song[['valence', 'acousticness', 'danceability', 'energy',
'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo']].values
recommend_by_vector(vector)

elif choice == '4':

print("👋 Exiting. Enjoy the music!")
break
return
else:
print("❌ Invalid choice.")

input("\nPress Enter to return to menu...")

recommend_menu()

# Run the program

if __name__ == "__main__":
recommend_menu()

OUTPUT:
MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE
(An autonomous Institution)
#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab
MEENAKSHI SUNDARARAJAN ENGINEERING COLLEGE
(An autonomous Institution)
#363, Arcot Road, Kodambakkam, Chennai – 600024, Tamil Nadu, India

Department : IT Lab Name: CS3491 – Artificial Intelligence and Machine Learning Lab

RESULT:
Thus a mini project to implement Music Recommendation System is executed successfully.

Music Recommendation System Analysis
No ratings yet
Music Recommendation System Analysis
16 pages
Music Recommendation System Report
No ratings yet
Music Recommendation System Report
23 pages
Machine Learning Music Recommendation System
No ratings yet
Machine Learning Music Recommendation System
10 pages
Music Recommendation System in Streamlit
No ratings yet
Music Recommendation System in Streamlit
7 pages
Music Recommender System Project Report
No ratings yet
Music Recommender System Project Report
24 pages
Python Song Recommendation System
No ratings yet
Python Song Recommendation System
5 pages
Spotify Playlist Recommendation System
No ratings yet
Spotify Playlist Recommendation System
21 pages
AI Music Recommendation System
No ratings yet
AI Music Recommendation System
13 pages
Dynamic Music Recommendations via Clustering
No ratings yet
Dynamic Music Recommendations via Clustering
14 pages
Music Recommendation System
No ratings yet
Music Recommendation System
5 pages
Personalized Music Recommendation System
No ratings yet
Personalized Music Recommendation System
5 pages
Music Emotion-Based Recommendation System
No ratings yet
Music Emotion-Based Recommendation System
14 pages
Python Music Recommendation System
No ratings yet
Python Music Recommendation System
5 pages
Music Recommendation via K-Means Clustering
No ratings yet
Music Recommendation via K-Means Clustering
24 pages
Spotify's Data Science in Music Recommendations
No ratings yet
Spotify's Data Science in Music Recommendations
7 pages
Content-Based Music Recommendation System
No ratings yet
Content-Based Music Recommendation System
5 pages
Amazon Music Clustering Project Guide
No ratings yet
Amazon Music Clustering Project Guide
11 pages
Projects 2021 C6
No ratings yet
Projects 2021 C6
93 pages
Song Recommendation System Analysis
No ratings yet
Song Recommendation System Analysis
32 pages
Compose Compute - Computer Generation and Classification of Music Through Operations Research Methods
No ratings yet
Compose Compute - Computer Generation and Classification of Music Through Operations Research Methods
250 pages
Music Recommendation System Analysis
No ratings yet
Music Recommendation System Analysis
6 pages
Music Genre Classification Report
No ratings yet
Music Genre Classification Report
6 pages
K Means Spotify
No ratings yet
K Means Spotify
5 pages
Music Emotion-Based Recommendation System
No ratings yet
Music Emotion-Based Recommendation System
13 pages
Music Genre Classification with ResNet & Bi-GRU
No ratings yet
Music Genre Classification with ResNet & Bi-GRU
17 pages
SSRN Id4447197
No ratings yet
SSRN Id4447197
8 pages
Spotify Music Genre Prediction Analysis
No ratings yet
Spotify Music Genre Prediction Analysis
4 pages
Music Recommendation System Project Report
No ratings yet
Music Recommendation System Project Report
13 pages
Mitigating Bias in Music Streaming AI
No ratings yet
Mitigating Bias in Music Streaming AI
12 pages
Personalized Music Recommendations Using ML
No ratings yet
Personalized Music Recommendations Using ML
9 pages
LastFM Artist Recommendation Systems
No ratings yet
LastFM Artist Recommendation Systems
10 pages
Music Recommendation System Project
No ratings yet
Music Recommendation System Project
11 pages
MySpotify: Music Recommendation System
No ratings yet
MySpotify: Music Recommendation System
11 pages
Music Data Cleaning & Mood Classifier
No ratings yet
Music Data Cleaning & Mood Classifier
5 pages
Music Genre Prediction with Decision Trees
No ratings yet
Music Genre Prediction with Decision Trees
3 pages
Paper PDF Data
No ratings yet
Paper PDF Data
3 pages
Spotify Playlist Recommendation System
100% (1)
Spotify Playlist Recommendation System
38 pages
Music Recommendation System with Spotify
No ratings yet
Music Recommendation System with Spotify
39 pages
Music Recommendation Using Kaggle Dataset
No ratings yet
Music Recommendation Using Kaggle Dataset
10 pages
Spotify Genre Clustering Analysis
No ratings yet
Spotify Genre Clustering Analysis
11 pages
User-Based Collaborative Filtering Guide
No ratings yet
User-Based Collaborative Filtering Guide
3 pages
Workshop RecSys Challenge 2018
No ratings yet
Workshop RecSys Challenge 2018
6 pages
AI-Driven Music Recommendation System
No ratings yet
AI-Driven Music Recommendation System
10 pages
Spotify Song Popularity Analysis Insights
No ratings yet
Spotify Song Popularity Analysis Insights
16 pages
Final Report: Music Recommender System
No ratings yet
Final Report: Music Recommender System
21 pages
Smart Music Recommendation System
No ratings yet
Smart Music Recommendation System
5 pages
Machine Learning for Music Classification
No ratings yet
Machine Learning for Music Classification
48 pages
Music Recommendation System Overview
No ratings yet
Music Recommendation System Overview
10 pages
Music Genre Classification Techniques
No ratings yet
Music Genre Classification Techniques
33 pages
MIDI Generation with LSTM-GRU Models
No ratings yet
MIDI Generation with LSTM-GRU Models
38 pages
Music Recommendation System Analysis
No ratings yet
Music Recommendation System Analysis
53 pages
Licence-Free AI Music Generation
No ratings yet
Licence-Free AI Music Generation
66 pages
Machine Learning for Music Recommendations
No ratings yet
Machine Learning for Music Recommendations
9 pages
Music Recommendation System Project
No ratings yet
Music Recommendation System Project
13 pages
EEG Autism Diagnosis with RFLDA
No ratings yet
EEG Autism Diagnosis with RFLDA
8 pages
Appliance Classification via Power Analysis
No ratings yet
Appliance Classification via Power Analysis
9 pages
Anomaly Detection Techniques Explained
No ratings yet
Anomaly Detection Techniques Explained
24 pages
K-Nearest Neighbour Algorithm Overview
No ratings yet
K-Nearest Neighbour Algorithm Overview
7 pages
Data Analysis of Stroke Risk Factors
No ratings yet
Data Analysis of Stroke Risk Factors
24 pages
Shark Tank Insights Dataset Analysis
100% (5)
Shark Tank Insights Dataset Analysis
23 pages
Advanced ML Architectures & Metrics
No ratings yet
Advanced ML Architectures & Metrics
10 pages
Machine Learning for Mental Health Detection
100% (1)
Machine Learning for Mental Health Detection
31 pages
Machine Learning for Horse Race Predictions
No ratings yet
Machine Learning for Horse Race Predictions
10 pages
Loan Approval Prediction with K-NN & Clustering
No ratings yet
Loan Approval Prediction with K-NN & Clustering
4 pages
Bangla Cricket Comment Sentiment Analysis
No ratings yet
Bangla Cricket Comment Sentiment Analysis
39 pages
Python Machine Learning Project Structure
No ratings yet
Python Machine Learning Project Structure
24 pages
Deep Learning for Indoor Positioning Review
No ratings yet
Deep Learning for Indoor Positioning Review
21 pages
IIoT Architecture: Layers & Security Insights
No ratings yet
IIoT Architecture: Layers & Security Insights
12 pages
Overview of Machine Learning Algorithms
No ratings yet
Overview of Machine Learning Algorithms
3 pages
Data Mining, Data Management Strategy
No ratings yet
Data Mining, Data Management Strategy
62 pages
Predictive Modeling Techniques Overview
No ratings yet
Predictive Modeling Techniques Overview
36 pages
Machine Learning for Parkinson's Detection
No ratings yet
Machine Learning for Parkinson's Detection
11 pages
Applied AI Course Syllabus Overview
No ratings yet
Applied AI Course Syllabus Overview
26 pages
House Price Prediction Using ML Techniques
No ratings yet
House Price Prediction Using ML Techniques
18 pages
Digital Image Processing in Remote Sensing
No ratings yet
Digital Image Processing in Remote Sensing
10 pages
Machine Learning for Waste Segregation
No ratings yet
Machine Learning for Waste Segregation
70 pages
ML Algorithms for Crop Recommendation System
No ratings yet
ML Algorithms for Crop Recommendation System
5 pages
Key AI Concepts for Class 10 Students
No ratings yet
Key AI Concepts for Class 10 Students
133 pages
CareerRec: ML for IT Career Paths
No ratings yet
CareerRec: ML for IT Career Paths
8 pages
Data Integration and Mining in Warehouses
No ratings yet
Data Integration and Mining in Warehouses
8 pages
Placement Prediction Using Machine Learning
No ratings yet
Placement Prediction Using Machine Learning
5 pages
User Guide
No ratings yet
User Guide
500 pages
Smart Wearable for Women's Safety
No ratings yet
Smart Wearable for Women's Safety
34 pages
ML Crop Recommendation in India
No ratings yet
ML Crop Recommendation in India
13 pages