0% found this document useful (0 votes)

10K views7 pages

Mean Squared Error in Sales Forecasting

This document contains code snippets for various predictive analytics and machine learning tasks, including sales forecasting using linear regression, sentiment analysis on social media data, disease prediction using random forest classification on healthcare data, recommendation systems for e-commerce using collaborative filtering, text classification for sentiment analysis using naive bayes, and time series analysis for stock price prediction using random forest regression. The code includes data loading, preprocessing, model training, evaluation, and visualization steps.

Uploaded by

tApIsH

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

10K views7 pages

Mean Squared Error in Sales Forecasting

Uploaded by

tApIsH

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

coe-projects

February 8, 2024

[ ]: # Predictive Analytics for Sales Forecasting

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from [Link] import mean_squared_error
import [Link] as plt

# load data
sales_data = pd.read_csv('[Link]')
print(sales_data.head())
features = sales_data[['Feature1', 'Feature2', '...']]
target = sales_data['Sales']

# Split data into train and test sets

X_train, X_test, y_train, y_test = train_test_split(features, target,␣
↪test_size=0.2, random_state=42)

# linear regression model

model = LinearRegression()

# Training the model

[Link](X_train, y_train)

#using Predictive modelling for estimate predictions

predictions = [Link](X_test)
mse = mean_squared_error(y_test, predictions)
print(f'Mean Squared Error: {mse}')

# Visualizing with matplotlib

[Link](X_test, y_test, color='blue', label='Actual Sales')
[Link](X_test, predictions, color='red', label='Predicted Sales')
[Link]('Feature')
[Link]('Sales')
[Link]()
[Link]()

1
[ ]: #sentiment analysis on social media data

from textblob import TextBlob

# Sample social media comments/reviews

comments = [
"I love this product! It's amazing!",
"The service was terrible, never using it again.",
"I'm not sure about this brand, needs improvement.",
"Best experience ever, highly recommend!"
]

# Perform sentiment analysis on each comment

for comment in comments:
blob = TextBlob(comment)
sentiment = [Link]
if sentiment > 0:
print(f"'{comment}' - Positive")
elif sentiment < 0:
print(f"'{comment}' - Negative")
else:
print(f"'{comment}' - Neutral")

'I love this product! It's amazing!' - Positive

'The service was terrible, never using it again.' - Negative
'I'm not sure about this brand, needs improvement.' - Negative
'Best experience ever, highly recommend!' - Positive

[ ]: # health care Analytics disease

# important libraries
import numpy as np
import pandas as pd
import [Link] as plt
import seaborn as sns

# libraries for modeling & prediction

from sklearn.model_selection import train_test_split
from [Link] import RandomForestClassifier
from [Link] import accuracy_score, classification_report
from [Link] import SimpleImputer

# Loading file
health_data = pd.read_csv('[Link]')
print(health_data.head())

2
# missing values ko handle kri using SimpleImputer
imputer = SimpleImputer(strategy='mean')
health_data = [Link](imputer.fit_transform(health_data),␣
↪columns=health_data.columns)

# relevant features for the model

features = health_data[['Feature1', 'Feature2', '...']]
target = health_data['Disease']

# Split data into train and test sets

X_train, X_test, y_train, y_test = train_test_split(features, target,␣
↪test_size=0.2, random_state=42)

# Random Forest prediction

model = RandomForestClassifier(n_estimators=100, random_state=42)
[Link](X_train, y_train)
# prediction of data
predictions = [Link](X_test)

# data modeling part

accuracy = accuracy_score(y_test, predictions)
print(f'Accuracy: {accuracy}')
print('Classification Report:\n', classification_report(y_test, predictions))

# Visualize using seaborn and matplotlib

[Link](figsize=(8, 6))
[Link](x=predictions, palette='Set2', label='Predicted')
[Link](x=y_test, palette='Pastel1', label='Actual')
[Link]('Disease')
[Link]('Count')
[Link]('Disease Prediction: Predicted vs. Actual')
[Link]()
[Link]()

[ ]: # recomendation system for e commerce

from surprise import Dataset, Reader, KNNBasic

from surprise.model_selection import train_test_split
from [Link] import rmse

# Load data
reader = Reader(line_format='user item rating', sep=',', rating_scale=(1, 5))
data = Dataset.load_from_file('[Link]', reader=reader)

# Split data into train and test sets

trainset, testset = train_test_split(data, test_size=0.2)

3
# Build and train the model
sim_options = {'name': 'cosine', 'user_based': True}
model = KNNBasic(sim_options=sim_options)
[Link](trainset)

# Evaluate the model

predictions = [Link](testset)
rmse(predictions)

# Make recommendations for a user

user_id = '123'
items_to_ignore = [item[0] for item in [Link][int(user_id)]]
top_n = 10
recommendations = model.get_neighbors(int(user_id), k=top_n)
print(recommendations)

[1]: # natural language processing for text classification

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from [Link] import accuracy_score, classification_report

# Sample data - replace with your own dataset

documents = [
("This product is great", "positive"),
("The service was terrible", "negative"),
("The delivery was fast", "positive"),
("I'm never buying from them again", "negative"),
("Worst experience ever", "negative")
]

# Split data into features and labels

X = [doc[0] for doc in documents]
y = [doc[1] for doc in documents]

# Split data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,␣
↪random_state=42)

# Feature extraction using TF-IDF vectorization

vectorizer = TfidfVectorizer()
X_train_vec = vectorizer.fit_transform(X_train)
X_test_vec = [Link](X_test)

4
# Build and train a Multinomial Naive Bayes classifier
classifier = MultinomialNB()
[Link](X_train_vec, y_train)

# Predictions
y_pred = [Link](X_test_vec)

# Evaluate the model

accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.2f}")

# Classification report
print("\nClassification Report:")
print(classification_report(y_test, y_pred))

Accuracy: 0.00

Classification Report:
precision recall f1-score support

negative 0.00 0.00 0.00 1.0

positive 0.00 0.00 0.00 0.0

accuracy 0.00 1.0

macro avg 0.00 0.00 0.00 1.0
weighted avg 0.00 0.00 0.00 1.0

/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344:
UndefinedMetricWarning: Precision and F-score are ill-defined and being set to
0.0 in labels with no predicted samples. Use `zero_division` parameter to
control this behavior.
_warn_prf(average, modifier, msg_start, len(result))
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344:
UndefinedMetricWarning: Recall and F-score are ill-defined and being set to 0.0
in labels with no true samples. Use `zero_division` parameter to control this
behavior.
_warn_prf(average, modifier, msg_start, len(result))
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344:
UndefinedMetricWarning: Precision and F-score are ill-defined and being set to
0.0 in labels with no predicted samples. Use `zero_division` parameter to
control this behavior.
_warn_prf(average, modifier, msg_start, len(result))
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344:
UndefinedMetricWarning: Recall and F-score are ill-defined and being set to 0.0
in labels with no true samples. Use `zero_division` parameter to control this
behavior.
_warn_prf(average, modifier, msg_start, len(result))

5
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344:
UndefinedMetricWarning: Precision and F-score are ill-defined and being set to
0.0 in labels with no predicted samples. Use `zero_division` parameter to
control this behavior.
_warn_prf(average, modifier, msg_start, len(result))
/usr/local/lib/python3.10/dist-packages/sklearn/metrics/_classification.py:1344:
UndefinedMetricWarning: Recall and F-score are ill-defined and being set to 0.0
in labels with no true samples. Use `zero_division` parameter to control this
behavior.
_warn_prf(average, modifier, msg_start, len(result))

[ ]: # time series analysis for stock price prediction

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from [Link] import RandomForestRegressor
from [Link] import mean_squared_error
import [Link] as plt

# Load historical stock price data

# Replace 'stock_data.csv' with your dataset file path or API call to fetch data
stock_data = pd.read_csv('[Link]')

# Calculate financial indicators (e.g., moving averages, RSI, MACD, etc.)

# Here, we'll use a simple moving average as an example
window = 30
stock_data['SMA'] = stock_data['Close'].rolling(window=window).mean()

# Define features and target variable

features = ['SMA'] # Add more financial indicators as needed
target = 'Close'

# Drop rows with missing values

stock_data.dropna(inplace=True)

# Split data into features and target variable

X = stock_data[features]
y = stock_data[target]

# Split data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,␣
↪random_state=42)

# Train a Random Forest regressor

rf_regressor = RandomForestRegressor(n_estimators=100, random_state=42)

6
rf_regressor.fit(X_train, y_train)

# Make predictions
y_pred_train = rf_regressor.predict(X_train)
y_pred_test = rf_regressor.predict(X_test)

# Evaluate the model

train_rmse = [Link](mean_squared_error(y_train, y_pred_train))
test_rmse = [Link](mean_squared_error(y_test, y_pred_test))
print(f"Train RMSE: {train_rmse:.2f}")
print(f"Test RMSE: {test_rmse:.2f}")

# Plot actual vs. predicted prices

[Link](figsize=(10, 6))
[Link](stock_data.index, stock_data['Close'], label='Actual Price')
[Link](stock_data.index, [Link]((y_pred_train, y_pred_test)),␣
↪label='Predicted Price')

[Link]('Stock Price Prediction')

[Link]('Date')
[Link]('Price')
[Link]()
[Link]()

Machine Learning Model Predictions and Analysis
No ratings yet
Machine Learning Model Predictions and Analysis
1 page
Machine Learning Predictive Modeling
No ratings yet
Machine Learning Predictive Modeling
16 pages
Titanic Dataset ML Analysis
No ratings yet
Titanic Dataset ML Analysis
10 pages
Amazon Sales Data Analysis & Modeling
No ratings yet
Amazon Sales Data Analysis & Modeling
16 pages
Machine Learning with Iris Dataset
No ratings yet
Machine Learning with Iris Dataset
6 pages
Build Regression and Classification Models
No ratings yet
Build Regression and Classification Models
15 pages
Decision Tree and Machine Learning Models
No ratings yet
Decision Tree and Machine Learning Models
40 pages
ML PDF
No ratings yet
ML PDF
30 pages
Data Analysis and Modeling for Sales
No ratings yet
Data Analysis and Modeling for Sales
24 pages
Machine Learning Model Predictions
No ratings yet
Machine Learning Model Predictions
9 pages
Python Metrics and Classifiers Guide
No ratings yet
Python Metrics and Classifiers Guide
7 pages
Linear & Logistic Regression Programs
No ratings yet
Linear & Logistic Regression Programs
17 pages
Machine Learning Practical Guide
No ratings yet
Machine Learning Practical Guide
29 pages
Data Science Algorithms and Techniques
No ratings yet
Data Science Algorithms and Techniques
32 pages
Advanced Supply Chain Price Prediction
No ratings yet
Advanced Supply Chain Price Prediction
15 pages
Data Preprocessing and Modeling Techniques
No ratings yet
Data Preprocessing and Modeling Techniques
25 pages
Frequent Patterns and Classification Techniques
No ratings yet
Frequent Patterns and Classification Techniques
30 pages
Linear Regression with CSV Data
No ratings yet
Linear Regression with CSV Data
10 pages
Implementing Machine Learning Models
No ratings yet
Implementing Machine Learning Models
10 pages
Data Analysis and Visualization Techniques
No ratings yet
Data Analysis and Visualization Techniques
13 pages
House Price and Tennis Play Prediction
No ratings yet
House Price and Tennis Play Prediction
5 pages
Python & R Machine Learning Cheatsheet
100% (1)
Python & R Machine Learning Cheatsheet
1 page
Big Data Algorithms Practical Guide
No ratings yet
Big Data Algorithms Practical Guide
20 pages
Bayesian Classifier and Network Models
No ratings yet
Bayesian Classifier and Network Models
6 pages
KNN and Naive Bayes Salary Prediction
No ratings yet
KNN and Naive Bayes Salary Prediction
7 pages
Customer Churn Prediction in Telecom
No ratings yet
Customer Churn Prediction in Telecom
4 pages
Python Data Import, Export & ML Models
No ratings yet
Python Data Import, Export & ML Models
24 pages
Random Forest Regression with Cross-Validation
No ratings yet
Random Forest Regression with Cross-Validation
2 pages
Data Analysis and Visualization in Python
No ratings yet
Data Analysis and Visualization in Python
17 pages
Creating Python Models: A Comprehensive Guide
No ratings yet
Creating Python Models: A Comprehensive Guide
29 pages
Machine Learning Models Overview
No ratings yet
Machine Learning Models Overview
3 pages
Sales Prediction Using ML Models
No ratings yet
Sales Prediction Using ML Models
14 pages
Simple Linear Regression Implementation
No ratings yet
Simple Linear Regression Implementation
14 pages
Machine Learning Classification Assignment
No ratings yet
Machine Learning Classification Assignment
2 pages
Model Evaluation and Validation Guide
100% (1)
Model Evaluation and Validation Guide
504 pages
Machine Learning Lab Manual: Python & R
No ratings yet
Machine Learning Lab Manual: Python & R
15 pages
Naive Bayes and Clustering in Python
No ratings yet
Naive Bayes and Clustering in Python
7 pages
Machine Learning Classification Algorithms
No ratings yet
Machine Learning Classification Algorithms
16 pages
Linear and Logistic Regression Techniques
No ratings yet
Linear and Logistic Regression Techniques
33 pages
Machine Learning Lab Manual for B.Tech
No ratings yet
Machine Learning Lab Manual for B.Tech
19 pages
Linear Regression and Classification Models
No ratings yet
Linear Regression and Classification Models
22 pages
Stock Price Prediction with ML Techniques
No ratings yet
Stock Price Prediction with ML Techniques
14 pages
Naïve Bayes and Bayesian Networks Implementation
No ratings yet
Naïve Bayes and Bayesian Networks Implementation
27 pages
K-Medoids Clustering with PyClustering
No ratings yet
K-Medoids Clustering with PyClustering
18 pages
Data Processing for Profit Prediction
No ratings yet
Data Processing for Profit Prediction
18 pages
Machine Learning Classification Techniques
No ratings yet
Machine Learning Classification Techniques
30 pages
Machine Learning Course Lab Guide
No ratings yet
Machine Learning Course Lab Guide
9 pages
Predictive Modeling with Regression Techniques
No ratings yet
Predictive Modeling with Regression Techniques
3 pages
SK Krai Hardware Data Analysis Techniques
No ratings yet
SK Krai Hardware Data Analysis Techniques
38 pages
Synthetic Data for LDA Evaluation in MATLAB
No ratings yet
Synthetic Data for LDA Evaluation in MATLAB
14 pages
Random Forest for Loan Default Prediction
100% (1)
Random Forest for Loan Default Prediction
11 pages
Linear Regression Implementation Guide
100% (1)
Linear Regression Implementation Guide
45 pages
Random Forest Customer Behavior Analysis
No ratings yet
Random Forest Customer Behavior Analysis
11 pages
Mean Squared Error in Regression Models
No ratings yet
Mean Squared Error in Regression Models
22 pages
Regression, Decision Trees, and Classifiers
No ratings yet
Regression, Decision Trees, and Classifiers
16 pages
Supervised Learning with Scikit-Learn
No ratings yet
Supervised Learning with Scikit-Learn
67 pages
Python Machine Learning Techniques Guide
No ratings yet
Python Machine Learning Techniques Guide
24 pages
Statistical Inference Course Outline
100% (1)
Statistical Inference Course Outline
7 pages
Brown-Forsythe Test for ANOVA Variances
No ratings yet
Brown-Forsythe Test for ANOVA Variances
7 pages
Understanding Random Variables in Statistics
No ratings yet
Understanding Random Variables in Statistics
21 pages
ch17 Operation Management Roberta Russell & Bernard W. Taylor
No ratings yet
ch17 Operation Management Roberta Russell & Bernard W. Taylor
35 pages
CS229 Autumn 2015 Midterm Exam
No ratings yet
CS229 Autumn 2015 Midterm Exam
21 pages
Probability Fundamentals in Statistics
No ratings yet
Probability Fundamentals in Statistics
31 pages
Maths Practice Test: Integrals & Probability
No ratings yet
Maths Practice Test: Integrals & Probability
3 pages
Introduction to Statistics and Variables
No ratings yet
Introduction to Statistics and Variables
7 pages
Calculate Quartiles and IQR in Data
No ratings yet
Calculate Quartiles and IQR in Data
43 pages
Collective Behaviours in Stock Markets
No ratings yet
Collective Behaviours in Stock Markets
146 pages
BECC-110 Econometrics Exam Guide
No ratings yet
BECC-110 Econometrics Exam Guide
7 pages
Machine Learning Based Predicting House Prices Using Regression Techniques
No ratings yet
Machine Learning Based Predicting House Prices Using Regression Techniques
7 pages
Wireless Communications Assignment 2
No ratings yet
Wireless Communications Assignment 2
3 pages
Bayesian Measurement Error Models INLA
No ratings yet
Bayesian Measurement Error Models INLA
37 pages
Statistical Analysis of Mean and Deviation
No ratings yet
Statistical Analysis of Mean and Deviation
16 pages
HSC Bivariant Data Analysis Quiz
No ratings yet
HSC Bivariant Data Analysis Quiz
4 pages
Class XII Applied Mathematics Question Paper
No ratings yet
Class XII Applied Mathematics Question Paper
5 pages
Correlation and Regression Analysis Guide
No ratings yet
Correlation and Regression Analysis Guide
30 pages
Chlorella's Impact on Soil Properties
No ratings yet
Chlorella's Impact on Soil Properties
5 pages
Regression Analysis Project Overview
No ratings yet
Regression Analysis Project Overview
3 pages
Correlated Topic Model with Word Embeddings
No ratings yet
Correlated Topic Model with Word Embeddings
7 pages
Statistical Methods for Managerial Decisions
No ratings yet
Statistical Methods for Managerial Decisions
29 pages
Statistical Process Control Fundamentals
No ratings yet
Statistical Process Control Fundamentals
122 pages
Hypothesis Testing Explained: Methods & Examples
No ratings yet
Hypothesis Testing Explained: Methods & Examples
35 pages
E-Views 9 Workshop: VECM & Unit Root Tests
No ratings yet
E-Views 9 Workshop: VECM & Unit Root Tests
26 pages
Understanding Stationary Time Series
No ratings yet
Understanding Stationary Time Series
12 pages
Merits and Demerits of Averages
No ratings yet
Merits and Demerits of Averages
5 pages
Quasi-Experimental Studies Checklist
No ratings yet
Quasi-Experimental Studies Checklist
4 pages
Email Spam Classification Analysis
No ratings yet
Email Spam Classification Analysis
5 pages