0% found this document useful (0 votes)

85 views

Rolling Window Functions With Pandas

Rolling window functions in pandas allow users to calculate metrics over subsets of time series data. This includes rolling and expanding windows. Rolling windows use a fixed-size window that slides over the data, while expanding windows aggregate all prior data up to each point. Examples demonstrate calculating rolling means and other metrics, as well as expanding sums, rates of return, and minimum/maximum values. Random walk simulations can also be performed by generating random returns and calculating cumulative prices.

Uploaded by

Vadim Yermolenko

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

85 views

Rolling Window Functions With Pandas

Uploaded by

Vadim Yermolenko

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 37

MANIPULATING TIME SERIES DATA IN PYTHON

Rolling Window Functions

with Pandas
Manipulating Time Series Data in Python

Window Functions in pandas

● Windows identify sub periods of your time series
● Calculate metrics for sub periods inside the window
● Create a new time series of metrics
● Two types of windows:
● Rolling: same size, sliding (this video)
● Expanding: contain all prior values (next video)
Manipulating Time Series Data in Python

Calculating a Rolling Average

In [1]: data = pd.read_csv('google.csv',
parse_dates=['date'],
index_col='date')

DatetimeIndex: 1761 entries, 2010-01-04 to 2016-12-30

Data columns (total 1 columns):
price 1761 non-null float64
dtypes: float64(1)
Manipulating Time Series Data in Python

Calculating a Rolling Average

# Integer-based window size
In [5]: data.rolling(window=30).mean() # fixed # observations

DatetimeIndex: 1761 entries, 2010-01-04 to 2017-05-24

Data columns (total 1 columns): window=30: # business days
price 1732 non-null float64 min_periods: choose value < 30 to
dtypes: float64(1)
get results for first days

# Offset-based window size

In [6]: data.rolling(window='30D').mean() # fixed period length

DatetimeIndex: 1761 entries, 2010-01-04 to 2017-05-24

Data columns (total 1 columns):
price 1761 non-null float64 30D: # calendar days
dtypes: float64(1)
Manipulating Time Series Data in Python

90 Day Rolling Mean

In [7]: r90 = data.rolling(window='90D').mean()

In [8]: google.join(r90.add_suffix(‘_mean_90’)).plot()

.join:
concatenate Series
or DataFrame along
axis=1
Manipulating Time Series Data in Python

90 & 360 Day Rolling Means

In [8]: data['mean90'] = r90

In [9]: r360 = data[‘price'].rolling(window='360D'.mean()

In [10]: data['mean360'] = r360; data.plot()

Manipulating Time Series Data in Python

Multiple Rolling Metrics (1)

In [8]: r = data.price.rolling(‘90D’).agg([‘mean’, 'std'])

In [9]: r.plot(subplots = True)

Manipulating Time Series Data in Python

Multiple Rolling Metrics (2)

In [10]: rolling = data.google.rolling('360D')

In [11]: q10 = rolling.quantile(.1).to_frame('q10')

In [12]: median = rolling.median().to_frame(‘median')

In [13]: q90 = rolling.quantile(.9).to_frame('q90')

In [14]: pd.concat([q10, median, q90], axis=1).plot()

MANIPULATING TIME SERIES DATA IN PYTHON

Let’s practice!
MANIPULATING TIME SERIES DATA IN PYTHON

Expanding Window
Functions with Pandas
Manipulating Time Series Data in Python

Expanding Windows in pandas

● From rolling to expanding windows
● Calculate metrics for periods up to current date
● New time series reflects all historical values
● Useful for running rate of return, running min/max
● Two options with pandas:
● .expanding() - just like .rolling()
● .cumsum(), .cumprod(), cummin()/max()
Manipulating Time Series Data in Python

The Basic Idea

In [1]: df = pd.DataFrame({'data': range(5)})

In [2]: df['expanding sum'] = df.data.expanding().sum()

In [3]: df['cumulative sum'] = df.data.cumsum()

In [4]: df

data expanding sum cumulative sum

0 0 X 0.0 0
1 1 1.0 1
2 2 3.0 3
3 3 6.0 6
4 4 10.0 10
Manipulating Time Series Data in Python

Get data for the S&P 500

In [5]: data = pd.read_csv('sp500.csv', parse_dates=['date'],
index_col=‘date')

DatetimeIndex: 2519 entries, 2007-05-24 to 2017-05-24

Data columns (total 1 columns):
SP500 2519 non-null float64
Manipulating Time Series Data in Python

How to calculate a Running Return

● Single period return r: current price over last price minus 1
Pt
rt = 1
Pt 1

● Multi-period return: product of (1 + r) for all periods, minus 1:

RT = (1 + r1 )(1 + r2 )...(1 + rT ) 1

● For the period return: .pct_change()

● For basic math .add(), .sub(), .mul(), .div()
● For cumulative product: .cumprod()
Manipulating Time Series Data in Python

Running Rate of Return in Practice

In [6]: pr = data.SP500.pct_change() # period return

In [7]: pr_plus_one = pr.add(1)

In [8]: cumulative_return = pr_plus_one.cumprod().sub(1)

In [9]: cumulative_return.mul(100).plot()
Manipulating Time Series Data in Python

Ge!ing the running min & max

In [2]: data['running_min'] = data.SP500.expanding().min()

In [3]: data['running_max'] = data.SP500.expanding().max()

In [4]: data.plot()
Manipulating Time Series Data in Python

Rolling Annual Rate of Return

In [10]: def multi_period_return(period_returns):
return np.prod(period_returns + 1) - 1

In [11]: pr = data.SP500.pct_change() # period return

In [12]: r = pr.rolling('360D').apply(multi_period_return)

In [13]: data['Rolling 1yr Return'] = r.mul(100)

In [14]: data.plot(subplots=True)
Manipulating Time Series Data in Python

Rolling Annual Rate of Return

In [13]: data['Rolling 1yr Return'] = r.mul(100)

In [14]: data.plot(subplots=True)
MANIPULATING TIME SERIES DATA IN PYTHON

Let’s practice!
MANIPULATING TIME SERIES DATA IN PYTHON

Case Study:
S&P500 Price Simulation
Manipulating Time Series Data in Python

Random Walks & Simulations

● Daily stock returns are hard to predict
● Models o!en assume they are random in nature
● Numpy allows you to generate random numbers
● From random returns to prices: use .cumprod()
● Two examples:
● Generate random returns
● Randomly selected actual SP500 returns
Manipulating Time Series Data in Python

Generate Random Numbers

In [1]: from numpy.random import normal, seed

In [2]: from scipy.stats import norm

In [3]: seed(42)

In [3]: random_returns = normal(loc=0, scale=0.01, size=1000)

In [4]: sns.distplot(random_returns, fit=norm, kde=False)

Normal
Distribution

1,000
Random
Returns
Manipulating Time Series Data in Python

Create A Random Price Path

In [5]: return_series = pd.Series(random_returns)

In [6]: random_prices = return_series.add(1).cumprod().sub(1)

In [7]: random_prices.mul(100).plot()
Manipulating Time Series Data in Python

S&P 500 Prices & Returns

In [5]: data = pd.read_csv('sp500.csv', parse_dates=['date'],
index_col=‘date')

In [6]: data['returns'] = data.SP500.pct_change()

In [7]: data.plot(subplots=True)
Manipulating Time Series Data in Python

S&P Return Distribution

In [8]: sns.distplot(data.returns.dropna().mul(100), fit=norm)

S&P 500
Returns

Normal
Distribution
Manipulating Time Series Data in Python

Generate Random S&P 500 Returns

In [9]: from numpy.random import choice

In [10]: sample = data.returns.dropna()

In [11]: n_obs = data.returns.count()

In [12]: random_walk = choice(sample, size=n_obs)

In [14]: random_walk = pd.Series(random_walk, index=sample.index)

In [15]: random_walk.head()

DATE
2007-05-29 -0.008357
2007-05-30 0.003702
2007-05-31 -0.013990
2007-06-01 0.008096
2007-06-04 0.013120
Manipulating Time Series Data in Python

Random S&P 500 Prices (1)

In [9]: start = data.SP500.first('D')

DATE
2007-05-25 1515.73
Name: SP500, dtype: float64

In [10]: sp500_random = start.append(random_walk.add(1))

In [11]: sp500_random.head())

DATE
2007-05-25 1515.730000
2007-05-29 0.998290
2007-05-30 0.995190
2007-05-31 0.997787
2007-06-01 0.983853
dtype: float64
Manipulating Time Series Data in Python

Random S&P 500 Prices (2)

In [9]: data['SP500_random'] = sp500_random.cumprod()

In [10]: data[['SP500', 'SP500_random']].plot()

MANIPULATING TIME SERIES DATA IN PYTHON

Let’s practice!
MANIPULATING TIME SERIES DATA IN PYTHON

Relationships between
Time Series: Correlation
Manipulating Time Series Data in Python

Correlation & Relations between Series

● So far, focus on characteristics of individual variables
● Now: characteristic of relations between variables
● Correlation: measures linear relationships
● Financial markets: important for prediction and risk
management
● Pandas & seaborns have tools to compute & visualize
Manipulating Time Series Data in Python

Correlation & Linear Relationships

● Correlation coefficient: how similar is the pairwise
movement of two variables around their averages?
PN
(x
i=i i x̄)(yi ȳ)
● Varies between -1 and + 1 r=
sx sy

Strength of linear
relationship

Positive or
negative

Not: non-linear
relationships
Manipulating Time Series Data in Python

Importing Five Price Time Series

In [1]: data = pd.read_csv('assets.csv', parse_dates=['date'],
index_col='date')

In [2]: data = data.dropna().info()

DatetimeIndex: 2469 entries, 2007-05-25 to 2017-05-22

Data columns (total 5 columns):
sp500 2469 non-null float64
nasdaq 2469 non-null float64
bonds 2469 non-null float64
gold 2469 non-null float64
oil 2469 non-null float64
Manipulating Time Series Data in Python

Visualize pairwise linear relationships

In [4]: daily_returns = data.pct_change()

In [5]: sns.jointplot(x='sp500', y='nasdaq', data=data_returns);

Manipulating Time Series Data in Python

Calculate all Correlations

In [6]: correlations = returns.corr()

In [7]: correlations
Out[7]:
bonds oil gold sp500 nasdaq
bonds 1.000000 -0.183755 0.003167 -0.300877 -0.306437
oil -0.183755 1.000000 0.105930 0.335578 0.289590
gold 0.003167 0.105930 1.000000 -0.007786 -0.002544
sp500 -0.300877 0.335578 -0.007786 1.000000 0.959990
nasdaq -0.306437 0.289590 -0.002544 0.959990 1.000000
Manipulating Time Series Data in Python

Visualize all Correlations

In [8]: sns.heatmap(correlations, annot=True)
MANIPULATING TIME SERIES DATA IN PYTHON

Let’s practice!

Data Analytics Using Python Lab Manual
50% (2)
Data Analytics Using Python Lab Manual
8 pages
Python For Financial Analysis Ebook 2021
100% (2)
Python For Financial Analysis Ebook 2021
82 pages
Step-By-Step Build Advanced InfoPath Form and SharePoint Designer Workflow
No ratings yet
Step-By-Step Build Advanced InfoPath Form and SharePoint Designer Workflow
32 pages
Naval Architecture II Theory Detailed Notes
100% (2)
Naval Architecture II Theory Detailed Notes
96 pages
SRI CO2 Manual
No ratings yet
SRI CO2 Manual
28 pages
Portfolio Data Cleaning
No ratings yet
Portfolio Data Cleaning
39 pages
Chapter 1
No ratings yet
Chapter 1
37 pages
Financial Analytics With Python
100% (1)
Financial Analytics With Python
40 pages
7 Visualizing Financial Time Series
No ratings yet
7 Visualizing Financial Time Series
26 pages
M1_L2 (Visualizing Times Series Plots)
No ratings yet
M1_L2 (Visualizing Times Series Plots)
28 pages
Pandas 6 1716219621
No ratings yet
Pandas 6 1716219621
17 pages
Time Series
100% (5)
Time Series
45 pages
Unit 1 Machine Learning
No ratings yet
Unit 1 Machine Learning
36 pages
Time Series Forecasting
100% (1)
Time Series Forecasting
52 pages
Num Py
No ratings yet
Num Py
25 pages
What is Big Data
No ratings yet
What is Big Data
8 pages
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
No ratings yet
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
11 pages
Time Series Forecasting Complete Tutorial Part 1
No ratings yet
Time Series Forecasting Complete Tutorial Part 1
10 pages
Unit 1 Machine Learning
No ratings yet
Unit 1 Machine Learning
61 pages
Unit 4 python
No ratings yet
Unit 4 python
12 pages
Data Science Programming In Python
From Everand
Data Science Programming In Python
Anita Raichand
No ratings yet
Application of Matlab For Finance: Imperial College London
No ratings yet
Application of Matlab For Finance: Imperial College London
24 pages
Record
No ratings yet
Record
25 pages
Time Series Using Python
No ratings yet
Time Series Using Python
18 pages
FOD Record Sem 1
No ratings yet
FOD Record Sem 1
25 pages
Time Series Forecast - A Basic Introduction Using Python
No ratings yet
Time Series Forecast - A Basic Introduction Using Python
18 pages
11 Classical Time Series Forecasting Methods in Python (Cheat Sheet)
No ratings yet
11 Classical Time Series Forecasting Methods in Python (Cheat Sheet)
5 pages
Python by Example Book 2 (Data Manipulation and Analysis)
No ratings yet
Python by Example Book 2 (Data Manipulation and Analysis)
105 pages
IS453 Module 2.3 - Exercises Overview
No ratings yet
IS453 Module 2.3 - Exercises Overview
5 pages
06-time-series-analysis
No ratings yet
06-time-series-analysis
9 pages
Introduction To The Course: Rob Reider
No ratings yet
Introduction To The Course: Rob Reider
36 pages
fdsa lab manual final
No ratings yet
fdsa lab manual final
70 pages
DVP First Module
No ratings yet
DVP First Module
88 pages
MLS+1+-+Python+for+Data+Science
No ratings yet
MLS+1+-+Python+for+Data+Science
33 pages
Stock Market Analysis ? pro2 my
No ratings yet
Stock Market Analysis ? pro2 my
32 pages
unit 5
No ratings yet
unit 5
28 pages
Unit 5 PythonPackages(Matplotlib)
No ratings yet
Unit 5 PythonPackages(Matplotlib)
24 pages
Numpy&pandas
No ratings yet
Numpy&pandas
17 pages
Python Pandas For Class XI Tutorial 1
No ratings yet
Python Pandas For Class XI Tutorial 1
8 pages
Mastering Pandas For Finance - Sample Chapter
100% (2)
Mastering Pandas For Finance - Sample Chapter
42 pages
EDA Document
No ratings yet
EDA Document
13 pages
FODS_LAB_MANUAL
No ratings yet
FODS_LAB_MANUAL
26 pages
12_Numpy&Matplotlib
No ratings yet
12_Numpy&Matplotlib
48 pages
Time Series Analysis With Python
100% (1)
Time Series Analysis With Python
64 pages
Time Series Analysis
No ratings yet
Time Series Analysis
2 pages
Ex1_Plotting and Visualization using Numpy and Pandas
No ratings yet
Ex1_Plotting and Visualization using Numpy and Pandas
14 pages
Time Series Interview Questions
No ratings yet
Time Series Interview Questions
7 pages
Unit 5 - Time Series Analysis and Predictive Modeling
No ratings yet
Unit 5 - Time Series Analysis and Predictive Modeling
21 pages
Report
No ratings yet
Report
18 pages
RAW Data
No ratings yet
RAW Data
22 pages
Complete Time Series Analysis in Python 1673057003
No ratings yet
Complete Time Series Analysis in Python 1673057003
56 pages
chapter_4-manipulating-time-series-data-with-xts-and-zoo-in-r
No ratings yet
chapter_4-manipulating-time-series-data-with-xts-and-zoo-in-r
22 pages
Matlab Fundamental 13
100% (1)
Matlab Fundamental 13
15 pages
Predicting Gold Prices: Working With The Time Series Data
No ratings yet
Predicting Gold Prices: Working With The Time Series Data
15 pages
Fundamentals of Data Science Lab Manual
No ratings yet
Fundamentals of Data Science Lab Manual
34 pages
Guy
No ratings yet
Guy
36 pages
Business Forecasting Using R
No ratings yet
Business Forecasting Using R
32 pages
Chap 1: Preparing Data and A Linear Model: Explore The Data With Some EDA
No ratings yet
Chap 1: Preparing Data and A Linear Model: Explore The Data With Some EDA
27 pages
Moving Averages in pandas (article) - DataCamp
No ratings yet
Moving Averages in pandas (article) - DataCamp
23 pages
549608474 Data Analytics Using Python Lab Manual
No ratings yet
549608474 Data Analytics Using Python Lab Manual
8 pages
Python Dataviz
No ratings yet
Python Dataviz
16 pages
Quick Python Guide
From Everand
Quick Python Guide
Coder1
No ratings yet
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Batch Management Customizing in SAP
100% (1)
Batch Management Customizing in SAP
19 pages
Experiment 1.1 (FZ F4)
No ratings yet
Experiment 1.1 (FZ F4)
2 pages
Phontech 8300 MkII User Manual/installation
No ratings yet
Phontech 8300 MkII User Manual/installation
42 pages
EVM Project Management With The Lights On
No ratings yet
EVM Project Management With The Lights On
38 pages
(C) Carboxylic Acid & It's Derivatives
No ratings yet
(C) Carboxylic Acid & It's Derivatives
28 pages
Chapter 14
No ratings yet
Chapter 14
43 pages
Relative Risk
No ratings yet
Relative Risk
8 pages
ARIMA and SARIMA Forecasting - Test Your Understanding
No ratings yet
ARIMA and SARIMA Forecasting - Test Your Understanding
4 pages
BMR Calculator
No ratings yet
BMR Calculator
1 page
FINAL-YEAR PROJECT PRESENTATION Updated (6855
No ratings yet
FINAL-YEAR PROJECT PRESENTATION Updated (6855
57 pages
Manual Conversor Datexel DAT5020 Ed.04-2007 - Rev.00
No ratings yet
Manual Conversor Datexel DAT5020 Ed.04-2007 - Rev.00
2 pages
1.4418-Stainless Soft Martensitic Chromium-Nickel-Molybdenum Steel
No ratings yet
1.4418-Stainless Soft Martensitic Chromium-Nickel-Molybdenum Steel
2 pages
CSA SIEM 100-6-Lab-Installing Splunk
No ratings yet
CSA SIEM 100-6-Lab-Installing Splunk
8 pages
Technical Data Sheet TR24-3-T US
No ratings yet
Technical Data Sheet TR24-3-T US
2 pages
Chloe NG - GM 2021
No ratings yet
Chloe NG - GM 2021
33 pages
Appendix B - Mechanical Vent Fan
No ratings yet
Appendix B - Mechanical Vent Fan
12 pages
Center of Mass and Momentum
No ratings yet
Center of Mass and Momentum
23 pages
DJ-Tech-Tools - Midi-Fighter - 64-User-Guide 2017 - Englisch
No ratings yet
DJ-Tech-Tools - Midi-Fighter - 64-User-Guide 2017 - Englisch
16 pages
Lab 5
No ratings yet
Lab 5
9 pages
Rc-2 Midterm Exam Part 1
No ratings yet
Rc-2 Midterm Exam Part 1
3 pages
Training Report
No ratings yet
Training Report
114 pages
Huerta-Beristain Et Al-2017-Journal of Chemical Technology and Biotechnology
No ratings yet
Huerta-Beristain Et Al-2017-Journal of Chemical Technology and Biotechnology
7 pages
Let's Practice. Work On The: Following Transformations and Patterns Carefully
No ratings yet
Let's Practice. Work On The: Following Transformations and Patterns Carefully
5 pages
Dumps: Latest Exam Dumps & Reliable Dumps VCE & Valid Certification King
No ratings yet
Dumps: Latest Exam Dumps & Reliable Dumps VCE & Valid Certification King
18 pages
Laplace Distribution
No ratings yet
Laplace Distribution
8 pages
Biotechnology and Biochemical Engineering: Prasanna B.D. Sathyanarayana N. Gummadi Praveen V. Vadlani Editors
No ratings yet
Biotechnology and Biochemical Engineering: Prasanna B.D. Sathyanarayana N. Gummadi Praveen V. Vadlani Editors
233 pages
Ways of Representing Molecules
No ratings yet
Ways of Representing Molecules
32 pages