Strassen

This document describes the implementation and testing of the Strassen matrix multiplication algorithm. The algorithm was implemented recursively with a minimum block size threshold to determine when to switch to regular matrix multiplication. Testing showed that Strassen outperformed naive and blocking implementations for larger matrix sizes, with performance peaking between 300-400 MFLOPS for 512x512 matrices depending on the minimum block size used.

Uploaded by

Hamid Aslani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

90 views2 pages

Strassen

Uploaded by

Hamid Aslani

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

Brandon Merkl

Strassen Implementation
This algorithm was implemented as follows:
void inline strassen(int n,double* c,int ldc,int rc,int cc, double*
a,int lda,int ra, int ca,double *b, int ldb, int rb, int cb, int alpha,
int min_block_size ){
//C(i,j) = alpha*C(i,j) + A(i,k) * B(k,j)
//alpha [0,1]

Since it is recursive in nature, a flag named alpha, was used to delineate whether the
results need to be accumulated into C or merely set to C. Also, a minimum level of
recursion was defined using a variable called min_block_size was used. If the recursion
level produces an n such that n < min_block_size, then normal matrix multiply is used.
The results are shown below for min_block_size = 32 and min_block_size = 64. Also
included are the IJK_Blocking_20 (block size = 20) and IJK_Blocking_21 (block size =
21). A naïve implementation is included as well as the default DGEMM for comparison.

Performance comparison of Selected Algorithms

450

400

350
Performance MFLOP/s

300 strassen32
strassen64
250
DGEMM
IJK_BLOCKING_20
200
IJK_BLOCKING_21
150 IJK_NAIVE

100

0
0 100 200 300 400 500 600 700
N
APPENDIX A – Results Strassen
F=frobenius norm

N B DGEMM STRASSEN IJK_blocking IJK_Naive

4 20 16.53 21.1 F:000.18 24.8 F:000.18 28.9 F:000000

8 20 40.68 78.6 F:000.49 91.0 F:000.49 75.0 F:000000
16 20 60.85 166.3 F:000.61 174.7 F:000.61 116.9 F:000000
32 20 68.25 198.1 F:000.97 251.7 F:000.76 153.9 F:000000
64 20 72.87 229.8 F:0001.5 334.0 F:000001 177.7 F:000000
128 20 74.53 213.2 F:0002.4 326.8 F:0001.4 146.8 F:000000
256 20 33.92 186.3 F:0004.1 194.9 F:0001.9 44.2 F:000000
512 20 33.91 175.8 F:0006.8 240.4 F:0002.7 44.5 F:000000

4 21 19.60 21.9 F:000.36 27.7 F:000.36 30.8 F:000000

8 21 41.19 76.6 F:000.47 87.3 F:000.47 66.4 F:000000
16 21 58.02 165.9 F:000.58 173.7 F:000.58 117.8 F:000000
32 21 68.32 184.3 F:000.94 253.2 F:000.77 153.1 F:000000
64 21 72.91 231.2 F:0001.6 342.1 F:000.99 177.9 F:000000
128 21 73.00 210.7 F:0002.6 346.2 F:0001.4 147.0 F:000000
256 21 33.91 185.7 F:0004.2 277.9 F:0001.9 43.9 F:000000
512 21 34.00 176.0 F:0006.8 262.4 F:0002.6 44.3 F:000000

4 64 20.67 22.7 F:000.25 29.0 F:000.25 25.5 F:000000

8 64 42.27 84.9 F:000.46 88.0 F:000.46 68.7 F:000000
16 64 58.18 168.0 F:000.59 172.2 F:000.59 118.1 F:000000
32 64 68.22 260.2 F:000.76 260.4 F:000.76 158.4 F:000000
64 64 72.94 318.8 F:000001 348.6 F:000.94 177.8 F:000000
128 64 72.30 296.1 F:0001.5 378.2 F:0001.4 147.4 F:000000
256 64 34.98 247.6 F:0002.2 282.2 F:0001.9 43.9 F:000000
512 64 34.05 225.9 F:0003.3 124.8 F:0002.6 44.2 F:000000

Frequency Response H1 (ACCEL, FUERZA) - P11
No ratings yet
Frequency Response H1 (ACCEL, FUERZA) - P11
16 pages
Wa0004
No ratings yet
Wa0004
13 pages
Lab 08 210021110
No ratings yet
Lab 08 210021110
7 pages
Staad CHB Fence Patches
No ratings yet
Staad CHB Fence Patches
105 pages
Q1
No ratings yet
Q1
48 pages
Beacons
No ratings yet
Beacons
12 pages
MCP Sparse Sdpa
No ratings yet
MCP Sparse Sdpa
9 pages
EQ Data2
No ratings yet
EQ Data2
18 pages
EQ Curve Data - 1
No ratings yet
EQ Curve Data - 1
18 pages
Sagar 16 PRGM PDF
No ratings yet
Sagar 16 PRGM PDF
12 pages
Frequency and Magnitude Data Analysis
No ratings yet
Frequency and Magnitude Data Analysis
18 pages
Structural Analysis Data Tables
No ratings yet
Structural Analysis Data Tables
1,832 pages
Shape Functions in FEM Analysis
No ratings yet
Shape Functions in FEM Analysis
25 pages
Zuna Iriya
No ratings yet
Zuna Iriya
9 pages
STAAD Space Joint Coordinates
No ratings yet
STAAD Space Joint Coordinates
12 pages
1.steel Design - Soffit
No ratings yet
1.steel Design - Soffit
1,110 pages
Tabel Distribusi Normal Baku
No ratings yet
Tabel Distribusi Normal Baku
1 page
LAMMPS Simulation Parameters
No ratings yet
LAMMPS Simulation Parameters
1,698 pages
ABAQUSVUMAT初学者用户子程序小例子
No ratings yet
ABAQUSVUMAT初学者用户子程序小例子
15 pages
LP III Lab Manual: Algorithms & ML
No ratings yet
LP III Lab Manual: Algorithms & ML
54 pages
Staad Input File
No ratings yet
Staad Input File
5 pages
Log Lammps 1400
No ratings yet
Log Lammps 1400
8 pages
Tables 123
No ratings yet
Tables 123
5 pages
Ml1.ipynb - Colaboratory
No ratings yet
Ml1.ipynb - Colaboratory
5 pages
Tukey IQR Outlier Detection Guide
No ratings yet
Tukey IQR Outlier Detection Guide
35 pages
Assignment 1 Code Input Output
No ratings yet
Assignment 1 Code Input Output
9 pages
Erosion Output
No ratings yet
Erosion Output
3,178 pages
Operaciones Con Matrices Y Vectores
No ratings yet
Operaciones Con Matrices Y Vectores
20 pages
GCT Report
No ratings yet
GCT Report
50 pages
Support Reaction (Struktur Pagoda)
No ratings yet
Support Reaction (Struktur Pagoda)
181 pages
DP v8
No ratings yet
DP v8
19 pages
Week 13 1-Pandas
No ratings yet
Week 13 1-Pandas
10 pages
Yucatán Cosine Table Activity 28
No ratings yet
Yucatán Cosine Table Activity 28
10 pages
2 DTSSTD
No ratings yet
2 DTSSTD
12 pages
Structural Load Combinations Guide
No ratings yet
Structural Load Combinations Guide
21 pages
Distribution Chamber
No ratings yet
Distribution Chamber
113 pages
05 05 Metodo de Biseccion
No ratings yet
05 05 Metodo de Biseccion
9 pages
Filter Annexe 1.anl
No ratings yet
Filter Annexe 1.anl
181 pages
Caszo
No ratings yet
Caszo
19 pages
Helical Stair STAAD File
No ratings yet
Helical Stair STAAD File
13 pages
ADADELTA
No ratings yet
ADADELTA
2 pages
Tabel Z
No ratings yet
Tabel Z
1 page
03.2 Input File
No ratings yet
03.2 Input File
47 pages
Uemm Engineering Analysis Formulae For UEMM3243: L CN K C
No ratings yet
Uemm Engineering Analysis Formulae For UEMM3243: L CN K C
4 pages
Ps-x01 Nls Inputdata
No ratings yet
Ps-x01 Nls Inputdata
100 pages
Error Function & Complementary Error Function Tables - Custom
100% (1)
Error Function & Complementary Error Function Tables - Custom
2 pages
ECN Informatics 2013
No ratings yet
ECN Informatics 2013
17 pages
Staad Analysis: Warning-The Following Commands Should Not Be Used When The Set Z Up
No ratings yet
Staad Analysis: Warning-The Following Commands Should Not Be Used When The Set Z Up
8 pages
Tapa Trias
0% (1)
Tapa Trias
15,540 pages
Fortran Programs Sai
No ratings yet
Fortran Programs Sai
13 pages
Max Bending Moment in 35° Square
No ratings yet
Max Bending Moment in 35° Square
72 pages
Heartdisease
No ratings yet
Heartdisease
6 pages
Quadrant Analysis of Integers
No ratings yet
Quadrant Analysis of Integers
222 pages
BOIFUND Design Calculation
No ratings yet
BOIFUND Design Calculation
81 pages
M64a Superstructure Main Building Rev A
100% (1)
M64a Superstructure Main Building Rev A
13,220 pages
Prin - An Alternative To Matlab's Sprintf and Fprinf Functions
No ratings yet
Prin - An Alternative To Matlab's Sprintf and Fprinf Functions
6 pages
RDF
No ratings yet
RDF
21 pages
HD660s Equaliser Preset
No ratings yet
HD660s Equaliser Preset
18 pages
Unit 4 Practical Questions
No ratings yet
Unit 4 Practical Questions
2 pages
Varioskan Flash Quick Reference Guide
No ratings yet
Varioskan Flash Quick Reference Guide
2 pages
MBA Finance Assignment Guide
0% (1)
MBA Finance Assignment Guide
10 pages
Grade 5 Maths Practice Questions
No ratings yet
Grade 5 Maths Practice Questions
3 pages
Vista Shower Enclosure Installation Instructions: Important
No ratings yet
Vista Shower Enclosure Installation Instructions: Important
10 pages
Eia 364 65B
No ratings yet
Eia 364 65B
3 pages
Exercise Basic Calculation
No ratings yet
Exercise Basic Calculation
3 pages
Discover The Big Story Behind This: Amazing Little Fruit
No ratings yet
Discover The Big Story Behind This: Amazing Little Fruit
6 pages
Reguli de Baza Protectia Muncii CSCT 2012
No ratings yet
Reguli de Baza Protectia Muncii CSCT 2012
1 page
Supply Chain Allocation Planning Insights
No ratings yet
Supply Chain Allocation Planning Insights
5 pages
Old But Gold: A Journey in Deciphering San Juan, Batangas
No ratings yet
Old But Gold: A Journey in Deciphering San Juan, Batangas
10 pages
Start Up Project Report (D)
No ratings yet
Start Up Project Report (D)
13 pages
MCLIS Brochure 2023 24
No ratings yet
MCLIS Brochure 2023 24
27 pages
Alternator Faults and Protection Methods
100% (2)
Alternator Faults and Protection Methods
25 pages
STS South Asia Webinar Document - For IACTS
No ratings yet
STS South Asia Webinar Document - For IACTS
8 pages
Intake and Exhaust Systems
No ratings yet
Intake and Exhaust Systems
16 pages
3 Topic Test Memo (Reaction Rates 2024)
No ratings yet
3 Topic Test Memo (Reaction Rates 2024)
4 pages
System Verilog Mini Project
No ratings yet
System Verilog Mini Project
21 pages
MBA - SEM 1 - Economic Analysis For Business Decisions - Course Syllabus
No ratings yet
MBA - SEM 1 - Economic Analysis For Business Decisions - Course Syllabus
5 pages
(Etextbook PDF) For Macroeconomics, 10th Edition by Andrew B. Abel PDF Version
No ratings yet
(Etextbook PDF) For Macroeconomics, 10th Edition by Andrew B. Abel PDF Version
145 pages
Underpinning Methods, Procedure, Use in Foundation Strengthening and Repair - Cement Concrete
No ratings yet
Underpinning Methods, Procedure, Use in Foundation Strengthening and Repair - Cement Concrete
1 page
Mas Midterms
No ratings yet
Mas Midterms
4 pages
Basic Elements of Research Proposal at T PDF
No ratings yet
Basic Elements of Research Proposal at T PDF
5 pages
NABARD Layer Farming Project
90% (40)
NABARD Layer Farming Project
11 pages
SAP Order To Cash Process - SD - SAP Community
No ratings yet
SAP Order To Cash Process - SD - SAP Community
24 pages
Number Systems Questions (Final Edited)
No ratings yet
Number Systems Questions (Final Edited)
5 pages
ARTICLE 1231: NOTE TO SELF Remember To Reread Examples in Book
100% (3)
ARTICLE 1231: NOTE TO SELF Remember To Reread Examples in Book
13 pages
Saksham Arora CV
No ratings yet
Saksham Arora CV
1 page
Tugas Bahasa Inggris Merangkum
No ratings yet
Tugas Bahasa Inggris Merangkum
2 pages
15-17may Esports
No ratings yet
15-17may Esports
12 pages

Strassen

Uploaded by

Strassen

Uploaded by

Brandon Merkl

Performance comparison of Selected Algorithms

N B DGEMM STRASSEN IJK_blocking IJK_Naive

4 20 16.53 21.1 F:000.18 24.8 F:000.18 28.9 F:000000

4 21 19.60 21.9 F:000.36 27.7 F:000.36 30.8 F:000000

4 64 20.67 22.7 F:000.25 29.0 F:000.25 25.5 F:000000

You might also like