データサイエンティストの
憂鬱と退屈
@shoe116
今日の予定
1. 自己紹介
2. データサイエンティストの憂鬱
1. 顧客が本当に必要だったもの
2. 顧客と価値の進捗
3. 日本人と確率と統計
3. データサイエンティストの退屈
4. まとめ
1. 自己紹介
• なまえ:しゅう (@shoe116)
• お仕事:黄色いゾウさんと愉快な仲間たちのお世話
• これまで:広告システム→ データサイエンティスト屋
• 言語:Python, Java > JavaScript > Scala, C++
• 興味:No music, no life. No idol, no life.
• 課外活動:お歌を歌ったり、戯言を並べたり
• https://shoe116.tumblr.com/
ストレングスファインダー
@shoe116最上もがさん ニセモノの恋
2. データサイエンティストの憂鬱
1. 顧客が本当に必要だったもの
2. 価値の進捗の話
3. 日本人と確立と統計
データ分析を生業にする人」
2.1 顧客が本当に必要だったもの
2.1 顧客が本当に必要だったもの
- 要件定義は基本的に必ず失敗する
- できる限り手早く片付けて、致命的でない失敗をしたい
- データサイエンティストに与えられる「要件」
- 売上(もしくはそれに類するKPI)を上げたい
- PDCAサイクルを回したい
- データを見て何か提案して欲しい(最悪かつ最頻)
2.2 顧客と価値の進捗
「データ分析を生業にする人」
2.2 顧客と価値の進捗
-顧客は待たされるのが嫌い
-「速い」ことにはそれだけで価値がある
-お通し的な、とりあえずの価値を見せるのが困難
-「データ収集とデータ加工」がつらい
-家計簿、つけられますか?
-レシートをなくす、もらえない、数値がずれる
-家計簿をつけただけではお金はたまらない
2.3日本人は確率と統計に疎い
-完全に教育課程の問題
-普通の人にとって、ほとんどのサイコロの出る目は
「同様に確からしい」
-理系しかやらない、しかも高校後半まで習わない
-理系の学生ですら、センター試験で捨てて良い
-分析結果の説明が難しい
-ベン図が伝わったら相当ラッキー
-簡潔に言うと、数値の見方から説明するハメにな
る
3. データサイエンティストの退屈
-分析自体の価値を知ることは非常に困難
1. データ分析の価値 = 意思決定が生む価値
2. その意味で、データサイエンスは占いに近い
-データ分析が役立つ主なシーン
1. 自分じゃ答えを出せない、もしくは出したくない
2. 自分の判断の正しさを客観的に示したい
3. その意思決定が、それほど重大でない
4. まとめ
1. データサイエンティストが憂鬱なのも退屈なのも、
あなたのせいではないし、僕のせいでもない
2. 根本的な問題は、データサイエンティストのお仕事
内容と、たぶん日本の教育課程
3. みなさん、明日も頑張りましょう

More Related Content

PDF
ハリーポッターに なりたいけどなれないからハニーポッターになる
PPTX
コミュ障の俺が、自分と近い特徴のヤツを探す(プロ生#32 LT)
PDF
データサイエンティスト養成勉強会 こんな僕がデータサイエンティストになれた秘密
PPTX
データサイエンティストの今
PDF
なぜ数学と理系人材がビジネスの現場で必要とされるのか
PDF
【IMJ】やり尽くし感を打開する新アプローチ『サービスデザイン』を体感ーサービスデザインワークショップ (2015.02.19)
PPTX
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)
PPTX
不動産価格査定におけるヘドニックアプローチからディープラーニングへの進化の軌跡
ハリーポッターに なりたいけどなれないからハニーポッターになる
コミュ障の俺が、自分と近い特徴のヤツを探す(プロ生#32 LT)
データサイエンティスト養成勉強会 こんな僕がデータサイエンティストになれた秘密
データサイエンティストの今
なぜ数学と理系人材がビジネスの現場で必要とされるのか
【IMJ】やり尽くし感を打開する新アプローチ『サービスデザイン』を体感ーサービスデザインワークショップ (2015.02.19)
20131031 首都大学東京 cloud_computing講演会 講演資料(野上)
不動産価格査定におけるヘドニックアプローチからディープラーニングへの進化の軌跡

Viewers also liked (15)

PDF
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
PPTX
5年後のデータサイエンティスト
PDF
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
PDF
TDAの概要と適用・有用性
PDF
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
PDF
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
PDF
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
PPTX
さらば!データサイエンティスト
PDF
データ分析というお仕事のこれまでとこれから(HCMPL2014)
PDF
Stan超初心者入門
PDF
Python for R Users
PDF
最新業界事情から見るデータサイエンティストの「実像」
PDF
統計学の基礎の基礎
PDF
20140727_第1回スポーツデータアナリティクス基礎講座
PDF
動的最適化の今までとこれから
データサイエンティストとは? そのスキル/ナレッジレベル定義の必要性
5年後のデータサイエンティスト
「データサイエンティスト・ブーム」後の企業におけるデータ分析者像を探る
TDAの概要と適用・有用性
直感的な単変量モデルでは予測できない「ワインの味」を多変量モデルで予測する
Base DDD(ドメイン駆動設計) 参考文献を巡る旅
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
さらば!データサイエンティスト
データ分析というお仕事のこれまでとこれから(HCMPL2014)
Stan超初心者入門
Python for R Users
最新業界事情から見るデータサイエンティストの「実像」
統計学の基礎の基礎
20140727_第1回スポーツデータアナリティクス基礎講座
動的最適化の今までとこれから
Ad

More from Shu (shoe116) (9)

PDF
GCPでStreamなデータパイプライン作った
PDF
DataProcessingInBuffettCode-20190213
PDF
オープンデータを利用した企業分析ツール"Buffett-Code"について
PDF
データ分析基盤の憂鬱と退屈
PDF
analists_rating_by_lda_hackday_201702
PPTX
idoling_approval_desire
PPTX
tokyo_webmining_no51
PDF
Hadoop Ops & Fabric
PDF
エンジニアが日々何を考えているのか、ということ
GCPでStreamなデータパイプライン作った
DataProcessingInBuffettCode-20190213
オープンデータを利用した企業分析ツール"Buffett-Code"について
データ分析基盤の憂鬱と退屈
analists_rating_by_lda_hackday_201702
idoling_approval_desire
tokyo_webmining_no51
Hadoop Ops & Fabric
エンジニアが日々何を考えているのか、ということ
Ad

データサイエンティストの憂鬱と退屈