Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スタートアップにおけるこれからの「データ整備」
Search
ShoMaekawa/ウィル
October 09, 2025
Technology
2
580
スタートアップにおけるこれからの「データ整備」
ShoMaekawa/ウィル
October 09, 2025
Tweet
Share
More Decks by ShoMaekawa/ウィル
See All by ShoMaekawa/ウィル
2025-03-25Communeデータの魅力&仕事の魅力
shomaekawa
0
370
解説!データ基盤の進化を後押しする手順とタイミング
shomaekawa
1
480
属人化からデータマネジメントをチームで実行するまでの道のり
shomaekawa
2
580
SaaSスタートアップにおけるデータマネジメントの始め方
shomaekawa
2
970
フルスタック一人目データアナリストがデータ基盤を作ったお話
shomaekawa
1
1.1k
BtoBSaaSCS-LightningTalks_CS_Ops立ち上げのアンチパターン5撰
shomaekawa
2
910
オープンエイトの CS Ops事例〜データで顧客を見える化し CS業務を強化する〜
shomaekawa
0
1.4k
Googleデータポータル徹底解剖
shomaekawa
1
260
データ活用する人のための論点整理トレーニング
shomaekawa
1
2.3k
Other Decks in Technology
See All in Technology
AIエージェントを導入する [ 社内ナレッジ活用編 ] / Implement AI agents
glidenote
1
230
これからアウトプットする人たちへ - アウトプットを支える技術 / that support output
soudai
PRO
1
480
ざっくり学ぶ 『エンジニアリングリーダー 技術組織を育てるリーダーシップと セルフマネジメント』 / 50 minute Engineering Leader
iwashi86
9
4.5k
Databricks Free Editionで始めるMLflow
taka_aki
0
800
Snowflake Marketplaceには”PODB”という便利なオープンデータがあってAI Ready対応してるらしいよ/the-snowflake-marketplace-has-a-useful-open-data-source-called-PODB-that-is-apparently-AI-ready
shinyaa31
0
130
今日から使える AWS Step Functions 小技集 / AWS Step Functions Tips
kinunori
4
380
データエンジニアとして生存するために 〜界隈を盛り上げる「お祭り」が必要な理由〜 / data_summit_findy_Session_1
sansan_randd
1
990
Kotlinで型安全にバイテンポラルデータを扱いたい! ReladomoラッパーをAIと実装してみた話
itohiro73
3
280
GTC 2025 : 가속되고 있는 미래
inureyes
PRO
0
160
日本のソブリンAIを支えるエヌビディアの生成AIエコシステム
acceleratedmu3n
0
130
Boxを“使われる場”にする統制と自動化の仕組み
demaecan
0
210
GPUをつかってベクトル検索を扱う手法のお話し~NVIDIA cuVSとCAGRA~
fshuhe
0
390
Featured
See All Featured
Art, The Web, and Tiny UX
lynnandtonic
303
21k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
36
6.1k
Site-Speed That Sticks
csswizardry
13
950
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.3k
How to train your dragon (web standard)
notwaldorf
97
6.3k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.7k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
658
61k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Building a Scalable Design System with Sketch
lauravandoore
463
33k
Into the Great Unknown - MozCon
thekraken
40
2.1k
RailsConf 2023
tenderlove
30
1.3k
Transcript
© Commune Inc. All rights reserved 1 スタートアップにおけるこれからの「データ整備」 Commune Inc.
Data Manager Sho Maekawa 2025/10/08
© Commune Inc. All rights reserved ⾃⼰紹介 Sho Maekawa (X:
@ willanalysts) 2 Communeのデータチームマネージャー。 ex-オープンエイト、ヤフー • 2023年6⽉にコミューンへ⼊社 • Product & Dataチームに所属 ◦ 10名くらいデータ専任が在籍しており、さ らに採⽤中〜 • データ分析エージェントを中⼼に捉えたデータ整 備が最近のメインミッションです。 • 札幌からリモートワークで働いています!
© Commune Inc. All rights reserved 3 Communeの
© Commune Inc. All rights reserved はじめに 4 スタートアップのデータ整備に、ようやく光が⾒えてきた! これまで、スタートアップにおけるデータ整備は「終わりの⾒えない戦い」でした。採⽤を頑張り、コツコ
ツと基盤を作り続けても、活⽤成果が現れるまでのリードタイムと不確実性が⾼かったと思います。データ チームは常にアドホックな依頼に追われ、根本的な改善に着⼿する余裕もない。多くのデータ⼈材が、この 状況に疲弊してきたのではないでしょうか。 2〜3⼈の精鋭チームが分析エージェントを中⼼に、ヒューマン‧イン‧ザ‧ループでデータ整備を回すこ とで、「将来、楽にデータ活⽤できる状態」を実現できるのではないか、と。
© Commune Inc. All rights reserved 分析エージェント:Community Sage 5 ‧チャット形式の分析エージェント
‧チャットシェア機能 ‧SQLコード表⽰機能 ‧グラフ作成サブエージェント ‧Slackバージョンの提供 etc 年内別のデータイベントで開発者のデータサイエンティストが詳しく発表予定
© Commune Inc. All rights reserved コミューンのデータ整備:Community Sageの精度向上に全ベットしていく 6 ヒューマンインザループな改善サイクルを回しています
問い合わせ 振り返り 精度改善 エージェント改善 データモデリング メトリクス辞書 etc データチームへの 問い合わせ
© Commune Inc. All rights reserved コミューンのデータ整備:AIアプリとダッシュボード開発の棲み分け 7 コミューンではデータラボというお客様にデータを活⽤した実験的な機能をクイック にリリースする環境があります。⽬的特化型のダッシュボードやAIアプリを提供して
います。
© Commune Inc. All rights reserved コミューンのデータ整備:AIアプリとダッシュボード開発の棲み分け 8 個別の集計条件 ⽰唆付きの情報
お客様のニーズをヒアリングし、どのお客様にも刺さる王道パターンか個別要件なの かを⾒極めて提供しています。 王道頻出の可視化 指標を並べて探索 使い分け⽅ 個別パターンに対応しなくて良くな りメンテしやすくなる 頻出の情報を何度もクエリしなく て良いのでコスト節約 使い分けのメリット
© Commune Inc. All rights reserved コミューンのデータ整備:BI as Codeなダッシュボード開発 9
コミューンではThoughtspotというBIツールを活⽤しています。ThoughtSpot Modeling Languageで各種オブジェクトをコードベースで管理しています。 ‧dashboardのHELPドキュメントの⾃動⽣成 ‧filterの登録漏れや差分検証 ‧ThoughtSpot側のmetric計算ロジックを抽出理解すること BI as Codeとは従来のようなGUI操作による直感的な操作によるダッシュボード開発ではなく、コードに基づきダッ シュボードを管理運用すること
© Commune Inc. All rights reserved 3~5年未来の「データ整備」: データ分析エージェントを育てられる⼈が1-2⼈いればデータ活⽤ができる世界 10 データ基盤〜データ集計までをエージェントで低コストに構築できるようになり、⼩さ
なスタートアップがデータ専任⼈材をたくさん雇わなくても標準的なデータ活⽤ができ るようになる。 多くのスタートアップや中⼩企業でデータ活⽤が⾏われるようになるかも?
© Commune Inc. All rights reserved 個⼈の⽬標:これから1年間データ整備に集中していきます! 11 ・暗黙知を共有知にすることを徹底し、どこまで仕事が楽になるのかを確かめたい。 ・最小のコストで実現できるデータ活用のあり方をベストプラクティスとしてまとめたい。
・自分たちは楽しくデータマネジメントやデータの民主化を探求し、 単純作業を切り出し新しい雇用を産んでいきたい。 そのために以下のような意識で業務の棚卸しをして行きます。 専門知識の不要な作業の再定義・ 分解 現状のデータ分析業務を洗い出し、 専門知識が不要なタスクを明確に 切り出す。 フレームワークとプロセスの整理 切り出したタスクをマニュアル化し、 AIor誰でも実行でき標準プロセスを 構築。 単純作業の切り出しと雇用創出 マニュアル化できた単純作業を切り 出し、例えば事務職の方の新しい雇 用を生むくらいまで標準化してみた い。
© Commune Inc. All rights reserved 12 3職種募集中(データサイエンティスト、デー タエンジニア、アナリティクスエンジニア) 10/170名ほどデータ⼈材がいて楽しいです!
興味ある⽅は私までDMください〜! @willanalysts
© Commune Inc. All rights reserved 13 実は今、北海道へのデータ⼈材の移住がプチ ブームです! 定期的にデータイベントを開催するので遊びに
来てください!美味しいお店⾏きましょう〜 @willanalysts
© Commune Inc. All rights reserved