More Related Content
PDF
PDF
Data-Centric AI開発における データ生成の取り組み PDF
コーポレートミッションを絵に描いた餅にしないために.pdf PDF
SSII2022 [OS3-01] 深層学習のための効率的なデータ収集と活用 PDF
Teslaにおけるコンピュータビジョン技術の調査 (2) PPTX
初学者のためのプロンプトエンジニアリング実践.pptx PPTX
PDF
What's hot
PDF
PPTX
信頼できるAIシステム開発の勘どころ ~AI開発方法論×AI品質保証~(NTTデータ テクノロジーカンファレンス 2020 発表資料) PDF
トップエンジニアが実践する思考整理法~テクニカルライティングを用いた課題解決の基本 PDF
ブレインパッドにおける機械学習プロジェクトの進め方 PDF
PPTX
エンタープライズアジャイルを阻む組織やプロセスと、その処方 PDF
PDF
PDF
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング PDF
(修正)機械学習デザインパターン(ML Design Patterns)の解説 PDF
ソフトウェア アーキテクチャ基礎 輪読会資料 第2章 アーキテクチャ思考 PDF
パターン QA to AQ: 伝統的品質保証(Quality Assurance)からアジャイル品質(Agile Quality)へ PDF
機械学習システムを受託開発 する時に気をつけておきたい事 PDF
PDF
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈 PDF
PDF
PPTX
PPTX
深層強化学習による自動運転車両の経路探索に関する研究 PPTX
世界と事例から学ぶ、プロダクトオーナーの「素養」としてのアジャイルメトリクス More from Takahiro Kubo
PDF
あるべきESG投資の評価に向けた、自然言語処理の活用 PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
Reinforcement Learning Inside Business PDF
PDF
PDF
TISにおける、研究開発の方針とメソッド 2018 PDF
arXivTimes Review: 2019年前半で印象に残った論文を振り返る PDF
PDF
Curiosity may drives your output routine. PPTX
PDF
画像認識モデルを自動的に作る。1日以内に。~Simple And Efficient Architecture Search for Convolutio... PDF
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章 PDF
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して ESG評価を支える自然言語処理基盤の構築
- 1.
Copyright © TISInc. All rights reserved.
ESG評価を支える自然言語処理基盤の構築
戦略技術センター
久保隆宏
- 2.
Copyright © TISInc. All rights reserved. 2
Agenda
ESG投資とは
ESG評価の課題
自然言語処理による支援
課題
- 3.
Copyright © TISInc. All rights reserved. 3
久保隆宏
TIS株式会社 戦略技術センター
化学系メーカーの業務コンサルタント出身
既存の技術では業務改善を行える範囲に限界があるとの実感から、戦
略技術センターへと異動
現在は会計/投資の現場で使える要約の実現を目指し、主にESG投資へ
の活用をテーマに研究中。
自己紹介
チュートリアル講演:深層学習
の判断根拠を理解するための研
究とその意義(@PRMU 2017)
機械学習をシステムに組み込む
際の依存性管理について
(@MANABIYA 2018)
あるべきESG投資の評価に向け
た、自然言語処理の活用
(@CCSE 2019)
- 4.
Copyright © TISInc. All rights reserved. 4
ESG投資とは (1/4)
E: Environment
S: Social
G: Governance
年金積立金管理運用独立行政法人: ESG投資より
売上や利益だけでなく、ESG(=環境/社会/ガバナンス)に関する取り組み
を評価する投資。
- 5.
Copyright © TISInc. All rights reserved. 5
ESG投資とは (2/4)
80兆ドルを超える資産がESGを加味して運用されている(2019年)。
日本の国家予算の約84年分
About the PRI
日本の年金(厚生年金/国民年金)の運用を担うGPIF(年金積立金管理運用独
立行政法人)でもESGを考慮している (参考)。
あなたの年金も、(部分的には)ESG投資で運用されている
ESGを考慮します
という運用機関
ESGが考慮され
た資産運用残高
- 6.
- 7.
Copyright © TISInc. All rights reserved. 7
ESG投資とは (4/4)
7つの手法がある。
手法名 概要
ネガティブ・スクリーニング ESG評価が低い企業を除外する
ポジティブ・スクリーニング ESG評価が高い企業を組み入れたり、比率を上げる
規範に基づくスクリーニング 国際的な規範に反する企業を除外する
インテグレーション 通常の投資基準(経営方針、財務etc)に+ESGを考慮する
エンゲージメント 投資先との対話/議決権行使でESG活動を促す
テーマ投資 ESGの特定テーマ(気候変動etc)に投資する
インパクト投資 ESに貢献する技術/サービス開発企業へ投資する
手法としてはスクリーニング、イ
ンテグレーションが多い。
いずれにしてもなんらかの「ESG評価」をベースとしている。
- 8.
Copyright © TISInc. All rights reserved. 8
ESG評価の課題 (1/4)
様々な評価機関がスコアを算出し、公開している。
MSCI ESG Ratings
FTSE Russells ESG ratings
Thomson Reuters Asset4
これらのスコアをベースにESG投資が行われている。
(各投資会社が、独自に企業のESGを評価する体力はない。)
投資パフォーマンスとの関係も、スコアを基に検証されているが・・・
- 9.
Copyright © TISInc. All rights reserved. 9
ESG評価の課題 (2/4)
各評価機関のスコアに、相関がない(上図はFTSE/MSCIのスコア相関)。
もちろん評価機関ごとに評価基準は異なる。
しかし、評価の属人性も見過ごせない要因となっている。
ESG 開示スコアとパフォーマンス
- 10.
Copyright © TISInc. All rights reserved. 10
ESG評価の課題 (3/4)
ESGの取り組みについて書かれた文書(統合報告書)の例(弊社)
数十~百ページ近くあるところもある(×会社数)
これを人が読んで評価(ダブルチェックを行う場合もある)
- 11.
Copyright © TISInc. All rights reserved. 11
ESG評価の課題 (4/4)
マンパワーのみでESG評価をこなすには限界がある。
各評価会社には大きな負荷がかかっている。
企業側も評価のチェックが負担になっている。
評価漏れなどが多く含まれるため。
評価のばらつきは、ESG投資自体の存続意義にも関わる。
機械化により、低コストで一定レベルの評価をできないか?
文書評価のサポート
=自然言語処理の出番!
- 12.
Copyright © TISInc. All rights reserved. 12
自然言語処理による支援
自然言語処理による支援として、以下3点を実施する。
文書データの収集
評価対象となる文・段落の絞り込み
自動評価
支援アプローチの全体像
CSR/統合報告書
有価証券報告書等
文書データの
収集
文書データの
整形・整理
テキスト・データ項目の抽出
PDFのテキスト化等
自然言語処理
モデル
文書データと、フィー
ドバックから学習
+ルール
評価担当者からの
フィードバック
- 13.
Copyright © TISInc. All rights reserved. 13
自然言語処理による支援: 文書データの収集 (1/3)
文書リスト取得
文書取得
XBRL/PDF
メタデータ
年次報告書(有価証券報告書)
の抽出
一覧の取得
文書取得
CSRポータル
サイト
Lambdaで一覧を取得、
各文書はSQSを使い並列で取得、
が基本の流れ(StepFunctionでJOB化)。
- 14.
Copyright © TISInc. All rights reserved. 14
自然言語処理による支援: 文書データの収集 (2/3)
決算書情報・CSR報告書・統合報告書
のメタデータと、決算書数値・株価の
情報をすべて合わせてビュー化。一覧
で見られるように加工。
S3のテーブル化にはGlue Crawler、
ビュー作成にはAthenaを使用。
年次報告書 年次報告書
ビュー
CSR報告書 CSR報告書
ビュー
統合ビュー
決算数値データ
株価データ 年集計株価データ
作成したデータ5年分を、
近日無償公開予定です!
- 15.
Copyright © TISInc. All rights reserved. 15
自然言語処理による支援: 文書データの収集 (3/3)
AWSによるデータ収集基盤構築のあれこれ
StepFunction or Glue
データを集める場合はSQSからのLambdaが便利。
データを見る場合はAthenaが便利。
S3のファイルを直で見られるが、パーティションでデータを区切りたい
場合、データ型を付与したい場合、Glueのデータカタログが必要。
Lambdaを呼び出せるStepFunctionか公式ETLのGlueか?
基本はStepFunctionで構築してGlue Crawlerを呼ぶ方式を採用。
Crawlerを起動するジョブをStepFunctionから起動する。
Lambda or ECS
処理の軽重、使用ライブラリの重さで切り分け。
稼働監視
AthenaとCloudWatchを統合できないのが不便(ダブルで見る)。
- 16.
Copyright © TISInc. All rights reserved. 16
自然言語処理による支援:評価対象となる文・段落の絞り込み
プロトタイプを作成し、評価会社様と共同で検証予定。
対象セクターなどを絞り込み中。
- 17.
Copyright © TISInc. All rights reserved. 17
課題 (1/2)
CSR報告書・統合報告書の収集。
ESG評価におけるメインの情報源。
各社各様の場所・仕様で公開しており集めにくい・解析しにくい。
綺麗なレポートよりも解析しやすいレポートを書きましょう!
(ESG評価はレポートの見た目では変わりません!)。
評価担当者はあなたの会社だけ見てるわけではないのです。
- 18.
Copyright © TISInc. All rights reserved. 18
課題 (2/2)
自然言語処理登場までの道のりは長い。
データ収集
営業
プロトタイプ開発
評価実験(まずルール)
自然言語処理!!
その辺に転がっているデータで価値が出ることはほぼない。
専門知識なしにアノテーションできることで価値が出ることもあまりない。
自社内にデータがなければ、端正にデータを集めることがスタート地点?
- 19.