Copyright © TIS Inc. All rights reserved.
ESG評価を支える自然言語処理基盤の構築
戦略技術センター
久保隆宏
Copyright © TIS Inc. All rights reserved. 2
Agenda
 ESG投資とは
 ESG評価の課題
 自然言語処理による支援
 課題
Copyright © TIS Inc. All rights reserved. 3
久保隆宏
TIS株式会社 戦略技術センター
 化学系メーカーの業務コンサルタント出身
 既存の技術では業務改善を行える範囲に限界があるとの実感から、戦
略技術センターへと異動
 現在は会計/投資の現場で使える要約の実現を目指し、主にESG投資へ
の活用をテーマに研究中。
自己紹介
チュートリアル講演:深層学習
の判断根拠を理解するための研
究とその意義(@PRMU 2017)
機械学習をシステムに組み込む
際の依存性管理について
(@MANABIYA 2018)
あるべきESG投資の評価に向け
た、自然言語処理の活用
(@CCSE 2019)
Copyright © TIS Inc. All rights reserved. 4
ESG投資とは (1/4)
 E: Environment
 S: Social
 G: Governance
年金積立金管理運用独立行政法人: ESG投資より
売上や利益だけでなく、ESG(=環境/社会/ガバナンス)に関する取り組み
を評価する投資。
Copyright © TIS Inc. All rights reserved. 5
ESG投資とは (2/4)
80兆ドルを超える資産がESGを加味して運用されている(2019年)。
日本の国家予算の約84年分
About the PRI
日本の年金(厚生年金/国民年金)の運用を担うGPIF(年金積立金管理運用独
立行政法人)でもESGを考慮している (参考)。
あなたの年金も、(部分的には)ESG投資で運用されている
ESGを考慮します
という運用機関
ESGが考慮され
た資産運用残高
Copyright © TIS Inc. All rights reserved. 6
ESG投資とは (3/4)
「ESGを考慮する」とは具体的に?
Copyright © TIS Inc. All rights reserved. 7
ESG投資とは (4/4)
 7つの手法がある。
手法名 概要
ネガティブ・スクリーニング ESG評価が低い企業を除外する
ポジティブ・スクリーニング ESG評価が高い企業を組み入れたり、比率を上げる
規範に基づくスクリーニング 国際的な規範に反する企業を除外する
インテグレーション 通常の投資基準(経営方針、財務etc)に+ESGを考慮する
エンゲージメント 投資先との対話/議決権行使でESG活動を促す
テーマ投資 ESGの特定テーマ(気候変動etc)に投資する
インパクト投資 ESに貢献する技術/サービス開発企業へ投資する
手法としてはスクリーニング、イ
ンテグレーションが多い。
いずれにしてもなんらかの「ESG評価」をベースとしている。
Copyright © TIS Inc. All rights reserved. 8
ESG評価の課題 (1/4)
 様々な評価機関がスコアを算出し、公開している。
 MSCI ESG Ratings
 FTSE Russells ESG ratings
 Thomson Reuters Asset4
 これらのスコアをベースにESG投資が行われている。
 (各投資会社が、独自に企業のESGを評価する体力はない。)
 投資パフォーマンスとの関係も、スコアを基に検証されているが・・・
Copyright © TIS Inc. All rights reserved. 9
ESG評価の課題 (2/4)
 各評価機関のスコアに、相関がない(上図はFTSE/MSCIのスコア相関)。
 もちろん評価機関ごとに評価基準は異なる。
 しかし、評価の属人性も見過ごせない要因となっている。
ESG 開示スコアとパフォーマンス
Copyright © TIS Inc. All rights reserved. 10
ESG評価の課題 (3/4)
ESGの取り組みについて書かれた文書(統合報告書)の例(弊社)
数十~百ページ近くあるところもある(×会社数)
これを人が読んで評価(ダブルチェックを行う場合もある)
Copyright © TIS Inc. All rights reserved. 11
ESG評価の課題 (4/4)
 マンパワーのみでESG評価をこなすには限界がある。
 各評価会社には大きな負荷がかかっている。
 企業側も評価のチェックが負担になっている。
 評価漏れなどが多く含まれるため。
 評価のばらつきは、ESG投資自体の存続意義にも関わる。
 機械化により、低コストで一定レベルの評価をできないか?
文書評価のサポート
=自然言語処理の出番!
Copyright © TIS Inc. All rights reserved. 12
自然言語処理による支援
自然言語処理による支援として、以下3点を実施する。
 文書データの収集
 評価対象となる文・段落の絞り込み
 自動評価
支援アプローチの全体像
CSR/統合報告書
有価証券報告書等
文書データの
収集
文書データの
整形・整理
テキスト・データ項目の抽出
PDFのテキスト化等
自然言語処理
モデル
文書データと、フィー
ドバックから学習
+ルール
評価担当者からの
フィードバック
Copyright © TIS Inc. All rights reserved. 13
自然言語処理による支援: 文書データの収集 (1/3)
文書リスト取得
文書取得
XBRL/PDF
メタデータ
年次報告書(有価証券報告書)
の抽出
一覧の取得
文書取得
CSRポータル
サイト
Lambdaで一覧を取得、
各文書はSQSを使い並列で取得、
が基本の流れ(StepFunctionでJOB化)。
Copyright © TIS Inc. All rights reserved. 14
自然言語処理による支援: 文書データの収集 (2/3)
決算書情報・CSR報告書・統合報告書
のメタデータと、決算書数値・株価の
情報をすべて合わせてビュー化。一覧
で見られるように加工。
S3のテーブル化にはGlue Crawler、
ビュー作成にはAthenaを使用。
年次報告書 年次報告書
ビュー
CSR報告書 CSR報告書
ビュー
統合ビュー
決算数値データ
株価データ 年集計株価データ
作成したデータ5年分を、
近日無償公開予定です!
Copyright © TIS Inc. All rights reserved. 15
自然言語処理による支援: 文書データの収集 (3/3)
AWSによるデータ収集基盤構築のあれこれ
 StepFunction or Glue
 データを集める場合はSQSからのLambdaが便利。
 データを見る場合はAthenaが便利。
 S3のファイルを直で見られるが、パーティションでデータを区切りたい
場合、データ型を付与したい場合、Glueのデータカタログが必要。
 Lambdaを呼び出せるStepFunctionか公式ETLのGlueか?
 基本はStepFunctionで構築してGlue Crawlerを呼ぶ方式を採用。
 Crawlerを起動するジョブをStepFunctionから起動する。
 Lambda or ECS
 処理の軽重、使用ライブラリの重さで切り分け。
 稼働監視
 AthenaとCloudWatchを統合できないのが不便(ダブルで見る)。
Copyright © TIS Inc. All rights reserved. 16
自然言語処理による支援:評価対象となる文・段落の絞り込み
プロトタイプを作成し、評価会社様と共同で検証予定。
対象セクターなどを絞り込み中。
Copyright © TIS Inc. All rights reserved. 17
課題 (1/2)
 CSR報告書・統合報告書の収集。
 ESG評価におけるメインの情報源。
 各社各様の場所・仕様で公開しており集めにくい・解析しにくい。
綺麗なレポートよりも解析しやすいレポートを書きましょう!
(ESG評価はレポートの見た目では変わりません!)。
評価担当者はあなたの会社だけ見てるわけではないのです。
Copyright © TIS Inc. All rights reserved. 18
課題 (2/2)
自然言語処理登場までの道のりは長い。
 データ収集
 営業
 プロトタイプ開発
 評価実験(まずルール)
 自然言語処理!!
その辺に転がっているデータで価値が出ることはほぼない。
専門知識なしにアノテーションできることで価値が出ることもあまりない。
自社内にデータがなければ、端正にデータを集めることがスタート地点?
THANK YOU

ESG評価を支える自然言語処理基盤の構築

  • 1.
    Copyright © TISInc. All rights reserved. ESG評価を支える自然言語処理基盤の構築 戦略技術センター 久保隆宏
  • 2.
    Copyright © TISInc. All rights reserved. 2 Agenda  ESG投資とは  ESG評価の課題  自然言語処理による支援  課題
  • 3.
    Copyright © TISInc. All rights reserved. 3 久保隆宏 TIS株式会社 戦略技術センター  化学系メーカーの業務コンサルタント出身  既存の技術では業務改善を行える範囲に限界があるとの実感から、戦 略技術センターへと異動  現在は会計/投資の現場で使える要約の実現を目指し、主にESG投資へ の活用をテーマに研究中。 自己紹介 チュートリアル講演:深層学習 の判断根拠を理解するための研 究とその意義(@PRMU 2017) 機械学習をシステムに組み込む 際の依存性管理について (@MANABIYA 2018) あるべきESG投資の評価に向け た、自然言語処理の活用 (@CCSE 2019)
  • 4.
    Copyright © TISInc. All rights reserved. 4 ESG投資とは (1/4)  E: Environment  S: Social  G: Governance 年金積立金管理運用独立行政法人: ESG投資より 売上や利益だけでなく、ESG(=環境/社会/ガバナンス)に関する取り組み を評価する投資。
  • 5.
    Copyright © TISInc. All rights reserved. 5 ESG投資とは (2/4) 80兆ドルを超える資産がESGを加味して運用されている(2019年)。 日本の国家予算の約84年分 About the PRI 日本の年金(厚生年金/国民年金)の運用を担うGPIF(年金積立金管理運用独 立行政法人)でもESGを考慮している (参考)。 あなたの年金も、(部分的には)ESG投資で運用されている ESGを考慮します という運用機関 ESGが考慮され た資産運用残高
  • 6.
    Copyright © TISInc. All rights reserved. 6 ESG投資とは (3/4) 「ESGを考慮する」とは具体的に?
  • 7.
    Copyright © TISInc. All rights reserved. 7 ESG投資とは (4/4)  7つの手法がある。 手法名 概要 ネガティブ・スクリーニング ESG評価が低い企業を除外する ポジティブ・スクリーニング ESG評価が高い企業を組み入れたり、比率を上げる 規範に基づくスクリーニング 国際的な規範に反する企業を除外する インテグレーション 通常の投資基準(経営方針、財務etc)に+ESGを考慮する エンゲージメント 投資先との対話/議決権行使でESG活動を促す テーマ投資 ESGの特定テーマ(気候変動etc)に投資する インパクト投資 ESに貢献する技術/サービス開発企業へ投資する 手法としてはスクリーニング、イ ンテグレーションが多い。 いずれにしてもなんらかの「ESG評価」をベースとしている。
  • 8.
    Copyright © TISInc. All rights reserved. 8 ESG評価の課題 (1/4)  様々な評価機関がスコアを算出し、公開している。  MSCI ESG Ratings  FTSE Russells ESG ratings  Thomson Reuters Asset4  これらのスコアをベースにESG投資が行われている。  (各投資会社が、独自に企業のESGを評価する体力はない。)  投資パフォーマンスとの関係も、スコアを基に検証されているが・・・
  • 9.
    Copyright © TISInc. All rights reserved. 9 ESG評価の課題 (2/4)  各評価機関のスコアに、相関がない(上図はFTSE/MSCIのスコア相関)。  もちろん評価機関ごとに評価基準は異なる。  しかし、評価の属人性も見過ごせない要因となっている。 ESG 開示スコアとパフォーマンス
  • 10.
    Copyright © TISInc. All rights reserved. 10 ESG評価の課題 (3/4) ESGの取り組みについて書かれた文書(統合報告書)の例(弊社) 数十~百ページ近くあるところもある(×会社数) これを人が読んで評価(ダブルチェックを行う場合もある)
  • 11.
    Copyright © TISInc. All rights reserved. 11 ESG評価の課題 (4/4)  マンパワーのみでESG評価をこなすには限界がある。  各評価会社には大きな負荷がかかっている。  企業側も評価のチェックが負担になっている。  評価漏れなどが多く含まれるため。  評価のばらつきは、ESG投資自体の存続意義にも関わる。  機械化により、低コストで一定レベルの評価をできないか? 文書評価のサポート =自然言語処理の出番!
  • 12.
    Copyright © TISInc. All rights reserved. 12 自然言語処理による支援 自然言語処理による支援として、以下3点を実施する。  文書データの収集  評価対象となる文・段落の絞り込み  自動評価 支援アプローチの全体像 CSR/統合報告書 有価証券報告書等 文書データの 収集 文書データの 整形・整理 テキスト・データ項目の抽出 PDFのテキスト化等 自然言語処理 モデル 文書データと、フィー ドバックから学習 +ルール 評価担当者からの フィードバック
  • 13.
    Copyright © TISInc. All rights reserved. 13 自然言語処理による支援: 文書データの収集 (1/3) 文書リスト取得 文書取得 XBRL/PDF メタデータ 年次報告書(有価証券報告書) の抽出 一覧の取得 文書取得 CSRポータル サイト Lambdaで一覧を取得、 各文書はSQSを使い並列で取得、 が基本の流れ(StepFunctionでJOB化)。
  • 14.
    Copyright © TISInc. All rights reserved. 14 自然言語処理による支援: 文書データの収集 (2/3) 決算書情報・CSR報告書・統合報告書 のメタデータと、決算書数値・株価の 情報をすべて合わせてビュー化。一覧 で見られるように加工。 S3のテーブル化にはGlue Crawler、 ビュー作成にはAthenaを使用。 年次報告書 年次報告書 ビュー CSR報告書 CSR報告書 ビュー 統合ビュー 決算数値データ 株価データ 年集計株価データ 作成したデータ5年分を、 近日無償公開予定です!
  • 15.
    Copyright © TISInc. All rights reserved. 15 自然言語処理による支援: 文書データの収集 (3/3) AWSによるデータ収集基盤構築のあれこれ  StepFunction or Glue  データを集める場合はSQSからのLambdaが便利。  データを見る場合はAthenaが便利。  S3のファイルを直で見られるが、パーティションでデータを区切りたい 場合、データ型を付与したい場合、Glueのデータカタログが必要。  Lambdaを呼び出せるStepFunctionか公式ETLのGlueか?  基本はStepFunctionで構築してGlue Crawlerを呼ぶ方式を採用。  Crawlerを起動するジョブをStepFunctionから起動する。  Lambda or ECS  処理の軽重、使用ライブラリの重さで切り分け。  稼働監視  AthenaとCloudWatchを統合できないのが不便(ダブルで見る)。
  • 16.
    Copyright © TISInc. All rights reserved. 16 自然言語処理による支援:評価対象となる文・段落の絞り込み プロトタイプを作成し、評価会社様と共同で検証予定。 対象セクターなどを絞り込み中。
  • 17.
    Copyright © TISInc. All rights reserved. 17 課題 (1/2)  CSR報告書・統合報告書の収集。  ESG評価におけるメインの情報源。  各社各様の場所・仕様で公開しており集めにくい・解析しにくい。 綺麗なレポートよりも解析しやすいレポートを書きましょう! (ESG評価はレポートの見た目では変わりません!)。 評価担当者はあなたの会社だけ見てるわけではないのです。
  • 18.
    Copyright © TISInc. All rights reserved. 18 課題 (2/2) 自然言語処理登場までの道のりは長い。  データ収集  営業  プロトタイプ開発  評価実験(まずルール)  自然言語処理!! その辺に転がっているデータで価値が出ることはほぼない。 専門知識なしにアノテーションできることで価値が出ることもあまりない。 自社内にデータがなければ、端正にデータを集めることがスタート地点?
  • 19.