内容紹介
ベイジアンネットワークの知識と実践がわかる
ベイジアンネットワークは変数間の依存関係を確率によって表示した確率的グラフィカルモデルで、原因と結果の関係性を確率的に、またグラフィカルに示すことができるため、近年注目されています。
本書ではベイジアンネットワークの基本的な知識と、実際に実務の現場でどのようにベイジアンネットワークが使われているかの実践例を説明します。BayoLinkSというソフトウェア(体験版)を用いた実際の分析方法も紹介しています。
〈執筆者一覧〉(五十音順)
小野 義之
北村 章
阪井 尚樹
佐藤 雅哉
鈴木 聖一
野守 耕爾
本村 陽一
安松 健
株式会社NTTデータ数理システム
このような方におすすめ
◎データ分析を行う若手エンジニア
◯情報科学を学ぶ大学生
目次
主要目次
第1章 モデル化すると何がよいのか
第2章 ベイジアンネットワークとは
第3章 ベイジアンネットワークをBayoLinkS で体験しよう
第4章 思考力を拡張させるベイジアンネットワーク
第5章 ベイジアンネットワークでID-POS データから顧客行動を分析する
第6章 テキストデータにおけるベイジアンネットワーク
第7章 ベイジアンネットワーク×予測モデル化によるデータアクティベーション
第8章 因果連鎖分析とベイジアンネットワーク
第9章 医療分野におけるベイジアンネットワークの応用
第10章 ベイジアンネットワークによる製造情報論の実現
第11章 ベイジアンネットワークの理論
第12章 ベイジアンネットワークによるモデリング
詳細目次
第1章 モデル化すると何がよいのか
1.1 モデル化することは世の中をよく理解するアプローチ
1.2 確率的に世の中を理解すると何がいいのか
1.3 条件付き確率とはなんだろうか
1.4 機械学習で条件付き確率をモデル化できる
参考文献
第2章 ベイジアンネットワークとは
2.1 条件付き確率を利用してシミュレーションもできるベイジアンネットワーク
2.2 ベイジアンネットワークの特徴
2.3 ここまでのまとめ
第3章 ベイジアンネットワークをBayoLinkS で体験しよう
3.1 BayoLinkS とは
3.1.1 BayoLinkS の概要
3.1.2 BayoLinkS とサンプルデータの入手方法
3.1.3 BayoLinkS の起動と画面構成
3.1.4 BayoLinkS の主要機能
3.2 ベイジアンネットワークで確率推論してみよう
3.2.1 確率推論の実行
3.2.2 モデルの中をのぞいてみよう
3.3 ベイジアンネットワークを作ってみよう
3.3.1 ベイジアンネットワークの構築
3.3.2 確率推論
3.4 例題に挑戦してみよう
3.4.1 例題:仕事満足度調査
3.4.2 ベイジアンネットワークの構築
3.4.3 確率推論
第4章 思考力を拡張させるベイジアンネットワーク
4.1 私たちの知的能力とはなにか―自分の思考力を拡張させる―
4.1.1 知的能力とは:記憶と思考力
4.1.2 道具を使って能力を拡張する
4.2 人の思考力の特徴を理解する①―数値データとカテゴリカルデータ―
4.2.1 ベイジアンネットワークと数値データ
4.2.2 人は数値データをどのように思考しているか
4.2.3 数値をカテゴリカルデータに変換する
4.2.4 生年月日の情報を離散化する
4.3 人の思考力の特徴を理解する②―複雑なネットワーク構造―
4.3.1 交互作用は単純ではない組合せ:意思決定の綱引き
4.4 データ活用の共通課題
4.4.1 ビッグデータの時代でもほとんどのデータはない
4.4.2 人はどのようにしているのか
4.4.3 代理変数を見いだすには
4.4.4 人の能力をベイジアンネットワークに活かす
4.5 思考力を拡張させる三つのポイント
4.5.1 無茶ぶりしない、自分の考えを押し付けない
4.5.2 単純構造で人を理解しようとしない
4.5.3 じっくり話し合う、向き合う、学び合う
4.5.4 戦略的に右往左往する!
参考文献
第5章 ベイジアンネットワークでID-POS データから顧客行動を分析する
5.1 ID-POS 分析におけるベイジアンネットワークの活用
5.1.1 ID-POS 分析とは―POS 分析との違い
5.1.2 ID-POS 分析におけるベイジアンネットワークの活用
5.1.3 BayoLinkS による ID-POS 分析の併売分析への応用
5.1.4 ID-POS 分析の併売分析からベイジアンネットワークによる併売分析へ
5.2 ID-POS 分析の併売分析へのBayoLinkS の実践的な導入手法
5.2.1 親子関係の抽出と確率推論手法
5.2.2 ID-POS 分析特有の購入頻度の活用手法
5.3 棚割り改善によるベイジアンネットワークのマーチャンダイジングへの活用
5.3.1 ID-POS 分析へのベイジアンネットワークの適用領域について
5.3.2 棚割り改善が最重要かつ最適、製販配の集約点
5.3.3 補足
第6章 テキストデータにおけるベイジアンネットワーク
6.1 はじめに
6.2 テキストデータの分析と活用
6.2.1 テキストデータを分析することの意義
6.2.2 テキストマイニングという分析手法
6.2.3 大規模言語モデルの登場
6.2.4 大規模言語モデルとテキストマイニングの位置づけ
6.2.5 大規模言語モデルとテキストマイニングの組み合わせ術
6.3 テキストデータの分析に適用するベイジアンネットワークの可能性
6.3.1 テキストマイニングにベイジアンネットワークを適用するメリット
6.3.2 テキストマイニング×ベイジアンネットワークのモデル化の方法と限界
6.3.3 トピックモデルのクラスタリングを応用したモデル化
6.4 テキストマイニング×トピックモデル×ベイジアンネットワークによるテキストデータの分析手法:Nomolytics
6.4.1 Nomolytics の分析手法の概要
6.4.2 PLSA の理論の概要
6.4.3 Nomolytics の各手法の連携における工夫
6.5 テキストデータにベイジアンネットワークを適用したモデル構築例
6.5.1 自由記述付アンケートデータへの適用
6.5.2 ユーザレビューデータへの適用
6.5.3 コールセンターの問合せ履歴データへの適用
6.5.4 特許文書データへの適用
6.6 特許文書データにベイジアンネットワークを適用した用途と技術の関係分析の事例
6.6.1 分析の趣旨
6.6.2 分析で用いるデータ
6.6.3 用途と技術のトピックの抽出
6.6.4 抽出されたトピックの結果
6.6.5 トピックのスコアリング
6.6.6 トピックを用いた競合他社の分析
6.6.7 ベイジアンネットワークを適用した用途と技術の関係分析
6.6.8 用途⇒技術の関係分析
6.6.9 技術⇒用途の関係分析
6.6.10 特許文書データの分析事例のまとめ
6.7 おわりに
6.7.1 心得 1:結果をミスリードしないための手法の理解
6.7.2 心得 2:問題解決におけるモデル化という行為の位置づけの理解
参考文献
第7章 ベイジアンネットワーク×予測モデル化によるデータアクティベーション
7.1 ビジネス×データアクティベーションの実現に向けて
7.1.1 データアクティベーションを目指す
7.1.2 実現するための障壁・難しさ、事例を知る大切さ
7.1.3 ロードマップ(ストーリー)を描く
7.1.4 アクションにつなげる予測モデル化の進め方
7.2 ベイジアンネットワークを使った「予測モデル化」の事例を知ろう
7.2.1 なぜ予測が必要なのか―予測モデルが活かせるビジネス課題
7.2.2 マーケティング分野において「施策反応」を予測する効率化アプローチの事例
7.2.3 契約型ビジネスにおいて「リスク」を予測する抑制アプローチの事例
7.2.4 人事分野において「離職・活躍など」を予測するデータドリブンの高度化事例
7.3 予測モデル化だけでなく、新たな要素との組み合わせにチャレンジしよう
7.3.1 新たな要素との組み合わせ展開
7.3.2 外部データ基盤(Ponta データ基盤)と組み合わせた新規客獲得の高度化事例
7.3.3 分類モデルと組み合わせた、多種データの変数化事例
7.3.4 数理最適化手法と組み合わせた利益最大化の事例
7.4 今後の展望
第8章 因果連鎖分析とベイジアンネットワーク
8.1 データ分析者の悩み
8.2 因果連鎖分析の適用事例
8.3 課題設定の重要性
8.4 因果連鎖分析とは
8.4.1 基本的な考え方
8.4.2 因果連鎖図とGraphviz
8.4.3 因果連鎖図の推奨記述ルール
8.4.4 因果連鎖分析の効果と留意点
8.4.5 因果連鎖分析の流れ
8.4.6 ヒアリングによる暗黙知の可視化
8.4.7 因果連鎖分析を適用する場面
8.5 因果連鎖分析の例
8.6 ベイジアンネットワークの利用方法
8.7 おわりに
第9章 医療分野におけるベイジアンネットワークの応用
9.1 医療分野にベイジアンネットワークを適用する理由
9.1.1 変数への重み付けを行う機械学習手法
9.1.2 尤度をモデル化するベイジアンネットワーク
9.2 ベイジアンネットワークを用いた治療効果のシミュレーション
9.2.1 慢性疾患に対する治療効果をシミュレーションする
9.2.2 急性疾患に対する治療や処置の効果をシミュレーションする
9.3 おわりに
参考文献
第10章 ベイジアンネットワークによる製造情報論の実現
10.1 はじめに
10.2 石油精製プロセスのリアルタイムリスクアセスメント
10.2.1 事故予兆分析システムの概要
10.2.2 ヒヤリハット報告書
10.2.3 ベイジアンネットワークによる確率推論のためのデータベース
10.2.4 ベイジアンネットワークによる事故の予兆分析実験
10.2.5 事故シナリオ作成とリスクアセスメントシステム
10.3 液晶ディスプレイ製造工程の不良分析システム
10.3.1 TFT の概要
10.3.2 不良原因分析システムの概要
10.3.3 SVM による原因種別判別モデルによる類似従来不良の特定
10.3.4 オントロジーを用いた情報の体系化とその活用
10.3.5 決定木を用いた離散化処理による局所的特徴選択
10.3.6 不良原因探索支援システムの適用実験と評価
10.4 まとめ
参考文献
第11章 ベイジアンネットワークの理論
11.1 同時確率と条件付き確率
11.1.1 確率の計算
11.1.2 同時確率と条件付き確率
11.1.3 確率変数と確率分布
11.1.4 同時確率分布と条件付き確率分布
11.2 ベイズの定理
11.2.1 ベイズ確率
11.2.2 ベイズの定理
11.2.3 ベイズ的な解釈
11.2.4 確率推論(ベイズ推論)
11.3 ベイジアンネットワークと確率推論
11.3.1 ベイジアンネットワークの確率推論
11.4 確率推論の近似計算
11.4.1 確率推論の計算式
11.4.2 複雑なネットワークでの確率推論(確率推論アルゴリズム)
参考文献
第12章 ベイジアンネットワークによるモデリング
―人とベイジアンネットワークの協働に向けて―
12.1 現象をモデリングするとは
12.2 リアルワールドデータを学習するために人の知識を使う
12.2.1 なぜ人の能力が重要なのか
12.2.2 人の知識を使うにはどうすればいいか
12.3 BayoLinkSではどのように構造学習しているか
12.3.1 評価スコアについて
12.3.2 ネットワークの評価方法(ML、AICとMDL)
12.3.3 ノードの順序について
12.3.4 感度分析について
12.4 BayoLinkSの発展的な使い方―人とBayoLinkSの相互作用
発展 広く使える情報量規準
1 ベイズ推論の枠組みと学習理論
1.1 予測と発見
1.2 ベイズ推論の学習理論
2 学習理論と情報量規準
2.1 従来の情報量規準:正則学習理論とAIC/BIC
2.2 新しい情報量規準:特異学習理論とWAIC/WBIC
3 まとめ
参考文献
続きを見る