内容紹介
現実のデータマイニング事例をRで分析する!!
本書は、大量データを解析するデータマイニングについて、理論の基礎から解析手法まで、Rを使ったアルゴリズムの例題を交えてていねいに解説します。主な構成は、第1部でRを使ったデータマンニングの簡単な分析と探索的データ解析およびデータの可視化について解説、第2部でデータマイニングの一連の流れについて解説、第3部でRを使った、データマイニング手法をサンプルデータでコードを示して解説、現実のデータマイニング事例を紹介という流れで解説します。
このような方におすすめ
Rでデータマイニングを実行してみたい人
データ分析部門の企業内テキストとして
目次
主要目次
第I部 R を使ったデータマイニングの準備
第1章 R によるデータ解析入門
第2章 データマイニングとは
第II部 データマイニング手法
第3章 回帰分析
第4章 ロジスティック回帰分析
第5章 決定木分析
第6章 サポートベクターマシン(SVM)
第7章 記憶ベース推論
第8章 クラスター分析
第9章 自己組織化マップ(SOM)
第10章 主成分分析
第11章 対応分析
第12章 アソシエーションルール
第III部 データマイニングの実践例
第13章 複数の手法による予測の評価
第14章 株価データを用いた総合指標の作成
第15章 SNSデータの分析
詳細目次
はじめに
第I部 R を使ったデータマイニングの準備
第1章 R によるデータ解析入門
1.1 R およびRStudio のインストール
1.2 RStudio の基本操作
1.3 R 言語入門
1.3.1 電卓としての使い方
1.3.2 ベクトル――R におけるデータ構造の基本
1.3.3 ベクトルの変数への代入と演算
1.3.4 配列と行列
1.3.5 因子型
1.3.6 リスト
1.3.7 データフレーム
1.4 外部データの取り込み
1.5 データの要約
1.6 パッケージのインストール
1.7 dplyr パッケージによるデータフレームの操作
1.8 データの可視化
1.8.1 棒グラフ
1.8.2 ヒストグラム
1.8.3 箱ひげ図
1.8.4 散布図
1.8.5 層別のプロット
第2章 データマイニングとは
2.1 ビッグデータとデータサイエンス
2.2 CRISP-DM
2.2.1 ビジネスの理解
2.2.2 データの理解
2.2.3 データの準備
2.2.4 モデリング
2.2.5 評価
2.2.6 適用
2.3 データマイニング手法
2.3.1 データの種類とモデリング
2.3.2 予測と判別
2.3.3 分類・クラスタリング
2.3.4 次元縮約
2.3.5 ルールの発見
第II部 データマイニング手法
第3章 回帰分析
3.1 単回帰分析
3.2 重回帰分析
第4章 ロジスティック回帰分析
4.1 データの準備
4.2 1 つの説明変数を用いた予測
4.3 2 つ以上の説明変数を用いた予測
第5章 決定木分析
5.1 分類木を用いた判別
5.2 回帰木を用いた予測
第6章 サポートベクターマシン(SVM)
6.1 サポートベクターマシンとは
6.2 カテゴリー予測の例
6.3 数値予測の例
第7章 記憶ベース推論
7.1 k 近傍法とは
7.2 変数の基準化と標準化
第8章 クラスター分析
8.1 クラスター分析とは
8.2 階層型クラスター分析
8.3 階層型クラスター分析の実行
8.4 可視化の工夫
8.5 非階層型クラスター分析
8.6 非階層型クラスター分析の実行
第9章 自己組織化マップ(SOM)
9.1 自己組織化マップとは
9.2 自己組織化マップによる分析例
9.3 自己組織化マップによる分類
第10章 主成分分析
10.1 主成分分析とは
10.2 対象とするデータの準備
10.3 主成分分析の実行
第11章 対応分析
11.1 対応分析
11.2 多重対応分析
第12章 アソシエーションルール分析
12.1 アソシエーションルールとその評価指標
12.2 アソシエーションルール分析の実例
12.3 アソシエーションルール分析の応用例
第III部 データマイニングの実践例
第13章 複数の手法による予測の評価
13.1 予測の評価のためのデータ
13.2 判別の手法によるカテゴリー予測の比較
13.2.1 ロジスティック回帰分析
13.2.2 決定木分析
13.2.3 サポートベクターマシン
13.3 数値予測の手法による比較
13.3.1 重回帰分析
13.3.2 決定木分析
13.3.3 サポートベクターマシン
第14章 株価データを用いた総合指標の作成
14.1 株価データの取得
14.2 株価データから総合指標の作成
第15章 SNS データの分析
15.1 Twitter API とOAuth
15.2 R によるツイートの取得
15.3 形態素解析
15.4 ワードクラウド
15.5 ネットワーク分析
索 引
続きを見る