内容紹介
Rでデータの扱い方から多変量解析まで理解することができる!
データ解析者にとって、統計学の理論は重要だが、それ以上に重要なのは、抱えている目的を解決するために、なんらかの統計解析手法を適用し、結果を求めることである。本書はRのインストールからデータの取り扱い方、操作方法、結果の見方、さらにRのエラーの対処方法など、Rでデータを解析していくうえで必要なことを解説する。
このような方におすすめ
統計学を学ぶ学生
企業のマーケティング・情報企画部門
目次
主要目次
第1章 Rを使ってみる
第2章 データの取り扱い方
第3章 一変量統計
第4章 二変量統計
第5章 検定と推定
第6章 多変量解析
第7章 統合化された関数を利用する
第8章 データ分析の例
付録A Rの解説
付録B Rの参考図書など
詳細目次
はじめに
目次
第1章 Rを使ってみる
1.1 必要なファイルをダウンロードする
1.2 Rのインストール
1.2.1 Mac OS Xの場合
1.2.2 Windowsの場合
1.3 Rを起動し終了する
1.4 Rの環境設定をする
1.5 パッケージを利用する
1.6 オンラインヘルプを使う
1.7 作業ディレクトリを変える
1.8 エディタを使う
第2章 データの取り扱い方
2.1 Rで扱うデータ
2.2 データファイルを準備する
2.3 R以外のソフトウェアで作成されたファイルを読み込む
2.3.1 Excelのワークシートファイルを読み込む
2.3.2 SPSSのシステムファイルを読み込む
2.4 データファイルを読み込む
2.4.1 タブなどで区切られたデータファイルを読み込む
2.4.2 タブなどで区切られていないデータファイルを読み込む
2.5 データフレームの変数を使う
2.6 データのチェックを行う
2.7 データの修正などを行う
2.8 カテゴリー変数を定義する
2.8.1 数値で入力されたカテゴリーデータを定義する
2.8.2 カテゴリーの定義順序を変える
2.9 連続変数をカテゴリー化する
2.10 カテゴリー変数を再カテゴリー化する
2.11 新しい変数を作る
2.12 新しいデータフレームを作る
2.12.1 変数を抽出して新しいデータフレームを作る
2.12.2 ケースを抽出して新しいデータフレームを作る
2.12.3 データフレームを分割する
2.13 複数のデータフレームを結合する
2.13.1 ケースを結合する
2.13.2 変数を結合する
2.14 データを並べ替える
2.15 そのほかのデータ操作
2.15.1 グループ別データリストをデータフレーム形式で表す
2.15.2 対応のあるデータを2通りのデータフレーム形式で表す
2.15.3 繰り返される測定結果を2通りのデータフレーム形式で表す
2.15.4 分割表から元のデータを復元する
2.15.5 特定の平均値,標準偏差,相関係数を持つデータを生成する
2.16 ファイルに保存する
2.16.1 write.table関数とread.table関数を使う
2.16.2 save関数とload関数を使う
第3章 一変量統計
3.1 データを要約する
3.1.1 グループ別にデータを要約する
3.2 基本統計量を求める
3.2.1 統計関数を使いやすくする
3.2.2 複数の変数の基本統計量を求める
3.2.3 グループ別に基本統計量を求める
3.2.4 グループ別に複数の変数の基本統計量を求める
3.3 度数分布表を作る
3.3.1 table関数を使う
3.3.2 度数分布表を作る関数を定義する
3.3.3 度数分布表を簡単に作る
3.3.4 複数の変数の度数分布表を作る
3.3.5 グループ別に度数分布表を作る
3.4 度数分布図を描く
3.4.1 複数の変数の度数分布図を描く
3.4.2 グループ別に度数分布図を描く
3.4.3 グループ別にデータの分布状況を示す
第4章 二変量統計
4.1 クロス集計表を作る
4.1.1 二重クロス集計表を作る
4.1.2 三重以上のクロス集計表を作る
4.2 相関係数を求める
4.2.1 二変数間の相関係数を求める
4.2.2 グループ別に二変数間の相関係数を求める
4.2.3 複数の変数間の相関係数を求める
4.2.4 グループ別に複数の変数間の相関係数を求める
4.3 二変数の関係を図に表す
4.3.1 二変数の散布図を描く
4.3.2 グループ別に二変数の散布図を描く
4.3.3 複数の変数の散布図を描く
第5章 検定と推定
5.1 比率の差の検定
5.2 独立性の検定
5.2.1 2分布を利用する検定(2検定)
5.2.2 フィッシャーの正確検定
5.3 平均値の差の検定(パラメトリック検定)
5.3.1 独立2標本の場合:t検定
5.3.2 独立k標本の場合:一元配置分散分析
5.3.3 対応のある2標本の場合:対応のある場合のt検定
5.3.4 対応のあるk標本の場合:乱塊法
5.4 代表値の差の検定(ノンパラメトリック検定)
5.4.1 独立2標本の場合:マン・ホイットニーのU検定
5.4.2 独立k標本の場合:クラスカル・ウォリス検定
5.4.3 対応のある2標本の場合:ウィルコクソンの符号付順位和検定
5.4.4 対応のあるk標本の場合:フリードマンの検定
5.5 等分散性の検定
5.5.1 独立2標本の場合
5.5.2 独立k標本の場合:バートレットの検定
5.6 相関係数の検定(無相関検定)
5.7 複数の対象変数について検定を繰り返す方法
第6章 多変量解析
6.1 重回帰分析
6.1.1 重回帰分析の基本
6.1.2 変数選択
6.1.3 ダミー変数を使う重回帰分析
6.1.4 多項式回帰分析
6.2 非線形回帰分析
6.2.1 累乗モデルと指数モデル
6.2.2 漸近指数曲線
6.2.3 ロジスティック曲線とゴンペルツ曲線
6.3 従属変数が二値データのときの回帰分析
6.3.1 ロジスティック回帰分析
6.3.2 プロビット回帰分析
6.4 正準相関分析
6.5 判別分析
6.5.1 線形判別分析
6.5.2 正準判別分析
6.5.3 二次の判別分析
6.6 主成分分析
6.6.1 主成分負荷量について
6.6.2 主成分が持つ情報量
6.6.3 主成分得点について
6.6.4 主成分の意味付け
6.6.5 主成分負荷量が持つ意味
6.7 因子分析
6.7.1 バリマックス解
6.7.2 プロマックス解
6.8 数量化I類
6.8.1 数量化I類と等価な分析を行う
6.8.2 数量化I類とダミー変数を使う重回帰分析が同じである理由
6.9 数量化II類
6.10 数量化III類
6.10.1 カテゴリーデータ行列の分析
6.10.2 アイテムデータ行列の分析
6.11 クラスター分析
6.11.1 階層的クラスター分析
6.11.2 非階層的クラスター分析
第7章 統合化された関数を利用する
7.1 共通する引数
7.2 度数分布表と度数分布図を作る
7.3 散布図,箱ひげ図を描く
7.4 クロス集計表を作り検定を行う
7.5 マルチアンサーのクロス集計を行う
7.6 多元分類の集計を行う
7.7 独立k標本の検定を行う
7.8 相関係数行列の計算と無相関検定を行う
第8章 データ解析の実例
8.1 各変数の度数分布
8.2 群による各変数の分布の違い
8.3 群による各変数の位置の母数の検定
8.4 変数間の相関関係
8.5 グループの判別
付録A Rの概要
A.1 データの種類
A.1.1 スカラー
A.1.2 ベクトル
A.1.3 行列
A.1.4 データフレーム
A.1.5 リスト
A.2 ベクトルや行列やデータフレームの要素の指定法
A.2.1 ベクトルの要素の指定例
A.2.2 行列,データフレームの要素の指定例
A.2.3 データフレームならではの要素の指定例
A.3 演算
A.3.1 四則演算など
A.3.2 関数
A.3.3 2つのデータの間の演算
A.4 行列ならではの操作
A.4.1 転置行列
A.4.2 対角行列と単位行列
A.4.3 三角行列
A.4.4 行列式
A.4.5 行列積
A.4.6 逆行列
A.4.7 固有値と固有ベクトル
A.4.8 特異値分解
A.5 apply一族
A.5.1 apply関数
A.5.2 lapply関数とsapply関数
A.5.3 tapply関数とby関数
A.5.4 mapply関数
A.6 制御構文
A.6.1 if, if-else, if-elseif-else
A.6.2 for
A.6.3 while
A.6.4 repeat
A.6.5 breakとnext
A.7 関数の作成
付録B Rの参考図書など
B.1 参考図書
B.2 Webサイト
関数一覧
索引
続きを見る