はじめに

序章　統計ソフトRのインストールと使い方

A　Rの特徴と動作環境

B　Rのインストール

1．Rスクリプト・R_dataのダウンロード

2．Rのインストール

C　Rの使い方

1．Rを走らせる

2．実習用スクリプトの読み込み

3．ディレクトリ（フォルダ）の固定方法

4．実習用スクリプトを使ってみる

5．スクリプトの修正と保存

6．終了手順と再開手順

第1章　統計の基礎

A　Rによる統計処理の基礎的知識

1．「EXCEL」でデータを作成する

例1.1　データの読み込みと確認

2．Rでデータセットの読み込み

1）テキストデータの読み込み

2）EXCEL ファイルの読み込み

3．Rでデータセットの確認

4．Rのデータセットの構造

5．変数名の明示化（データセットの1 行目を変数名に使える）

6．ケース（行）の抽出

7．一部の変数のみを抽出したデータセットを作成

8．変数の抽出

9．変数の追加

10．Rでの注意点

11．Rの式と関数

12．統計関数

13．Rのデータタイプ（型）

B　記述統計

1．データの種類

1）データ

(1)スケール（間隔・比率尺度）に基づくもの

(2)順序尺度（順位尺度）に基づくもの

(3)名義尺度（名目尺度）に基づくもの

(4)2値データ

問1.1　次のデータはどの尺度か？

2）基本統計量

(1)代表値（中心傾向の測度）

(2)ばらつきを表す値（ばらつきを表す測度）

コラム　数式が苦手な人のために

例1.2　代表値の計算

例1.3　ばらつきの計算

例1.4　基本統計量の計算

問1.2

3）分布型の話

問1.3

4）正規分布

例1.5　偏差値の使い方

問1.4

例1.6　中性脂肪に対する正規性の検定（Shapiro-Wilk検定）

例1.7　中性脂肪の対数変換とその正規性の検定

5）不偏推定量

問1.5

6）平均値の標準偏差が標準誤差となる理由

7）グラフ表示

例1.8　ヒストグラムと箱ひげ図

C　データの収集

1．対照群の必要性

2．無作為抽出または無作為割り当てとマッチング

(1)無作為抽出

(2)無作為割り当て

(3)マッチング

問1.6

問1.7

3．無記名アンケートと二重盲検法

4．層別化

例1.9　層別化を必要とする例

D　統計的判断とは

1．仮説検定

2．両側検定と片側検定

3．仮説検定の立て方と検定用統計量

4．統計処理についての手順と注意

(1)研究計画とデータの収集

(2)統計前処理

(3)統計ソフトの選択

(4)統計手法の選択

(5)比較の方法

第2章　2群の比較

A 母集団と標本との比較

1．母平均と標本平均の比較（スケールの場合）

1）正規分布するデータで母SDが既知の場合：Z検定

2）正規分布するデータで母SDが未知の場合：t検定

例2.1　母平均と標本平均の比較（1標本t検定）

問2.1　全国平均との比較（1標本のt検定）

2．母比率と標本比率の比較（1標本カイ2乗検定）

1）カイ2乗検定（1標本カイ2乗検定）

例2.2　母比率と標本比率の比較（1標本カイ2乗検定）

問2.2　全国比率との比較（1標本のカイ2乗検定）

B　対応のある2群の比較

1．正規分布をしている場合：対応のあるt検定

例2.3　2群の比較：正規分布をしている場合：対応のあるt検定

問2.3　肥満対策の評価（対応のあるt検定）

2．符号付き順位和検定（WilcoxonのT検定）

例2.4　符号付き順位和検定（WilcoxonのT検定）

3．符号検定（S検定：sign test）

例2.5　符号検定（S検定：sign test）

C　独立した標本の比較

1．母SDが既知で等しい場合：Z検定-1

2．母SDは既知であるが等しくない場合：Z検定-2

3．等分散性の検定（F検定）

1）母分散は未知でF検定で分散が等しいと判断された場合（Student のt検定）

2）母分散は未知でF検定で分散が等しくないと判断された場合（Welchのt 検定）

例2.6　F検定の結果によるt検定

問2.4　身長の男女比較（対応のないt検定）

4．データが正規分布していない場合の独立した標本の比較：平均ランク検定（Mann-WhitneyのU検定）

例2.7　Mann-WhitneyのU検定

問2.5　研修受講率に対する管理職の影響（Mann-WhitneyのU検定）

第3章　関係を調べる

A　2変量の統計

1．基本統計量

1）平方和と積和

2）修正ずみ平方和と積和

3）分散と共分散

4）不偏分散と不偏共分散

B　順序およびスケール尺度データの統計図表と相関係数および回帰式

1．クロス集計表と箱ひげ図

例3.1　関係を示す統計図表

2．散布図とPearsonの相関係数

例3.2　散布図と相関係数および回帰式

問3.1　身長と体重の関係（散布図，相関係数）

3．Spearmanの相関係数（順位相関係数）

例3.3　肥満度と循環器判定（クロス集計表とSpearmanの相関係数）

問3.2　理解能力と表現能力の関係（クロス集計表，順位相関係数）

C　名義尺度データの統計表と検定

1．対応のない2群の比率を比較する

例3.4　避妊教育の性差（2×2表）

例3.5　肥満と循環器判定の関連性（大きな表）

2．母比率との比較

例3.6　性行動比率の過去との比較（母比率との比較）

コラム　診断精度関係用語

3．対応のある2群の比率を比較する

例3.7　授業の効果（対応のある2群の比率を比較）

問3.3　授業の効果（マクネマーのカイ2 乗検定）

D　ROC　曲線

例3.8　便潜血検査の有効性（ROC曲線）

問3.4　体調，腫瘍マーカ，便潜血について大腸がんの診断への有効性（ROC曲線）

コラム　パッケージのインストール方法

第4章　生存率と危険度

A　生存率

1．生存率の計算方法：Kaplan-Meier法

2．生存率曲線の検定

例4.1　抗がん剤の副作用抑制（生存率曲線と検定）

問4.1　心臓移植と生存率（生存率曲線と検定）

B　危険度

1．前向き研究：コホート調査

例4.2　喫煙と肺がん（相対リスク）

問4.2　喫煙と肺疾患のコホート研究（相対リスク）

2．後ろ向き研究：ケース・コントロール研究

例4.3　大腸がんと母親のがん既往歴（オッズ比）

第5章　多変量解析

A　多変量解析とは

1．多変量データと多変量解析

2．多変量解析の分類

B　重回帰分析

1．重回帰モデル

2．検定

例5.1　生物学的年齢予測式（重回帰分析）

C　多重ロジスティック回帰分析

1．重回帰分析との違い

2．多重口ジスティック関数

3．順序データと名義データの2値化

1）順序データの2値化

(1)ダミー変数を使う方法

(2)科学的根拠や経験により前半と後半に分ける方法

(3)中央値により前半と後半に分ける方法

2）名義データの2値化

4．多重ロジスティック回帰

例5.2　大腸がんのリスク因子（多重ロジスティック回帰）

D　Cox比例ハザード解析

例5.3　ライフスタイルと糖尿病発症（Cox比例ハザード回帰）

E　判別分析

1．マハラノビスの距離

2．線形判別式

例5.4　複数の検査結果からの疾病の診断（線形判別関数）

F　主成分分析

1．主成分とは

2．主成分分析の実際

例5.5　患者が病院を選ぶ因子（主成分分析）

G　因子分析

1．因子負荷量

2．共通性の推定

3．因子数の決定

4．因子軸の回転

5．因子分析の実際

例5.6　患者が病院を選ぶ因子（因子分析）

第6章　多群の比較

A　同時推測

1．対照群との比較とすべての対の比較

2．対応のある多群の比較と対応のない多群の比較

3．なぜ個別の2 群の比較の単純な繰り返しではいけないのか？

B　独立した多群の比較

1．一元配置分散分析

例6.1　赤血球数の年齢間比較（一元配置分散分析）

2．二元配置分散分析

例6.2　年代およびストレスレベルの違いによる女性の赤血球数の比較（二元配置分散分析）

3．Kruskal-Wallis検定

例6.3　6つの地域間での女性の赤血球数の同時比較（Kruskal-Wallis検定）

4．Mann-WhitneyのU検定

C　対応のある標本の比較

1．反復測定の分散分析

例6.4　3つの年度間での20歳代女性の赤血球数の対応のある比較（反復測定の分散分析）

2．Friedman検定

例6.5　40歳代女性の3つの年度間でのBMIの対応のある比較（反復測定のFriedman検定）

3．WilcoxonのT検定

例6.6　ポストホック検定（WilcoxonのT検定とBonferroniの補正）

4．CochranのQ検定

例6.7　20歳代男性の健診総合判定変化の同時比較（CochranのQ検定）

5．McNemarのカイ2乗検定

例6.8　ポストホック検定（McNemarのカイ2乗検定とBonferroniの補正）

第7章　研究計画法

A　研究の目的について

B　研究方法について

1．ケース・シリーズ研究

2．断面調査研究

3．ケース・コントロール研究

4．コホート研究

5．自己コントロール試験研究

6．無作為化試験研究

1）無作為抽出

2）無作為割り当て

7．クロスオーバー試験研究

C　研究計画の不備で起こる諸問題

1．脱落によるバイアス

2．頻度によるバイアス

3．参加意識差によるバイアス

4．所属グループによるバイアス

5．割り当てによるバイアス

D　統計的判断に必要なデータ数について

1．プリテスト

2．計算による必要データ数の推計

3．統計パッケージを使ったシミュレーションによる必要データ数の推計

4．標本数の推計支援プログラム

E　論文の書き方について

付録

1　統計処理のガイダンス

2　正規分布の例

3　算数的判断と統計学的判断

（1）コインを4 回トスする実験

（2）箱からボールを20 回取り出す実験

（3）サイコロを12 回撮る実験

4　退院患者と入院患者の疾患統計の違い

略解

本書で取りあげたRスクリプト一覧

索引

アクセスしようとしたページが表示できませんでした。