3版の序

 初版の刊行から約5年,2版の刊行から3年近くが経過し,読者から要望もあり,改訂版を刊行することとなった.9章を新たに設け,SAS(Statistical Analysis System)を詳説した.約70頁の増補版となった.

 8章までで統計手法を概観し,その必要性,重要性については,強調してきた.そして実際の統計解析にあたっては,時間や,煩雑さのこともあり,自分でできる部分は少なく,統計パッケージに頼る部分が多いことも解説してきた.

 どのような統計パッケージが医学研究,臨床疫学研究において有用なのであろうか.著者らが,疫学研究,臨床疫学研究を始めた1970年代においては,医学研究用の統計パッケージといえば,BMDP(BIOMEDICAL Computer Programs-P)であった.その後,主流はSPSS(Statistical Package for Social Science),SPSS-Xに移り,最近では,汎用性,拡張性,自由度の問題を考慮してSASが普及している.

 SASとはStatistical Analysis Systemの省略形で,元はNorth Carolina大学で開発された統計プログラムであり,多くの開発者が作り上げたものを統合したシステムである.現在はそれが企業化され,サスインスティチュートジャパンを含め,30を超える海外現地法人があり,その頂点に立つのは米国SASインスティチュート(SAS Institute Inc.)である.

 医学統計学は応用の科学であり,推定,検定に当たっては,多忙な医療関係者の間では統計パッケージの利用は現在では当たり前のこととなっている.SASは統計パッケージの中でも最も信頼性が高く,汎用されているものである.

 SASプログラミングは単純なプログラムで,いかに簡単に多くの結果が出力されるかを示すことができる.

 まず,SASはSASが起動されるとSASデータセットを作製し,作業用ファイルとし,SASの作業を行う.場合によっては,SAS終了後も保存される場合がある.SASでは,各個人(個体)がいくつかの変数を持っている形にする.各個体をオブザベーションという.

 SASのプログラムは,DATAステップと,PROCステップに分かれる.DATAステップではSASデータセットを編集し,作製する.PROCステップでは指定されたデータセットに対し,統計処理を実施する.EBM(Evidence-Based Medicine)の理解,実践のために不可欠の項目を配した.

 SASの主要な統計解析法は非常に多彩である.CORR(相関係数の計算),SUMMARY(1変量基本統計),TABULATE(クロス集計などの表形式表示),REG(線形回帰分析),RSREG(2次の反応局面回帰分析),ANOVA(分散分析),GLM(線形モデル解析汎用プロシジャ),GLMMOD(GLM流モデル指定の計画行列出力),LATTICE(格子法計画の分散分析),MIXED(混合線形モデル),MULTTEST(多重検定問題),NESTED(枝分かれ実験の分散,共分散分析),PLAN(ランダム割付),VARCOMP(分散成分の推定),CALIS(共分散構造分析),CANCORR(正準相関分析),CORRESP(コレスポンデント分析),FACTOR(因子分析,成分分析),MDS(多次元尺度構成),PRINCOMP(主成分分析),TRANSREG(F. Youngの回帰分析,分散分析,正準相関分析),CANDISC(正準判別分析),DISCRIM(線形判別分析,ノンパラメトリック判別分析),STEPDISC(判別分析逐次変数選択),CLUSTER(クラスター分析),FASTCLUS(非階層的クラスタリング),TREE(クラスターのデンドログラム表現),VARCLUS(変数のクラスター分析),CATMOD(カテゴリカルデータモデリング),PROBIT(プロビット分析),LIFEREG(生存時間解析),LIFETEST(生存関数推定),PHREG(Cox比例ハザードモデル解析),INBREED(近交係数計算),SCORE(線形結合スコア計算)など175BEBMの実践,臨床研究には不可欠なものばかりである.

 また,やや特殊な計算のためのプロシジャとして,本テキストの検定手法をSASでと考えてみるとやや困ったことに遭遇する場合がある.つまり,コンピュータで計算するにはあまりにも簡単すぎる,またはやや特殊すぎる場合,SASのプロシジャがそのまま適用できないことがある.その時には少し工夫をすると,あるいは発想の転換をするだけで,SASのプロシジャが使えるようになる.その例を示した.またいくつかの例では,解法の最後は省略してある.その際は読者が独自に判断して,プログラムを完成していただきたい.

 10章のQ&Aでは,「インターネットをEBMに利用する際,どのようなことに注意したらよいですか」等を最新情報で改訂し,「データが集まったのですがどの統計手法を用いるとよいでしょうか」では統計の正しい利用法を解説した.また,「臨床試験で用意する文書・データ書式にはどんなものがありますか」,「治療シェーマとは何でしょうか」,「急送報告では何を報告すべきでしょうか」,「モニタリングや中間解析は何のために行うのですか」,など臨床試験,臨床研究でよくきかれる疑問を解決することに努めた.

 これらが今回の改訂で新たに加えられ,著者らが強調したい点である.また,著者も各分野の専門家にお願いし,全部で7名となった.

 2版で追加されたオッズ比,リスク比の考え方や,EBMの理解,実践上の注意,インターネットをEBMに利用する際の注意点,サーチエンジンの利用法,標本数算定法,臨床試験上の意味づけなど,いずれもEBM,臨床研究,医学研究を念頭に置いたものであるであるので,今回の改訂も加えると,かなりこの分野が強化されたこととなる.

 本書の対象読者,基本的目的は初版と同様であり,「推定と検定」と「統計の正しい利用法」を中心とし,例題,イラストを多用した執筆の基本的スタイルも初版と同様である.

 本書を執筆するにあたり,中外医学社の小川孝志氏に非常にお世話になった.また,東京慈恵会医科大学大学院中村晃士医師,西岡真樹子医師,佐野浩齋医師やサスインスティチュートジャパンスタッフ諸氏をはじめとする皆様にも多大な協力とご援助をいただいた.また,資料整理,イラスト作成などにおいては縣千聖氏,縣賢太郎氏におおきな援助をいただいた.ここに記して感謝の意を表したい.

  2002年2月

    編著者

初版の序

 本書は,医学,歯学,薬学,看護学,およびその関連分野の人々,いわゆるメディカルサイエンスあるいは,ヘルスサイエンス領域で活躍する人々を対象とした統計学の入門書である.

 とかく統計学は難しい,難解だ,などと言われ,敬遠される学問領域に属している.しかし,小規模な調査や実験,あるいは,自分達がデータを保持・保存している臨床データから臨床疫学的なまとめをしたとしても,それを学会,研究会や地方会などで報告する場合には,統計的処理がなされていないと,意味がないとか,科学的でないといった非難・批判を受ける場合も間々みられる.そういった批判が必ずしも的を得ているとは限らないが,本書は,そのような状況に対応できるように統計学,特に医学統計学の基礎的手法,標準的方法を中心に解説したものである.

 実際,統計が必要な場合,われわれが問題とするのは「推定と検定」が中心であり,大部分である.しかし,今までの統計の教科書や解説書では,その目次,構成はほぼ似たような形をとり,「統計とは」ではじまり,母集団と標本,度数分布,代表値,散布度,確率分布,順列組み合わせなどが綿々と連なり,テキストの1/3あるいは半分がその内容に費やされ,その後にようやくお目当ての「推定と検定」が登場する.しかし,ここまで到達する人は全体の半数以下ではないかと思う.そしてかりに「推定と検定」の章に到達できたとしても,自分のデータにはどのような統計手法が最適なのか,なかなか自信を持って判断できないことが多く,結局うやむやに終わってしまうか,統計手法の適用をあきらめてしまうことが多い.せっかく自分の実験や調査結果に対して統計的な検討をしてみようと思っても,こうして挫折してしまう場合がかなりの数に上るという.そして,ますます統計学は難しい,難解だ,統計の専門家しか理解できないなどと思われるようになるのである.

 そこで本書では,今までのテキストで多くのページを費やしてきた,統計とは,母集団と標本,度数分布,代表値,散布度,確率分布,順列組み合わせなどの解説を極力少なくし,「推定と検定」にほとんどのページをさき,具体例を中心とした解説をし,図も多用しているのでイメージとしても理解しやすいと思う.

 私のように疫学,医学統計学,医療情報処理を専門とする人間は日本ではまだ少ない.アメリカではepidemiologist; 疫学者,biostatistician; 生物(医学)統計学者,medical information scientist; 医療情報学者の数も多く,世の中でも相応の位置を占めている.しかし日本では数が少ないこともあり,万屋的な商売となっている.そして,日常的に多くの臨床家や,基礎医学研究者から種々雑多なデータが持ち込まれ,その問題解決,時には研究の指針まで提供する立場に立たされてしまう.そんな中で他の研究者と一緒に悩んできた過程を,端的にわかりやすく解説していきたいと思う.

 こうした現状の下,本書は医学,歯学,薬学,看護学,およびその関連分野の人々を対象とした統計学の入門書で,標準的な手法を理解し,医学統計の常識を身につけ,さらには,統計の誤用・悪用をなくし,「統計の正しい利用法」を身につけられるようにしてある.

 そしてその特長は;

  (1)「推定と検定」に重点をおく.

  (2)難しい数式を少なくし,イラストなどを増やす.

  (3)例題を多くし,解説をていねいにする.

  (4)「統計の正しい利用法とEvidence-Based Medicine」を解説する.

である.

 [(1)「推定と検定」に重点をおく]については,統計学の基礎的・入門的・標準的手法の中でも特に「推定と検定」の解説に力点をおくということである.医学・医療の研究や実験的研究,地域での研究を進める場合にはさらに複雑な手法,例えば多変量解析などが必要となる場合もありうるが,その際には他の参考書を利用されるか,生物統計の専門家に相談する必要があるであろう.

 [(2)難しい数式を少なくし,イラストなどを増やす]については,数式の記述もできる限りコンパクトにし,文章による説明も最小限とした.あまり長い文章だとかえって混乱を来たし,どこまで覚え,理解すべきかわからなくなり,理解不能に陥るという人が多いからである.また理解の助けとしてイラストを用いイメージ的に解釈できるようにした.

 [(3)例題を多くし,解説をていねいにする]ことで,実際自分たちの直面する問題についても応用が簡単にできるものと考えられる.各章・節ごとに各種検定法に対応した例題を取り上げ,計算の仕方も含め詳しく解説している.

 [(4)「統計の正しい利用法とEvidence-Based Medicine」を解説する]については,陥りやすい統計の誤用,解釈の誤り,ふだん統計を使っている時に一般研究者が疑問に思うことなどに関してていねいに解説している.情報化社会の現代・未来を生きていく若い研究者・保健医療従事者としての医学統計学・生物統計学の常識や証拠に基づく医療,正しい研究法の考え方も身につくように心掛けている.

 また本書の記載内容は大きく4つのLEVELに分けて記載してある.各項目のはじめに示してあるので,自修の際の参考にしてほしい.LEVEL 4は最初は読み飛ばして差し支えない.

 実際の必要な場面に遭遇した時,他の参考書と併せて読んで理解していただきたい.

 LEVELの内容は

  LEVEL 1 基礎的必須事項

  LEVEL 2 基礎的重要事項

  LEVEL 3 やや応用的事項

  LEVEL 4 応用的事項

となっている.

 おおよその目安として

  大学生,専門学校生  LEVEL 1+2+3

  大学院生,若手研究者以上 LEVEL 1+2+3+4

と考えてよいであろう.

 また,各章のはじめにKEY WORDS を設けたので,その言葉の意味内容はしっかり把握していただきたい.

 本書によって,統計嫌いの人が少しでも減少し,医学統計学は便利で有用なものであることを理解してくれる人が増加することを願ってやまない.執筆にあたっては完全無欠をめざしたつもりであるが,不備や欠点がみつかるかも知れない.お気づきの点があれば,遠慮なくご意見,ご批判をいただきたい.次回改訂版作成の際の参考として利用させていただきます.本書が多くの人の目にとまり,教育上,実務・研究上に役立つことを願ってやまない.

 本書を執筆するにあたり,中外医学社の小川孝志氏に非常にお世話になった.また,総武病院社会精神医学研究所の門倉真人医師,東京慈恵会医科大学環境保健医学教室の大学院生西村理明医師,辻洋子医師,浅尾啓子医師をはじめとする皆様にも多大な協力とご援助をいただいた.また,イラストなどの作成においては縣千聖嬢に大きな援助をいただいた.ここに記して感謝の意を表したい.

  1997年3月

    縣 俊彦

基本医学統計学3版の発刊に寄せて

 基本医学統計学が改訂され,この度,第3版が刊行されることをうれしく思います.版を重ねるということは本書が多くの読者に読まれ,また,使われていることの証拠でしょう.欧米では優れた教科書などは版を重ね,初版とは異なった著者によって版が重ねられている名著が数多くあります.本書も是非,版を重ね息の長い著書となって欲しいと願っています.

 版を改めるにあたり,SAS(statisticalニanalysis system)が取り上げられています.SASはM汎用されている統計プログラムで,これがパソコンでも使えるというのは魅力的です.学生教育にも使われており,本書は学生諸君にも大いに利用されるでしょう.

 また,Q&Aの章が設けられているのも読者の立場に立った配慮と思われます.統計を必要とする利用者にとって,統計学は使えて初めて意味があります.本を初めから読んでも現実の場面ではいろいろな疑問がでてきますが,Q&Aが基本的な疑問に答えていて,本書の利用価値を高めています.

 縣助教授は本学で臨床疫学というコースの教育に携わっています.学生諸君と接しその体験を通して得られたものが本書にも反映されているものと思います.本学の創設者・高木兼寛が脚気の原因が栄養の障害にあることを約120年前に指摘しました.この時,高木は英国で医学を学んでいたので,疫学的手法を用いて証明したのです.しかし,残念ながら当時の医学界では認められませんでした.Evidence-Based Medicine(EBM)が当時の日本ではよく理解されていなかったからでしょう.この高木の精神を受け継ぐ本学の縣助教授が本書を著し,この度,版を改めてより多くの読者に利用されることを願っています.

  2002年1月

    東京慈恵会医科大学学長 栗原 敏


1.医学統計の必要性 (LEVEL 1) 1

 1.1 統計学とは 1

 1.2 効果の判定,治療方針の決定 4

2.推定と検定の基礎知識 6

 2.1 統計資料の種類 (LEVEL 1) 6

 2.2 分布の表示 (LEVEL 1) 7

 2.3 特性値 10

  2.3.1 平均値 1〜3 10

  2.3.2 順位を示す特性値 (LEVEL 1) 10

  2.3.3 散布度 (LEVEL 2) 11

 2.4 確率分布 (LEVEL 2) 13

  2.4.1 正規分布 13

  2.4.2 正規分布の性質 15

 2.5 相関と回帰 20

  2.5.1 相関係数 (LEVEL 2) 20

  2.5.2 順位相関係数 (LEVEL 2) 21

  2.5.3 回帰直線 (LEVEL 3) 22

3.推定 24

 3.1 母集団と標本 (LEVEL 2) 24

 3.2 点推定と区間推定 (LEVEL 2) 26

 3.3 母平均の推定 (LEVEL 2) 27

 3.4 母(集団)比率の推定 30

  3.4.1 正規分布による近似 (LEVEL 2) 30

  3.4.2 F分布から算出する方法 (LEVEL 3) 31

 3.5 母相関係数の推定 32

  3.5.1 母相関係数の有意性の検定(ρ=0の検定) (LEVEL 2) 32

  3.5.2 母相関係数の推定(ρ≠0の場合) (LEVEL 3) 33

 4.1 仮説検定,帰無仮説,対立仮説 (LEVEL 2) 35

 4.2 両側検定,片側検定 (LEVEL 2) 37

 4.3 有意水準,第1種の過誤,第2種の過誤 (LEVEL 2) 37

 4.4 検出力,標本数 (LEVEL 3) 40

  4.4.1 母比率の検定に必要な標本数 40

  4.4.2 母平均の検定に必要な標本数 41

  4.4.3 2つの標本比率の検定に必要な標本数 42

  4.4.4 2つの標本平均の検定に必要な標本数 43

  4.4.5 標本数nが等しくない場合(n1≠n2) 44

5.検定 各論1 度数と比率の検定 45

 5.1 度数の検定 45

  5.1.1 適合度の検定 (LEVEL 2) 45

  5.1.2 独立性の検定 (LEVEL 3) 47

  5.1.3 Fisherの直接確率法 (LEVEL 3) 50

  5.1.4 McNemarテスト (LEVEL 3) 53

  5.1.5 関連係数 (LEVEL 3) 54

  5.1.6 Habermanの残査分析 (LEVEL 4) 55

  5.1.7 リスク比とオッズ比 (LEVEL 4) 57

 5.2 母比率の検定 61

  5.2.1 2項検定 (LEVEL 2) 62

  5.2.2 正規分布に近似する方法 (LEVEL 3) 62

 5.3 独立2標本の比率の検定 (LEVEL 3) 63

 5.4 対応2標本の比率の検定 (LEVEL 3) 65

6.検定 各論2 平均と代表値の検定 67

 6.1 母平均の検定 (LEVEL 2) 67

  6.1.1 母分散が既知の場合の母平均の検定 67

  6.1.2 母分散が未知の場合の母平均の検定 69

 6.2 独立2標本の平均値の検定 71

  6.2.1 母分散が既知の場合,μ1=μ2の検定 (LEVEL 2) 71

  6.2.2 母分散が未知だが等しい場合,μ1=μ2の検定 (LEVEL 3) 73

  6.2.3 母分散が未知で等しくない場合,μ1=μ2の検定 (LEVEL 3) 78

 6.3 対応2標本の平均値の検定 (LEVEL 2) 80

 6.4 独立2標本の代表値の検定 (LEVEL 3) 85

  6.4.1 中央値検定 86

  6.4.2 Mann-WhitneyのU検定 89

  6.4.3 Kolmogorov-Smirnovの検定 92

 6.5 対応2標本の代表値の検定 94

  6.5.1 符号検定 (LEVEL 2) 95

  6.5.2 Wilcoxonの符号付順位検定 (LEVEL 3) 97

7.検定 各論3 相関と回帰における検定 97

 7.1 母相関係数の検定 (LEVEL 3) 101

 7.2 順位相関係数の検定 (LEVEL 2) 105

  7.2.1 Spearmanの順位相関係数rsの検定 105

  7.2.2 Kendallの順位相関係数τの検定 107

 7.3 切片の検定 (LEVEL 3) 109

 7.4 傾きの検定 (LEVEL 4) 110

  7.4.1 連続量の場合 110

  7.4.2 離散量の場合 Mantel-extension法 118

 7.5 偏相関係数の検定 (LEVEL 3) 122

 7.6 重相関係数の検定 (LEVEL 4) 128

8.検定 各論4 対応多標本の検定 131

 8.1 1元配置分散分析 (LEVEL 3) 131

 8.2 分散の等質性の検定 (LEVEL 3) 138

 8.3 2元配置分散分析 (LEVEL 4) 141

 8.4 ラテン方格法 (LEVEL 4) 147

 8.5 Kruskal-Wallis検定 (LEVEL 4) 150

 8.6 Friedman検定 (LEVEL 4) 153

9.SAS 156

 9.1 概要 156

  9.1.1 SASのインストール (LEVEL 1) 157

  9.1.2 SAS実行 (LEVEL 2) 158

  9.1.3 データの確認,または作成(ファイルの確認,または作成) (LEVEL 2) 160

  9.1.4 プログラム作成,結果出力 (LEVEL 2) 162

 9.2 DATAステップ 167

  9.2.1 SASプログラミング (LEVEL 3) 167

  9.2.2 DATAステップの流れ (LEVEL 3) 167

 9.3 PROCステップ 179

  9.3.1 1変数の集計,外れ値の検討,CHART,MEANSなど (LEVEL 3) 179

  9.3.2 2変数間の関連 (LEVEL 3) 191

  9.3.3 標準的初歩的検定,解析,FREQ,TTEST,NPAR1WAY (LEVEL 3) 197

  9.3.4 SASにおける重回帰分析とロジスティック回帰分析の実行 (LEVEL 4) 203

 9.4 やや特殊な計算のためのプロシジャ (LEVEL 3) 207

10.Q&A 統計の正しい利用とEvidence-Based Medicineの発展に向けて 220

Q1 平均値を求める場合,計算はどの桁まで行えばよいのでしょうか. 220

Q2 検定を行う前に考えておかねばならないことは何ですか. 221

Q3 データをまとめる際には 平均値±標準偏差 で表現すればよいのでしょうか. 228

Q4 標準偏差(SD)と平均の標準誤差(SEM)の違いは何ですか.

   また,どのように使い分ければよいのでしょうか. 229

Q5 比,比率で表現するとどんなメリットがありますか.

   その時注意しなければいけないのはどんな点ですか. 230

Q6 どんな検定法により検定を行えばよいのですか. 232

Q7 データが集まったのですがどの統計手法を用いるとよいでしょうか. 238

Q8 正規分布に基づくパラメトリック検定は,

   データが正規分布していないと利用できないのですか. 239

Q9 検定法により結果に差がある場合はどうしたらよいのですか. 240

Q10 統計的有意性は本当に意味がありますか.また,その逆はどうなるのでしょう. 240

Q11 対象を変えた複数の調査・実験でまったく逆の結論が出た場合,

   どう解釈したらよいのでしょう. 241

Q12 予後の生命表解析とか,Kaplan-Meier法とはどんなものなのですか.

   使用する時の注意もお願いします. 243

Q13 臨床試験を行う時どんな点に注意して実施すればよい研究ができますか. 247

Q14 臨床試験のプロトコールを作成した時どのような点に注意してチェックすれば

   完全,またはそれに近いプロトコールができますか. 252

Q15 臨床試験で用意する文書・データ書式にはどんなものがありますか. 253

Q16 治療シェーマとは何でしょうか. 254

Q17 急送報告では何を報告すべきでしょうか. 255

Q18 モニタリングや中間解析は何のために行うのですか. 255

Q19 Evidence-Based Medicineとはどのようなものですか. 256

Q20 臨床医としてEBMを正しく理解し,実践するためには,

   どのような点に注意すればよいですか. 257

Q21 インターネットをEBMに利用する際,どのようなことに注意したらよいですか.

   また,検索方法はどのようにしたらよいでしょうか. 259

Q22 サーチエンジンとはどのようなものですか.

   また,使用法はどのようにしたらよいでしょうか. 262

Q23 標本数算定の際の,臨床試験上の意味づけを教えて下さい. 264

[付録]

付表1 対数表 266

付表2 二乗表 268

付表3 標準正規分布表 270

付表4 Poisson分布表 271

付表5 t分布表 272

付表6 χ2表 273

付表7 z変換表 274

付表8 F分布表 276

付表9 Wilcoxon符号付順位検定表 278

付表10 Mann-WhitneyU検定表 279

付表11 2標本Kolmogorov-Smirnov検定表(D) 283

付表12 Spearman順位相関係数検定表 283

付表13 Kendall順位相関係数検定表 284

付表14 Kruskal-Wallis検定表 285

付表15 Friedman検定表 286

付表16 歪度・尖度検定表 288

[索引] 289