医学統計学
世の中に公表されているデータは、すでに偏っている。
(悪結果は対象から外すため)
また、雑誌社も、ポジティブな論文を喜ぶ・・・・Publication bias
検定:
標本を基準に母集団の特徴や状態について何らかの仮説をもうけ、
その妥当性を確率論的に検証する方法
推定:
標本の特徴(統計量)から、母集団の特徴(母数)を推し量る方法
母集団
調べる対象となる有限または無限の個体の全集合
標本
母集団を調べるため、そこから取り出した個体の集合
母数
母集団の特徴を要約した値。普通分かっていない。対応する統計量の真値(期待値)。
尺度
対象とする個体や現象の特性に対して数値を割り振ったり分類するための基準。
分類尺度、順序尺度、間隔尺度・比尺度など。
統計的には、分類を順序尺度として取り扱った方がよい。
要因・因子
調べる数値の変動を説明するための基準。
属性
個体を定性的な条件で分類するための基準。
パラメトリック検定
検定法の中で、母集団の分布型に対して一定の仮定をおき、
それに基づいて統計的仮説検定を行うもの。←間隔尺度に固有の概念
代表的なもの:一標本または二標本t検定、分散分析など
これらは、母集団が正規分布であることを前提とする。
ノンパラメトリック検定
検定法の中で、その適用にあたり母集団の分布型に関して特別の仮定を置く必要がないもの。
代表的なもの:Wilcoxon検定、Mann-Whitney検定、Friedman検定など
「差がない」という仮説・・・帰無仮説
「差がある」という仮説・・・対立仮説
有意水準(危険率)・・・帰無仮説が正しいのに、それを誤って否定する確率。
t分布検定
対応のない、unpaired t-test df=(m-1)+(n-1)=m+n-2
対応のある場合、paired t-test df=n-1
信頼区間
母分散が既知の場合、未知の場合で別
比率の検定(母比率と標本比率の差の検定)
母比率・・・π
標本比率・・・Pi
2群の比率の差の検定(母集団から2群取ってくる)
独立性の検定
分割表
a,b,c,d<10のときや、N<40のときは、Yatesの補正
適合度の検定
df=n-1
帰無仮説:観察値が理論値と一致する
例:男女の出生率など
相関関係
散布図
ほぼ直線に並ぶと、強い相関
完全に直線なら、完全相関
楕円だと、不完全相関
相関係数(r)・・・分子は共分散・・・0.8以上なら、かなり相関があると言っていいらしい。
回帰式、回帰直線
相関係数rの検定
相関係数の推定
単変量解析
1変数の解析
2変数、質的データの解析
2変数、量的データの解析
多変量解析
変数がたくさんある
独立変数→従属変数(変化を及ぼされる変数。ここでは「結果」を指す)
横断研究・・・現状の輪切り
x2検定をする
コホート研究
相対危険度、寄与危険度は、コホートでしか使えない。
症例対照研究
過去の喫煙 | |||
肺ガン | + | − | |
+ | a | b | a+b |
− | c | d | c+d |
症例の要因オッズ・・・a/b
対照の要因オッズ・・・c/d
オッズ比・・・a/b÷c/d=ac/bc・・・相対危険度の近似値
Randomized Controlled Trial Design
t検定で、正規分布をしていない場合、または、してるかどうか分からないときは、
同一個体について行う場合・・・Wilcoxon検定
違う個体に対してやってる場合は・・・Mann-Whitney検定
相関は、xの変量、yの変量が正規分布していなければならない。
なってない場合は、Spearmanの順位相関係数rsを用いる。