Data Blue

データの海で遊んでます。

False Discovery Rateのメモ

FDR: False Discovery Rateは、q-valueとも呼ばれ、
SNPやMetabolomeなどで多重検定を行いシグナル検出を
するときに、とりあえず可能性のあるシグナルは多めに
拾っておきたいというときに使用されます。

 

例えば q-value < 0.05だとすると
検定で有意としたもののうち約5%は疑陽性であることを
容認するということになります。

 

p-value補正(ボンフェローニなど)では、行う全ての検定を対象
Type I errorの割合をalphaにコントロールするのに対して、

q-value補正では有意と結論付けた検定のみを対象として、
Type I error をalphaにコントロールといったような理解をしています。

 

具体的な計算方法*1は下記
p-valueを小さい順に並べて k 番目のものをp(k)とすると

  • q-value = p(k) * 全検定回数 /  k  < alpha *2

となる最大のkをみつけ、p(1) ~ p(k) までを有意とします。
例えば1000回の検定を行い、p(3) = 0.00012のとき(alpha = 0.05)

  • q-value = 0.00012 * 1000 / 3 = 0.04 < 0.05

となるのでp(3)は (p(1), p(2)が有意であれば)有意です*3

*1:Benjamini-Hochberg法

*2:q * = alpha / 1000 * kとしてp(k)とq*を比べるという方法もありますが結果は同じです

*3:ちなみにBonferonniの補正では、0.00012 * 1000 = 0.12 > 0.05ですので、これは、有意とはなりません