Data Blue

データの海で遊んでます。

検定

多重検定問題

第一種の過誤(Type I error)はアルファエラー(alpha error)とも呼ばれ、実際に差が無いものを誤って差があるといってしまうことです。アワテンボウのエラーと呼ばれる所以です。 よく行われるのが α (有意水準)= 0.05として、p値*1がこれを下回ると、2群…

False Discovery Rateのメモ

FDR: False Discovery Rateは、q-valueとも呼ばれ、SNPやMetabolomeなどで多重検定を行いシグナル検出をするときに、とりあえず可能性のあるシグナルは多めに拾っておきたいというときに使用されます。 例えば q-value < 0.05だとすると検定で有意としたもの…

Permutation テスト

遺伝子やメタボロームなどのOmicsデータの解析でよく聞くパーミュテーションテストについて概要をメモします。 結論からいうと、 ”知りたい因子の相関係数の正規分布が仮定できないときでも使える” 検定です。 例えばデータX(5列1000行)が、下記のような構…