Data Blue

データの海で遊んでます。

Windows機へのXGBoostのインストール

Rの場合は、

> install.packages("xgboost")

 のみでいいので簡単ですが、

 

PythonはHPに書いてある通りにしても全くうまくいきませんでした。

 

最終的には、カルフォルニア大学のHPから、

非公式のバイナリ―ファイルをダウンロードし、

> pip install ダウンロード.whl 

で使えるようにするのが一番早かったです。

 

もしここでつまずいている人がいたら、試してみてください。

条件付ロジスティック回帰(conditional logistic regression)

臨床研究で対象が稀な時に

よく使用される 症例対照研究

患者さんを一人登録したら、

マッチング因子(年齢・性別等)を

合せた症例対照を一人登録する

というのが通常のやり方です。

 

100人(D+50/D-50)参加してもらい、データを集めました。

さあ暴露因子(E+/E-)の頻度が症例と対照で

違うかを調べましょう。

普通にロジスティック回帰をして、、、、、

 

ストップ!

 

単純なロジスティック回帰分析では、

マッチングの情報が考慮されないので

検出力が落ちてしまいます。

せっかく集めたデータを最大限に有効活用する

ためにも、

条件付きロジスティック回帰分析がいいと思います。

 

Rであれば普通のロジスティック回帰は下記ですが

> model = glm(case ~ exposure + age + sex, data=data, family = binomial(link = "logit"))

 

条件付ロジスティック回帰は下記となります。

> library(survival)   # Packageのインストール

> model = clogit (case ~ exposure + strata(matchid), data=data)

※ matchid = マッチングID. 症例と、マッチさせた対照が同じID。
 ここでは年齢性別マッチとしました。