Data Blue

データの海で遊んでます。

2017-08-22から1日間の記事一覧

勾配ブースティング(Gradient Boosting )について

前回は、CARTについてまとめてみましたが、ブースティングの中では勾配ブースティング(gradient boosting)が特によく用いられます。 【木1+残差→木1+木2+残差】 と残差について(小さな)木を次々に適用していく(Gradient)モデルです。 残差は連続数…

CARTまとめ(decision tree method)

決定木:Decision treeは2種類 分類木:Classification Tree(目的変数がカテゴリー変数) 回帰木:Regresion Tree (目的変数が連続変数) これら決定木を用いた分析が Classification and Regression Tree: CART分析と呼ばれます。 色々な解析方法がありま…

Windows機へのXGBoostのインストール

Rの場合は、 > install.packages("xgboost") のみでいいので簡単ですが、 PythonはHPに書いてある通りにしても全くうまくいきませんでした。 最終的には、カルフォルニア大学のHPから、 非公式のバイナリ―ファイルをダウンロードし、 > pip install ダウンロ…