研究等で機械学習をする際に、私はAzure Machine Learning StudioとRを使っています。通常はAzure、データ処理がいろいろある場合にはR(Windows)といった感じで使い分けています。
機械学習にはH2Oがとても便利なのですが、ふと気づくと
H2O cluster version:
H2O cluster version age:
がとても古いまま(2年以上前)となっています。パッケージの更新をしても変わりません。
なんでだろう、としばらく前から思っていましたが、本腰を入れて?解決したので以下はそのメモです。
公式サイトには更新は以下のようにする、と書いてあります。
if (“package:h2o” %in% search()) { detach(“package:h2o”, unload=TRUE) }
if (“h2o” %in% rownames(installed.packages())) { remove.packages(“h2o”) }
pkgs <- c(“RCurl”,”jsonlite”)
for (pkg in pkgs) {
if (! (pkg %in% rownames(installed.packages()))) { install.packages(pkg) }
}
install.packages(“h2o”, type=”source”, repos=(c(“http://h2o-release.s3.amazonaws.com/h2o/latest_stable_R”)))
ここで少し混乱しがちな点はh2oパッケージとそれに伴ってインストールされるh2o本体の2つの更新が必要だ、ということです。
結論から言うとそれだけではなく、デフォルトのR(Windows)のCRANミラーサイトの指定が問題です。以下のような手順で行えば更新可能です。
- パッケージ→CRANミラーサイトの設定
- 「Japan(Tokyo)」などを選ぶ
- 上の公式サイトの手順で更新
- パッケージ→ パッケージのインストールから「h2o」をインストール
このCRAN指定の問題はH2O以外のパッケージでも同じ影響があります。なにか私が設定等で思い違いしているような気がするのですが…。