(今更ですが)Microsoft Azure Machine Learning Studio(長い…)を使ってみました。
実はRでの機械学習を試してみるように3年生数名へ卒研指示を出したところです。Rなら手元のPCにインストールから試行まで一気に済ませることができますからとても手軽です。また、個人的には前後のデータ処理の都合から、研究や業務上の機械学習にはRを使ってきましたので、フォローしやすいという側面もあります。
H2Oを使えば(RでもH2Oを前提に指示しています)、そもそもRを経由しないでブラウザー上で操作可能ですが、検証・可視化までは少し難しいところがあります。
Rもコーディング / コマンドラインベースですからハードルが高い側面があります。今後、データ量が増えるたびに高速なコンピューターを用意・占有するのも非現実的(昨年、Xeon+QuadroなPCを導入しました。ある論文のための計算は、このPCを数週間、フル回転させて試行錯誤しました)なので、クラウド上での機械学習も試しておこうと考えました。
既に4年生がそういった環境でトライしているので、実はこれは後追いです。いつまでも放置はできませんから、このあたりで追いつこうという目論見もあります。
基本的に3年生に指示したのと同じ内容(IRISデータセットを使用)を試しました。この範囲であればRでもほとんど十数行(設定等を含む、おおよそサンプルをコピーすれば終わる)で済みますが、こちらだとコーディングした行は1行もありません。6つの部品を配置・接続し、一つだけパラメーターを指定しました。
というわけで、研究室の3年生はRの次はこちらにも挑戦してみませんか?