機械学習を試せるチュートリアル:IntegratedML
開発者の皆さん、こんにちは!
前の記事では、開発者向け情報を集めた「Developer Hub」をご紹介しましたが、この記事では Developer Hub のチュートリアルの中から「機械学習」をテーマとしたチュートリアル:IntegratedML についてご紹介します
InterSystems IRISには、機械学習を行うために必要なプロセスのいくつかを自動化するAutoMLの機能が組み込まれていて、機能名として「IntegratedML」と呼んでいます。機能概要については、末尾のビデオをご参照さい。
チュートリアルを始めるための準備は不要で、 ボタンをクリックするだけでチュートリアルを開始できます。
機械学習のテーマは「再入院のリスクの予測」で、1万2千件のデータを利用してモデルを学習させています。
実際に使用するデータはCSVで用意され、こちらに公開されています。
実際のモデル作成、学習、検証、予測に使う構文はSQL文に似ていて、以下の構文を使用しています。
<モデル作成時の構文例>
CREATE MODEL ReadmissionModel PREDICTING (MxWillReAdmit) FROM Readmission
<学習時の構文例>
全体で1万4千件程度のレコードがあるので、先頭1万2千件を学習用データ、残りを検証用データに使用しています。
- 学習用データの準備
CREATE VIEW ReadmissionTraining AS SELECT * FROM Readmission where ID<=12000
- 学習時の構文
TRAIN MODEL ReadmissionModel FROM ReadmissionTraining
<検証時の構文>
- 検証用データの準備
CREATE VIEW ReadmissionValidation AS SELECT * FROM Readmission where ID>12000
- 検証時の構文
VALIDATE MODEL ReadmissionModel FROM ReadmissionValidation
<予測時の構文>
SELECT PREDICT(ReadmissionModel) As PredictedReadmission, MxWillReAdmit, * FROM Readmission WHERE ID=1
<予測結果の確率を算出する構文>
SELECT PROBABILITY(ReadmissionModel) As PredictedReadmission, * FROM Readmission WHERE ID=1
それぞれの構文は、IRISとCSVがあればどこでも実行できますが、お手元の準備無しにすぐに始めることのできる IntegratedMLチュートリアル をぜひご利用ください!
IntegratedMLの機能概要については以下のビデオもぜひご参照ください。
【目次】
0:00 機械学習の概要と課題、AutoMLについて
8:30 IntegratedMLについて
13:20 IntegratedMLの文法
18:32 デモ
26:50 まとめ