前回、Apache Spark と InterSystems Data Platform を使って機械学習を実験するためのプレイグラウンドを作成したときは(「Spark と Caché による機械学習」を参照)、Caché、Python、Apache Spark、Java、Hadoop ライブラリなど、すべてを直接自分のノートパソコンにインストールして構成しました。 これには多少の努力が必要でしたが、最終的には上手くいきました。 満足していましたが、 心配になりました。 「この手順をすべて再現できるのだろうか?」 ―多分できる。 「Windows や Java のアップデートですべてが一瞬にして台無しになる可能性はないか?」 ―ほぼ確実にある。
今では、ますます普及しているコンテナとますます使いやすくなった Docker for Windows により、事前に構成された機械学習環境とデータサイエンス環境を選択できるようになりました。 たとえば、Jupyter Docker Stacks と Zeppelin on Docker Hub をご覧ください。




.png)
.png)
.png)
.png)
.png)