記事
Minoru Horita · 2020年6月29日 8m read

Python Gateway パート I:はじめに

この連載記事では、InterSystemsデータプラットフォーム用のPython Gatewayについて説明します。 また、InterSystems IRISの最新のAI/MLツールを利用してPythonコードなどを実行します。 このプロジェクトは、InterSystems IRIS環境にPythonの力を与えます。 

  • 任意のPythonコードを実行する 
  • InterSystems IRISからPythonへのシームレスなデータ転送 
  • Python相互運用アダプタでインテリジェントな相互運用ビジネスプロセスを構築する 
  • InterSystems IRISからのPythonコンテキストの保存、調査、変更、復元 

索引 

現時点での連載計画です(変更される可能性があります)。 

  • パート I:概要、展望、紹介 <-- 現在、この記事を参照しています 
  • パート II:インストールとトラブルシューティング 
  • パート III:基本機能 
  • パート IV:相互運用アダプタ 
  • パート V:Execute関数 
  • パート VI:動的ゲートウェイ 
  • パート VII:プロキシゲートウェイ 
  • パート VIII:使用事例とML Toolkit 

概要 

機械学習(ML)は、明示的な命令を使用せず、その代わりにパターンと推論に基づいて特定のタスクを効果的に実行するためのアルゴリズムと統計モデルを研究するものです。 

機械学習のアルゴリズムとモデルは、ますます普及が進んでいます。 その理由はさまざまですが、結局はその手頃な価格、シンプルさ、そして実用的な結果を生み出していることが重視されています。 クラスタリングやニューラルネットワークモデリングも新しい技術なのでしょうか? もちろん、そうではありません。ただし、現在ではこれを実行するために数十万行のコードを記述する必要はなく、コストははるかに手頃になっています。 

ツールは進化し続けています。現時点では完全にGUIベースのAI/MLツールはありませんが、他の多くのコンピューター技術で見られたのと同じ進歩が、BIツール(コードの記述からフレームワークの利用、GUIベースの構成可能なソリューションまで) とAI/MLツールの組み合わせで最も顕著に見られます。 私たちはすでにコードを書く段階を通過し、現在はフレームワークを利用してモデルの構成と計算を行っています。 

その他の改善、すなわちエンドユーザーが実際のデータに基づいてモデルのトレーニングを完了するだけで済むような事前トレーニング済みモデルを配布することも、導入プロセスを単純化しています。 このような進歩により、個人と企業の両方がはるかに簡単にデータサイエンスに取り組めるようになっています。 

その一方で、今日では企業が行うあらゆる取引に関する多くのデータが収集されています。 InterSystems IRISなどの統合データプラットフォームを使用すると、このような情報すべてに即座にアクセスし、予測モデルのデータソースとして使用できます。 

もう1つの大きな要因であるクラウドを利用すれば、AI/MLワークロードをかつてないほど簡単に実行できます。 さらに重要なことに、必要なリソースだけを消費できます。 また、クラウドプラットフォームは大規模に並列化されているため、ソリューションを実行するまでの時間を短縮できます。 

しかし、結果についてはどうでしょうか? ここから少し複雑になります。 モデルを構築するためのツールはたくさん存在しますが、それらについては後で説明します。また、優れたモデルを構築するのは必ずしも簡単ではありませんが、そのあとはどうなるでしょうか? モデルからビジネス価値を抽出することも重要な作業です。 問題の根本は、分析データとトランザクションデータのフローとデータモデルの分離です。 モデルをトレーニングする際には、ウェアハウスシステムの履歴データがよく使用されています。 しかし、構築されたモデルはトランザクション処理の中心に置くのが最適です。 1日に1回実行する場合、最高の不正検出モデルはどのようなものになるでしょうか? 犯罪者たちはお金を持ってとっくに姿を消しているかもしれません。 履歴データでモデルをトレーニングする必要がありますが、ビジネスプロセスがモデルの予測に基づいて実行されるよう、新しい受信データにリアルタイムでモデルを適用する必要もあります。 

MLToolkit 

MLToolkitは包括的なツールセットであり、正確に予測モデルとトランザクション環境を1つにまとめ、作成したモデルをビジネスプロセス内で簡単に活用できるようにすることを目的としています。 Python GatewayはMLToolkitの一部であり、Python言語との統合を提供します。 

展望 

先に進む前に、後で使用するPythonのいくつかのツールとライブラリについて説明します。 

ツール 

  • Pythonはインタープリター型の高度な汎用プログラミング言語です。 この言語の主な優位点は、数学、ML、AIのライブラリが豊富に存在することです。 ObjectScriptと同様のオブジェクト指向言語ではありますが、すべてが静的ではなく動的となっています。 また、すべてがオブジェクトとなっています。 後の記事は、この言語にある程度精通していることを前提としています。 学習を開始する場合、まずはドキュメントを読むことをお勧めします 。 
  • 後の演習では、Python 3.6.7(64ビット版)をインストールします。 
  • IDEについてはPyCharmを使用しますが、他にも多くのIDEが存在します。 現在Atelierを使用しているのであれば、Pythonの開発者にはEclipseを使うのが良いでしょう。
  • ノートブック:IDEの代わりに、Webベースのノートブックでスクリプトを作成して共有できます。 最も一般的なのはJupyterです。 

ライブラリ 

機械学習に使用されるライブラリのリストを次に示します(すべてを網羅しているわけではありません)。 

  • NumpyはPythonを使用した科学計算のための基本パッケージです。 
  • Pandasは高性能で使いやすいデータ構造とデータ分析ツールを提供するライブラリです。 
  • Matplotlibは2次元プロットライブラリであり、さまざまなハードコピー形式や複数プラットフォームのインタラクティブな環境で図を生成します。  
  • Seabornはmatplotlibに基づくデータ視覚化ライブラリです。 魅力的で有益な統計グラフを描画するための高度なのインターフェースを提供します。 
  • Sklearnは機械学習ライブラリです。 
  • XGBoostは最適化された分散型勾配ブースティングライブラリであり、非常に効率がよく、柔軟性があり、移植性があります。 勾配ブースティングフレームワークの下で機械学習アルゴリズムを実装します。 
  • Gensimは教師なしトピックモデリングと自然言語処理のためのライブラリです。 
  • KerasはPythonで記述された高度なニューラルネットワークAPIであり、TensorFlow、CNTK、またはTheano上で実行できます。 
  • Tensorflowはエンドツーエンドのオープンソース機械学習プラットフォームです。 
  • PyTorchディープラーニングプラットフォームはTensorflowに似ていますが、Pythonに重点を置いています。 
  • NyokaはPythonモデルからPMMLを生成します。 

要約 

AI/MLテクノロジーを活用すると、企業の生産性と適応性がより高くなります。 さらに、今日ではこれらのテクノロジーの構築と導入がより簡単になっています。 AI/MLテクノロジーと、それが組織の成長と繁栄にどのように役立つかを調査してください。 ほぼすべての業界で応用例やストーリー、使用事例があります。 未来のテクノロジーを利用するチャンスを見逃さないようにしましょう。 

次の内容 

次のパートでは、Python Gatewayをインストールします。 次回のウェビナーには忘れずに参加してください(詳細は下記)! 

リンク 

ウェビナー 

この記事は2019年4月12日に英語版のコミュニティに投稿された記事の翻訳です。以下のウェビナーはすでに終了しました。

人工知能および機械学習分野の進歩からメリットを享受したいですか? InterSystems IRISと機械学習(ML)ツールキットを使用すれば、これまでになく簡単にその希望を叶えることができます。 4月23日(火)の午前11時(米国東部標準時)に私と同僚のSergey Lukyanchikovと一緒にInterSystems IRISの機械学習ツールキットのウェビナーに参加し、InterSystems IRISをスタンドアロン開発プラットフォームと、InterSystems IRIS、Python、その他の外部ツールを併用するAI/MLモデルのオーケストレーションプラットフォームの両方として使用する方法を確認してください。 

日付:4月23日(火)午前11時(米国東部標準時) 

対象者:開発者、ソリューションアーキテクト、データサイエンティスト、データエンジニア。 

今すぐご登録ください! 

 

続けて「Python Gateway パート II:インストール」をお読みください。 

InterSystems Open Exchangeで関連アプリケーションを確認してください。 

 

00
1 0 0 59
Log in or sign up to continue