記事

Tomohiro Iwamoto · 2020年8月17日 9m read

本稿について

本稿では、InterSystems IRISを使用してSQLベースのベンチマークを行う際に、実施していただきたい項目をご紹介します。
Linuxを念頭においていますが、Windowsでも考慮すべき点は同じです。

メモリ自動設定をやめる

パフォーマンスに直結する、データベースバッファサイズの自動設定はデフォルトで有効になっています。自動設定は、実メモリの搭載量にかかわらず、データベースバッファを最大で1GBしか確保しません。

更新: 2020年11月20日バージョン2020.3から、確保を試みるデータベースバッファが実メモリの25%に変更されました。

搭載実メモリ64GB未満の場合は実メモリの50%程度、搭載実メモリ64GB以上の場合は実メモリの70%を目途に、明示的に設定を行ってください。

#SQL #パフォーマンス #InterSystems IRIS #InterSystems IRIS for Health

4 0

0 559

記事

Toshihiko Minamoto · 2020年10月27日 14m read

Cachéでの照合

秩序（順序）はだれにとっても必要であるが、皆が同じように秩序（順序）を理解しているわけではない（ファウスト・セルチニャーニ）

免責事項: この記事では、例としてロシア語とキリル文字を使用しますが、英語以外のロケールでCachéを使用するすべての方に関連のある記事です。 この記事は主にNLS照合について言及しており、SQL照合とは異なることに注意してください。 SQL照合（SQLUPPER、SQLSTRING、照合なしを意味するEXACT、TRUCATEなど）は、値に明示的に適用される実際の関数であり、その結果はグローバルサブスクリプトに明示的に格納されることがあります。サブスクリプトに格納されると、これらの値は当然、有効なNLS照合（「SQLおよびNLS照合」）に従うことになります。

#ObjectScript #SQL #グローバル #Caché

0 0

0 553

記事

Toshihiko Minamoto · 2020年11月18日 5m read

クラス、テーブル、グローバルとその仕組み

InterSystems IRIS を技術的知識を持つ人々に説明する際、私はいつもコアとしてマルチモデル DBMSであることから始めます。

個人的には、それが（DBMSとして）メインの長所であると考えています。また、データが格納されるのは一度だけです。ユーザーは単に使用するアクセス API を選択するだけです。

データのサマリをソートしたいですか？SQL を使用してください！
1 つのレコードを手広く操作したいですか？オブジェクトを使用してください！
あなたが知っているキーに対して、1 つの値にアクセスしたりセットしたいですか？グローバルを使用してください！

これは短く簡潔なメッセージで、一見すると素晴らしく聞こえます。しかし、実際には intersystems IRIS を使い始めるたユーザーにはクラス、テーブル、グローバルはそれぞれどのように関連しているのだろうか？互いにどのような存在なのだろうか？データは実際にどのように格納されているのだろうか？といった疑問が生じます。

この記事では、これらの疑問に答えながら実際の動きを説明するつもりです。

#SQL #オブジェクトデータモデル #グローバル #リレーショナルテーブル #初心者 #InterSystems IRIS

0 0

0 546

記事

Toshihiko Minamoto · 2021年5月12日 12m read

インデックスを理解する

これは、SQLインデックスに関する2部構成の記事の前半です。

第1部 - インデックスを理解する

#SQL #インデックス付け #パフォーマンス #ベストプラクティス #Caché #InterSystems IRIS

0 0

0 545

記事

Mihoko Iijima · 2020年11月6日 4m read

外れ値について

これはInterSystems FAQ サイトの記事です。

テーブルチューニングを行った際に、フィールドに値がほとんど登録されていない（Null）場合や、特定の値がほとんどを占める場合、その値を [外れ値] として除外して選択性計算を行います。また、外れ値が全レコードの何 % を占めているかの値は [外れ値の選択性] として記録されます。

InterSystems 製品のクエリオプティマイザは、選択性数値とエクステントサイズを使用してクエリの経路を決定しますが、クラスクエリ、埋め込み SQL に使用しているクエリに外れ値が含まれる場合は、外れ値の選択性が自動的に考慮され、インデックスの使用有無を決定しています。

#SQL #インデックス付け #ヒントとコツ #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 528

記事

Mihoko Iijima · 2020年11月10日 4m read

大量データのロードを高速化する方法

これはInterSystems FAQ サイトの記事です。

インデックスが複数定義されているクラス／テーブルへ csv 形式等のシーケンシャルファイルから大量データをデータベースに登録する際、推奨される登録方法として、データ登録時インデックスを生成させず、登録完了後に一括でインデックスを生成する 方法があります。

この方法は、新規に大量のレコードを一括登録する際に最も有効な手段となります。

＜メモ＞
大量のデータを追加登録する際には、既存のデータ量と新規データ量のバランスにより、この手法が有効でないケースもあります。その場合は、インデックスの再構築を範囲指定で行うこともできます。

説明に使用するクラス定義例は以下の通りです。

#SQL #インデックス付け #ヒントとコツ #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

1 0

0 503

記事

Megumi Kakechi · 2020年12月15日 1m read

プログラムでクエリキャッシュを削除する方法

これはInterSystems FAQ サイトの記事です。

%SYSTEM.SQL クラスの Purge* メソッドを使用して削除することが可能です。

※各メソッドの詳細は、以下ドキュメントをご参照ください。

%SYSTEM.SQLクラスについて【IRIS】

%SYSTEM.SQLクラスについて

#SQL #ヒントとコツ #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 488

記事

Tomoko Furuzono · 2023年4月11日 3m read

データ更新中にインデックスの再構築を実行する

これは、InterSystems FAQサイトの記事です。

データの登録/更新/削除を実行中でも、インデックスを再構築することは可能です。
ただし、再構築中は更新途中の状態で参照されますので、専用ユーティリティを使用することをお勧めします。
手順は以下の通りです。

追加予定のインデックス名をクエリオプティマイザから隠します。
インデックス定義を追加し、再構築を実施します。
再構築が完了したら、追加したインデックスをオプティマイザに公開します。

実行例は以下の通りです。
Sample.Person の Home_State（連絡先住所の州情報）カラムに対して標準インデックス HomeStateIdx を定義する目的での例で記載します。

1、追加予定のインデックス名を Caché のクエリオプティマイザから隠します。

#SQL #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 478

記事

Mihoko Iijima · 2020年12月7日 2m read

SELECT ... FOR UPDATE を使用できるかどうか

これは、InterSystems FAQサイトの記事です。

SELECT ... FOR UPDATE は明示的な行ロック取得の方法として多くの RDBMS で実装されているため、この機能を使われているケースも多いと思います。

このシンタックスは InterSystems 製品ではエラーにはなりませんが、期待されるような行ロックの取得は行われません。

この記事では同等の機能を実現する方法をご紹介します。

DECLARE CURSOR C1 IS
SELECT Name FROM Person WHERE Name LIKE 'A%' FOR UPDATE
OPEN C1
LOOP FETCH C1 INTO name　
... name を表示
... 終了ならLOOPをEXIT
END LOOP
CLOSE C1

上記のようなSQL文は、下記のSQL文で代替可能です。

※下記2行目のUPDATE文の実行により対象行に対して排他ロックがかかるため、他DBの動作と異なる点ご注意ください。

#SQL #ヒントとコツ #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

1 0

0 477

記事

Megumi Kakechi · 2021年9月1日 1m read

SQL文ではなくユーザコードでクラスクエリを記述する方法

これは InterSystems FAQ サイトの記事です。

InterSystems製品のクラスクエリにはSQL文を利用する方法と、ユーザコードによる記述が選択できます。

スタジオメニューの [クラス] >[追加] > [クエリ] を選択すると、クエリウィザードが起動します。

画面に、「実装」を選択する項目があり、「このクエリはユーザコードで定義されている」を選択すると SQL文ではなく、ユーザコードによりクエリ定義が行えます。

#SQL #ヒントとコツ #InterSystems IRIS #InterSystems IRIS for Health

1 0

0 474

記事

Mihoko Iijima · 2021年9月14日 1m read

管理ポータルから任意のSQL実行結果をCSVファイルに出力する方法

これは InterSystems FAQ サイトの記事です。

管理ポータルの SQL 画面（管理ポータル > システムエクスプローラ > SQL）で、任意の SQL を実行した後、結果の行数などが表示されいる行の右端にある「印刷」のリンクから、CSVファイル出力を選択できます。

「クエリ印刷」画面で「ファイルにエクスポート」をチェックすると「ファイル形式」の欄が表示されます。

形式に「CSV」を指定し、出力ファイル名を指定したあと「エクスポート」ボタンをクリックすると出力できます。

注意：古いバージョンでは正しくCSV出力が行えない場合もあります。新しいバージョンをぜひご利用ください。

#SQL #ヒントとコツ #Caché #Ensemble #HealthShare #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 465

記事

Hiroshi Sato · 2020年12月8日 1m read

SQLでユニークな番号を自動付番する方法

これはInterSystems FAQ サイトの記事です。

連番を生成する関数（$INCREMENT）を使用してユニークな番号を自動付番することができます。

SQLのSELECT文で使用する場合には OracleのSequence相当の機能を実装したクラスを利用する方法があります。

サンプルを以下のGitHubリポジトリより取得することができます。

OracleのSequence機能を実装するサンプル

#SQL #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 451

記事

Mihoko Iijima · 2021年3月5日 1m read

ID を指定してインデックスを再構築する方法

これは InterSystems FAQ サイトの記事です。

永続クラス（＝テーブル）定義に提供される %BuildIndices() メソッドの引数に、インデックスを再構築したい ID の開始値と終了値を指定することにより、その範囲内のインデックスのみが再構築できます。

例えば、Sample.Person クラスにある NameIDX インデックスと ZipCode インデックスを ID=10～20 のみ再構築する場合は、以下のように実行します（ID の範囲は、第5引数、第6引数に指定してます）。

#SQL #インデックス付け #オブジェクトデータモデル #ヒントとコツ #リレーショナルテーブル #Caché #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 430

記事

Megumi Kakechi · 2023年2月12日 3m read

%TimeStamp型プロパティを使用した範囲指定のクエリが遅い場合の対処方法

これは InterSystems FAQ サイトの記事です。

日時検索で、TimeStamp型のクエリのパフォーマンスが出ない場合の対処法をご紹介します。

%TimeStamp データ型形式 (yyyy-mm-dd hh:mm:ss.ffff)は、人が読めることを目的とした ODBC 日付形式の文字列として格納されます。
そのため、どうしてもデータサイズが大きくなりクエリの実行に時間がかかってしまいます。
%TimeStamp型のプロパティにインデックスを作成している場合にも、クエリオプティマイザはそのインデックスを優先して最適化するようにはなっておりません。

#SQL #ヒントとコツ #InterSystems IRIS #InterSystems IRIS for Health

1 0

1 429

記事

Mihoko Iijima · 2021年8月30日 2m read

クエリをチューニングする方法

これは InterSystems FAQ サイトの記事です。

InterSystems 製品には、テーブルのコンテンツに関する統計を収集し、クエリの最適化に役立てる「テーブルチューニング機能」があります。

設定方法は、以下のドキュメントをご参照ください。

ターミナルでは次のコマンドを実行します。

Do $system.SQL.TuneTable("<テーブル名>",0,1)

また、以下の資料もご参照ください。

1) パフォーマンス調査の基礎知識として必要なグローバル構造の解説やSQLの動作の仕組みからクエリプランの見方の解説

インターシステムズ・シンポジア2011の資料

2) パフォーマンスチューニングの例（P13～）

インターシステムズ・シンポジア2012の資料

3) ビットマップ・インデックスの圧縮やオプティマイザ・ヒントなど、Caché SQLのパフォーマンスを最大限に引き出すための情報について

インターシステムズ・シンポジア2014の資料

4) パフォーマンスに困ったときにどこに着目し、どのツールで調べていくか、お客様から日々ご相談をいただくカスタマーサポートから、解決に向かうアプローチの「イロハ」をご紹介するビデオ

動画：Performance 101

5) 開発者コミュティのパフォーマンス関連情報（performanceタグ）

performanceタグ

#SQL #パフォーマンス #ヒントとコツ #Caché #Ensemble #HealthShare #InterSystems IRIS #InterSystems IRIS for Health

1 0

0 418

記事

Toshihiko Minamoto · 2024年4月18日 13m read

レシピデータセットを外部テーブルで読み込み、組み込みPythonでLLMを使って分析する (Langchain + OpenAI)

我々には、Redditユーザーが書いた、おいしいレシピデータセットがありますが, 情報のほとんどは投稿されたタイトルや説明といったフリーテキストです。埋め込みPythonやLangchainフレームワークにあるOpenAIの大規模言語モデルの機能を使い、このデータセットを簡単にロードし、特徴を抽出、分析する方法を紹介しましょう。

データセットのロード

まず最初に、データセットをロードするかデータセットに接続する必要があります。

#Artificial Intelligence (AI) #Code Snippet #CSV #Embedded Python #JSON #ObjectScript #Python #SQL #ターミナル #InterSystems IRIS

1 0

0 414

記事

Toshihiko Minamoto · 2021年2月16日 8m read

グローバルをクラスにマッピングする技術 1/3

グローバルをクラスにマッピングする技術 (1/3)

古くなった MUMPS アプリケーションに新たな生命を吹き込みたいとお考えですか？以下にご紹介するステップを実行すれば、既存のグローバルをクラスにマッピングし、美しいデータを Object や SQL に公開できます。

本記事を含む合計 3 回の連載を通じてご紹介する簡単なステップを使えば、すべてのグローバル (特殊なものは除く) を Caché のクラスにマッピングできるようになります。特殊なものについては、私が長年に渡って集めた様々な種類のマッピングを zip ファイルにまとめて提供いたします。これは新しいデータを対象としたステップではありません。グローバルがないという方は、デフォルトのストレージをお使いください。

#SQL #グローバル #マッピング #Caché

3 1

1 413

記事

Toshihiko Minamoto · 2021年9月14日 10m read

リレーショナルデータベースにおけるEntity-Attribute-Valueモデル。グローバル変数はテーブルでエミュレートする必要がありますか？パート2.

より産業向けのグローバルストレージスキーム

この連載の第1回では、リレーショナルデータベースにおけるEAV（Entity-Attribute-Value）モデルを取り上げ、テーブルにエンティティ、属性、および値を保存することのメリットとデメリットについて確認しました。このアプローチには柔軟性という点でメリットがあるにもかかわらず、特にデータの論理構造と物理ストレージの基本的な不一致などによりさまざまな問題が引き起こされるという深刻なデメリットがあります。

こういった問題を解決するために、階層情報の保存向けに最適化されたグローバル変数を、EAVアプローチが通常処理するタスクに使用できるかどうかを確認することにしました。

パート1では、オンラインストア向けのカタログをテーブルを使って作成し、その後で1つのグローバル変数のみで作成しました。それでは、複数のグローバル変数で同じ構造を実装してみることにしましょう。

#SQL #グローバル #データベース #パフォーマンス #ヒントとコツ #リレーショナルテーブル #非構造化データ #Caché #InterSystems IRIS #InterSystems IRIS for Health

Open Exchange app

0 0

0 406

記事

Toshihiko Minamoto · 2022年4月1日 7m read

InterSystems IRIS の新しい埋め込み SQL

#SQL #InterSystems IRIS

0 0

0 394

記事

Toshihiko Minamoto · 2021年4月19日 8m read

配列プロパティ要素のための SQL インデックス

クラスの中で配列プロパティを使い、その要素 (キーと値の両方) によってスピーディに検索を実行できると非常に便利な場合があります (EAV モデルの場合は特に重宝します)。

それでは、簡単な例を見てみましょう。

#ObjectScript #SQL #インデックス付け #パフォーマンス #Caché

1 0

0 391

記事

Mihoko Iijima · 2021年2月12日 3m read

SQL から ObjectScript で記述したプログラムを実行して値を返す方法

これは InterSystems FAQ サイトの記事です。

以下例のクラスメソッド getLatestID() のように ObjectScript のクラスメソッドを用意します。
返したい値を戻り値に指定し、SQLストアドプロシージャ（SqlProc）キーワードを指定するだけで値が返せます。

ClassMethod getLatestID() As %Integer [ SqlName = getLatestID, SqlProc ]
{
    set latestID=$Order(^ISJ.TestClass1D(""),-1)
    quit latestID
}

操作を試す場合は、以下のクラス定義をご準備ください。

#ObjectScript #SQL #ヒントとコツ #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 388

記事

Megumi Kakechi · 2024年5月24日 4m read

Linuxで SSL/TLS を使用して JDBC 接続を行う方法

こちらの記事では、LinuxでJDBC接続を行う方法をご紹介しました。

今回は、SSL/TLS を使用するように InterSystems IRIS スーパーサーバを構成した IRIS に対して、JDBCで SSL/TLS 接続をする方法をご紹介します。

LinuxでJDBC接続を行う方法の記事で紹介している手順で、SSL/TLS なしでJDBC接続できる環境を用意していることを前提にご説明します。

手順は以下のようになります。手順の詳細は、この後で説明します。

#Java #SQL #セキュリティ #ヒントとコツ #InterSystems IRIS #InterSystems IRIS for Health

2 0

0 382

記事

Toshihiko Minamoto · 2020年6月3日 6m read

InterSystems IRISによる水平スケーラビリティ

先週、私たちはInterSystems IRIS Data Platformを発表しました。これは、トランザクション、分析、またはその両方に関係なく、あらゆるデータの取り組みに対応する新しい包括的なプラットフォームです。 CachéとEnsembleでお客様が慣れ親しんでいる多くの機能が取り込まれていますが、この記事では、プラットフォームの新機能の1つであるSQLシャーディングについてもう少し詳しく説明します。これはスケーラビリティに関する強力な新機能です。

#Artificial Intelligence (AI) #ECP #SQL #シャーディング #分散データ管理 #分析 #Machine Learning (ML) #InterSystems IRIS

0 0

0 374

記事

Mihoko Iijima · 2023年4月4日 7m read

PythonからNativeAPIを利用してIRISに接続する AWS Lambda関数を作成するまでの流れ

開発者の皆さん、こんにちは。

Python Native APIを利用すると、IRISにあるグローバル変数の参照／更新をPythonから行えたり、メソッドやルーチンをPythonから実行することができます。

この記事では「AWS Lambda の IRIS Python Native API IRIS」の記事を参考に、NativeAPIを利用してPythonからIRISに接続するAWS Lambda関数を作成する流れで必要となる、レイヤー作成と関数用コードの作成例をご紹介します。

※ 事前にAWSのEC2インスタンス（Ubuntu 20.04を選択）にIRISをインストールした環境を用意した状態からの例でご紹介します。

#AWS #Python #SQL #グローバル #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 367

記事

Megumi Kakechi · 2020年12月17日 1m read

選択性の数値について

これはInterSystems FAQ サイトの記事です。

選択性（または Selectivity）の数値とは、カラムに対するユニークデータの割合を示す数値です。

例） Person テーブルの個別値である PID カラム、住所のうち都道府県名が入る Pref カラム
　Pref カラムの選択性 = 約 2%
　PID カラム（ユニーク属性のカラム）の選択性 = 1

InterSystems製品のクエリオプティマイザは、クエリ実行経路（プラン）とインデックスの選択を決定するため、エクステントサイズ（テーブル内のレコード数）と選択性の数値を使用します。

詳細は下記ドキュメントページをご参照ください。

テーブルの最適化【IRIS】

#SQL #パフォーマンス #ヒントとコツ #Caché #Ensemble #InterSystems IRIS #InterSystems IRIS for Health

0 0

0 366

記事

Toshihiko Minamoto · 2023年7月24日 8m read

Embedded Python を使ってストアドプロシージャを作成する

Python は世界で最も使用されているプログラミング言語になり（出典: https://www.tiobe.com/tiobe-index/）、SQL はデータベース言語としての道をリードし続けています。 Python と SQL が連携して、SQL だけでは不可能であった新しい機能を提供できれば、素晴らしいと思いませんか？結局のところ、Python には 380,000 を超える公開ライブラリがあり（出典: https://pypi.org/）、Python 内で SQL クエリを拡張できる興味深い機能が提供されています。この記事では、Embedded Python を使用して、InterSystems IRIS データベースに新しい SQL ストアドプロシージャを作成する方法を詳しく説明します。

サンプルとして使用する Python ライブラリ

この記事では、IRIS で SQL を扱う人にとって非常に便利な GeoPy と Chronyk という 2 つのライブラリを使用します。

#Embedded Python #Python #SQL #ベストプラクティス #InterSystems IRIS #InterSystems IRIS for Health

Open Exchange app

1 0

0 359

記事

Tomoko Furuzono · 2020年9月7日 6m read

フリーテキスト検索：SQL開発者が秘密にしているテキストフィールドの検索方法*

アプリケーションに、効率的に検索したいフリーテキストを含むフィールドがありますか？これまで複数の方法を試してみたものの、顧客が要求するパフォーマンスを満たせなかった経験はありませんか？私は変わった手段を使ってあらゆる問題を解決できると思っていませんか。もうご存じですよね。私ができるのは、パフォーマンス低下に対処する優れたソリューションを提供することです。

#iFind #オブジェクトデータモデル #ObjectScript #SQL #インデックス付け #Caché #InterSystems IRIS

0 0

0 358

記事

Megumi Kakechi · 2022年11月28日 2m read

IRIS SQLでは LIMIT/OFFSET句のような機能をサポートしていますか？

Question:

IRISでは、PostgreSQLやMySQLで使うことができる、開始位置や取得件数を指定する LIMIT句やOFFSET句をサポートしているでしょうか？

Answer:

※2025/4/17更新：IRIS2025.1 以降のバージョンでは、LIMIT/OFFSET句をサポートするようになりました。ご参考

残念ながらサポートしていません。
ただ、代わりに使える同様の方法がありますのでご紹介します。

以下のようなSQLクエリをIRIS SQLで行うとします。