データハブ 5.1
- Last Updated: April 5, 2026
- 3 minute read
MarkLogicデータハブ
概要
「MarkLogicデータハブ」は、MarkLogicサーバー上でオペレーショナルデータハブを迅速に構築するためのツールとライブラリのセットです。
「データハブ」は、さまざまなサイロからのデータを統合するリポジトリです。「オペレーショナルデータハブパターン」は、より迅速かつアジャイルなデータ統合を促進するだけでなく、データへのリアルタイムの対話型アクセスを可能にするデータハブを構築する手法です。例えば、シェアードサービスと分析レポートは、データハブに追加データが統合されつつある間でも、同時にデータハブにアクセスできます。
さらに、オペレーショナルデータハブでは以下のことが可能です。
- エンティティレベルまたは属性レベルですべてのデータと運用を保護します。
- データリネージをトレースします。どこから来たのか? 誰が読み込んだのか? いつ?
MarkLogicデータハブは、開発をすぐに開始できるようにコードのスキャフォールディング(叩き台)を生成し、完全に自動化されたビルドをセットアップするためのDevOpsプロセスを提供します。
MarkLogicデータハブのコンセプト
さまざまなソースからデータハブにデータを読み込み、データを標準化することで、アプリケーションでデータを容易に利用できます。データハブでは、フロー内のステップを使用してこれを実現します。
フローには、次のタイプのステップを組み合わせて含めることができます。
- 読み込みでは、データをデータハブに取り込みます。
- マッピングでは、エンティティモデルを使用してデータを標準化します。
- マッチングでは、重複しているものを探します(複数ステップによるマスタリングプロセスの第1ステップです)。
- マージングでは、重複しているものを合体させます(複数ステップによるマスタリングプロセスの第2ステップです)。
- マスタリングでは、重複しているもののマッチングとマージを行います(ステップが統合されている従来のマスタリング処理)。
- カスタムでは、データに対して追加処理を実行したり、他のステップタイプのデフォルト動作を置き換えたりできます。
詳細については、「エンティティ」、「フロー」、「ステップ」を参照してください。
始めてみましょう
- データハブフレームワーク4.xをインストールまたはアップグレードします。
- フローやステップの作成などのタスクを実行するツールを選択します。