画像・PDFなどの「非構造化データ」をどう統合する?
Denodo × Boxで実現する次世代データ活用基盤

2026.03.13

カテゴリー: データ仮想化
  • linkedinでシェア
  • Xでシェア
  • facebookでシェア
  • LINEでシェア
  • はてなブックマークでシェア

はじめに

皆さん、こんにちは!
「NebulaShift di」のDenodo技術を担当しております、大山です。

普段はDenodoのエンジニアとして、お客様のデータ基盤構築を支援しています。

昨今、データ活用の現場では、散在するデータを全社的なデータ基盤へと統合し、AIやBI等多様なツールで多角的な分析を行うことで、迅速な意思決定やビジネス変革へ繋げようとする動きが加速しています。しかし、エンジニアとして多くのプロジェクトに関わる中で、ある「共通の悩み」をよく耳にします。

それは、「データベースの数字(構造化データ)は活用できているが、ファイルサーバーやクラウドストレージにある画像や動画(非構造化データ)が、手付かずのまま眠っている」という課題です。

今回は、データ統合の新たなアプローチである「論理統合(Denodo)」と、身近なクラウドストレージ「Box」を組み合わせることで、この壁をどう乗り越えるかについてお話しします。

2. データ統合の2つのアプローチ:物理統合と論理統合

データ統合には、大きく分けて「物理統合」と「論理統合」の2種類のアプローチがあります。これらは、目的やデータの性質に応じて使い分けるのが理想的です。

① 物理統合(EAI/ETL・DWH/データレイク等)

データを一つの場所に集約し、一貫性と整合性を確保して管理する方法です。

メリット:
データの集中管理、一貫性と整合性の確保、データ変換・加工処理が容易
デメリット:
データ移行に時間がかかる、更新頻度の多いデータに対して最新データの提供が困難
向いているシーン:
大規模な過去データの蓄積、複雑な加工を伴うAI/機械学習、全社共通の指標管理など。

②論理統合(データ仮想化)

データを物理的に移動させず、必要な時に必要な場所へアクセスし、仮想的なビューとして提供する方法です。

メリット:
更新頻度の多いデータに対しても最新データの提供が可能、柔軟性が高い
デメリット:
データの整合性を保つ為の仕組みが必要
向いているシーン:
更新頻度が高い最新データの参照、散在するSaaSデータの統合、部門ごとの柔軟なデータ提供など

「常に最新のデータを、スピーディーに活用したい」というニーズが高まる中、この「論理統合」への注目が集まっています。

3. Denodo Platformとは? -- 導入で得られる3つの大きなメリット

Denodo Platformは、上記で挙げた「論理統合」において世界的なシェアを持つリーダー製品です。導入することで、以下のような大きなメリットが得られます。

  • データの「鮮度」を落とさない:データソースへ直接アクセスするため、バッチ処理を待たずに「今、この瞬間」の状況をキャッチアップできます。
  • 開発コストの抑制:複雑なETLパイプラインを構築せず、仮想的なビュー定義のみでデータを提供できるため、ビジネス側の要望に数日単位で応える機動力が手に入ります。
  • セキュアな一元窓口:データがどこにあっても、Denodoを「窓口」にすることでアクセス制御やマスキングを一括適用でき、セキュリティを担保しながら、ビジネス部門が自らデータを取り出して活用できる環境をスムーズに構築できます。

4. データ統合の課題〜立ちはだかる「非構造化データ」の壁〜

さて、ここからが本題です!
Denodoはデータベースなどの統合に非常に強力ですが、ビジネス現場で扱うデータはそれだけではありません。
取扱うデータは、大きく以下の2つに分けられます。

  • 構造化データ:商品情報や販売実績など、書式が決まって整理されているデータ
  • 非構造化データ:店内映像、商品画像、設計図、監視カメラ映像、各種IoTデータなど、自由な形式のデータ

これらのデータ統合を考えた際、構造化データは物理・論理どちらでも容易に統合可能ですが、非構造化データはそのままでは統合ができません。なぜなら、分析基盤で扱うためには、画像認識や自然言語処理などの「前処理」が必要になるからです。
この非構造化データを統合するための前処理基盤として、私たちは「Boxを用いた管理」をご提案しています。

5. 【ユースケース】Box連携による「非構造化データ」の統合

この課題を解決するのが、DenodoとBoxを組み合わせたアーキテクチャです。
仕組みは非常にシンプルかつ合理的です。
構造化データ(商品情報など)はそのままDenodoで直接論理統合し、非構造化データ(店内映像や設計図など)はコンテンツ管理に長けたBoxを通してDenodoへ連携させます。最後にDenodoが持つ強力なセキュリティ管理機能を通すことで、安全なデータ提供を実現します。
この組み合わせにより、各部門で以下の画像ような次世代のデータ活用が可能になります。

「Box」について

6. まとめ

Denodo Platform単体でも、構造化データをスピーディーかつセキュアに繋ぐ基盤として絶大な威力を発揮します。そこに「Box」という非構造化データ管理のベストプラクティスを組み合わせることで、企業内に眠る「あらゆる形式のデータ」をビジネスの戦力に変えることができます。
物理的なデータ移動を伴わず、社内外に点在するデータをセキュアに繋ぎ合わせる。ビジネス現場の「今すぐ最新データを見たい」という要求に最短ルートで応えることこそが、Denodoの真骨頂です。
「自社に眠っているファイルサーバーのデータを活用したい」「具体的な連携イメージをもっと知りたい」という方は、ぜひ弊社SCSKまでお気軽にご相談ください!

NebulaShift di・データ仮想化導入サービス

担当者紹介

CSK株式会社ITインフラ・ソフトウェア事業本部データ・ミドルウェア部 大山 典慶
担当者名
大山 典慶
所属
SCSK株式会社
ITインフラ・ソフトウェア事業本部
データ・ミドルウェア部
コメント
Denodoを中心に、データ基盤の設計・構築・運用に関するエンジニア業務を担当

記載されている製品/サービス名称、社名、ロゴマークなどは該当する各社の商標または登録商標です。

本ブログ記事は正確性を保証するものではなく、記事の内容によって生じた結果について、いかなる責任も負いません。

PAGETOP