独自の文書処理パイプラインを構築してみたことがあるなら、きっと「なぜソリューションを購入する必要があるのか? このPDFをGeminiかGPT-4に送るだけで答えが得られるのに」と、思ったことがあるでしょう。
メタデータ抽出はLLMプロンプトの問題に過ぎないという誤解がよくあります。しかし実際には、複雑なスキャンを処理し、アクセス権限を適用し、構造化されたクエリ可能なデータを出力する、本番環境対応のメタデータ抽出パイプラインを構築することは、単一のAPIコールよりもはるかに難しいのです。
Boxは、単なる「RAG(検索拡張生成)」から、エージェント型メタデータ抽出へと進化しました。新しいBox Extractのフルスタック、AIネイティブアーキテクチャの内部構造をご紹介します。

1. トリガーレイヤ: 柔軟性を最優先
実際のアプリケーションでは、メタデータ抽出は必ずしも直線的なプロセスではありません。Box Extractアーキテクチャは、複数のエントリーポイントをサポートしています。
- 手動: ユーザーがBox Webアプリ内でドキュメントをプレビューして、「自動入力」ボタンをクリックします。
- ファイルアップロード(自動): ファイルがアップロードまたは更新されると、即座にトリガーされます。
- ワークフローとAPI: 大規模なビジネスロジックパイプラインに統合するか、プログラムから呼び出されます。
- MCP(エージェント型): ユーザーを代わって動作するモデルコンテキストプロトコル(MCP)エージェントによってトリガーされます。
2. コア:「単なるLLM」だけでは不十分な理由
トリガーされると、データはBox Intelligent Extraction Coreに格納されます。ここで、コアインテリジェンスであるBox AI抽出エージェントがオーケストレーションして、重要な処理が行われます。
A. セキュリティ、デジタル化、準備
処理を開始する前に、システムはセキュリティ権限を検証します。Box AI抽出エージェントは、特定のファイルにアクセスするために明示的な権限を持っている必要があります。これは、企業のコンプライアンスにとって不可欠な「権限優先」のアプローチです。
次に、単にPDFをそのままAIモデルに渡すだけではありません。システムは、統合された高度なOCRを使用してコンテンツを準備し、乱雑なドキュメントを、構造と階層を維持しながら、AIに適したクリーンな形式に変換します。
B. Box AI抽出エージェントのパワー
準備されたコンテンツは、オペレーションの頭脳であるBox AI抽出エージェントに渡されます。これは「ファイアアンドフォーゲット」(発射したらあとは忘れておける)な生成ではありません。Box AI抽出エージェントはプランナー兼オーケストレーターとして、抽出プロセスをいくつかの重要なステップでインテリジェントに指揮します。
- 分類: Box AI抽出エージェントは、まずドキュメントの種類を分類し、最適な抽出戦略を決定します。
- 精製と拡充: 単にテキストを抽出するだけでなく、データを精製、拡充し、ほかのソースやメタデータ階層との相互参照も行います。
- 検証: Box AI抽出エージェントは、抽出したデータを事前に定義されたビジネスルールや信頼度しきい値を参照して検証します。
C. ヒューマンインザループ
重要なのは、アーキテクチャに「ヒューマンインザループ」(人間の介在)のレビューステップが組み込まれていることです。信頼度の低いメタデータや機密文書の場合は、最終決定前に人間がレビューすることができます。
3. 保存と更新: メタデータの威力
検証とレビューが完了したら、最後のステップはメタデータとして保存することです。新たに構造化されたデータを非構造化ファイルに直接付与することで、コンテンツとデータを結びつけます。静的なファイルがデータベースレコードに変換され、Boxアーキテクチャ内で即座に利用可能になります。
4. データ消費と統合: 構築できるもの
データが抽出され、メタデータとして保存されると、アクティブな資産となります。メタデータは、さまざまな方法で活用できます。
- Boxでコンテンツ管理: 静的なファイルを構造化されたレコードに変換します。抽出したフィールドに基づいて、コンテンツを検索、絞り込み、並び替えできます。キーワード検索だけでなく「金額が$10,000以上」で契約書を検索することもできます。
- Box Appsのダッシュボードを活用: 構造化データを利用して、Box Appsでカスタムビュー、ポータル、ビジュアルダッシュボードを作成できます。
- Box Relayでワークフローをオーケストレーション: メタデータ値を使用して、後続の業務プロセスを自動的に開始して、データに基づいてタスクを割り当てたり、ドキュメントを回覧できます。
- 外部アプリへのエクスポート: Salesforce、Snowflake、Databricksなどのほかのシステムに、クリーンで構造化されたデータを直接送信できます。
- AIエージェントエコシステムとの連携: サードパーティのAIエージェントや外部ツールが、構造化されたメタデータにアクセスして読み取り、自律的にタスクを実行できるようにします。
開発者の「勝利」: 運用上の負担なし
Box Extractを利用する開発者にとっての最大のメリットは、AIだけでなく、インフラストラクチャにあります。
- 429エラーはもうありません: Box SDKは、APIの利用状況を自動で監視、管理します。スロットリングと同時実行のロジックはBoxが処理するので、「Too Many Requests」エラーを防ぐための防御コードを書く必要はありません。
- 構造化と自由形式: 標準化された請求書のための構造化メタデータ抽出でも、契約書の探索的クエリのための自由形式メタデータ抽出でも、APIはそのユースケースに合わせて適応します。
コンプライアンス準拠、セキュア、オールインワン
Box Extractのすべての機能は、セキュアで、コンプライアンスに準拠し、かつ拡張性に優れたエンタープライズグレードのプラットフォーム上で動作します。ドキュメントはセキュリティ境界から外れることがなく、メタデータ抽出は完全な監査ログとともに実行され、すべてのステップでアクセス制御が遵守されます。Box Extractは、企業の要件を満たす安全、安心なAIです。
肝心なのは
Box Extractは、単なるAIモデルのラッパーではありません。Box Extractは、コンプライアンスに準拠したセキュアなオールインワンのパイプラインであり、ドキュメントAIの複雑な部分を綿密に処理するように設計されています。実世界の雑然としたドキュメントをAIで読み取り可能な形式に変換し、反復処理と改善のタイミングを把握できるエージェント型ワークフローを使用し、セキュリティとコンプライアンスを常に維持しながら、既存のBoxワークフローと統合した形で結果を保存できます。
ドキュメントワークフローを構築している場合、Box Extractは長年の研究開発に裏付けられた本番環境に対応するメタデータ抽出システムを提供します。PDFやプロンプトエンジニアリングに悩まされることなく、アプリケーションロジックに集中できます。ドキュメント処理の機能は、LLMコールを1回行うことではありません。適切なツールを適切なタイミングで巧みにオーケストレーションできるインテリジェントなAIエージェントが必要です。
そしてまさに、Box Extractがそれを実現しています。
※このブログは Box, Inc 公式ブログ(https://blog.box.com/)2026年1月15日付投稿の翻訳です。
著者: Rutuja Rajwade, Senior Product Marketing Manager, Platform & AI at Box
原文リンク: https://blog.box.com/beyond-just-wrappers-inside-architecture-box-extract
関連コンテンツ
- トピックス:
- Box製品情報


