本日、OpenAIがGPT-5.4をリリースしました。Boxでは、最新のGPT-5.4と前身のGPT-5.2を比較してAIモデルを評価しました。
GPT-5.4は、あらゆるドキュメント作業レベルにおいて、全体的なメタデータ抽出精度が6パーセントポイント向上(72%から78%)しています。GPT-5.4へのアップグレードにより、アウトプットの信頼性が向上し、エラーが減少します。AIを活用したメタデータの抽出、さまざまな種類のドキュメントの分析、複雑なワークフローの自動化を行う企業にとって特に重要です。GPT-5.4は、複数ステップの計算、多様なドキュメントタイプにわたる深い推論、複雑なコンテンツからの推論を必要とするタスクにおいて、特に優れた性能を発揮します。
メタデータ抽出性能の全体的な向上

Boxの評価では、メタデータ抽出パフォーマンスがすべてのカテゴリーで向上し、多様なドキュメントタイプと業種で大幅な向上が見られました。一貫性のない文書構造からメタデータを確実に取得できることで、財務や法務の複雑なワークフローを自動化し、より高い信頼性と手作業による検証の削減を実現できます。
ドキュメントタイプ別のパフォーマンス
GPT-5.4の進化が日常業務をどのように改善するかを確認するために、いくつかの特定のドキュメントタイプでAIモデルを評価しました。
- 臨床データ: 5パーセントポイント向上(81% → 86%)— 患者のリスクグループの分類と、治験募集および臨床ワークフローのための数値抽出をサポートします。
- 法的契約書: 3パーセントポイント向上(82% → 85%)— 手続きの詳細を特定し、それらを特定の法的原則にマッピングし、デューデリジェンス中に契約条件を把握するのに役立ちます。
- 規制関連申請書: 5パーセントポイント向上(79% → 84%) — 構造化された企業申請書からコンプライアンスデータとメタデータを抽出できます。
- 研究出版物: 7パーセントポイント向上(71% → 78%)— 実験結果と科学文献のデータを解析できます。
- 政府統計出版物: 10パーセントポイント向上(60% → 70%)— 公共部門および政策立案のための大規模なデータセットと人口統計データを分析できます。
- 業界メディアレポート: 7パーセントポイント改善 (61% → 68%) - アナリストレポートから市場動向、クリック単価指標、パフォーマンスデータを抽出できます。
GPT-5.4の進化により、専門的なコンテンツの有効性が目に見える形で向上します。GPT-5.4は、メタデータ抽出のベースラインを引き上げることで、臨床試験の募集や研究開発から法務デューデリジェンスに至るまで、重要なワークフローを効率化し、手作業による監視の必要性を大幅に削減します。
複雑な推論タスクにおけるパフォーマンス

ドキュメントタイプ以外にも、GPT-5.4は、主要な高負荷メタデータ抽出カテゴリー全体で幅広い進化を示しました。
- 計算量の多いフィールド(85% → 89%): 定量分析を必要とするメタデータ抽出時のエラーが減少します。
- 推論ステップ数が多いフィールド(73% → 79%): 複数ステップのタスクをより効率的に実行することで、微妙な法的および調達レビューにおいてGPT-5.2を上回ります。
- 長文ドキュメント全体から多くのフィールドを抽出(64% → 71%): 膨大なファイルから多数のメタデータを抽出する必要がある大規模なメタデータテンプレートを作成する際のギャップや不整合を削減します。
Q&Aのパフォーマンスは業界全体で向上

Boxの評価により、GPT-5.4は業界特有の複雑なシナリオにおいて、より一貫性のあるメタデータ抽出を実現することが確認されました。GPT-5.4は、ソーステキストから正解を直接特定する能力が大幅に向上し、GPT-5.2では情報を省略したり、「該当なし」と誤って返答したりしていたケースが大幅に削減されました。
- ヘルスケア: 9パーセントポイント向上(57% → 66%)。ヘルスケア業界の採用分析タスクにおいて、GPT-5.4は基礎となるデータパターンからカテゴリーをマッピングし、正確な数値を抽出しました。GPT-5.2は同じテストで、複数のカテゴリーを誤って「該当なし」とマークし、やや不正確な数値を抽出していました。
- 法務: 11パーセントポイント向上(52% → 63%)。法的要約の作成などの関連評価タスクにおいて、GPT-5.4は複数の基準に基づく文書要件を適切に処理し、無関係な出典を引用するなどのGPT-5.2のスコアペナルティとなるマイナスウェイト基準を回避しました。
- エネルギー: 16パーセントポイント向上(44% → 60%)。GPT-5.4は、専門家によるレビューと検証タスクにおいて優れたパフォーマンスを発揮し、ソーステキストから直接正解を推論する能力が向上しました。
Box AI Studioで利用可能
GPT-5.4は、本日よりBox AI Studioで利用可能です。より高性能なAIモデルを使用してカスタムAIワークフローを構築できます。スプレッドシートからのメタデータ抽出、ドキュメントレビューの自動化、医療、法務、エネルギー分野のユースケース向けワークフローの構築など、GPT-5.4の進化を企業コンテンツ環境内で直接活用できます。
このブログは、Box, Inc.公式ブログ(https://blog.box.com/)2026年3月5日付投稿の翻訳です。
著者: Rutuja Rajwade, Senior Product Marketing Manager, Platform & AI at Box
原文: https://blog.box.com/how-openai-gpt-54-improves-data-extraction
関連コンテンツ
- トピックス:
- Box製品情報
