Boxでは、非常に複雑なドキュメントからより高い精度でキーと値のペアを抽出できるように設計された抽出エージェント (強化) を新しくリリースしました。Box UIでボタンをクリックするだけで利用でき、非構造化データをファイルに追加された意味のあるメタデータに変換できるため、Boxのメタデータ検索ツールを使用してインサイトの迅速な取得と容易な検出が可能になります。
多くの場合、これらのファイルは、開発者が簡単にアクセスする必要がある、大きなワークフローにおける1つのデータポイントであることも認識しています。開発者にとってBox AIの主な用途の1つは、非構造化データを構造化データに変換し、本番データベース、サードパーティ製システム、分析などで使用することです。そのため、Box AI API経由でこのエージェントにアクセスできるようにしました。
機能の仕組み
新しい抽出エージェント (強化) は、Gemini 2.5 Proを搭載し、思考連鎖処理を採用しているため、最良の回答を提供するだけでなく、これが正しい回答であるとエージェントが考える理由も開発者に示します。
たとえば、「総額」というキーについて抽出する場合、返されるJSONには、総額と、「推論」キー (値は「この金額は、リストの最後の合計という文字の横にある」) の両方が含まれることがあります。この手法は、開発者に安心感を与えるだけでなく、LLMがその値を受け入れるかさらなる措置を講じるかについて推論を検証できるようにするための第2のステップを実装できるようにします。
作業を開始する方法
この新しいエージェントの使用を開始する最も簡単な方法は、Box SDKのいずれかを使用することです。デモを紹介するため、ここでは、生成された最新のPython SDKを使用します。これを実行するには、以下のように必要なものがいくつかあります。
- [AIを管理する] スコープが有効になっているBox Platformアプリ。この例では、認証にclient_credentials許可タイプを使用します。
- このアプリをBoxインスタンスにインストールして有効にすること
- テストに使用するファイル
まず、エージェントを使用せずに抽出 (構造化) エンドポイントを使用する方法を見てみましょう。
AiItemBase,
AiItemBaseTypeField,
BoxClient,
BoxCCGAuth,
CCGConfig,
CreateAiExtractStructuredMetadataTemplate
)
# Create your client credentials grant config from the developer console
ccg_config = CCGConfig(
client_id="my_box_client_id", # replace with your client id
client_secret="my_box_client_secret", # replace with your client secret
user_id="my_box_user_id", # replace with the box user id that has access
# to the file you are referencing
)
auth = BoxCCGAuth(config=ccg_config)
client = BoxClient(auth=auth)
# Use the Box SDK to call the extract_structured endpoint
box_ai_response = client.ai.create_ai_extract_structured(
# Create the items array containing the file information to extract from
items=[
AiItemBase(
id="my_box_file_id", # replace with the file id
type=AiItemBaseTypeField.FILE
)
],
# Reference the Box Metadata template
metadata_template=CreateAiExtractStructuredMetadataTemplate(
template_key="InvoicePO",
scope="enterprise"
)
)
print(f"box_ai_response: {box_ai_response.answer}")
この例では、注意すべき重要な点がいくつかあります。データの抽出元となるファイルのファイルIDが必要であるほか、抽出するフィールドに関するデータを含むメタデータテンプレートがBox内に必要になります。テンプレートを用意する必要はなく、CreateAiExtractStructuredMetadataTemplateメソッドで抽出するフィールドを直接定義できることにご留意ください。
抽出するデータが頻繁に変更されないのであれば、メタデータテンプレートを使用することをお勧めします。管理パネルでテンプレートを作成し、ここで参照するだけです。データが変更される場合や、フィールドを定義するために管理者とやり取りしたくない場合は、コード内にインラインで定義することができます。
上記のコードを使用すると、データ抽出の多くのニーズに対応できます。抽出エンドポイントは、短いドキュメントや、表や画像のような複雑な構造があまり含まれていないドキュメントからデータを取得するのに非常に優れています。
逆に、複雑なメタデータ階層やバーコードを含む100ページのドキュメントがある場合は、今回の新しいエージェントを使用すると非常に役立ちます。これはすでにご存知のAPIに含まれているため、実装するためにコードを全面的に書き直す必要はありません。
実装するには、2つの新しいインポート、エージェントを定義するための数行のコードを追加し、create_ai_extract_structuredメソッドにもう1つのメソッド呼び出しを追加すれば、準備は完了です。
以下に、Box AI SDKを使用して、ファイルに対して抽出エージェント (強化) を呼び出す方法を示すPythonのサンプルスクリプト全体を示します。
AiAgentReference,
AiAgentReferenceTypeField,
AiItemBase,
AiItemBaseTypeField,
BoxClient,
BoxCCGAuth,
CCGConfig,
CreateAiExtractStructuredMetadataTemplate
)
# Create your client credentials grant config from the developer console
ccg_config = CCGConfig(
client_id="my_box_client_id", # replace with your client id
client_secret="my_box_client_secret", # replace with your client secret
user_id="my_box_user_id", # replace with the box user id that has access
# to the file you are referencing
)
auth = BoxCCGAuth(config=ccg_config)
client = BoxClient(auth=auth)
# Create the agent config referencing the enhanced extract agent
enhanced_extract_agent_config = AiAgentReference(
id="enhanced_extract_agent",
type=AiAgentReferenceTypeField.AI_AGENT_ID
)
# Use the Box SDK to call the extract_structured endpoint
box_ai_response = client.ai.create_ai_extract_structured(
# Create the items array containing the file information to extract from
items=[
AiItemBase(
id="my_box_file_id", # replace with the file id
type=AiItemBaseTypeField.FILE
)
],
# Reference the Box Metadata template
metadata_template=CreateAiExtractStructuredMetadataTemplate(
template_key="InvoicePO",
scope="enterprise"
),
# Attach the agent config you created earlier
ai_agent=enhanced_extract_agent_config,
)
print(f"box_ai_response: {box_ai_response.answer}")
今すぐお試しください
抽出エージェント (強化) は、Box AI StudioやBox AI APIで利用できます。よりスマートで信頼性の高いコンテンツ自動化を、ぜひお試しください。
- トピックス:
- 開発者