急速に進化する企業のAI環境において、単純なチャットボットから複雑で多段階のワークフローを実行できる機能への移行が、新たな潮流になりつつあります。Anthropicの最新モデルClaude Sonnet 4.6が、Box AI Studioで利用可能(ベータ版)になりました。Claude Sonnet4.6のパフォーマンスに関する分析結果をご紹介します。Boxの評価では、Claude Sonnet 4.6が前バージョンのClaude Sonnet 4.5と比較して、企業の日常的な業務の要求にどのように対応できるかに焦点を当てました。Claude Sonnet 4.6は、複数のタスクにおいてClaude Sonnet4.5を上回り、これまでAIエージェントにとって課題となっていたオーケストレーションや時間を要するタスクにおいて優れたパフォーマンスを発揮します。
AIエージェントを強化する推論機能

評価の第一の柱は、AIエージェントに必要な推論機能に焦点を当てました。Boxでは、Claude Sonnet 4.6が様々な業種における複雑なタスクでオーケストレーション、検索、Q&Aを実行する能力をテストしました。
推論負荷の高いデータセットにおいて、ClaudeSonnet 4.6は総合精度スコアで77%を達成しました。これは、Claude Sonnet 4.5の62%を15パーセントポイントも上回る結果です。この指標は、Claude Sonnet 4.6が、単発の迅速な回答ではなく、時間を要する詳細なオーケストレーションを必要とするタスクを処理できる能力を測る上で非常に重要です。Claude Sonnet 4.6は、公共部門(88%)、ヘルスケア(78%)で顕著な性能を発揮し、高い信頼性が要求される業種全体で優れた精度を示しました。機能面で見ると、Claude Sonnet 4.6は複雑な情報を統合し、実用的なドキュメントにまとめる能力にも優れており、デューデリジェンスとデータ分析において特に優れた進化が見られました。
複雑なワークフローにおけるハルシネーションの低減

数字が物語るように、Boxの評価における具体的な成果は、Claude Sonnet 4.6が日常業務のためのAIモデルとして最適な理由を浮き彫りにしています。
- 計算ミスの防止: 複数年にわたる売上データを分析する小売業の業務でテストしました。ワークフローでは、属性による商品のフィルタリング、前年比成長率の計算、そして将来のコスト予測が必要でした。Claude Sonnet 4.5は財務分析に苦労し、計算ミスが連鎖的に発生しました。しかし、Claude Sonnet 4.6は投資対コスト比率を正しく計算して、価格上昇率の高い商品を上位にランク付けすることに成功しました。
- 報告の整合性の確保: 教師が対象を絞った学習プログラムを試行するシナリオもテストしました。生徒の学習成果を要約して意思決定を推奨する必要がありました。Claude Sonnet 4.5は合格者数を誤って計算し、誤った推奨結果を回答しました。Claude Sonnet 4.6は合格者数を正確に特定し、実際のデータと一致する推奨結果を提供しました。
高精度なメタデータ抽出

AIエージェントは推論に加えて、非構造化コンテンツから構造化データを正確に抽出する必要があります。ワンショットの抽出テストでは、複雑なロジックの処理においてClaude Sonnet 4.6がClaude Sonnet 4.5を上回りました。数式処理を必要とするフィールドでは、Claude Sonnet 4.6は89%の精度を達成したのに対し、Claude Sonnet 4.5は62%でした。Claude Sonnet 4.6は、テストセットに含まれるPDFおよびDocxファイルで80%を超える精度を達成するなど、ファイル形式を問わず高いパフォーマンスを維持しました。Claude Sonnet 4.6は、高度な推論を必要とするタスクでも優れたパフォーマンスを維持しており、Claude Sonnet 4.6がデータを見つけるだけでなく、コンテキストも理解していることを示しています。
より信頼性の高いAIエージェントを構築しましょう
推論と抽出の進化により、Claude Sonnet 4.6は高い精度が求められる高度なワークフローの自動化に最適な選択肢となります。以前のClaude Sonnet 4.5は複数ステップのロジック処理に課題がありましたが、Claude Sonnet 4.6のリリースにより、より要求の厳しい企業ユースケースにも対応できるようになりました。
Claude Sonnet 4.6は、Box AI StudioおよびBox APIでベータ版としてご利用いただけます。
このブログは、Box, Inc.公式ブログ 2026年2月17日付投稿の翻訳です。
Sidharth Srinivasan, Product Manager, Box AI
原文リンク: https://blog.box.com/enhanced-reasoning-agents-announcing-box-ai-support-claude-sonnet-46
関連コンテンツ
- トピックス:
- Box製品情報
