Anthropic は2026年4月16日、フラッグシップモデル Claude Opus 4.7 を発表した。Opus 4.6 と同じ API 価格(入力 $5 / 出力 $25 per M tokens)を維持しながら、ソフトウェアエンジニアリング領域での性能向上、画像処理の長辺2,576ピクセル(~3.75メガピクセル、従来比3倍超)への拡張、そしてコーディング作業向けの新機能 ultrareview / auto mode / xhigh effort を同時に投入している(出典:Anthropic 公式)。
BtoBマーケ視点で見るべきはベンチマークの数字ではない。本当の論点は、「業務のどこまでを AI に任せるか」という設計判断の自由度が、また一段階広がったという事実だ。価格据え置きで性能が伸び、レビュー・自律実行・推論深度の選択といった工程レベルの制御が可能になった結果、AI を組み込んだワークフロー設計の選択肢が増えている。スペック競争を追うのは設計判断ではなく、追従反応だ。
本記事は Anthropic Claude Design 発表 を起点とする Vegimax の Anthropic シリーズの延長線上にある。前回までで見てきた「設計済みの組織を加速する AI」という論点が、コーディングモデルの進化を通じて、今度は業務工程そのものの設計レイヤーへと到達している。BtoBマーケが向き合うべきは、新モデルへの乗り換え判断ではなく、自社業務に対する設計原則の言語化だ。
Opus 4.7 で何が変わったのか(公式公開分の整理)
Anthropic が公開している主な改良点は、性能・モダリティ・新機能・価格の4軸に整理できる。まずは事実関係を出典付きで確認する。
ソフトウェアエンジニアリング性能の向上
公式ページは「Opus 4.6 比で最難関タスクほど改善幅が大きい」と説明し、SWE-Bench Verified / Terminal-Bench 2.0 / Finance Agent / GDPval-AA といった代表的評価で改善または SOTA(state-of-the-art)を達成したと記載している。Replit / XBOW / Notion / Cursor / Rakuten など28社の顧客引用がページ上に並び、いずれも「同等品質をより低コストで」「特定ベンチで Opus 4.6 から数十ポイント改善」「本番タスク解決数が大幅増」といった定性的・定量的な改善を報告している(具体数値は出典 Anthropic 公式ページを参照)。
画像入力の解像度が従来比3倍超に
画像入力の最大解像度が長辺 2,576 ピクセル / 約 3.75 メガピクセルに引き上げられた。Anthropic 自身が「従来モデルの3倍超」と表現している。BtoBマーケ実務では、LP のフルキャプチャ・広告クリエイティブの細部・サイト構造図の流し込みなど、これまで「縮小しないと食わせられなかった」素材をそのまま AI に解釈させられるようになる。
3つの新機能 ultrareview / auto mode / xhigh effort
Opus 4.7 と同時に導入された新機能は、いずれも「工程を細かく設計する」発想に基づいている。ultrareview は変更差分を読み込んでバグや設計上の問題を検出する専用レビューセッション、auto mode は人間の介入を減らして長時間タスクを自律実行させる権限モード、xhigh effort は high と max の間に位置する新たな推論深度レベルで、推論コストとレイテンシのトレードオフを細かく制御できる。3つに共通するのは、「同じモデルで工程ごとに振る舞いを切り替える」設計思想だ。
価格は据え置き
API 料金は入力 $5 / 出力 $25 per M tokens で、Opus 4.6 と同一。性能向上ぶんを Anthropic が吸収する形で価格を保っている。BtoBマーケ視点では、「乗り換えに伴うコスト計算のやり直しが不要」という運用面のメリットが大きい。
ただし——スペック追従は「設計判断」ではない
ここで Vegimax として一つ強調しておきたい。新モデル発表のたびに性能ベンチマークを比較し、最高値のモデルへ乗り換える運用は、「設計」ではなく「追従」だ。
現在の AI モデルの進化サイクルは、半年〜1年で次世代が登場する速度になっている。Opus 4.7 の数ヶ月後には Opus 4.8 が来るだろうし、競合の Gemini や GPT も並走している。スペック最高値のモデルに業務を最適化すると、半年ごとにワークフローを再設計し続ける羽目になる。これは BtoBマーケ組織が支払うべきコストではない。
性能向上で「できる範囲」は確実に広がる。しかし「何を任せるか」「どこに人間判断を残すか」「どの工程をどの深度で回すか」という設計判断は、モデル進化と独立した、組織側の責任領域だ。Opus 4.7 が示しているのは、設計の自由度を広げる道具立てであって、設計判断の代行ではない。
「スペック追従型」と「設計起点型」の違い
BtoBマーケ組織が AI を業務に組み込むとき、2つのアプローチが存在する。Opus 4.7 のような新モデルが出るたびに、この違いが顕在化する。
| 観点 | スペック追従型 | 設計起点型 |
|---|---|---|
| モデル選定基準 | ベンチマーク最高値 | 業務工程との適合度 |
| ワークフロー変更頻度 | モデル更新ごと | 設計変更時のみ |
| 組織知見の累積先 | モデルに依存 | 工程設計に蓄積 |
| 新機能への対応 | 追従して再構成 | 既存設計に編入 |
| アウトプット品質 | モデル性能依存 | 工程設計依存 |
ultrareview / auto mode / xhigh effort のような工程レベルの制御機能は、設計起点型の組織にとっては「既存ワークフローを精緻化する追加の道具」になる。一方、スペック追従型の組織にとっては「新たな組み込み先を毎回ゼロから決める負担」になる。同じ機能が、組織のスタンスによって資産にも負債にもなる。
BtoBマーケが取り出すべき3つの含意
Opus 4.7 の新機能群から、BtoBマーケ実務に直結する設計原則を3つ抽出する。
1.「執筆」と「レビュー」を別工程として分離する
ultrareview は「コード生成」と「コードレビュー」を別セッションとして分離する設計だ。BtoBマーケでも、記事執筆・提案資料作成・広告クリエイティブ生成の各工程に対し、独立した「レビュー工程」を AI 設定として明示的に持つと、品質が一段上がる。同じ AI に「書いて、自分でチェックして」と頼むのではなく、書き手 AI とレビュアー AI を分離する発想だ。
2.「自律実行」と「人間判断」の境界を明文化する
auto mode の本質は「人間がいつ介入するかをあらかじめ設計する」点にある。BtoB ワークフローでも、AI に任せて良い範囲(データ集計・初稿生成・パターン作成)と、人間判断を必須にする範囲(媒体配分の最終決定・ステートメントの言い切り表現・予算配分の方針)を、組織として明文化しておく必要がある。境界が言語化されていない組織が auto mode 的な AI を導入すると、責任所在が曖昧になり事故が起きる。
3.「推論深度」を意思決定の重みに合わせる
xhigh effort は「同じモデルで深度を切り替える」発想を実装している。BtoBマーケ実務に翻訳すれば、日次レポートのコメント生成は浅い深度、四半期の戦略方針ドラフトは深い深度といった切り分けを設計として持つ、ということだ。すべてを最深度で回せばコストが破綻し、すべてを浅い深度で回せば質が落ちる。意思決定の重みに対して AI の深度を意図的に変える設計が、コストと品質を両立させる。
「運用」ではなく「設計」— Vegimax の立場
Vegimax は 運用ではなく設計 を一貫して標榜してきた。Opus 4.7 の発表は、その思想がコーディング AI という最も技術寄りの領域においても、まったく同じ構造で成立することを示している。
モデルがどれだけ強くなっても、「組織として何をどう設計するか」が成果を分ける。AI Citation Source Index 2026 の論点で見た「引用される情報構造の設計」も、本記事の「業務工程の設計」も、根は同じだ。AI ツールの進化は道具立てを更新するが、道具をどう使うかの設計判断は、組織側の累積資産としてしか作れない。
まとめ:Opus 4.7 が示すのは「設計の自由度の拡張」
Claude Opus 4.7 の登場は、AI モデルが「業務代行ツール」から「業務工程の設計対象」へと変質してきていることを象徴している。BtoBマーケが向き合うべきは、新モデルの導入判断ではなく、自社業務の設計原則をどこまで言語化できているかという内向きの問いだ。これは Claude Design 発表 の時点から我々が言い続けてきた論点でもある。AI は設計済みの組織を加速する道具であって、設計の代行者ではない。Opus 4.7 はその輪郭を、もう一段くっきりさせた。