エディタから、エージェント管理へ ── Google Antigravity 2.0 が示す Agent OS の到来
Antigravity 2.0 は単なる AI IDE のアップデートではなく、開発体験の重心が「エディタ」から「エージェント管理」へ移る転換点に見える。Desktop / CLI / SDK / 統合導線を束ねる構造は、Claude Code / Codex / Grok Build と同じ「専門ワーカー層」というより、Agent OSに近い。
比較軸はもう「どのモデルが賢いか」だけでは足りない。harness 設計 / 権限境界 / コンテキスト / 自動実行タイミング / レビュー、この 5 つが開発生産性を左右する。AI コーディングの次の主戦場を整理する。
Antigravity 2.0 は エディタではなく Agent OS。Claude Code / Codex / Grok Build と同じ「専門ワーカー層」ではなく、Desktop / CLI / SDK / API をまとめる基盤に寄ってきた。AI コーディングの次の主戦場は、エディタの中ではなくエージェントをどう編成・監督・継続実行するかになる。
本記事で繰り返し出てくる用語と編集軸を最初に揃える。詳しい議論は各セクション参照。
- Agent harness
- モデルの周りに巻き付ける「実行装置」全体。Karpathy の Agent = Model + Harness 定義でいう Harness 側。具体的には以下を束ねたランタイム:
- システムプロンプト / ロール定義(モデルにどう振る舞わせるか)
- ツール(tools / function calling)(ファイル読み書き / Bash / Web fetch / MCP 経由の外部システム呼び出しなど)
- メモリ / 状態(会話履歴、ファイル所在、過去の決定)
- 権限とガードレール(読み取り専用か / 書き込み可か / Bash 実行は要承認か)
- フィードバックループ(エラー時の再試行、出力の検証、サブエージェント生成)
- Claude Code の harness = CLI agent loop + 標準ツール群 + プロジェクト権限 + ToolUse/ToolResult パイプライン
- Cursor の harness = エディタ統合 + Apply 機構 + コードベース index
- Antigravity の harness = ローカル app server + agent harness ランタイム + Skill パック装着機構
- Agent OS 層 / 専門ワーカー層
- 本記事の中心軸。Agent OS 層 = harness を共有しつつ複数 UI / 権限 / scheduler / エージェント編成を一元管理する側(Antigravity / Hermes / Copilot Studio)。専門ワーカー層 = 呼ばれて作業する側(Claude Code / Codex CLI / Grok Build)。「Agent OS」は Google 公式の用語ではなく、コミュニティと本記事の編集軸(§03 用語注も参照)。
- Subagent(サブエージェント)
- 親エージェントが動的に生成する子エージェント。並列実行 / 役割分担に使う。Antigravity 2.0 のローンチデモでは 93 並列の subagent で OS をゼロから構築した(後段 VOICES 参照)。
- Skill(スキル)
- エージェントに装着する能力パック。Antigravity の Android Skills / Firebase Skills のように、特定ドメインの API・流儀を agent harness に追加する仕組み(§2-4 参照)。
- App server(共有バックエンド)
- Antigravity ローカルインストール内に常駐する共有バックエンド。Desktop UI と CLI バイナリの両方が同じ app server を叩いて agent harness を動かす(§2-2 参照)。
- 比較 5 軸
- 本記事で AI コーディング基盤を評価する軸 ── (1) harness 設計 / (2) 権限境界 / (3) コンテキスト / (4) 自動実行タイミング / (5) 人間レビュー。「どのモデルが賢いか」だけでは捉えられない(§04 参照)。
- Antigravity 2.0 のポイントは Desktop / CLI / SDK / AI Studio×Android×Firebase 連携 の 4 つ。バラバラな機能追加ではなく、同一の agent harness を 4 つの UI で共有する構造。
- Claude Code / Codex / Grok Build は専門ワーカー層、Antigravity 2.0 はそれらを束ねる Agent OS。レイヤーが違うので "VS" で並べると論点が崩れる。
- 比較軸の刷新が必要:(1) どの harness で / (2) どの権限境界で / (3) どのコンテキストを読み / (4) どのタイミングで自動実行し / (5) どう人間がレビューするか。この 5 軸が開発生産性を左右する。
- 個人なら Hermes(OSS)× Antigravity 純正、組織なら Copilot Studio / Workspace Studio / Antigravity の横断選定。エディタ単体比較は周回遅れ。
エディタからエージェント管理へ ── 開発体験の重心移動
過去 2 年の AI コーディングツールの進化は、ほぼ 「エディタ」を中心に語られてきた。GitHub Copilot から始まり、Cursor、Claude Code、Codex CLI、Grok Build。どれも「エディタの中で AI がコードを書く」ことを軸に進化した。
Antigravity 2.0 はこの軸自体をずらした、と私は読んでいる。今回のリリースのキーポイントは大きく 4 つ:
- Desktop app ── 複数エージェントを並列で動かす command center
- Antigravity CLI ── Gemini CLI からの移行先。Desktop と同じ agent harness を共有する別 UI
- Antigravity SDK ── harness を自分のワークフロー / プロダクトに組み込んで自前 PC・サーバーで動かす方向
- AI Studio × Android × Firebase 連携 ── プロンプト → 実装 → 検証 → 公開の統合導線
並べてみると分かるが、これは「エディタの強化」ではない。「エージェントをどう束ね、どう動かすか」のレイヤーに重心が移ったと読める。1 つの作業を 1 つのエディタで進める感覚から、複数の作業を同時に走らせ、それを管理する感覚へ。
各機能を個別に見れば「dynamic subagents 対応」「scheduled tasks 追加」「SDK 公開」とバラバラに見える。だが束ねると 「同一 harness を 4 つの UI で出した」構造。これは IDE のロードマップではなく、Agent OS の構成図に近い。
4 つの柱 ── Desktop / CLI / SDK / 統合導線
>2-1Desktop app ── command center
複数のエージェントを並列で動かす命令塔。dynamic subagents(動的に子エージェントを増減)、scheduled tasks(cron 的な定期実行)、Project 単位の権限管理が入った。「1 つの作業を 1 つのエディタで進める」感覚から、「複数の作業を同時に走らせて見渡す」感覚に近づいた。
>2-2Antigravity CLI ── 同 harness の別 UI
従来の Gemini CLI からの移行先。ターミナル派向けの軽量 UI だが、重要なのは Desktop と同じ agent harness を共有する点。CLI だけ別物ではなく、同じ基盤の別インターフェースになる。Desktop で組んだエージェントが CLI からも同じ挙動で呼べる、という構造。
2 つの別アプリが競合するのではなく、1 つのローカルインストールの中に Desktop UI / CLI バイナリ / 共通の app server(agent harness 本体)が同居する構造。@karthickdotxyz の表現でいう "Same tools and app server as Antigravity 2.0"。
結果として:
・ 同時起動は不要 ── Desktop か CLI か、どちらか片方で完結する
・ 設定 / agent 定義 / 権限 / scheduled task は共有 ── Desktop で組んだジョブが CLI からそのまま呼べる
・ CI / サーバー headless 用途は CLI 中心、対話開発は Desktop 中心、という棲み分けが自然になる
※ ローカル app server の動作仕様(常駐 daemon か / Desktop 起動時のみか)は公式ドキュメント未確認のため、ここでは @karthickdotxyz の表現から推定して書いている。
>2-3SDK ── harness を自分のプロダクトに埋め込む
Google の agent harness を、自分のワークフローやプロダクトに組み込める方向に広がった。これは 「AI にコードを書かせるツール」 ではなく 「AI エージェントを作って運用する基盤」 に近い。SDK で書いたコードが動く場所は 自前の PC / サーバー / CI ランナー ── Google が hosted で動かしてくれるわけではなく、自社プロダクトの一部としてあなたのプロセス内で実行される。Antigravity が単なる Google 純正 IDE で終わらず、他社プロダクトの中で動く部品として広がる可能性がある。
client = Antigravity(...) / result = client.run(prompt, context))。下層 = SDK は 自前のプロセス(local PC / server / VM / container / CI runner)で動く ── Google が hosted で動かしてくれるわけではない。agent は「話しかける hosted service」ではなく「import する部品」になる。ローカル / サーバーどちらにも入れられる点は CLI も SDK も同じ。違うのは「想定された主用途」:
・ CLI = 人間 (またはシェルスクリプト) が直接対話する用途を主目的にした対話的フロント。antigravity chat / antigravity run のように打って結果を受け取る
・ SDK = あなたのプログラムから関数呼び出しでエージェントを使う用途を主目的にしたライブラリ。Slack ボット / 社内ダッシュボード / Datadog アラートを受けて自動修復するバックエンドなどに組み込む
厳密には CLI もプログラムからシェル経由で呼べる(subprocess.run("antigravity ...") のようなパターン)。ただし subprocess 経由は (a) 起動オーバーヘッド / (b) テキスト出力のパースが脆い / (c) 型がない / (d) ストリーミングや構造化イベントが扱いづらいというコストがつく。SDK はこれらを最初から想定して型付きレスポンス / 長寿命接続 / ストリーミング / 構造化イベントを提供する設計。
つまり AWS CLI と boto3 (AWS Python SDK) の関係と同じ。aws s3 ls を Python から subprocess で叩くこともできるが、boto3.client("s3") が正攻法、というあの構図。Antigravity も両方とも裏では同じ Google の agent harness を叩くだけだが、SDK の方が「プログラムからの利用」に最適化されている。
>2-4AI Studio × Android × Firebase 連携
「3 つの製品が UI 上で繋がる」というより、Antigravity を中心 harness とし、両端に AI Studio(入口)と Android / Firebase(出口)を Skill / 共有 harness 経由で繋ぐ構造。具体的な橋渡しは以下:
- AI Studio → Antigravity("Export to Antigravity"): AI Studio Build 自体が今や Antigravity と同じ agent harnessを使う。Web 上で試作した agent を、専用ボタンで Antigravity に書き出すと 「full agent conversation」(会話履歴 / agent 設定 / コード)ごと ローカル環境に持ち越せる。「プロンプトをコピペし直す」のではなく、Web プロトタイプ → ローカル production への state 保持移行が公式機能になっている。
- Antigravity → Android: 公式の Android Skills を agent に装着すると Android SDK / Gradle / マニフェスト等の流儀が harness 内に追加される。さらに Android CLI 1.0 の
studioコマンドで起動中の Android Studio に接続し、IDE の深いコード理解を借りられる("Open in Android Studio" 的なハンドオフを agent 主導で発火させる)。エンドツーエンドの Android アプリ構築まで担当できる構造。 - Antigravity → Firebase: 同様に Firebase Skills で Firestore / Functions / Hosting / Auth を agent が理解し、設定とデプロイまで含めて任せられる
つまり Google エコシステムの「縦の統合」は、UI レベルではなく harness と Skill(agent への能力パック)レベルで再設計されている。アイデア → 実装 → 検証 → 公開の距離を縮める仕掛けが、エディタの追加機能ではなくエージェント基盤として実装されているのが特徴的。
"専門ワーカー層" ではなく "Agent OS" のレイヤー
本記事で繰り返し使う 「Agent OS」 は Google 公式の用語ではない。Antigravity 2.0 のローンチ直後に X 上で @grok が "the emerging Agent OS category" と言及し、@arsh_goyal も "centralized Agent Manager" と類似のフレーミングをしている。本記事はこの言葉を借りて、同一 harness を複数 UI(Desktop / CLI / SDK / 統合導線)で共有し、権限・スケジューラ・サブエージェント編成を一元化する構造を OS の比喩で捉える編集軸として使う。
Antigravity 2.0 を Claude Code / Codex CLI / Grok Build と並べて「どれが一番か」と比べると、論点がズレる。これらはレイヤーが違う。
>3-1専門ワーカー層 vs Agent OS
Antigravity 2.0 の登場で、Google 純正の "Agent OS 寄り" プロダクトがフロントに出てきた。同じ Google 内では Workspace Studio が「Workspace 圏内の Agent OS」として閉じているのに対し、Antigravity は開発文脈の横断 Agent OSを狙っている。
>3-2VS 構図で並べると壊れる
「Antigravity 2.0 vs Claude Code」のような並べ方はレイヤー違反になる。Antigravity が SDK として他社プロダクトに広がれば、その上で Claude Code を呼ぶ・Codex CLI を呼ぶ・Grok Build を呼ぶ、という構図もありうる。比較対象は同じ Agent OS 層の Hermes / Copilot Studioに置くのが筋。
Agent OS 層内の比較軸はこう整理できる:
Hermes = OSS / 個人寄り / 多モデル / 22 gateway / Obsidian 連携 / ドメイン汎用(コード以外も)
Microsoft Copilot Studio = M365 圏内 / 企業権限管理 / Power Platform 連携 / 業務ワークフロー特化
Google Antigravity 2.0 = Google 純正 / AI Studio × Android × Firebase 縦統合 / ソフトウェア開発に特化("Built for developers for the agent-first era" を公式に明言)
スコープが違う点が重要: 同じ Agent OS 層に居るからといって役割が同じわけではない。Hermes は領域非依存の汎用 harness、Copilot Studio は業務ワークフロー、Antigravity は software engineering ドメイン専用。「個人/組織がどのドメインで agent を編成するか」 で選び方が変わる。
比較軸の刷新 ── 「モデルの賢さ」では足りない
Antigravity 2.0 が変えたのは「個別の AI コーディングツール」ではなく 「比較軸そのもの」だ、というのが私の見方。§02 で見た 4 つの柱(Desktop / CLI / SDK / 統合導線)を構造として読み返すと、それぞれが従来の「どのモデルが賢いか」では捉えられない設計選択を含んでいる:
- Desktop の dynamic subagents + scheduled tasks → 「どんな harness で組むか」「いつ 自動実行するか」
- CLI が Desktop と app server を共有(§2-2 FIG)→ 「同じ harness を別 UI から呼ぶ」という harness 設計
- SDK が自前プロセスで動く(§2-3 FIG)→ 「どの 権限境界 / どこで動くか」を呼び出し側が決める
- AI Studio / Android Skills / Firebase Skills(§2-4 FIG)→ 「どの コンテキストを agent に与えるか」を Skill パックで切替
- Antigravity の "agentic IDE" としての出力レビュー UI → 「どう人間が レビューするか」
つまり Antigravity 2.0 の構造を素直に解きほぐすと、自然に harness / 権限境界 / コンテキスト / タイミング / レビュー という 5 つの軸が立ち上がってくる。「Agent OS とは何の集合か」を問うた瞬間に出てくる軸、と言ってもいい。
以下で使う 5 つの設計軸(harness / 権限境界 / コンテキスト / タイミング / レビュー)は Google / IDC / Forrester 等が定めた標準軸ではなく、私(菊池)が「これが効く」と考える編集的合成。「3 軸でも 7 軸でもなく、この 5 軸でこそ Agent OS 時代の生産性を捉えられる」と判断した根拠は以下:
- harness ── モデルが同じでも harness 設計でエージェントの「振る舞い」が決まる。"model IQ" の次にくる本丸
- 権限境界 ── エージェントが自律的に動く時代、permission scope の設計が blast radius を決める(read / write / exec / 何処に対して)
- コンテキスト ── 同 IQ の同モデルでも、与えるコンテキストで出力品質が桁違いに変わる。別記事で詳しく書いた
- タイミング ── 手動 / hook / cron で動く agent は別物。Antigravity 2.0 が scheduled tasks を公式機能にした事実が補強
- レビュー ── human-in-the-loop の負荷が生産性のボトルネック。AI 安全文脈の標準語彙でもある
個々の用語(harness / permission など)は業界共通ですが、この 5 つを「評価軸セット」として束ねたのは私の判断。違う切り方を提案する人がいて当然です。
Antigravity 2.0 が示しているのは、AI ツールの比較軸そのものを更新しろというメッセージだと思う。
軸ごとに「エディタ時代の評価」と「Agent OS 時代の評価」を並べると、何が変わったのかが一目で見える:
| 軸 | エディタ時代(〜2025)の評価 | Agent OS 時代(2026〜)の評価 |
|---|---|---|
| harness | エディタの補完速度・UX(Cursor / Claude Code / Codex のどれが速い・使いやすいか) | どんなツール・記憶・権限・フィードバックループをモデルに巻き付けるかの設計(同モデルでも harness で振る舞いが激変) |
| 権限境界 | 1 人の開発者が手で操作する前提なので、ほぼ議論不要 | 自律 agent が動くので Project / User / Agent 単位の permission scope が blast radius を決める(read / write / exec を何処に対して) |
| コンテキスト | コンテキストウィンドウのサイズ(何トークン入るか、という「量」) | 何を引っ張ってきて agent に与えるか(docs / コード / issue / 運用ログ / 差分理由、という「質」と Skill パック) |
| タイミング | 人間がtyping する瞬間に補完が出るかどうか(同期 / 即時のみ) | 手動 / hook / cron / scheduled task で agent をいつ走らせるか(非同期 / 並列 / 24/7 を含む) |
| レビュー | コードを書く前後で人間が読む(人間が中心、AI は補助) | 自動実行された agent 出力をどこまで信頼し、どこで人間が止めるか(確認負荷の最小化) |
補足: 旧軸の「どのモデルが賢いか(GPT-5 / Claude Opus / Gemini / grok-4.3)」は、harness や context によって出力品質が桁違いに変わるので、もはや単独軸として成立しにくい。
この 5 軸の設計が 開発生産性そのものを左右する。モデルが賢くなっても、harness が雑だと「Slop を自動化するだけ」になる(Slop を自動化するなの原則はここでも効く)。
前記事「過去の正しさを再現する AI を作るな」で扱った Harness Engineering がここに直結する。Karpathy の Agent = Model + Harness 定義からすれば、Antigravity 2.0 はまさに Google 純正の Harness 提供基盤として読むのが正しい。
AI コーディングの次の主戦場 ── エディタの中ではない
結論はシンプルだ。AI コーディングの次の主戦場は、エディタの中ではなく、エージェントをどう編成・監督・継続実行するかになる。
これまでの主戦場:
- 2023: プロンプトの上手さ(プロンプトエンジニアリング)
- 2024: コンテキストの揃え方(vibe coding / Cursor)
- 2025: エディタの中での AI 介入(Claude Code / Codex / Grok Build)
これからの主戦場:
- 2026〜: Agent OS としての harness 設計 ── Antigravity 2.0 / Hermes / Copilot Studio / Workspace Studio
- 個人開発者の「使うツール」が、エディタ単独から 「Agent OS + 専門ワーカー」の組み合わせ に移る
- 「複数の作業を並列で進める / cron で自走させる / 自分の文脈を harness に蓄える」が日常になる
編成 = どのエージェントに何を任せるか(権限境界の設計)
監督 = いつどう人間がレビューに入るか(確認負荷の最小化)
継続実行 = cron / webhook / hooks で 24/7 動かす設計
この 3 つはエディタ単体では成立しない、明確に Agent OS の仕事。
ローンチから 48 時間で X 上に出てきたユースケースを並べてみる。フル OS のゼロ構築、AlphaZero 論文の再現、コード解析パイプライン、scheduled 並列エージェント ── 話題は「専門ワーカーが書く」ではなく「エージェント群を編成して動かす」側に明らかに寄っている。
個人と組織それぞれの選び方
このセクションで述べる「個人なら○○、組織なら○○」という選び方は、Google / Microsoft / Nous Research 等の公式ガイドラインではなく、私(菊池)の個人的な推奨です。
事実ベース(誰が見ても確認できる部分):
・ Hermes は OSS / 多モデル / Obsidian 連携 / 汎用ドメイン
・ Antigravity 2.0 は Google エコシステムに縦統合 / ソフトウェア開発特化
・ Microsoft Copilot Studio は M365 圏内 / 業務ワークフロー特化
私見(人によって判断が分かれる部分):
・ 個人開発者なら Hermes と Antigravity の併用が現実解と私が考える理由は、(1) Hermes の Obsidian / gateway 連携が個人の知的生産には強い、(2) Antigravity は Google エコシステム開発に最適、という個人開発者としての私の作業観察から。組織で違う最適があり得る。
・ 組織なら横断選定と私が言うのは、業務軸(Copilot Studio)/開発軸(Antigravity)/個人軸(Hermes)で要件が違いすぎて 1 製品に寄せられないと判断するから。違う見解(「全部 Copilot Studio に寄せた方が運用が楽」「全部 Hermes ベースで OSS 統一する方が透明性が高い」など)は十分成立する。
絶対解ではないので、自分の文脈に合わせて読み替えてください。
個人 vs チーム / 組織で何が変わるかを §04 の 5 軸ごとに並べると、選び方の根拠が見える:
| 軸 | 個人用途 | チーム / 組織用途 |
|---|---|---|
| harness | 各自ローカルで好きな harness を入れる(Claude Code / Hermes / Cursor / Antigravity) | 統一 harness を社内標準化 / Antigravity SDK で社内プロダクトに埋め込んだカスタム harness |
| 権限境界 | 個人の Mac / 個人 repo への read / write が中心 | Project / User / Role の階層 ACL、社内システムへの権限分離、agent 個別の scope 制限 |
| コンテキスト | 個人の Obsidian / 個人 git repo / 個人 Slack DM など、自分が持っている情報源 | 社内 Confluence / 共有 GitHub org / 全社 Slack / Linear・Jira / on-call runbooks ── マルチユーザー間で共有される情報源 |
| タイミング | 個人 PC で対話的、または個人の cron で軽く回す(自分の PC が落ちると止まる) | 共用サーバー / CI ランナー / 24/7 稼働環境に SDK 経由で agent を組み込む。業務時間外も稼働、責任者が明確 |
| レビュー | 個人の self-check(書きながら見る) | code review / PR approval flow / 監査ログ / コンプライアンスチェック ── 多段審査が必要 |
補足: 「harness」自体は個人 / チーム中立な概念(モデルに巻き付ける実行装置)。チーム対応の度合いは個別実装に依存する ── Claude Code / Hermes / Cursor は基本「個人ローカル」前提、Antigravity 2.0 は Project permission + SDK + Enterprise 文言で「個人とチームの両建て」、Copilot Studio は M365 圏内で「最初からチーム/業務」を前提。
Antigravity の Desktop / CLI のスタンドアロン構成は、構造上「個人マシンに常駐する app server」が前提(§2-2 FIG 参照)。同じハーネスをチームで共有しようとしても、agent 定義 / Project / scheduled task はそれぞれのローカル app server に紐づくので、git で config を share してもインスタンスは別々。
チームで harness を「共有」したいなら、§2-3 の SDK 経由で社内バックエンド / 共用サーバー / CI ランナーに埋め込み、複数ユーザーから単一の harness インスタンスを叩く構造を自前で組むのが現実解。Google が hosted の「Managed harness」を提供しない以上、"team harness as a Service" は自社で実装する必要がある、というのが現時点の制約。
>6-1個人 ── Hermes と Antigravity を併用
OSS 派の個人は引き続き Hermes が強い。Obsidian 連携・多モデル切替・gateway(Telegram / Discord / LINE / Slack)の標準対応は今のところ Hermes ならでは。
Google エコシステム派の個人には Antigravity が刺さる。AI Studio で試したアイデアを Antigravity Desktop に持ち込み、Firebase まで一気通貫で持っていける統合導線は Hermes には作れない。
実用解は 併用。Hermes で個人の暗黙考プールを動的にオーケストレーションし、Antigravity を Google 圏の重い開発作業に当てる。
>6-2組織 ── 3 Agent OS の横断選定
エンタープライズでは 3 つの Agent OS を「業務文脈」「開発文脈」「個人文脈」で使い分ける構図になる:
- Microsoft Copilot Studio ── M365 / Power Platform 圏の業務自動化
- Google Workspace Studio ── Google Workspace 圏の業務自動化
- Google Antigravity 2.0 ── 開発文脈の Agent OS(横断)
選定は 「どの圏のエコシステムを軸にするか」 でほぼ決まる。M365 中心なら Copilot Studio、Google 中心なら Antigravity + Workspace Studio。業務系(Workspace / M365)と開発系(Antigravity)を別 Agent OS として併用するのが自然。
3 つの Agent OS を横断して 「現場の暗黙知 / 暗黙考を引き出し、適切な harness に流し込む」 役割が、FDE / Applied Engineer の本領になる。エディタ単体で完結する時代の終わりは、現場×AI を繋ぐ人材の価値上昇と表裏。
「どのモデルが賢いか」では足りない、Agent OS の設計時代へ
Antigravity 2.0 のリリースは、AI コーディングツールの比較軸が変わる転換点を示している。エディタの中でモデルを比べる時代から、harness 設計 / 権限境界 / コンテキスト / 自動実行タイミング / レビューの 5 軸で Agent OS の設計を比べる時代へ。
Claude Code / Codex / Grok Build は専門ワーカー層、Antigravity 2.0 / Hermes / Copilot Studio / Workspace Studio は Agent OS 層。レイヤーが違うものを VS で並べる議論はもう成立しない。同じレイヤー内での比較と、別レイヤー間の組み合わせ設計に思考を移す必要がある。
- エディタ単独比較は周回遅れ(モデル単体性能は急速にコモディティ化)
- Agent OS の設計が次の差別化(harness × 権限 × コンテキスト × タイミング × レビュー)
- 「編成・監督・継続実行」が AI コーディングの主戦場
個人なら Hermes と Antigravity を併用、組織なら Copilot Studio / Workspace Studio / Antigravity を業務軸・開発軸・個人軸で使い分ける。エディタの中ではなく、Agent OS の設計でこそ生産性が決まる。AI コーディングの次のフェーズはここから始まる。