okikusan-public / articles / エディタから、エージェント管理へ — Google Antigravity 2.0 が示す Agent OS の到来
JA EN
← articles
CONTENTS6 sections
  1. 01エディタからエージェント管理へ
  2. 024 つの柱
  3. 03"専門ワーカー層" ではない
  4. 04比較軸の刷新
  5. 05次の主戦場
  6. 06個人と組織の選び方
  7. まとめ
AGENT OS / 2026

エディタから、エージェント管理へ ── Google Antigravity 2.0 が示す Agent OS の到来

Antigravity 2.0 は単なる AI IDE のアップデートではなく、開発体験の重心が「エディタ」から「エージェント管理」へ移る転換点に見える。Desktop / CLI / SDK / 統合導線を束ねる構造は、Claude Code / Codex / Grok Build と同じ「専門ワーカー層」というより、Agent OSに近い。

比較軸はもう「どのモデルが賢いか」だけでは足りない。harness 設計 / 権限境界 / コンテキスト / 自動実行タイミング / レビュー、この 5 つが開発生産性を左右する。AI コーディングの次の主戦場を整理する。

Antigravity 2.0 Agent OS Agent Harness Google Gemini AI エージェント 2026.05.20 · 6 min read
FIG.0 — AGENT OS STACK
Antigravity 2.0 = Agent OS の階層構造: MODEL → AGENT HARNESS → 4 つのインターフェース(Desktop / CLI / SDK / AI Studio×Android×Firebase)
中心の AGENT HARNESS(Antigravity) が MODEL と 4 つのインターフェース(Desktop / CLI / SDK / 統合導線)を束ねる構造。「same harness, different UIs」。比較軸が モデルの賢さ → harness と権限境界の設計 に移る。
▍ THE PROMISE

Antigravity 2.0 は エディタではなく Agent OS。Claude Code / Codex / Grok Build と同じ「専門ワーカー層」ではなく、Desktop / CLI / SDK / API をまとめる基盤に寄ってきた。AI コーディングの次の主戦場は、エディタの中ではなくエージェントをどう編成・監督・継続実行するかになる。

▍ SOURCES — 元ネタ
▍ TERMS — 用語と前提(先に揃える)

本記事で繰り返し出てくる用語と編集軸を最初に揃える。詳しい議論は各セクション参照。

Agent harness
モデルの周りに巻き付ける「実行装置」全体。Karpathy の Agent = Model + Harness 定義でいう Harness 側。具体的には以下を束ねたランタイム:
  • システムプロンプト / ロール定義(モデルにどう振る舞わせるか)
  • ツール(tools / function calling)(ファイル読み書き / Bash / Web fetch / MCP 経由の外部システム呼び出しなど)
  • メモリ / 状態(会話履歴、ファイル所在、過去の決定)
  • 権限とガードレール(読み取り専用か / 書き込み可か / Bash 実行は要承認か)
  • フィードバックループ(エラー時の再試行、出力の検証、サブエージェント生成)
実例:
  • Claude Code の harness = CLI agent loop + 標準ツール群 + プロジェクト権限 + ToolUse/ToolResult パイプライン
  • Cursor の harness = エディタ統合 + Apply 機構 + コードベース index
  • Antigravity の harness = ローカル app server + agent harness ランタイム + Skill パック装着機構
要するに「モデルが賢くても harness が雑だとエージェントとして使い物にならない」「同じモデルでも harness を取り替えると振る舞いが激変する」── その「振る舞いを決める部分」が harness。
Agent OS 層 / 専門ワーカー層
本記事の中心軸。Agent OS 層 = harness を共有しつつ複数 UI / 権限 / scheduler / エージェント編成を一元管理する側(Antigravity / Hermes / Copilot Studio)。専門ワーカー層 = 呼ばれて作業する側(Claude Code / Codex CLI / Grok Build)。「Agent OS」は Google 公式の用語ではなく、コミュニティと本記事の編集軸(§03 用語注も参照)。
Subagent(サブエージェント)
親エージェントが動的に生成する子エージェント。並列実行 / 役割分担に使う。Antigravity 2.0 のローンチデモでは 93 並列の subagent で OS をゼロから構築した(後段 VOICES 参照)。
Skill(スキル)
エージェントに装着する能力パック。Antigravity の Android Skills / Firebase Skills のように、特定ドメインの API・流儀を agent harness に追加する仕組み(§2-4 参照)。
App server(共有バックエンド)
Antigravity ローカルインストール内に常駐する共有バックエンド。Desktop UI と CLI バイナリの両方が同じ app server を叩いて agent harness を動かす(§2-2 参照)。
比較 5 軸
本記事で AI コーディング基盤を評価する軸 ── (1) harness 設計 / (2) 権限境界 / (3) コンテキスト / (4) 自動実行タイミング / (5) 人間レビュー。「どのモデルが賢いか」だけでは捉えられない(§04 参照)。
▍ TL;DR
§ 01 SHIFT

エディタからエージェント管理へ ── 開発体験の重心移動

過去 2 年の AI コーディングツールの進化は、ほぼ 「エディタ」を中心に語られてきた。GitHub Copilot から始まり、Cursor、Claude Code、Codex CLI、Grok Build。どれも「エディタの中で AI がコードを書く」ことを軸に進化した。

Antigravity 2.0 はこの軸自体をずらした、と私は読んでいる。今回のリリースのキーポイントは大きく 4 つ:

並べてみると分かるが、これは「エディタの強化」ではない。「エージェントをどう束ね、どう動かすか」のレイヤーに重心が移ったと読める。1 つの作業を 1 つのエディタで進める感覚から、複数の作業を同時に走らせ、それを管理する感覚へ。

▍ 「AI IDE のアップデート」として読むと小さく見える

各機能を個別に見れば「dynamic subagents 対応」「scheduled tasks 追加」「SDK 公開」とバラバラに見える。だが束ねると 「同一 harness を 4 つの UI で出した」構造。これは IDE のロードマップではなく、Agent OS の構成図に近い。

§ 02 PILLARS

4 つの柱 ── Desktop / CLI / SDK / 統合導線

>2-1Desktop app ── command center

複数のエージェントを並列で動かす命令塔dynamic subagents(動的に子エージェントを増減)、scheduled tasks(cron 的な定期実行)、Project 単位の権限管理が入った。「1 つの作業を 1 つのエディタで進める」感覚から、「複数の作業を同時に走らせて見渡す」感覚に近づいた。

>2-2Antigravity CLI ── 同 harness の別 UI

従来の Gemini CLI からの移行先。ターミナル派向けの軽量 UI だが、重要なのは Desktop と同じ agent harness を共有する点。CLI だけ別物ではなく、同じ基盤の別インターフェースになる。Desktop で組んだエージェントが CLI からも同じ挙動で呼べる、という構造。

FIG.2-2 — SHARED HARNESS
Antigravity (local install) 内に DESKTOP (GUI) と CLI (Go binary, $ ag run) の 2 つの front-end があり、両方が同じ LOCAL APP SERVER(agent harness: agent definitions / permissions / scheduler / tools・skills)に矢印で接続。そこから Gemini 3.5 Flash API (cloud) へ
外側の点線枠が Antigravity ローカルインストール。中に Desktop (GUI) と CLI (Go binary) の 2 つの front-end が同居し、両方の矢印が 同一の LOCAL APP SERVER(agent harness 本体: agent definitions / permissions / scheduler / tools · skills)に流れ込む。Desktop で組んだジョブが CLI からも同じように呼べるのはこのため。すべての model 呼び出しは下の Gemini 3.5 Flash API に集約される。
▍ 補足: 「同じ harness を共有」とは何を意味するか

2 つの別アプリが競合するのではなく、1 つのローカルインストールの中に Desktop UI / CLI バイナリ / 共通の app server(agent harness 本体)が同居する構造。@karthickdotxyz の表現でいう "Same tools and app server as Antigravity 2.0"

結果として:
同時起動は不要 ── Desktop か CLI か、どちらか片方で完結する
設定 / agent 定義 / 権限 / scheduled task は共有 ── Desktop で組んだジョブが CLI からそのまま呼べる
CI / サーバー headless 用途は CLI 中心、対話開発は Desktop 中心、という棲み分けが自然になる

※ ローカル app server の動作仕様(常駐 daemon か / Desktop 起動時のみか)は公式ドキュメント未確認のため、ここでは @karthickdotxyz の表現から推定して書いている。

>2-3SDK ── harness を自分のプロダクトに埋め込む

Google の agent harness を、自分のワークフローやプロダクトに組み込める方向に広がった。これは 「AI にコードを書かせるツール」 ではなく 「AI エージェントを作って運用する基盤」 に近い。SDK で書いたコードが動く場所は 自前の PC / サーバー / CI ランナー ── Google が hosted で動かしてくれるわけではなく、自社プロダクトの一部としてあなたのプロセス内で実行される。Antigravity が単なる Google 純正 IDE で終わらず、他社プロダクトの中で動く部品として広がる可能性がある。

FIG.2-3 — SDK EMBED
YOUR APPLICATION (Slack bot / Internal dashboard / Datadog auto-fix backend / Custom backend) が ANTIGRAVITY SDK (agent harness as library, client = Antigravity(...) / result = client.run(prompt, context)) を import し、SDK は自前の PC / server / VM / container / CI runner で実行される 3 層構造
上層 = あなたのアプリケーション(Slack ボット / 社内ダッシュボード / Datadog アラートを受けた自動修復バックエンド等)が Antigravity SDK を import / call する。中層 = agent harness をライブラリとして使う API(client = Antigravity(...) / result = client.run(prompt, context))。下層 = SDK は 自前のプロセス(local PC / server / VM / container / CI runner)で動く ── Google が hosted で動かしてくれるわけではない。agent は「話しかける hosted service」ではなく「import する部品」になる
▍ CLI と SDK ── 何が違うのか

ローカル / サーバーどちらにも入れられる点は CLI も SDK も同じ。違うのは「想定された主用途」:

CLI = 人間 (またはシェルスクリプト) が直接対話する用途を主目的にした対話的フロントantigravity chat / antigravity run のように打って結果を受け取る
SDK = あなたのプログラムから関数呼び出しでエージェントを使う用途を主目的にしたライブラリ。Slack ボット / 社内ダッシュボード / Datadog アラートを受けて自動修復するバックエンドなどに組み込む

厳密には CLI もプログラムからシェル経由で呼べるsubprocess.run("antigravity ...") のようなパターン)。ただし subprocess 経由は (a) 起動オーバーヘッド / (b) テキスト出力のパースが脆い / (c) 型がない / (d) ストリーミングや構造化イベントが扱いづらいというコストがつく。SDK はこれらを最初から想定して型付きレスポンス / 長寿命接続 / ストリーミング / 構造化イベントを提供する設計。

つまり AWS CLI と boto3 (AWS Python SDK) の関係と同じ。aws s3 ls を Python から subprocess で叩くこともできるが、boto3.client("s3") が正攻法、というあの構図。Antigravity も両方とも裏では同じ Google の agent harness を叩くだけだが、SDK の方が「プログラムからの利用」に最適化されている。

>2-4AI Studio × Android × Firebase 連携

「3 つの製品が UI 上で繋がる」というより、Antigravity を中心 harness とし、両端に AI Studio(入口)と Android / Firebase(出口)を Skill / 共有 harness 経由で繋ぐ構造。具体的な橋渡しは以下:

つまり Google エコシステムの「縦の統合」は、UI レベルではなく harness と Skill(agent への能力パック)レベルで再設計されている。アイデア → 実装 → 検証 → 公開の距離を縮める仕掛けが、エディタの追加機能ではなくエージェント基盤として実装されているのが特徴的。

FIG.3 — INTEGRATION BRIDGES
Antigravity 2.0 を中央 harness として、左の AI Studio(UPSTREAM、Export to Antigravity で full agent conversation を持ち越し)と右の Android / Firebase(DOWNSTREAM、Android Skills / Firebase Skills で能力パック追加)を接続する 3 つの統合導線
中央の Antigravity 2.0 が agent harness の本体。左 UPSTREAM AI Studio から "Export to Antigravity" で full agent conversation(chat / config / code)が state 保持のまま 持ち越される。右 DOWNSTREAM の Android / FirebaseSkills(装着可能な能力パック) として harness に追加され、SDK / Gradle / Firestore / Functions などのドメイン流儀を agent が理解する。UI ではなく harness と Skill の層で統合している。
youtube.com / Google
Antigravity 2.0 公式ローンチ動画(YouTube)
Google が IO 2026 で公開した Antigravity の紹介映像。上の 4 つの柱 ── Desktop / CLI / SDK / 統合導線 ── が実際にどう動くかを確認できる。
Watch on YouTube →
§ 03 LAYER

"専門ワーカー層" ではなく "Agent OS" のレイヤー

▍ 用語注: 「Agent OS」について

本記事で繰り返し使う 「Agent OS」Google 公式の用語ではない。Antigravity 2.0 のローンチ直後に X 上で @grok"the emerging Agent OS category" と言及し、@arsh_goyal も "centralized Agent Manager" と類似のフレーミングをしている。本記事はこの言葉を借りて、同一 harness を複数 UI(Desktop / CLI / SDK / 統合導線)で共有し、権限・スケジューラ・サブエージェント編成を一元化する構造を OS の比喩で捉える編集軸として使う。

Antigravity 2.0 を Claude Code / Codex CLI / Grok Build と並べて「どれが一番か」と比べると、論点がズレる。これらはレイヤーが違う。

>3-1専門ワーカー層 vs Agent OS

▍ 専門ワーカー層
呼ばれて作業する側
Claude Code Codex CLI Grok Build Cursor Agent
即時推論・コード生成・ファイル操作が得意
▍ Agent OS 層
全体を編成・監督する側
Hermes (OSS) Microsoft Copilot Studio Google Antigravity 2.0
複数 UI / 並列実行 / 権限管理 / harness 共有を一元化

Antigravity 2.0 の登場で、Google 純正の "Agent OS 寄り" プロダクトがフロントに出てきた。同じ Google 内では Workspace Studio が「Workspace 圏内の Agent OS」として閉じているのに対し、Antigravity は開発文脈の横断 Agent OSを狙っている。

>3-2VS 構図で並べると壊れる

「Antigravity 2.0 vs Claude Code」のような並べ方はレイヤー違反になる。Antigravity が SDK として他社プロダクトに広がれば、その上で Claude Code を呼ぶ・Codex CLI を呼ぶ・Grok Build を呼ぶ、という構図もありうる。比較対象は同じ Agent OS 層の Hermes / Copilot Studioに置くのが筋。

FIG.4 — LAYER STACK / Agent OS が specialist worker を呼ぶ
Agent OS 層(Antigravity 2.0 / Hermes / Copilot Studio)が下層の専門ワーカー層(Claude Code / Codex CLI / Grok Build / Cursor Agent)を calls / orchestrates する 2 階層構造。同じレイヤー内で比較し、レイヤー間で組み合わせる。
上層 Agent OS 層(Antigravity 2.0 / Hermes / Copilot Studio)が下層の 専門ワーカー層(Claude Code / Codex CLI / Grok Build / Cursor Agent)を "calls / orchestrates" する 2 階層構造。同じレイヤー内で比較(peer comparison)し、レイヤー間で組み合わせる(cross-layer composition)、というのが正しい思考の進め方。
▍ Hermes / Copilot Studio との直接比較

Agent OS 層内の比較軸はこう整理できる:
Hermes = OSS / 個人寄り / 多モデル / 22 gateway / Obsidian 連携 / ドメイン汎用(コード以外も)
Microsoft Copilot Studio = M365 圏内 / 企業権限管理 / Power Platform 連携 / 業務ワークフロー特化
Google Antigravity 2.0 = Google 純正 / AI Studio × Android × Firebase 縦統合 / ソフトウェア開発に特化("Built for developers for the agent-first era" を公式に明言)

スコープが違う点が重要: 同じ Agent OS 層に居るからといって役割が同じわけではない。Hermes は領域非依存の汎用 harness、Copilot Studio は業務ワークフロー、Antigravity は software engineering ドメイン専用。「個人/組織がどのドメインで agent を編成するか」 で選び方が変わる。

§ 04 AXIS

比較軸の刷新 ── 「モデルの賢さ」では足りない

Antigravity 2.0 が変えたのは「個別の AI コーディングツール」ではなく 「比較軸そのもの」だ、というのが私の見方。§02 で見た 4 つの柱(Desktop / CLI / SDK / 統合導線)を構造として読み返すと、それぞれが従来の「どのモデルが賢いか」では捉えられない設計選択を含んでいる:

つまり Antigravity 2.0 の構造を素直に解きほぐすと、自然に harness / 権限境界 / コンテキスト / タイミング / レビュー という 5 つの軸が立ち上がってくる。「Agent OS とは何の集合か」を問うた瞬間に出てくる軸、と言ってもいい。

▍ これは私見: 5 軸を選んだ理由

以下で使う 5 つの設計軸(harness / 権限境界 / コンテキスト / タイミング / レビュー)は Google / IDC / Forrester 等が定めた標準軸ではなく、私(菊池)が「これが効く」と考える編集的合成。「3 軸でも 7 軸でもなく、この 5 軸でこそ Agent OS 時代の生産性を捉えられる」と判断した根拠は以下:

  • harness ── モデルが同じでも harness 設計でエージェントの「振る舞い」が決まる。"model IQ" の次にくる本丸
  • 権限境界 ── エージェントが自律的に動く時代、permission scope の設計が blast radius を決める(read / write / exec / 何処に対して)
  • コンテキスト ── 同 IQ の同モデルでも、与えるコンテキストで出力品質が桁違いに変わる。別記事で詳しく書いた
  • タイミング ── 手動 / hook / cron で動く agent は別物。Antigravity 2.0 が scheduled tasks を公式機能にした事実が補強
  • レビュー ── human-in-the-loop の負荷が生産性のボトルネック。AI 安全文脈の標準語彙でもある

個々の用語(harness / permission など)は業界共通ですが、この 5 つを「評価軸セット」として束ねたのは私の判断。違う切り方を提案する人がいて当然です。

Antigravity 2.0 が示しているのは、AI ツールの比較軸そのものを更新しろというメッセージだと思う。

FIG.1 — AXIS MAP
Agent OS 時代の 5 つの新比較軸(harness / 権限境界 / コンテキスト / タイミング / レビュー)を五角形マップで可視化
旧軸は「どのモデルが賢いか / どのエディタが速いか / コンテキストウィンドウ」。新軸は harness / 権限境界 / コンテキスト / 自動実行タイミング / レビュー の 5 つ。モデル単体性能ではなく Agent OS の設計で比べる時代へ。

軸ごとに「エディタ時代の評価」と「Agent OS 時代の評価」を並べると、何が変わったのかが一目で見える:

エディタ時代(〜2025)の評価 Agent OS 時代(2026〜)の評価
harness エディタの補完速度・UX(Cursor / Claude Code / Codex のどれが速い・使いやすいか) どんなツール・記憶・権限・フィードバックループをモデルに巻き付けるかの設計(同モデルでも harness で振る舞いが激変)
権限境界 1 人の開発者が手で操作する前提なので、ほぼ議論不要 自律 agent が動くので Project / User / Agent 単位の permission scope が blast radius を決める(read / write / exec を何処に対して)
コンテキスト コンテキストウィンドウのサイズ(何トークン入るか、という「量」) 何を引っ張ってきて agent に与えるか(docs / コード / issue / 運用ログ / 差分理由、という「質」と Skill パック)
タイミング 人間がtyping する瞬間に補完が出るかどうか(同期 / 即時のみ) 手動 / hook / cron / scheduled task で agent をいつ走らせるか(非同期 / 並列 / 24/7 を含む)
レビュー コードを書く前後で人間が読む(人間が中心、AI は補助) 自動実行された agent 出力をどこまで信頼し、どこで人間が止めるか(確認負荷の最小化)

補足: 旧軸の「どのモデルが賢いか(GPT-5 / Claude Opus / Gemini / grok-4.3)」は、harness や context によって出力品質が桁違いに変わるので、もはや単独軸として成立しにくい。

この 5 軸の設計が 開発生産性そのものを左右する。モデルが賢くなっても、harness が雑だと「Slop を自動化するだけ」になる(Slop を自動化するなの原則はここでも効く)。

▍ Harness Engineering の延長線

前記事「過去の正しさを再現する AI を作るな」で扱った Harness Engineering がここに直結する。Karpathy の Agent = Model + Harness 定義からすれば、Antigravity 2.0 はまさに Google 純正の Harness 提供基盤として読むのが正しい。

§ 05 BATTLEFIELD

AI コーディングの次の主戦場 ── エディタの中ではない

結論はシンプルだ。AI コーディングの次の主戦場は、エディタの中ではなく、エージェントをどう編成・監督・継続実行するかになる。

FIG.2 — BATTLEFIELD TIMELINE
AI コーディング主戦場の遷移: 2023 プロンプト → 2024 コンテキスト → 2025 エディタ → 2026+ Agent OS
主戦場の階段型タイムライン。2023 プロンプト → 2024 コンテキスト → 2025 エディタ → 2026〜 Agent OS。Antigravity 2.0 がこの転換点にいる。

これまでの主戦場:

これからの主戦場:

▍ 「編成・監督・継続実行」の意味

編成 = どのエージェントに何を任せるか(権限境界の設計)
監督 = いつどう人間がレビューに入るか(確認負荷の最小化)
継続実行 = cron / webhook / hooks で 24/7 動かす設計
この 3 つはエディタ単体では成立しない、明確に Agent OS の仕事。

▍ VOICES — ローンチ 48 時間で出てきたユースケース

ローンチから 48 時間で X 上に出てきたユースケースを並べてみる。フル OS のゼロ構築、AlphaZero 論文の再現、コード解析パイプライン、scheduled 並列エージェント ── 話題は「専門ワーカーが書く」ではなく「エージェント群を編成して動かす」側に明らかに寄っている。

A
Andreas
@andreasawires · 2026.05.20
Google's Antigravity 2.0 project, combined with Gemini 3.5 Flash agents, built a fully functioning operating system from scratch. 93 parallel sub-agents, 12 hours, 15K+ model requests, 2.6 billion tokens, under $1K in API credits.
View on X →
A
Andy Zhang
@andyzhang · 2026.05.20
I'm so proud of the @antigravity team for everything we've launched today. We introduced Antigravity 2.0, a desktop application to manage all of your agents. The team poured a lot of heart into this and I can't wait for you to try it alongside Gemini 3.5 Flash.
View on X →
V
Vahab Mirrokni
@mirrokni · 2026.05.20
Gemini 3.5 is indeed a great model. Apart from its efficiency and improved agentic evals, it's good for long-horizon complex tasks, e.g., built on this model, /teamwork agents in Antigravity created a full training of AlphaZero paper with self-play and all. Try it out!
View on X →
S
SHT4BHARAT
@SHT4BHARAT · 2026.05.20
93 AI agents just built a functional operating system framework from scratch in 12 hours. Total cost? Under $1K for 2.6 billion tokens. This live demo from #GoogleIO2026 just proved we are officially out of the chatbot era and deep into production-scale autonomous workflows.
View on X →
K
Karthick
@karthickdotxyz · 2026.05.20
Say hello to Antigravity CLI 🚀 🧑‍💻 - Written in Go for a snappy feel ✨ - Available with Gemini 3.5 Flash today 🤖 - Built for async workflows and subagents ⚒️ - Same tools and app server as Antigravity 2.0 Get started and install it today 👇
View on X →
Y
Yoshifumi Kawai
@neuecc · 2026.05.20
Antigravity 2.0の変化の方向性は当然っちゃあ当然。実際Cursor 3めっちゃ好ましかったですもの。そして一周回ってエージェントアプリはエージェントアプリで独立するので、コードはIDE(Visual Studio 2026)という使い分けになって、ワークフロー的にも更に好ましい。
View on X →
G
GptZone
@gptzone_net · 2026.05.20
Antigravity 2.0 no se debería evaluar como un autocompletado más agresivo. Se debería evaluar como un cambio de workflow. Si el agente puede trabajar en segundo plano, crear subagentes, gestionar proyectos con varias carpetas, usar permisos integrados y ejecutar tareas...
View on X →
ビームマンP ver40
@BeamManP · 2026.05.19
Gemini 3.5 Flashのヤバいところ: ついに音楽解析ができるようになってた!! 曲を食わせると、Aメロ・サビとかの区切りをめっちゃ正確に解析してくれる。MV作り序盤が激楽になる!!!!! (Google AI Studioで解析。参考資料はClaudeで作成)
View on X →
§ 06 FIT

個人と組織それぞれの選び方

▍ ここからは私見です

このセクションで述べる「個人なら○○、組織なら○○」という選び方は、Google / Microsoft / Nous Research 等の公式ガイドラインではなく、私(菊池)の個人的な推奨です。

事実ベース(誰が見ても確認できる部分):
・ Hermes は OSS / 多モデル / Obsidian 連携 / 汎用ドメイン
・ Antigravity 2.0 は Google エコシステムに縦統合 / ソフトウェア開発特化
・ Microsoft Copilot Studio は M365 圏内 / 業務ワークフロー特化

私見(人によって判断が分かれる部分):
個人開発者なら Hermes と Antigravity の併用が現実解と私が考える理由は、(1) Hermes の Obsidian / gateway 連携が個人の知的生産には強い、(2) Antigravity は Google エコシステム開発に最適、という個人開発者としての私の作業観察から。組織で違う最適があり得る。
組織なら横断選定と私が言うのは、業務軸(Copilot Studio)/開発軸(Antigravity)/個人軸(Hermes)で要件が違いすぎて 1 製品に寄せられないと判断するから。違う見解(「全部 Copilot Studio に寄せた方が運用が楽」「全部 Hermes ベースで OSS 統一する方が透明性が高い」など)は十分成立する。

絶対解ではないので、自分の文脈に合わせて読み替えてください。

個人 vs チーム / 組織で何が変わるかを §04 の 5 軸ごとに並べると、選び方の根拠が見える:

個人用途 チーム / 組織用途
harness 各自ローカルで好きな harness を入れる(Claude Code / Hermes / Cursor / Antigravity) 統一 harness を社内標準化 / Antigravity SDK で社内プロダクトに埋め込んだカスタム harness
権限境界 個人の Mac / 個人 repo への read / write が中心 Project / User / Role の階層 ACL、社内システムへの権限分離、agent 個別の scope 制限
コンテキスト 個人の Obsidian / 個人 git repo / 個人 Slack DM など、自分が持っている情報源 社内 Confluence / 共有 GitHub org / 全社 Slack / Linear・Jira / on-call runbooks ── マルチユーザー間で共有される情報源
タイミング 個人 PC で対話的、または個人の cron で軽く回す(自分の PC が落ちると止まる) 共用サーバー / CI ランナー / 24/7 稼働環境に SDK 経由で agent を組み込む。業務時間外も稼働、責任者が明確
レビュー 個人の self-check(書きながら見る) code review / PR approval flow / 監査ログ / コンプライアンスチェック ── 多段審査が必要

補足: 「harness」自体は個人 / チーム中立な概念(モデルに巻き付ける実行装置)。チーム対応の度合いは個別実装に依存する ── Claude Code / Hermes / Cursor は基本「個人ローカル」前提、Antigravity 2.0 は Project permission + SDK + Enterprise 文言で「個人とチームの両建て」、Copilot Studio は M365 圏内で「最初からチーム/業務」を前提。

▍ チームで harness を共有するなら SDK 一択

Antigravity の Desktop / CLI のスタンドアロン構成は、構造上「個人マシンに常駐する app server」が前提(§2-2 FIG 参照)。同じハーネスをチームで共有しようとしても、agent 定義 / Project / scheduled task はそれぞれのローカル app server に紐づくので、git で config を share してもインスタンスは別々

チームで harness を「共有」したいなら、§2-3 の SDK 経由で社内バックエンド / 共用サーバー / CI ランナーに埋め込み、複数ユーザーから単一の harness インスタンスを叩く構造を自前で組むのが現実解。Google が hosted の「Managed harness」を提供しない以上、"team harness as a Service" は自社で実装する必要がある、というのが現時点の制約。

>6-1個人 ── Hermes と Antigravity を併用

OSS 派の個人は引き続き Hermes が強い。Obsidian 連携・多モデル切替・gateway(Telegram / Discord / LINE / Slack)の標準対応は今のところ Hermes ならでは。

Google エコシステム派の個人には Antigravity が刺さる。AI Studio で試したアイデアを Antigravity Desktop に持ち込み、Firebase まで一気通貫で持っていける統合導線は Hermes には作れない。

実用解は 併用。Hermes で個人の暗黙考プールを動的にオーケストレーションし、Antigravity を Google 圏の重い開発作業に当てる。

>6-2組織 ── 3 Agent OS の横断選定

エンタープライズでは 3 つの Agent OS を「業務文脈」「開発文脈」「個人文脈」で使い分ける構図になる:

選定は 「どの圏のエコシステムを軸にするか」 でほぼ決まる。M365 中心なら Copilot Studio、Google 中心なら Antigravity + Workspace Studio。業務系(Workspace / M365)と開発系(Antigravity)を別 Agent OS として併用するのが自然。

▍ FDE / Applied Engineer の役割

3 つの Agent OS を横断して 「現場の暗黙知 / 暗黙考を引き出し、適切な harness に流し込む」 役割が、FDE / Applied Engineer の本領になる。エディタ単体で完結する時代の終わりは、現場×AI を繋ぐ人材の価値上昇と表裏。

▍ THE WORLDVIEW — エディタの次は Agent OS

「どのモデルが賢いか」では足りない、Agent OS の設計時代へ

Antigravity 2.0 のリリースは、AI コーディングツールの比較軸が変わる転換点を示している。エディタの中でモデルを比べる時代から、harness 設計 / 権限境界 / コンテキスト / 自動実行タイミング / レビューの 5 軸で Agent OS の設計を比べる時代へ。

Claude Code / Codex / Grok Build は専門ワーカー層、Antigravity 2.0 / Hermes / Copilot Studio / Workspace Studio は Agent OS 層。レイヤーが違うものを VS で並べる議論はもう成立しない。同じレイヤー内での比較と、別レイヤー間の組み合わせ設計に思考を移す必要がある。

  • エディタ単独比較は周回遅れ(モデル単体性能は急速にコモディティ化)
  • Agent OS の設計が次の差別化(harness × 権限 × コンテキスト × タイミング × レビュー)
  • 「編成・監督・継続実行」が AI コーディングの主戦場

個人なら Hermes と Antigravity を併用、組織なら Copilot Studio / Workspace Studio / Antigravity を業務軸・開発軸・個人軸で使い分ける。エディタの中ではなく、Agent OS の設計でこそ生産性が決まる。AI コーディングの次のフェーズはここから始まる。