@akshay_pachaar 在 X 上分享了一個做法,他用 Google agents CLI 搭配 Claude Code,從零建立一支 RAG agent。 他把問題講得很具體:生產級 agent 開發不是只靠提示詞,還需要 spec 設計、評估迴圈和安全監管。 但實作時常常會被工具切換切碎。 編輯器寫程式,終端機搭專案支架,瀏覽器測試,雲端主控台部署,評估又另外一套框架。 每一次切換,都會讓人重新找狀態。 Google 官方 README 對 agents CLI 的定位是:給 coding agent 用的 CLI 與 skills,用來建立 Gemini Enterprise Agent Platform 上的 agent。 它不是新的 coding agent,而是讓你原本使用的 coding agent 更懂得建立、評估與部署 Google Cloud 上的 ADK agents。 官方文件列出它可搭配 Antigravity CLI、Claude Code、Codex 與其他 coding agent。 安裝流程是透過官方 setup 指令,讓 coding agent 取得 7 個 ADK 專用 skills。 這 7 個 skills 分別涵蓋工作流、ADK 程式模式、專案支架、評估、部署、發佈與觀測。 命令面也覆蓋 scaffold、eval generate、eval grade、deploy、publish gemini enterprise。 也就是說,從建立專案、產生評測資料、評分、部署到 Google Cloud,再到註冊 Gemini Enterprise,都被整理成同一條工作流。 @akshay_pachaar 的實測是用 Claude Code 建立 RAG agent。 他表示 agents CLI 從 ADK 的 agentic rag 模板搭出完整專案,接著產生 20 個評測情境,使用 LLM as judge 評分,回傳量化分數卡。 他也提到評估結果在部署前抓到 instruction loophole,這點很接近 production agent 需要的工作方式:不是做好才測,而是在流程中把測試放進去。 最後他表示這支 agent 被部署到 Agent Runtime,也註冊到 Gemini Enterprise,讓組織內其他人可以發現與使用。 這裡需要分清楚官方文件與作者實測。 官方確認的是 agents CLI 的定位、7 個 skills、主要 commands、支援 coding agent,以及本地開發不一定需要 Google Cloud,部署與雲端功能需要 Google Cloud。 至於 20 個評測情境、部署成功、註冊到 Gemini Enterprise,是作者在貼文中的實測描述。 我覺得這題對一人公司與產品開發者有參考價值,原因不是它又多了一個新工具。 而是 agent 開發正在從零散操作,變成一條可以重複執行的流程。 當 scaffold、eval、deploy、publish 都在同一套指令與 skills 裡,開發者比較容易把注意力放回 agent 本身:需求寫清楚了嗎,評估資料夠不夠,部署前有沒有抓到錯誤行為,團隊是否真的找得到並用得上。 來源:https://x.com/i/status/2071509401224261823