社畜進化論｜Raven AI

Write something

Pinned

Nov '25 •

各位好，此社群是 Raven AI 週報的延伸社群。在這裡我會固定每月更新至少 2 篇文章或影片，這裡的更新是指： - Classroom：分成 AI 知識管理、AI Coding、AI 自動化(n8n)，各自有基礎與進階內容。每個人進來都是 Lv1 ，如果 Classroom 內課程寫 Lv1 ，代表你能直接進去。與社群互動，發文、留言等等，能夠增加經驗值，當你升級，就能進到相對應的課程。提醒各位：想升級只有按讚沒用，要留言，然後別人跟你互動。最後，請各位在「自我介紹」區發文，讓大家幫你留言按讚。

New comment May 6

Kaiyuan Kang

2d •

一般討論

AI 基礎設施 / 自研晶片 / LLM 推論：OpenAI 發表首款自研 AI 晶片 Jalapeño，專為 LLM 推論打造

今天在 X 上看到 @OpenAI 寫的內容，他提到他們設計並打造了第一款自研 AI 晶片，命名為 Jalapeño。這顆晶片由 OpenAI 從零開始設計，並與 Broadcom 合作量產。OpenAI 表示，Jalapeño 是專為 LLM 工作負載打造的，服務 ChatGPT、Codex、API，以及未來的 agentic 產品。OpenAI 指出，晶片是 AI 經濟的基礎建設。自研晶片讓他們從產品、模型到基礎設施，擴展為完整的全棧平台。他們認為這將幫助擴大智慧規模、服務更多用戶，並拓展 AI 的普及。這件事對於關注 AI 基礎設施的人來說，是一個重要的訊號。當 AI 公司開始自研晶片，代表他們不再只是依賴現有的硬體供應鏈，而是從底層開始優化推論的效能、供應與產品節奏。Jalapeño 以 LLM 推論為核心設計目標，這對於 ChatGPT、Codex 這類需要大規模即時回應的產品來說，影響會很直接。隨著未來 agentic 產品持續發展，推論效能、成本與可取得性都會變得更關鍵。

Kaiyuan Kang

2d •

一般討論

AI 產品開發：Gemini 3.5 Flash 把螢幕與目標交給 AI agent，產品測試會更像交辦任務

我是 Raven，今天看到 @_philschmid 在 X 上分享了一個做法：用 Gemini 3.5 Flash 的 computer use 功能來測試文件。他給 agent 的指令很直接：稽核這個頁面、執行程式碼範例、找出問題。接著 agent 會自己瀏覽頁面、操作、截圖，最後回來給一份報告。這個功能的意思是，你不只是在聊天框裡請 AI 生成文字。你給它一個螢幕畫面與一個目標，它會自己推論接下來要做什麼。例如該點哪個按鈕、該輸入什麼、該切到哪個頁面、該怎麼確認結果。這次支援的環境包含瀏覽器、手機與桌面。所以它不只適合網頁流程，也可能用在行動 App 測試、桌面軟體流程檢查、內部工具操作驗證。對產品團隊來說，這會讓很多原本需要人工走一遍的測試工作，變成可以交辦給 agent 的任務。安全設計也很重要。原文提到它整合了使用者確認、自動停止提示注入攻擊，以及針對提示注入的額外訓練。AI 能看到螢幕並操作畫面，不代表每一步都應該直接放行。尤其是瀏覽器和桌面操作，很容易碰到網頁文字、外部內容、未知指令，所以確認與停止機制會變成基本配備。我覺得這功能最適合先從文件測試開始用。文件有明確路徑、有步驟、有範例程式碼、有預期結果。你可以要求 agent 逐頁檢查教學是否能跑通，記錄哪一步卡住，截圖保留證據，再整理成回報。這種工作以前很瑣碎，現在可以被包成一個稽核任務。真正要注意的是任務描述要夠具體。不要只說「幫我看看文件」。可以改成「打開這個 URL，依序執行教學中的程式碼範例，記錄失敗步驟、錯誤訊息、截圖與修正建議」。這樣 agent 才知道什麼叫完成，也比較容易交出可用的報告。來源：https://x.com/i/status/2069819170477293863

Kaiyuan Kang

3d •

一般討論

AI Agents / LLM UIUX / 團隊工作流：Karpathy 談 Claude Tag：LLM 從網站、App 走向團隊成員

看到 @karpathy 在 X 上的貼文，他在聊 Claude Tag 不只是 Slack 的新功能，而是 LLM UIUX 的第三次重大重新設計。Claude 官方的說法是，Claude Tag 讓 Claude 在 Slack 裡以團隊成員的身份加入，能存取你指定的頻道與工具。你可以標記 Claude，然後把任務委派給它，自己繼續專注在其他工作上。 Karpathy 的觀察是，這種互動方式比過去更內嵌在組織裡的人類活動之中。它不是把聊天機器人放到另一個入口而已。要讓這件事真正運作，底層需要完成很多工程工作，包括跨工具、跨整合、跨運算環境，以及記憶與安全。當這些條件到位，Claude 基本上就能以很順暢的方式加入團隊。你可以像對人說話一樣和它溝通，它也能幫忙處理非常廣泛的工作負載。他把這件事稱為 LLM UIUX 的第三次重大重新設計。第一次範式是 LLM 作為網站，你需要到某個網站上使用它。第二次範式是 LLM 作為電腦上的應用程式，你把它下載到本機，讓它更靠近你的工作環境。第三次範式則是 LLM 成為一個自包含、持久存在、非同步的實體。它擁有組織範圍內的工具與上下文，並且和人類團隊一起工作。這個差別在於工作流程的入口改變了。以前是人停下手邊工作，打開網站或 App 去找 AI。現在是 AI 直接待在團隊已經工作的地方，等你在上下文中標記它、交代任務、接續協作。這讓 AI 協作從主動查詢變成日常委派。 Karpathy 也提到，這種模式需要花一點時間才能真正理解。因為它不是單一功能的改良，而是角色位置的變化。AI 從被使用的工具，逐漸變成可以被安排進工作流程的成員。當一個 AI 能夠在團隊對話裡長期存在，理解頻道上下文，使用指定工具，並且非同步處理任務，團隊管理工作的方式也會跟著改變。

Kaiyuan Kang

3d •

一般討論

AI 產品開發：Claude Tag 的隱藏風險：企業記憶鎖在供應商代理層，模型可換但上下文難搬

@ashwingop 在 X 上分享了他對這題的觀察，他認為 Claude Tag 表面上只是一個方便的工具：在 Slack 中標記 Claude，讓它跟著討論串、記住上下文、串接工具、拆解任務、追蹤工作進度，像一個真正的隊友。但他指出，這其實是一個 Trojan horse。他解釋說，不是 Anthropic 在做壞事，而是誘因太明顯了。從第一天開始，當你的 AI 供應商同時變成你的共享 coworker，它就從模型提供者，變成工作被解讀、被記憶、被路由、最後被執行的核心平台。真正的風險不是模型鎖定，而是上下文鎖定。你正在把你的公司租給供應商。他表示，模型可以隨時替換，代理可以被複製，但企業的營運記憶非常難搬移：Slack 裡面累積的溝通疤痕、各種例外處理路徑、對客戶做出的承諾、未完成的討論串、各種奇怪的內部流程、隱性的任務負責人，還有「我們在 Q2 試過但失敗了」這類過去經驗。一旦這些知識活在單一供應商的代理層裡，你就不只是租用智慧了，你是在租用你公司的營運記憶。他進一步提醒，定價模型讓這件事更加危險。人類同事的支出是固定薪資，但 Claude 是無上限的代幣化計費。工作愈多流經這個系統，供應商拿到的不只是 IT 預算，而是整個勞動支出。他認為這筆企業交易遲早會讓人後悔：現在換取方便，未來換來快速淪為依賴。他提出的正確架構很直接：租用當月最好用的智慧，無論是 OpenAI、Anthropic、Gemini 還是開源模型，誰最強就用誰。但必須自己擁有上下文層。公司記憶應該是可檢查、可控制權限、可攜帶、且模型中立的。它不該被埋在同一個同時賣你智慧和 workflow 介面的供應商裡面。他的結論是，Claude Tag 很有用，正因為有用所以危險。租智慧，但擁有上下文。否則，以後再後悔。來源：https://x.com/i/status/2069814177624121469

1-30 of 193

社畜進化論｜Raven AI

skool.com/decode-ai-ai-2667

不再當每天加班的社畜啦！本社群深入解析 AI Agent 技術應用，利用科技槓桿成為超級個體，打造一人公司！

AI-Driven Business Community

Bring people together around your passion and get paid.