User
Write something
Pinned
入社群必看
各位好,此社群是 Raven AI 週報的延伸社群。 在這裡我會固定每月更新至少 2 篇文章或影片,這裡的更新是指: - Classroom:分成 AI 知識管理、AI Coding、AI 自動化(n8n),各自有基礎與進階內容。 每個人進來都是 Lv1 ,如果 Classroom 內課程寫 Lv1 ,代表你能直接進去。 與社群互動,發文、留言等等,能夠增加經驗值,當你升級,就能進到相對應的課程。 提醒各位:想升級只有按讚沒用,要留言,然後別人跟你互動。 最後,請各位在「自我介紹」區發文,讓大家幫你留言按讚。
AI 基礎設施 / 自研晶片 / LLM 推論:OpenAI 發表首款自研 AI 晶片 Jalapeño,專為 LLM 推論打造
今天在 X 上看到 @OpenAI 寫的內容,他提到他們設計並打造了第一款自研 AI 晶片,命名為 Jalapeño。這顆晶片由 OpenAI 從零開始設計,並與 Broadcom 合作量產。OpenAI 表示,Jalapeño 是專為 LLM 工作負載打造的,服務 ChatGPT、Codex、API,以及未來的 agentic 產品。OpenAI 指出,晶片是 AI 經濟的基礎建設。自研晶片讓他們從產品、模型到基礎設施,擴展為完整的全棧平台。他們認為這將幫助擴大智慧規模、服務更多用戶,並拓展 AI 的普及。 這件事對於關注 AI 基礎設施的人來說,是一個重要的訊號。當 AI 公司開始自研晶片,代表他們不再只是依賴現有的硬體供應鏈,而是從底層開始優化推論的效能、供應與產品節奏。Jalapeño 以 LLM 推論為核心設計目標,這對於 ChatGPT、Codex 這類需要大規模即時回應的產品來說,影響會很直接。隨著未來 agentic 產品持續發展,推論效能、成本與可取得性都會變得更關鍵。
0
0
AI 基礎設施 / 自研晶片 / LLM 推論:OpenAI 發表首款自研 AI 晶片 Jalapeño,專為 LLM 推論打造
AI 產品開發:Gemini 3.5 Flash 把螢幕與目標交給 AI agent,產品測試會更像交辦任務
我是 Raven,今天看到 @_philschmid 在 X 上分享了一個做法:用 Gemini 3.5 Flash 的 computer use 功能來測試文件。他給 agent 的指令很直接:稽核這個頁面、執行程式碼範例、找出問題。接著 agent 會自己瀏覽頁面、操作、截圖,最後回來給一份報告。 這個功能的意思是,你不只是在聊天框裡請 AI 生成文字。你給它一個螢幕畫面與一個目標,它會自己推論接下來要做什麼。例如該點哪個按鈕、該輸入什麼、該切到哪個頁面、該怎麼確認結果。 這次支援的環境包含瀏覽器、手機與桌面。所以它不只適合網頁流程,也可能用在行動 App 測試、桌面軟體流程檢查、內部工具操作驗證。對產品團隊來說,這會讓很多原本需要人工走一遍的測試工作,變成可以交辦給 agent 的任務。 安全設計也很重要。原文提到它整合了使用者確認、自動停止提示注入攻擊,以及針對提示注入的額外訓練。AI 能看到螢幕並操作畫面,不代表每一步都應該直接放行。尤其是瀏覽器和桌面操作,很容易碰到網頁文字、外部內容、未知指令,所以確認與停止機制會變成基本配備。 我覺得這功能最適合先從文件測試開始用。文件有明確路徑、有步驟、有範例程式碼、有預期結果。你可以要求 agent 逐頁檢查教學是否能跑通,記錄哪一步卡住,截圖保留證據,再整理成回報。這種工作以前很瑣碎,現在可以被包成一個稽核任務。 真正要注意的是任務描述要夠具體。不要只說「幫我看看文件」。可以改成「打開這個 URL,依序執行教學中的程式碼範例,記錄失敗步驟、錯誤訊息、截圖與修正建議」。這樣 agent 才知道什麼叫完成,也比較容易交出可用的報告。 來源:https://x.com/i/status/2069819170477293863
2
0
AI 產品開發:Gemini 3.5 Flash 把螢幕與目標交給 AI agent,產品測試會更像交辦任務
AI Agents / LLM UIUX / 團隊工作流:Karpathy 談 Claude Tag:LLM 從網站、App 走向團隊成員
看到 @karpathy 在 X 上的貼文,他在聊 Claude Tag 不只是 Slack 的新功能,而是 LLM UIUX 的第三次重大重新設計。Claude 官方的說法是,Claude Tag 讓 Claude 在 Slack 裡以團隊成員的身份加入,能存取你指定的頻道與工具。你可以標記 Claude,然後把任務委派給它,自己繼續專注在其他工作上。 Karpathy 的觀察是,這種互動方式比過去更內嵌在組織裡的人類活動之中。它不是把聊天機器人放到另一個入口而已。要讓這件事真正運作,底層需要完成很多工程工作,包括跨工具、跨整合、跨運算環境,以及記憶與安全。當這些條件到位,Claude 基本上就能以很順暢的方式加入團隊。你可以像對人說話一樣和它溝通,它也能幫忙處理非常廣泛的工作負載。 他把這件事稱為 LLM UIUX 的第三次重大重新設計。第一次範式是 LLM 作為網站,你需要到某個網站上使用它。第二次範式是 LLM 作為電腦上的應用程式,你把它下載到本機,讓它更靠近你的工作環境。第三次範式則是 LLM 成為一個自包含、持久存在、非同步的實體。它擁有組織範圍內的工具與上下文,並且和人類團隊一起工作。 這個差別在於工作流程的入口改變了。以前是人停下手邊工作,打開網站或 App 去找 AI。現在是 AI 直接待在團隊已經工作的地方,等你在上下文中標記它、交代任務、接續協作。這讓 AI 協作從主動查詢變成日常委派。 Karpathy 也提到,這種模式需要花一點時間才能真正理解。因為它不是單一功能的改良,而是角色位置的變化。AI 從被使用的工具,逐漸變成可以被安排進工作流程的成員。當一個 AI 能夠在團隊對話裡長期存在,理解頻道上下文,使用指定工具,並且非同步處理任務,團隊管理工作的方式也會跟著改變。
2
0
AI Agents / LLM UIUX / 團隊工作流:Karpathy 談 Claude Tag:LLM 從網站、App 走向團隊成員
AI 產品開發:Claude Tag 的隱藏風險:企業記憶鎖在供應商代理層,模型可換但上下文難搬
@ashwingop 在 X 上分享了他對這題的觀察,他認為 Claude Tag 表面上只是一個方便的工具:在 Slack 中標記 Claude,讓它跟著討論串、記住上下文、串接工具、拆解任務、追蹤工作進度,像一個真正的隊友。但他指出,這其實是一個 Trojan horse。 他解釋說,不是 Anthropic 在做壞事,而是誘因太明顯了。從第一天開始,當你的 AI 供應商同時變成你的共享 coworker,它就從模型提供者,變成工作被解讀、被記憶、被路由、最後被執行的核心平台。真正的風險不是模型鎖定,而是上下文鎖定。你正在把你的公司租給供應商。 他表示,模型可以隨時替換,代理可以被複製,但企業的營運記憶非常難搬移:Slack 裡面累積的溝通疤痕、各種例外處理路徑、對客戶做出的承諾、未完成的討論串、各種奇怪的內部流程、隱性的任務負責人,還有「我們在 Q2 試過但失敗了」這類過去經驗。一旦這些知識活在單一供應商的代理層裡,你就不只是租用智慧了,你是在租用你公司的營運記憶。 他進一步提醒,定價模型讓這件事更加危險。人類同事的支出是固定薪資,但 Claude 是無上限的代幣化計費。工作愈多流經這個系統,供應商拿到的不只是 IT 預算,而是整個勞動支出。他認為這筆企業交易遲早會讓人後悔:現在換取方便,未來換來快速淪為依賴。 他提出的正確架構很直接:租用當月最好用的智慧,無論是 OpenAI、Anthropic、Gemini 還是開源模型,誰最強就用誰。但必須自己擁有上下文層。公司記憶應該是可檢查、可控制權限、可攜帶、且模型中立的。它不該被埋在同一個同時賣你智慧和 workflow 介面的供應商裡面。 他的結論是,Claude Tag 很有用,正因為有用所以危險。租智慧,但擁有上下文。否則,以後再後悔。 來源:https://x.com/i/status/2069814177624121469
1
0
AI 產品開發:Claude Tag 的隱藏風險:企業記憶鎖在供應商代理層,模型可換但上下文難搬
1-30 of 193
powered by
社畜進化論|Raven AI
skool.com/decode-ai-ai-2667
不再當每天加班的社畜啦!本社群深入解析 AI Agent 技術應用,利用科技槓桿成為超級個體,打造一人公司!
Build your own community
Bring people together around your passion and get paid.
Powered by