跳到主要內容

2026 AI Agent 框架大戰:不是打造 Agent,是打造 Skills

 前言:一場正在發生的典範轉移

2026 年初,AI Agent 框架的競爭已經白熱化。GitHub 上每週都有新的 Agent 框架問世,Reddit 的 r/AI_Agents、r/LocalLLaMA 充斥著「A 框架 vs B 框架」的戰文。

但如果你只看框架之爭,你會錯過最重要的一件事 —— Anthropic 在一場演講中揭示了 Agent 發展的真正方向:別再打造 Agent,打造 Skills 吧。

這篇文章結合了 Anthropic 演講的核心洞見、五大框架的實戰比較,以及社群論壇的第一線觀點,幫你看清 2026 年 AI Agent 的全景。

第一章:五大框架,五種哲學

1. OpenClaw — 最完整的個人 AI Agent

OpenClaw 是 2026 年最具話題性的開源專案,48 小時內突破 10 萬 GitHub stars。由奧地利工程師 Peter Steinberger 打造,從 Clawdbot 改名而來。

核心理念:自託管的個人 AI 助理,連接你的 Telegram、WhatsApp、Discord,在你的電腦上本機執行任務 — 讀寫檔案、控制瀏覽器、排程 cron、管理記憶。

優勢:

  • - 開箱即用的「個人助理」體驗
  • - Skill 生態系快速成長(第三方 Skills 已達數百個)
  • - 社群龐大、文件豐富
  • - 支援 Claude、GPT、Gemini 等多種 LLM

隱憂:

  • - ⚠️ 安全性被嚴格質疑:研究者發現 RCE 漏洞,惡意 Skill 供應鏈攻擊(ClawHavoc 事件)
  • - Meta、Google、Microsoft、Amazon 禁止員工在公司設備使用
  • - RAM 消耗 >1GB
  • - 創辦人已加入 OpenAI,專案轉向開源基金會管理

Reddit 觀點:「OpenClaw 是你現在最快能跑起來的 Agent,但我不敢在公司用。」

2. OpenFang — Agent Operating System

2026 年 2 月剛釋出 v0.1.0 的新星。由 RightNow-AI 團隊打造,用 Rust 從零寫起,137,000 行程式碼,14 個 crate,1,767 個測試。

核心理念:這不是聊天機器人框架,是 Agent 的作業系統。最大創新是「Hands」— 預建的自主任務套件,排程自動執行,不需要你打字。

內建 Hands:

  • - Lead Hand:每天自動搜尋符合 ICP 的潛在客戶、評分、去重、產出 CSV
  • - Clip Hand:輸入 YouTube URL → 自動剪輯短影音 + 字幕 + 配音
  • - Collector Hand:OSINT 等級情報蒐集

優勢:

  • - 真正的「主動式 Agent」— 6:00AM 自己醒來跑任務,你起床看報告
  • - 編譯成單一 32MB 二進制檔
  • - 16 套安全系統(WASM sandbox、Merkle 審計、污染追蹤)
  • - 40 個通訊管道、27 個 LLM 供應商、123+ 模型

定位差異:OpenClaw 是「你的個人助理」,OpenFang 是「你的自主員工」。

第二章:Anthropic 的洞見 — Skills 才是真正的護城河

就在框架混戰之際,Anthropic 的 Barry Zhang 和 Mahesh Murag 在一場演講中提出了一個改變思路的觀點:

「別再打造 Agent 了,打造 Skills 吧。」

為什麼?

他們發現,做了 Claude Code 之後,Agent 的底層架構比想像中更通用 — 程式碼就是 Agent 與數位世界互動的通用介面。核心鷹架可以薄到只剩 bash 和檔案系統。

Agent 很聰明(IQ 300 的天才),但缺乏領域專業知識。你報稅要的是經驗豐富的稅務專家,不是天才從第一原理推導稅法。

Skills 的設計就是解決這個問題。

Skills 是什麼?

簡單到令人意外 — 就是資料夾。

skill-name/

├── SKILL.md        ← 使用說明(Markdown)

├── scripts/        ← 可執行腳本

├── references/     ← 參考文件

└── assets/         ← 素材資源

這個設計是刻意的:任何人只要有電腦就能建立和使用。可以 Git 版控、丟 Google Drive、壓成 zip 分享。


漸進式載入:不撐爆 Context Window

Skills 的精髓在於三層漸進式載入:

  • Metadata(永遠在 context):name + description,約 100 字
  • SKILL.md(觸發時載入):核心指引,<5,000 字
  • Bundled Resources(按需載入):腳本可以直接執行,不需讀入 context
  • 這讓你可以裝載上百個 Skills 而不會爆 context window。


類比計算史

Anthropic 用了一個精闢的類比:


計算史                  AI Agent 時代

處理器 Processor 模型 Models

作業系統 OS          Agent 框架

應用程式 Applications   Skills


少數公司做處理器和 OS,但百萬開發者建構了應用程式。Skills 就是要開放這一層讓所有人參與。


第三章:四條戰線,一個趨勢

🔥 戰線 1:「被動等你問」vs「主動幫你做」

傳統框架:你打字 → Agent 才動

OpenFang Hands:Agent 排程自動執行,你起床看結果

OpenClaw Heartbeat/Cron:介於兩者之間

趨勢:Agent 正在從「助理」進化成「同事」。


🔥 戰線 2:Node.js / Python vs Rust

Python 陣營(CrewAI、AutoGen):生態豐富、開發快

Rust 陣營(OpenFang、ZeroClaw):效能、安全、輕量

Node.js(OpenClaw):中間路線

趨勢:Rust 正在吃 Agent 基礎設施的底層。


🔥 戰線 3:單一 Agent vs 多 Agent 協作

單一 Agent(OpenClaw、ZeroClaw):一個 Agent 搞定一切

多 Agent(CrewAI、AutoGen):專家團隊各司其職

趨勢:兩者正在融合。OpenClaw 有 sub-agent 系統,CrewAI 也支援單一 Agent 模式。


🔥 戰線 4:安全性 — 企業採用的最大障礙

OpenClaw:被爆 RCE 漏洞、惡意 Skill 攻擊,大企業禁用

ZeroClaw:主打安全替代

OpenFang:16 套安全系統

趨勢:安全性正在成為框架競爭的核心差異化。


結論:框架會收斂,Skills 才是複利

回到 Anthropic 的洞見:Agent 架構正在收斂 — 一個 Agent 迴圈(模型 + 程式碼工具)+ MCP 連接外部 + Skills 提供專業知識。


未來的贏家不是做出最好框架的人,而是累積最多高品質 Skills 的人和社群。


你今天寫下的每一個 Skill:

  • - 明天的你可以用
  • - 你的團隊可以用
  • - 開源社群可以用
  • - 未來更強的模型也可以用

這才是真正的複利。

別再從零打造 Agent — 把精力花在打造 Skills 上吧。

留言

這個網誌中的熱門文章

Vibe Coding:到底?氛圍驅動程式開發必殺技?

Vibe Coding(氛圍編程) 是由 OpenAI 共同創辦人 Andrej Karpathy 在 2025 年提出的革命性程式開發方式,它讓開發者透過自然語言與 AI 對話來生成程式碼,徹底改變了傳統的編程模式。 這種開發方式的核心理念是 「順著感覺走」 ,讓 AI 處理技術細節,開發者專注於創意和需求描述。 Vibe Coding 需要基本上的規劃和執行,但並沒有強制規範,從日常經驗來說可分為三個階段, 前期準備、開發過程、和後期維護 三個關鍵階段。每個階段都有其特定的任務和注意事項,正確執行這些步驟將大幅提升開發效率和程式品質。 將靈感與需求透過 AI 快速轉化成產品功能或原型。以下幫你分成 「前、中、後」 三階段要做的事情,適合你自己做、或帶團隊做 前期:設定 vibe & 準備素材 這個階段的重點是 「建立開發語境」 ,因為 AI 的生成表現高度依賴前期提供的上下文與資料。 明確目標 :釐清要解決的問題、預期要做的功能與核心價值。例如在筆記軟體的情境中,可能是:「我要做一款讓使用者能用 Markdown 記錄筆記,並提供標籤與全文搜尋功能的簡單 App。」 收集靈感 :觀察同類產品(如 Obsidian、Notion)、蒐集市場痛點(例如太多筆記軟體無法脫機使用,或同步效能差)。 建立語境 :準備初步 prompt、背景知識、產品定位、品牌調性、目標使用者輪廓等。 確認資源 :決定用哪些工具(Gemini、ChatGPT、設計軟體、流程管理工具等)。 確認完上述內容之後,就可以先開始進行準備規格,進行第一次的 Vibe Coding 方向驗證 提示詞模板準備 很多人會跳過這步驟,但一份 「好的 AI 提示詞模板」 將決定接下來每一次 AI 對話的品質。有效的提示詞模板需具備: 描述具體且無歧義 包含技術要求和約束條件 提供範例資料和測試案例 指定程式碼風格和慣例 例如針對筆記軟體的案例:   「建立一個支援 AI 功能純文字筆記,輸入內容可即時渲染;需支援儲存到本地檔案,提供標籤欄位做分類;以 React 架構,程式風格採用 Tailwind style components 並使用 hooks。」 開發工具選擇 開發工具的選擇 同樣重要,目前市場上主要的 ...

Claude Code Hooks:自動化與安全的最佳實踐

寫在最前頭,這份文章主要寫起來是給自己看, 同時內容是比較適合開發者,工程師們可以做些自動化處理的簡單筆記。 Claude Code hooks Claude Code hooks 是一種強大的自動化機制,允許用戶在 Claude Code 的不同生命週期階段,自定義執行 shell 指令。這種設計讓開發者能夠將規則和自動化行為嵌入到應用層級,確保每次都能可靠執行,而不必依賴 LLM(大型語言模型)是否會選擇執行某項操作。 Hooks 的核心用途 通知 :自訂收到 Claude Code 等待用戶輸入或執行權限時的提醒方式。 自動格式化 :如在每次檔案編輯後自動執行 prettier (針對 .ts 檔)、 gofmt (針對 .go 檔)等。 日誌記錄 :追蹤所有執行過的命令,便於合規或除錯。 自動反饋 :當 Claude Code 產生不符合團隊規範的程式碼時,自動給出反饋。 自訂權限 :阻擋對生產環境檔案或敏感目錄的修改[^1]。 配置與結構 Hooks 透過設定檔進行配置,分為全域( ~/.claude/settings.json )、專案( .claude/settings.json )、本地專案( .claude/settings.local.json )以及企業級策略設定。每個 hook 由「事件名稱」和「匹配器」組成: "hooks": { "PreToolUse": [ { "matcher": "Bash", "hooks": [ { "type": "command", "command": "jq -r '...'" } ] } ] } matcher :用於匹配工具名稱(支援正則表達式),如 Write 、 Edit|Write 、 Notebook.* 。 hooks :當匹配時要執行的命令陣列。 type :目前僅支援 "command" 。 ...

[CSS] z-index 在不同瀏覽器繼承問題

今天會討論到這個課題,是因為要實做一個Popup dialog,所以我們希望的結果如下圖。 可是在IE7 卻發生了這樣的情況。 Popup不論怎麼設定z-index都無法浮在最上層,我們看一下html架構發生什麼事情。