GLM-5 與前代模型最大的不同是什麼？

GLM-5 不再只是語言模型，而是針對複雜系統工程與長程任務設計的代理人引擎，參數規模擴增至 744B，並引入 DSA 技術提升長文本處理效率。

什麼是 DSA 技術？

DSA (DeepSeek Sparse Attention) 技術讓 AI 具備專家級的索引能力，能迅速鎖定關鍵資訊並忽略雜訊，大幅降低運算成本與回應時間。

GLM-5 的代理人能力體現在哪裡？

在 Vending Bench 2 模擬經營測試中，GLM-5 展現了跨越一年的長期規劃與資源分配能力，表現逼近頂級閉源模型。

GLM-5：當 AI 不再只是陪聊，而是能幫你經營公司的「全能代理人」

[TL;DR] 重點快讀

GLM-5 核心定位從「對話」轉向「工作」，是具備 744B 參數的長程任務代理人。
引入 DSA 架構實現專家級「略讀」技巧，大幅降低超長文本處理的算力成本與時間。
透過 Slime 非同步強化學習，邏輯推理與代碼能力已直逼 Claude 4.5 等頂尖閉源模型。
具備經營規劃能力，在模擬經營測試中奪冠，並能直接生成 .docx 與 .xlsx 辦公檔案。
模型權重全面開源，開發者可直接基於此引擎建構私有的企業自動化應用。

還記得我們第一次使用 ChatGPT 時的驚艷嗎？那時我們驚嘆於它能流暢對話。但隨著時間推移，我們開始對 AI 有了更高的期待，我們不再滿足於一個「懂很多的聊天伴侶」，我們需要的是一個能真正動手解決複雜問題、甚至能獨立工作的「數位員工」。

智譜 AI 最新發布的 GLM-5，正是為了回應這個需求而生。這一次，它不再只是單純的語言模型，而是一個針對「複雜系統工程」與「長程任務」設計的強大引擎。它標誌著 AI 從「Chat（對話）」邁向「Work（工作）」的關鍵轉折點。

龐大腦容量與「精準快搜」的藝術：參數與 DSA 架構

想像一下，如果我們要把一個普通人的大腦升級為愛因斯坦，我們需要做兩件事：增加腦細胞的數量，以及閱讀更多的書籍。GLM-5 正是這麼做的。它的參數規模從上一代的 3550 億（355B）擴增到了 7440 億（744B），而它「閱讀」過的訓練資料量，也從 23兆（23T）個 Token 提升到了 28.5兆（28.5T）。這意味著它的知識儲備與邏輯底蘊達到了前所未有的深度。

然而，大腦越大，思考通常越慢，成本也越高。為了打破這個魔咒，GLM-5 引入了一項名為 DeepSeek Sparse Attention (DSA) 的技術。

你可以把傳統的 AI 想像成一個極度認真的圖書管理員，當你問他一個問題，他會把圖書館裡每一本書的每一頁都掃描一遍，這雖然精確但極度耗能。而搭載了 DSA 技術的 GLM-5，則學會了人類專家的「略讀」與「索引」技巧。它依然擁有海量的記憶（長文本能力），但在處理訊息時，它能迅速鎖定與當下任務最相關的「關鍵區域」，忽略那些無關的雜訊。這讓 GLM-5 在保持強大長文本理解力的同時，大幅降低了運算成本與部署門檻。

為什麼這很重要？

這解決了目前企業應用 AI 的最大痛點：「既要馬兒跑，又要馬兒少吃草」。過去，想要 AI 處理幾百頁的財報或法規文件，往往伴隨著高昂的算力成本或龜速的反應時間。DSA 技術讓 GLM-5 能夠在一般商業環境中，以合理的成本處理超長文本，讓「讀完一整套技術手冊並回答問題」成為秒級完成的日常操作。

從「合格」到「卓越」的秘密武器：Slime 非同步強化學習

在 AI 的訓練過程中，預訓練（Pre-training）讓模型學會了知識（Competence），但要讓它變得聰明絕頂（Excellence），則需要強化學習（Reinforcement Learning, RL）的打磨。這就像是一個資優生，雖然考試滿分，但要成為頂尖的職場菁英，還需要大量的實戰回饋與修正。

然而，大規模模型的 RL 訓練效率極低，就像是老師改考卷的速度跟不上學生寫考卷的速度。為此，研發團隊開發了一套名為 Slime 的新型非同步 RL 基礎設施。

Slime 就像是一個全天候、高效率的「數位健身房」。它打破了傳統訓練中「等待與同步」的瓶頸，允許模型在多個任務上同時進行非同步的嘗試與學習，大幅提升了訓練的吞吐量。這讓 GLM-5 能夠進行更細顆粒度的自我迭代，在推理、程式碼撰寫等領域迅速縮小與世界頂尖閉源模型（如 Claude Opus 4.5）的差距。

實戰視角：這對我們有什麼影響？

透過 Slime 的訓練，GLM-5 在邏輯推理與數學能力上展現了驚人的爆發力。在 Humanity’s Last Exam 與 AIME 2026 等高難度學術基準測試中，它證明了自己不僅僅是「背誦」知識，而是真正具備了「思考」與「解題」的能力。對於需要精準邏輯的工程師與科研人員來說，這意味著你有了一個更可靠的副駕駛。

超越對話框：能經營公司的「長程代理人」

GLM-5 最令人興奮的突破，在於它的 Agentic（代理人）能力。目前的 AI 大多是「回合制」的——你問一句，它答一句。但真實世界的工作往往是連續且長期的。

在 Vending Bench 2 這個測試中，AI 被要求模擬經營一家自動販賣機公司長達「一年」。這不僅考驗單次對話的能力，更考驗模型對庫存管理、資金流動、突發狀況應對的 長期規劃能力。

GLM-5 在這項測試中拿下了開源模型的第一名，最終帳戶餘額達到了 4,432 美元，逼近頂級閉源模型 Claude Opus 4.5 的水準。這證明了它不再是一個只能寫寫文案的助理，而是一個能理解時間跨度、懂得資源分配的管理者。

此外，GLM-5 徹底打通了與 Office 辦公軟體 的隔閡。它能直接生成 .docx、.pdf 和 .xlsx 文件。想像一下，你不再需要從 AI 的對話框複製文字貼到 Word 裡排版，而是直接對 GLM-5 說：「幫我寫一份產品需求文檔（PRD）和對應的財務預算表」，幾秒鐘後，兩個格式完美的檔案就躺在你的資料夾裡了。

開源的未來已來

最令人振奮的是，這樣強大的工具選擇了擁抱開放。
GLM-5 的權重已在 Hugging Face 與 ModelScope 上開源，並相容於 Claude Code 與 OpenClaw 等開發工具。
這意味著，無論你是個人開發者還是大型企業，都能夠站在這個巨人的肩膀上，構建屬於自己的智慧應用。
從「對話」到「工作」，GLM-5 正在重新定義我們與 AI 的協作方式。

YOLO LAB｜解構科技邊際與媒體娛樂的數據實驗室

GLM-5 深度解析：超越對話框架，直出 Office 報表的全能代理人

GLM-5：當 AI 不再只是陪聊，而是能幫你經營公司的「全能代理人」

[TL;DR] 重點快讀