ExplainThis 全端開發雙週報 #76 為什麼你的 AI 代理總是越做越笨? 如何解決這問題?
為什麼你的 AI 代理總是越做越笨? 如何解決這問題?
嗨~歡迎閱讀第 76 期 ExplainThis 全端開發雙週報!
在進到這期的內容前,想與讀者們分享,最近在 ExplainThis 的 E+ 成長計畫中,陸續收到讀者們的好消息。有讀者在工作上有新突破,成為團隊在 AI 代理技能方面的最受主管信任的 go-to person;也有讀者成功拿到海外工作,開啟職涯的新篇章。
這些讀者都分享透過 E+ 的履歷回饋區,收到有幫助的回饋。我們為 E+ 設置的這個專區,不只是給找工作用;假如在職涯上遇到瓶頸,想要有進一步的突破,也可以在該專區獲得履歷的下一步可以如何累積的回饋。
除了來自讀者的好消息,E+ 在 2026 年的第一門線上課程《AI Coding 從實戰到最佳實踐》也上架了第一章共 6 個單元。在接下來我們也會以每週到每雙週的頻率陸續上架新章節。感興趣的讀者,歡迎加入 E+ 觀看 (連結)
為什麼你的 AI 代理總是越做越笨? 如何解決這問題?
這期的雙週報主題文要來談「為什麼你的 AI 代理總是越做越笨? 如何解決這問題?」。這個主題也是《AI Coding 從實戰到最佳實踐》的第一個單元的重點,我們有將影片公開放到 YouTube,歡迎讀者前往觀看 (連結)。課程第一章的其他五個單元,則可以在 E+ 中看到 (連結)。
在實務上使用 AI 代理一段時間後,很多人可能都有過類似的感受,剛開始用的時候覺得模型又聰明又精準,但用久了之後,品質卻像在緩慢下滑。這並不是錯覺,也不是你一個人的問題。即使是目前業界最頂規的模型,也經常被使用者抱怨「越用越笨」。例如在知名論壇 Reddit 上就有許多相關討論,其中一則抱怨 Claude Opus 4.5 一直無視規則、一再犯相同錯誤,而且問題越來越嚴重。
這個現象其實是有原因的,也有對應的最佳實踐可以解決。因此,這個單元的聚焦點在於有哪些具體做法,可以讓 AI 代理持續保持高品質的輸出。
提示詞工程為什麼不夠用了?
從 2023 年開始,許多人都在討論如何透過提示詞讓 AI 表現得更好,例如請 AI 扮演特定領域的專家、提供少量範例(few-shot),或明確定義任務的格式與限制。這些概念到了 2026 年依然重要,但它們已經不足以應付現在的使用情境。
以程式撰寫為例,除了最初請 AI 扮演某個語言的專家並給定任務之外,更理想的輸入應該還要包含既有的程式碼庫片段、技術設計文件、團隊使用的風格指南、AI 的長短期記憶,以及讓 AI 實際執行編譯或測試後的回傳結果。這些額外的資訊對輸出品質的影響非常顯著。
舉例來說,若沒有附上風格指南,AI 的程式碼或許是正確的,但整體可維護性就會大打折扣。而讓 AI 實際跑測試、根據失敗的測試案例回推問題,再將結果放入下一輪的輸入,這個做法對最終產出的精準度幫助極大。
因為管理給 AI 的「輸入」變得如此關鍵,社群中開始出現「上下文工程 Context Engineering」或「駕馭工程 Harness Engineering」等新詞,用來描述這一整套對輸入內容進行策略性管理的做法。不管怎麼稱呼,它們的本質都是一樣的,如果輸入垃圾,就會產出垃圾(Garbage in, garbage out)。越用越笨的根源,往往就在於輸入的管理出了問題。
什麼東西該放進輸入?什麼不該放?
在理解了輸入管理是重點,相信大家會問該如何管理?首先,輸入中當然要包含與當前任務高度相關的資訊,例如程式碼片段、技術文件、風格規範等。但有一個必須牢記的原則,AI 模型已知的通用知識,不需要再重複解釋。比如在請 AI 幫你操作 Git 的時候,你不需要再解釋什麼是 Git,這只會增加無效的雜訊,佔用寶貴的輸入空間。
另一個關鍵是任務的聚焦性。不同的任務,不應該混在同一個上下文窗口(context window)當中執行。假如你原本在一個對話視窗中請 AI 實作搜尋功能,接著想要實作另一個完全不同的功能,這時候正確的做法是開啟一個全新的對話視窗,而不是繼續沿用原本那個。
在目前大多數的 AI 代理工具(如 Claude Code、Codex 等)中,都支援 /new 這類指令來快速開啟全新的上下文窗口。在影片中,我們有實際示範,從原本已用掉 43% 的窗口跳到一個全新的 100% 可用狀態,這個動作看起來很小,對輸出品質的維持卻非常重要。
避免上下文腐敗(Context Rot)
在 2024 至 2025 年間,越來越多的模型號稱能夠容納超過百萬個 token 的輸入,於是社群中開始出現一種觀點,這個觀點認為既然容量這麼大,就不需要費心管理輸入的長度了,直接把所有東西都塞進去就好。但事實並非如此。
史丹佛大學與加州大學柏克萊分校的聯合研究發現,即使模型聲稱能容納超大量的 token,當輸入內容過多時,模型對文本中段落的召回能力會明顯下降。Chroma AI 團隊的研究也證實,隨著輸入 token 數量增加,大型語言模型的表現會逐漸劣化 (連結)。這個現象,社群中稱之為「上下文腐敗 Context Rot」。
用人類的工作記憶來比喻更容易理解:每個人同時能夠處理的資訊量是有限的,AI 也一樣。當輸入中塞入過多資訊,模型的「注意力預算」就會被耗盡 (連結),進而導致輸出品質下降。
OpenAI 的一篇技術文章 (連結) 也指出,過多的資訊會讓 AI 代理開始無法分辨哪些規則仍然有效,進而遺漏關鍵限制條件、針對錯誤目標進行優化。換言之,過多的引導反而等同於沒有引導。
因此,雖然 AGENTS.md 或 CLAUDE.md 這類系統提示詞檔案很有用,但不建議把所有規範都放進去。只有那些每次 AI 代理運作時都必然會用到的內容,才適合放在裡面。以 PR 提交的相關指引為例,如果在多數的日常互動中根本不會用到,放入只會成為每次與 AI 代理互動時佔用窗口的噪音。
三個具體的實踐建議
第一,不同任務開不同窗口。 養成習慣,只要遇到不同性質的任務,就開啟新的上下文窗口。這是避免無關的歷史記錄混入當前任務輸入的最直接方法。
第二,主動要求 AI 精簡輸出。 在 CLAUDE.md 或 AGENTS.md 中加入指示,要求 AI 在規劃模式(plan mode)時盡可能使用精簡的輸出,甚至可以在不影響理解的前提下捨棄部分語法規範。這樣可以有效降低每次互動在上下文窗口中佔用的 token 比例,為後續的對話保留更多空間。這個做法來自社群知名開發者 Matt 的分享,實際使用後效果顯著。
第三,主動監控並壓縮上下文。 大多數 AI 代理工具都提供 /status 或類似的指令,可以即時查看目前上下文窗口的使用比例。建議在使用過程中定期檢查,一旦發現使用比例達到七到八成,就使用 /compact 指令讓 AI 自動總結並壓縮現有的對話內容,再以全新的窗口繼續工作。此外,也可以透過開啟子代理(subagent)的方式來延伸上下文的可用空間,這部分在課程後續進階的使用技巧中會有更詳細的說明。
只要掌握並落實這三個核心觀念,相信能有效避免 AI 代理「越用越笨」的狀況,讓你的每一次互動都能維持在較高的品質水準。
本期推薦
先前讀到 Amazon 技術長 Werner Vogels 分享的筆記方法,他談到做筆記,談了相當精闢的觀點。推薦想要把技術筆記做更好的讀者參考 (連結)
Terence Tao 最近在一場 Podcast 訪談,提到當年他到普林斯頓高等研究院待了一年,在那年他不用教學,也不用處理平常做教授要忙的行政事務,而是能不受任何干擾,把所有的時間花在思考他的研究上。結果待了幾個月後,他發現自己不知為何地靈感枯竭,然後開始感到無聊,甚至常常會在網路上漫無目的地滑東滑西。透過這個分享,他點出在生活與工作中增加隨機性,能夠激發創新 (連結)
Go 語言的作者 Rob Pike 曾分享 5 個他認為寫程式該遵循的規則,最近這 5 個規則又被社群重新討論,推薦可以回顧 (連結)
在面試最後階段,許多面試官都會問「你有什麼想問我們的問題?」。面試時問好問題,不只能讓面試官感受到你對職缺的興趣,進而留下好印象。先前看到 Linear 的產品負責人 Nan Yu 分享他認為有幫助的問題 (連結)
最近看到有人在社群分享 Difftastic 這個工具,覺得是在 code review 時的一大幫手。這個工具的特點是根據語法差異,來顯示程式碼的改動,讓看程式碼改動 (diffing) 這件事變更容易 (連結)
最近有位網友發現,在逛紐約時報的網站時,進去後竟然發送了 422 個請求,總共傳輸了 49 MB 的資料。該網友進而寫了《The 49MB Web Page》一文討論現代網站常見的臃腫問題 (連結)
先前我們在《資料密集型應用系統設計 CH1 導讀 — 資料密集型系統設計的取捨》影片討論過是否使用雲端 (連結),最近看到 Comma 分享他們決定不用雲端而是自架,看到實際維運一個小型資料中心要做的事,非常有趣 (連結)
文末彩蛋
這期的文末彩蛋是呼應了上述推薦連結 Terence Tao 分享的一句話「你生命中美好事物的數量,取決於你發現它們的能力」。
The amount of good things in your life depends on your ability to notice them
如上面談到 Terence Tao 的分享,他提到如果要避免靈感枯竭,生活需要一定程度的干擾,藉此來增加足夠的隨機性。甚至有時候,需要高溫度的隨機性,打亂原本的規劃,卻也從中探掘驚奇。
在增加隨機性的同時,也需要抱持開放的心,讓那些非預期的事物與觀點進到自己的生命中。舉例來說,假如看到某篇技術文章,原本對標題不感興趣,仍是可以選擇花一點時間讀一下,說不定能學到預料外的洞見。因此,比起很直接地對自己說「我對這個沒興趣、那個對我沒幫助」,試著更主動去覺察,相信能讓職涯與人生都更加豐富美好。

