ExplainThis 全端開發雙週報 #76 為什麼你的 AI 代理總是越做越笨? 如何解決這問題?

為什麼你的 AI 代理總是越做越笨? 如何解決這問題?

Mar 29, 2026

嗨～歡迎閱讀第 76 期 ExplainThis 全端開發雙週報！

在進到這期的內容前，想與讀者們分享，最近在 ExplainThis 的 E+ 成長計畫中，陸續收到讀者們的好消息。有讀者在工作上有新突破，成為團隊在 AI 代理技能方面的最受主管信任的 go-to person；也有讀者成功拿到海外工作，開啟職涯的新篇章。

這些讀者都分享透過 E+ 的履歷回饋區，收到有幫助的回饋。我們為 E+ 設置的這個專區，不只是給找工作用；假如在職涯上遇到瓶頸，想要有進一步的突破，也可以在該專區獲得履歷的下一步可以如何累積的回饋。

除了來自讀者的好消息，E+ 在 2026 年的第一門線上課程《AI Coding 從實戰到最佳實踐》也上架了第一章共 6 個單元。在接下來我們也會以每週到每雙週的頻率陸續上架新章節。感興趣的讀者，歡迎加入 E+ 觀看 (連結)

為什麼你的 AI 代理總是越做越笨? 如何解決這問題?

這期的雙週報主題文要來談「為什麼你的 AI 代理總是越做越笨? 如何解決這問題?」。這個主題也是《AI Coding 從實戰到最佳實踐》的第一個單元的重點，我們有將影片公開放到 YouTube，歡迎讀者前往觀看 (連結)。課程第一章的其他五個單元，則可以在 E+ 中看到 (連結)。

在實務上使用 AI 代理一段時間後，很多人可能都有過類似的感受，剛開始用的時候覺得模型又聰明又精準，但用久了之後，品質卻像在緩慢下滑。這並不是錯覺，也不是你一個人的問題。即使是目前業界最頂規的模型，也經常被使用者抱怨「越用越笨」。例如在知名論壇 Reddit 上就有許多相關討論，其中一則抱怨 Claude Opus 4.5 一直無視規則、一再犯相同錯誤，而且問題越來越嚴重。

這個現象其實是有原因的，也有對應的最佳實踐可以解決。因此，這個單元的聚焦點在於有哪些具體做法，可以讓 AI 代理持續保持高品質的輸出。

提示詞工程為什麼不夠用了?

從 2023 年開始，許多人都在討論如何透過提示詞讓 AI 表現得更好，例如請 AI 扮演特定領域的專家、提供少量範例（few-shot），或明確定義任務的格式與限制。這些概念到了 2026 年依然重要，但它們已經不足以應付現在的使用情境。

以程式撰寫為例，除了最初請 AI 扮演某個語言的專家並給定任務之外，更理想的輸入應該還要包含既有的程式碼庫片段、技術設計文件、團隊使用的風格指南、AI 的長短期記憶，以及讓 AI 實際執行編譯或測試後的回傳結果。這些額外的資訊對輸出品質的影響非常顯著。

舉例來說，若沒有附上風格指南，AI 的程式碼或許是正確的，但整體可維護性就會大打折扣。而讓 AI 實際跑測試、根據失敗的測試案例回推問題，再將結果放入下一輪的輸入，這個做法對最終產出的精準度幫助極大。

因為管理給 AI 的「輸入」變得如此關鍵，社群中開始出現「上下文工程 Context Engineering」或「駕馭工程 Harness Engineering」等新詞，用來描述這一整套對輸入內容進行策略性管理的做法。不管怎麼稱呼，它們的本質都是一樣的，如果輸入垃圾，就會產出垃圾（Garbage in, garbage out）。越用越笨的根源，往往就在於輸入的管理出了問題。

什麼東西該放進輸入？什麼不該放？

在理解了輸入管理是重點，相信大家會問該如何管理？首先，輸入中當然要包含與當前任務高度相關的資訊，例如程式碼片段、技術文件、風格規範等。但有一個必須牢記的原則，AI 模型已知的通用知識，不需要再重複解釋。比如在請 AI 幫你操作 Git 的時候，你不需要再解釋什麼是 Git，這只會增加無效的雜訊，佔用寶貴的輸入空間。

另一個關鍵是任務的聚焦性。不同的任務，不應該混在同一個上下文窗口（context window）當中執行。假如你原本在一個對話視窗中請 AI 實作搜尋功能，接著想要實作另一個完全不同的功能，這時候正確的做法是開啟一個全新的對話視窗，而不是繼續沿用原本那個。

在目前大多數的 AI 代理工具（如 Claude Code、Codex 等）中，都支援 /new 這類指令來快速開啟全新的上下文窗口。在影片中，我們有實際示範，從原本已用掉 43% 的窗口跳到一個全新的 100% 可用狀態，這個動作看起來很小，對輸出品質的維持卻非常重要。

避免上下文腐敗（Context Rot）

在 2024 至 2025 年間，越來越多的模型號稱能夠容納超過百萬個 token 的輸入，於是社群中開始出現一種觀點，這個觀點認為既然容量這麼大，就不需要費心管理輸入的長度了，直接把所有東西都塞進去就好。但事實並非如此。

史丹佛大學與加州大學柏克萊分校的聯合研究發現，即使模型聲稱能容納超大量的 token，當輸入內容過多時，模型對文本中段落的召回能力會明顯下降。Chroma AI 團隊的研究也證實，隨著輸入 token 數量增加，大型語言模型的表現會逐漸劣化 (連結)。這個現象，社群中稱之為「上下文腐敗 Context Rot」。

用人類的工作記憶來比喻更容易理解：每個人同時能夠處理的資訊量是有限的，AI 也一樣。當輸入中塞入過多資訊，模型的「注意力預算」就會被耗盡 (連結)，進而導致輸出品質下降。

OpenAI 的一篇技術文章 (連結) 也指出，過多的資訊會讓 AI 代理開始無法分辨哪些規則仍然有效，進而遺漏關鍵限制條件、針對錯誤目標進行優化。換言之，過多的引導反而等同於沒有引導。

因此，雖然 AGENTS.md 或 CLAUDE.md 這類系統提示詞檔案很有用，但不建議把所有規範都放進去。只有那些每次 AI 代理運作時都必然會用到的內容，才適合放在裡面。以 PR 提交的相關指引為例，如果在多數的日常互動中根本不會用到，放入只會成為每次與 AI 代理互動時佔用窗口的噪音。

三個具體的實踐建議

第一，不同任務開不同窗口。 養成習慣，只要遇到不同性質的任務，就開啟新的上下文窗口。這是避免無關的歷史記錄混入當前任務輸入的最直接方法。

第二，主動要求 AI 精簡輸出。 在 CLAUDE.md 或 AGENTS.md 中加入指示，要求 AI 在規劃模式（plan mode）時盡可能使用精簡的輸出，甚至可以在不影響理解的前提下捨棄部分語法規範。這樣可以有效降低每次互動在上下文窗口中佔用的 token 比例，為後續的對話保留更多空間。這個做法來自社群知名開發者 Matt 的分享，實際使用後效果顯著。

第三，主動監控並壓縮上下文。 大多數 AI 代理工具都提供 /status 或類似的指令，可以即時查看目前上下文窗口的使用比例。建議在使用過程中定期檢查，一旦發現使用比例達到七到八成，就使用 /compact 指令讓 AI 自動總結並壓縮現有的對話內容，再以全新的窗口繼續工作。此外，也可以透過開啟子代理（subagent）的方式來延伸上下文的可用空間，這部分在課程後續進階的使用技巧中會有更詳細的說明。

只要掌握並落實這三個核心觀念，相信能有效避免 AI 代理「越用越笨」的狀況，讓你的每一次互動都能維持在較高的品質水準。

本期推薦

先前讀到 Amazon 技術長 Werner Vogels 分享的筆記方法，他談到做筆記，談了相當精闢的觀點。推薦想要把技術筆記做更好的讀者參考 (連結)
Terence Tao 最近在一場 Podcast 訪談，提到當年他到普林斯頓高等研究院待了一年，在那年他不用教學，也不用處理平常做教授要忙的行政事務，而是能不受任何干擾，把所有的時間花在思考他的研究上。結果待了幾個月後，他發現自己不知為何地靈感枯竭，然後開始感到無聊，甚至常常會在網路上漫無目的地滑東滑西。透過這個分享，他點出在生活與工作中增加隨機性，能夠激發創新 (連結)
Go 語言的作者 Rob Pike 曾分享 5 個他認為寫程式該遵循的規則，最近這 5 個規則又被社群重新討論，推薦可以回顧 (連結)
在面試最後階段，許多面試官都會問「你有什麼想問我們的問題?」。面試時問好問題，不只能讓面試官感受到你對職缺的興趣，進而留下好印象。先前看到 Linear 的產品負責人 Nan Yu 分享他認為有幫助的問題 (連結)
最近看到有人在社群分享 Difftastic 這個工具，覺得是在 code review 時的一大幫手。這個工具的特點是根據語法差異，來顯示程式碼的改動，讓看程式碼改動 (diffing) 這件事變更容易 (連結)
最近有位網友發現，在逛紐約時報的網站時，進去後竟然發送了 422 個請求，總共傳輸了 49 MB 的資料。該網友進而寫了《The 49MB Web Page》一文討論現代網站常見的臃腫問題 (連結)
先前我們在《資料密集型應用系統設計 CH1 導讀 — 資料密集型系統設計的取捨》影片討論過是否使用雲端 (連結)，最近看到 Comma 分享他們決定不用雲端而是自架，看到實際維運一個小型資料中心要做的事，非常有趣 (連結)

文末彩蛋

這期的文末彩蛋是呼應了上述推薦連結 Terence Tao 分享的一句話「你生命中美好事物的數量，取決於你發現它們的能力」。

The amount of good things in your life depends on your ability to notice them

如上面談到 Terence Tao 的分享，他提到如果要避免靈感枯竭，生活需要一定程度的干擾，藉此來增加足夠的隨機性。甚至有時候，需要高溫度的隨機性，打亂原本的規劃，卻也從中探掘驚奇。

在增加隨機性的同時，也需要抱持開放的心，讓那些非預期的事物與觀點進到自己的生命中。舉例來說，假如看到某篇技術文章，原本對標題不感興趣，仍是可以選擇花一點時間讀一下，說不定能學到預料外的洞見。因此，比起很直接地對自己說「我對這個沒興趣、那個對我沒幫助」，試著更主動去覺察，相信能讓職涯與人生都更加豐富美好。

ExplainThis 全端開發雙週報

Discussion about this post

Ready for more?