2026年3月26日 1 分鐘閱讀 2026

決定AI幫你還是害你的四種情境脈絡

花了一整個週末把100MB的PDF塞進Agent，結果效能反而變差。把輸入資料拆成四類之後，問題才終於看清楚。

我花了整整一個週末解析超過100MB的PDF檔案。當時的假設很直覺：餵給Agent的知識愈多，輸出就會愈好。結果完全不是這樣。

耗費好幾天的挫折之後，我畫了一張圖，把一直在輸入的資料拆成四個類別。問題立刻浮現。資料量從來不是關鍵，情境脈絡的類型才是。

餵給模型它早就知道的東西，只會讓結果更差

LLM在訓練結束時已消化了數兆個token。當你把相同的資訊貼進prompt，那些重複的token只是佔據了情境視窗的空間，讓注意力從真正重要的地方流失。你以為在幫模型，其實是在限制它。

我直接做了測試。把Python語法和基礎React模式塞進prompt，結果模型開始和自己的訓練資料互相衝突，產出比什麼都不給還要奇怪的結果。堆積夠多這類冗餘資訊，就會出現「情境腐化」（context rot）——模型的回應品質會逐漸惡化。「輸入愈多等於輸出愈聰明」這個直覺，是提示工程裡最危險的陷阱。

環境脈絡是唯一一種模型無法自己推斷的類型

專案目錄結構、團隊慣例、內部API Schema。這些東西不存在於訓練資料裡，模型在沒有明確輸入的情況下根本無從推論。這個類別才是情境脈絡真正值得存在的地方。

圍繞環境脈絡擷取的工具生態，正在以比其他領域都快的速度演進。文件OCR的努力同步在多個地方發生：台灣和韓國本地的研究社群、法國的Mistral、印度的Sarvam，以及中國的百度、智譜、DeepSeek乃至小紅書。語音，這個曾經最難捕捉的媒介，也正在被納入。像Granola這樣的會議筆記工具，把以前一通電話結束就消失的對話保存了下來。Typeless、Wispr Flow、Willow讓思緒能夠即時轉化成文字。瀏覽器行為、環境視覺輸入、你無意間瞥到的東西，都已經開始被結構化成模型可以使用的情境。

趨勢很清楚：過去會蒸發的資訊，現在正被轉換成模型能夠運用的形式。

知道和執行之間的落差，才是人與人之間真正的分水嶺

環境脈絡告訴模型有什麼存在。技能（Skills）告訴它怎麼做、按什麼順序、做到什麼標準。儲存和驗證知識是每個人都做得到的事。但一旦加入結構化執行——根據推理定義執行序列——人與人之間的差距就開始拉大。

一個好的技能定義不是簡單的指令清單。它包含六個要素：紀律原則、「完成」的定義、任務拆解方式、缺陷修補方法、反模式，以及環境適應邏輯。把所有任務塞進同一個技能，幾乎必然失敗。把工作拆解成細粒度的技能，再透過像AGENTS.md這樣的工作流程檔案組合起來，Agent才能靈活運作。即使是粗略的提示性備註，也能用工具瞬間轉換成技能。

這裡最重要的是設計視角。儲存中間檔案、先分析再執行、定義驗證標準：這些決策決定了Agent最終成功還是失敗。我是從實際生產使用中學到「偏好腳本而非MCP」這件事的，不是從理論推導的。技能也會隨著使用而精煉，給Agent對比範例，它會自己優化執行方式。

坦白說，把技能設計做好花了我比預期更長的時間。我前幾次的嘗試不是太寬泛（Agent無視了一半的指令），就是太死板（稍微偏離任務就無法適應）。要找到那個夠具體足以引導、又夠彈性足以應變的甜蜜點，需要真正的反覆迭代。

意圖與品味，是為什麼相同設定會產出截然不同結果的原因

觀察人們如何工作超過十年，一個模式不斷出現。收集和驗證知識是每個人都在做的事。通用知識現在AI擁有的量已超過任何人類。技能可以透過重複累積。但使用完全相同模型的人，依然產出差異懸殊的結果。

看看氛圍編程（Vibe coding）的輸出。有些人的作品會引發「你怎麼做到的？」的反應，有些人的作品只換來沉默。差別在於：一個人接受AI預設的美學，另一個人堅持推向自己特定的視野。快速捕捉資訊，和透過特定意圖過濾資訊，是兩種完全不同的能力。後者需要考量受眾的視角與完整的外部情境，是一種更高階的思考方式。

模型不知道你想要什麼。你必須有能力表達它。這就是為什麼在AI時代，品味比知識更重要。

愈難自動化的東西，背後的人愈有價值

通用知識已經歸AI所有。把更多知識塞進prompt，只會造成反效果。環境脈絡正被OCR和語音工具以愈來愈快的速度擷取。技能可以透過重複和結構建立，然後委派給Agent執行。只有意圖與品味，是唯一完全抵抗自動化的類別。

收集AI工具和資訊固然重要。但真正的槓桿不在那裡。與其把更多情境塞進prompt，不如更精準地知道自己想要什麼。你在AI時代的價值，活在你的品味裡。

訂閱電子報

獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。