目錄
1 分鐘閱讀 2026

決定AI幫你還是害你的四種情境脈絡

花了一整個週末把100MB的PDF塞進Agent,結果效能反而變差。把輸入資料拆成四類之後,問題才終於看清楚。

我花了整整一個週末解析超過100MB的PDF檔案。當時的假設很直覺:餵給Agent的知識愈多,輸出就會愈好。結果完全不是這樣。

耗費好幾天的挫折之後,我畫了一張圖,把一直在輸入的資料拆成四個類別。問題立刻浮現。資料量從來不是關鍵,情境脈絡的類型才是。

餵給模型它早就知道的東西,只會讓結果更差

LLM在訓練結束時已消化了數兆個token。當你把相同的資訊貼進prompt,那些重複的token只是佔據了情境視窗的空間,讓注意力從真正重要的地方流失。你以為在幫模型,其實是在限制它。

我直接做了測試。把Python語法和基礎React模式塞進prompt,結果模型開始和自己的訓練資料互相衝突,產出比什麼都不給還要奇怪的結果。堆積夠多這類冗餘資訊,就會出現「情境腐化」(context rot)——模型的回應品質會逐漸惡化。「輸入愈多等於輸出愈聰明」這個直覺,是提示工程裡最危險的陷阱。

環境脈絡是唯一一種模型無法自己推斷的類型

專案目錄結構、團隊慣例、內部API Schema。這些東西不存在於訓練資料裡,模型在沒有明確輸入的情況下根本無從推論。這個類別才是情境脈絡真正值得存在的地方。

圍繞環境脈絡擷取的工具生態,正在以比其他領域都快的速度演進。文件OCR的努力同步在多個地方發生:台灣和韓國本地的研究社群、法國的Mistral、印度的Sarvam,以及中國的百度、智譜、DeepSeek乃至小紅書。語音,這個曾經最難捕捉的媒介,也正在被納入。像Granola這樣的會議筆記工具,把以前一通電話結束就消失的對話保存了下來。Typeless、Wispr Flow、Willow讓思緒能夠即時轉化成文字。瀏覽器行為、環境視覺輸入、你無意間瞥到的東西,都已經開始被結構化成模型可以使用的情境。

趨勢很清楚:過去會蒸發的資訊,現在正被轉換成模型能夠運用的形式。

知道和執行之間的落差,才是人與人之間真正的分水嶺

環境脈絡告訴模型有什麼存在。技能(Skills)告訴它怎麼做、按什麼順序、做到什麼標準。儲存和驗證知識是每個人都做得到的事。但一旦加入結構化執行——根據推理定義執行序列——人與人之間的差距就開始拉大。

一個好的技能定義不是簡單的指令清單。它包含六個要素:紀律原則、「完成」的定義、任務拆解方式、缺陷修補方法、反模式,以及環境適應邏輯。把所有任務塞進同一個技能,幾乎必然失敗。把工作拆解成細粒度的技能,再透過像AGENTS.md這樣的工作流程檔案組合起來,Agent才能靈活運作。即使是粗略的提示性備註,也能用工具瞬間轉換成技能。

這裡最重要的是設計視角。儲存中間檔案、先分析再執行、定義驗證標準:這些決策決定了Agent最終成功還是失敗。我是從實際生產使用中學到「偏好腳本而非MCP」這件事的,不是從理論推導的。技能也會隨著使用而精煉,給Agent對比範例,它會自己優化執行方式。

坦白說,把技能設計做好花了我比預期更長的時間。我前幾次的嘗試不是太寬泛(Agent無視了一半的指令),就是太死板(稍微偏離任務就無法適應)。要找到那個夠具體足以引導、又夠彈性足以應變的甜蜜點,需要真正的反覆迭代。

意圖與品味,是為什麼相同設定會產出截然不同結果的原因

觀察人們如何工作超過十年,一個模式不斷出現。收集和驗證知識是每個人都在做的事。通用知識現在AI擁有的量已超過任何人類。技能可以透過重複累積。但使用完全相同模型的人,依然產出差異懸殊的結果。

看看氛圍編程(Vibe coding)的輸出。有些人的作品會引發「你怎麼做到的?」的反應,有些人的作品只換來沉默。差別在於:一個人接受AI預設的美學,另一個人堅持推向自己特定的視野。快速捕捉資訊,和透過特定意圖過濾資訊,是兩種完全不同的能力。後者需要考量受眾的視角與完整的外部情境,是一種更高階的思考方式。

模型不知道你想要什麼。你必須有能力表達它。這就是為什麼在AI時代,品味比知識更重要

愈難自動化的東西,背後的人愈有價值

通用知識已經歸AI所有。把更多知識塞進prompt,只會造成反效果。環境脈絡正被OCR和語音工具以愈來愈快的速度擷取。技能可以透過重複和結構建立,然後委派給Agent執行。只有意圖與品味,是唯一完全抵抗自動化的類別。

收集AI工具和資訊固然重要。但真正的槓桿不在那裡。與其把更多情境塞進prompt,不如更精準地知道自己想要什麼。你在AI時代的價值,活在你的品味裡。

訂閱電子報

獲取關於我最新專案、文章以及 AI 和 Web 開發實驗的更新。