prompt-engineering

2 posts

2026年2月20日

把提示詞貼兩次，準確率就不一樣了

Google Research 用7個模型驗證過的最便宜LLM效能提升方法。不需要額外訓練，不需要提示詞設計，複製貼上就好。

2026年2月18日

任務成功率從 6.7% 到 68.3%：10 倍差距來自 Harness，而非模型

LangChain 的 Terminal Bench 結果與 hashline 格式實驗揭示了什麼。同一個模型排名被逆轉，原因只有三個：提示詞、工具和中介軟體。