٢٠ فبراير ٢٠٢٦ 4 دقيقة للقراءة

لصقت الأمر مرتين فتغيرت الدقة

أرخص طريقة لتحسين أداء نماذج اللغة الكبيرة، أثبتها Google Research على 7 نماذج. بدون تدريب إضافي، بدون هندسة أوامر. مجرد نسخ ولصق.

ai llm prompt-engineering google-research performance

كنت أتعامل مع نموذج يخرج نتائج متذبذبة في مهمة استخلاص معلومات من نصوص طويلة. غيّرت الصياغة، عدّلت البنية، قسّمت المطالب إلى خطوات، فلم يتحسن الأمر كثيراً. ثم قرأت ورقة بحثية من Google Research تقترح شيئاً لم يخطر لي: أن أكرر الأمر نفسه مرتين داخل الطلب الواحد. جربت. النتائج تحسّنت.

ما الذي يحدث داخل النموذج

نماذج اللغة الكبيرة تعالج النص في اتجاه واحد، من البداية إلى النهاية. هذا يعني أن كل رمز نصي يرى ما قبله فقط، لا ما بعده. عندما يكون الأمر في البداية والمحتوى الطويل في المنتصف، يصل النموذج إلى نهاية المدخلات وقد تراجعت حدة “انتباهه” للتعليمات الأولى.

الظاهرة لها اسم في الأبحاث: Lost in the Middle. وهي موثّقة جيداً في سياق المحتوى الطويل. لكن الورقة البحثية هذه تتعامل معها من زاوية مختلفة: بدلاً من الاهتمام بكيفية ترتيب المحتوى، تركّز على موضع الأمر نفسه.

الفكرة أن النموذج حين يصل إلى نهاية المدخلات على وشك البدء بالإجابة، يكون أقرب إلى الجزء الثاني من الأمر مكانياً. هذا القرب المكاني في سياق التوليد له وزن. ليس مجازاً، بل حرفياً في آلية الانتباه.

الصيغة العملية

الطريقة مباشرة: تكتب الأمر في البداية، ثم تضع المحتوى الذي تريد معالجته، ثم تعيد الأمر نفسه أو صياغة مقتضبة منه في النهاية.

مثال عملي: إذا كنت تطلب من النموذج تلخيص وثيقة طويلة مع التركيز على البنود المالية، تضع هذا الطلب في البداية، ثم نص الوثيقة، ثم تعيد في النهاية: “لخّص مع التركيز على البنود المالية.” النموذج حين يشرع بالإجابة يكون الأمر حاضراً بوضوح في آخر ما قرأه.

اختبرت الباحثون هذا النهج على سبعة نماذج مختلفة عبر مهام متعددة: الإجابة عن أسئلة تتطلب استرجاع معلومات، والتلخيص، والتصنيف. الأداء تحسّن في معظم الحالات دون أي تدريب إضافي أو تعديل في البنية.

التكرار الثالث مضيعة

قد يبدو منطقياً أن تكرار الأمر ثلاث مرات أفضل من مرتين. البيانات تقول خلاف ذلك. التكرار الثالث لم يضف تحسناً يُذكر، وفي بعض الحالات أضر بالنتائج قليلاً.

التفسير المحتمل أن التكرار المفرط يبدأ يبدو كضوضاء للنموذج لا كتوجيه. كأنك تعيد قراءة جملة ثلاث مرات متتالية فتفقد قدرتك على فهم معناها. المرة الثانية تُثبّت، المرة الثالثة تُشوّش.

متى لا تنجح الطريقة

هذا النهج ليس حلاً شاملاً. الورقة البحثية صريحة في هذا.

النماذج المصمّمة للتفكير المتعدد الخطوات، ما يُسمى بنماذج الاستدلال، لا تستفيد من التكرار بالطريقة نفسها. هذه النماذج تبني إجاباتها عبر سلسلة من الخطوات الداخلية، وآلية انتباهها تعمل بشكل مختلف. فائدة التكرار فيها ضئيلة أو معدومة.

كذلك، التكرار لا يعالج ضعف الأمر نفسه. إذا كانت التعليمات غامضة أو متناقضة، إعادتها مرتين لن تجعلها أوضح. الأساس يجب أن يكون سليماً أولاً.

المهام القصيرة جداً حيث يكون المحتوى بضع جمل لا تستفيد كثيراً أيضاً، لأن المشكلة الأصلية، وهي ابتعاد النموذج عن الأمر بسبب المسافة النصية، لا تظهر بصورة حادة في المدخلات القصيرة.

التكلفة والجدوى

الاعتراض المنطقي هو التكلفة. الرموز النصية الإضافية تعني فاتورة API أعلى. لكن الورقة تضع هذا في سياقه: تكلفة التكرار نسبة مئوية صغيرة من حجم المدخل الكلي عندما يكون المحتوى طويلاً. إذا كانت الوثيقة تحتوي على ألف رمز نصي، وأضفت خمسين رمزاً كتكرار للأمر، فالزيادة خمسة بالمئة في التكلفة مقابل تحسين قد يصل إلى نقاط مئوية عدة في الدقة.

بالمقارنة مع بدائل تحسين الأداء الأخرى، كالضبط الدقيق أو بناء خطوط معالجة معقدة، هذا التكرار رخيص جداً. لا يحتاج إلى بيانات تدريب، لا إلى وقت حوسبة إضافي، لا إلى تعديل في البنية التحتية.

الورقة البحثية

الاطلاع على التفاصيل الكاملة متاح في Prompt Repetition Improves Non-Reasoning LLMs. الباحثون يوثّقون الإعداد التجريبي، والنماذج المستخدمة، وحدود الطريقة بوضوح. التجارب أُجريت على سبعة نماذج عبر مهام متنوعة، والنتائج متسقة بما يكفي لتبرير التجربة.

ما يستحق القراءة بعناية هو القسم المتعلق بالنماذج التي لم تستفد من التكرار. يُعطي فكرة أوضح عن متى تستخدم هذا الأسلوب ومتى لا تفعل.

التغيير الذي يسهل اختباره يستحق الاختبار. إذا كنت تتعامل مع مدخلات طويلة وتلاحظ أن النموذج يتجاهل جزءاً من تعليماتك، جرّب أن تلصق الأمر مرة ثانية في النهاية قبل أن تبحث عن حلول أكثر تعقيداً.

انضم إلى النشرة الإخبارية

احصل على تحديثات حول أحدث مشاريعي ومقالاتي وتجاربي في الذكاء الاصطناعي وتطوير الويب.