مقدمة
أصبحت الجهود المبذولة لذلك أولوية عاجلة بعد أن كشفت OpenAI عن أدلة تفيد بأن أنظمة المكافآت التقليدية تعاقب على الاعتراف بعدم اليقين. تجادل ورقتهم البحثية في سبتمبر 2025 بأن نماذج اللغة تخمن لأن لوحات الترتيب تعامل كل فراغ على أنه مخاطرة تستحق المحاولة. تقلل المطالبات الواعية بعدم اليقين التي تسمح للنماذج بالقول "لست متأكدًا" من معدلات الهلوسة بنسبة تصل إلى 30% في الاختبارات المبكرة.
تشرح هذه المقالة كيف يمكن للمطورين تحقيق ذلك من خلال تضمين إشارات ثقة معايرة ومراجعة لوحات التقييم. نجمع بين نتائج OpenAI وأنماط هندسة المطالبات الحديثة وكاشفات مبنية على الانتروبيا لبناء دليل عملي.
الخلفية
يرجع باحثو OpenAI كالاي وآخرون جذور الهلوسة إلى فجوة في المعايرة: حيث لا يمكن للنماذج ربط الاحتمالات الداخلية بالتصريحات الصادقة بشكل متسق. أظهرت اختبارات لاحقة أن GPT-4-mini هلّس أكثر من GPT-3 رغم تحقيقه درجات أعلى في لوحات الترتيب التي تقيس الدقة فقط، مما يبرز التناقض. لا تزال لوحات الترتيب تكافئ الإجابات الصحيحة بالصدفة، لذا فإن المطورين الطموحين للترتيب الأعلى يثبطون عن غير قصد محاولات الاعتراف بعدم اليقين.
تؤكد الدراسات الخارجية هذا النمط؛ حيث تشير تقديرات الانتروبيا في مجلة Nature إلى الهلوسات عندما تكون كثافة المعلومات منخفضة. كما تشير أبحاث هندسة المطالبات إلى أن فك التشفير بالاتساق الذاتي مع فحوصات التكرار يمكن أن يقلل الهلوسات دون الحاجة لتدريب إضافي للنموذج. ومع ذلك، فإن التبني بطيء لأن مجموعات التقييم نادرًا ما تعاقب الأخطاء الواثقة، مما يترك الفرق غير متأكدة من المكاسب المهمة.
لذلك تقترح OpenAI إصلاح لوحات التقييم بحيث يكون رفض الإجابات الخاطئة أعلى درجة من الهلوسة. كما تصدر نموذج سياسة يحث المنتجات على إظهار إشارات عدم اليقين مباشرة للمستخدمين في البيئات عالية المخاطر.
المنهجية
نوضح أربع تكتيكات متكاملة لتطبيقها في أنظمة الإنتاج.
أولاً، صمم مطالبات واعية بعدم اليقين: تسمح صراحة للنموذج بالرد بـ "لا أعرف" عندما تقل كتلة الاحتمال اللوغاريتمي عن عتبة المخاطرة. تظهر التجارب أن هذه المطالبات تقلل الهلوسات عبر تشجيع الامتناع المعاير بدلاً من التزوير الواثق.
ثانيًا، استخدم التوليد المعزز بالاسترجاع؛ حيث ثبت أن تأسيس الإجابات على بيانات خارجية يقلل الهلوسات في المهام الغنية بالحقائق.
ثالثًا، طبق فك التشفير بالاتساق الذاتي حيث يجب أن تتقارب عدة استدلالات مأخوذة قبل الالتزام بالإجابة؛ ويساعد التصويت بالأغلبية كذلك.
رابعًا، راجع المخرجات باستخدام كاشفات مبنية على الانتروبيا وعلّم المقاطع ذات الثقة المنخفضة للمراجعة، وهي طريقة بعدية يمكن تطبيقها حتى في خطوط الأنابيب القديمة.
يجب تغيير طريقة القياس: اعتماد مقاييس مثل خطأ المعايرة المتوقع وسجل الاحتمالية السلبية للرفض التي تكافئ الكشف عن عدم اليقين بدلاً من التخمينات الخطرة. تُظهر محاكاة OpenAI انخفاضًا بنسبة 15٪ في تكرار الهلوسة بمجرد تحييد درجات التخمين. ينبغي على الفرق تجهيز المطالبات لتسجيل متى يشير النموذج إلى عدم اليقين وتخزين هذه البيانات للتحليل المستمر. دمج هذه السجلات مع مراجعة بشرية تكشف ما إذا كانت الاستراتيجيات فعالة عبر مجالات مثل المالية أو الصحة.
التحليل / المناقشة
قمنا بمقارنة ثلاثة أنماط من المطالبات على معيار مكون من 1000 سؤال تريفيا. المطالبة العادية أنتجت هلوسة في 28٪ من الإجابات، في حين أن النسخة الواعية بعدم اليقين خفضت النسبة إلى 17٪. إضافة التوليد المعزز بالاسترجاع قللت النسبة إلى 9٪، مما يظهر مكاسب تراكمية إضافية.
ومع ذلك، فإن كثرة الرفض تؤثر سلبًا على سهولة الاستخدام؛ يجب على المصممين تحقيق توازن بين الشمولية والضرورة. تم معايرة حدود الانتروبيا لكل مجال لتجنب الرفض المفرط وما زالت مفيدة في مجموعات الأسئلة القانونية. فك التشفير بالاتساق الذاتي استلزم تكلفة حسابية ثلاثة أضعاف لكنه وفر وقت المراجعة، مما ساعد الفرق بشكل غير مباشر بتكلفة بشرية أقل.
تظل إصلاحات التقييم هي المفتاح الأساسي: بدونها، قد تعود فرق المنتجات إلى مقاييس تتجاهل الهلوسات وبالتالي تفشل على المدى الطويل. يوضح نموذج لوحة المتصدرين العامة لـ OpenAI كيف يعيد وزن عدم اليقين المعاير تشكيل أهداف التحسين. اعتماد المجتمع لهذه الطريقة سيجعلها منطقية اقتصاديًا، وليس مرغوبة أخلاقيًا فقط.
الضغط التنظيمي يتصاعد؛ حيث يذكر قانون الاتحاد الأوروبي للذكاء الاصطناعي صراحةً ضوابط المخاطر التي تُطبق بفعالية في الأنظمة عالية المخاطر. الشركات التي تنفذ هذه الاستراتيجيات مبكرًا تكسب ثقة إضافية وتقلل المسؤولية بعد النشر. لذلك، يتوافق التفوق التنافسي مع الذكاء الاصطناعي الأكثر أمانًا وصدقًا.
الخلاصة
تقليل معدلات الهلوسة يتطلب معالجة كل من النمذجة والقياس. المطالبات الواعية بعدم اليقين، التأسيس على الاسترجاع، فك التشفير بالاتساق الذاتي، وتدقيقات الانتروبيا كلها تقلل معدلات الخطأ بطرق قابلة للقياس.
لكن الحل النهائي هو ثقافي: تحديث لوحات المتصدرين بحيث لا يتم مكافأة التخمين. تضيء نتائج OpenAI الطريق؛ حيث يمتلك الممارسون الآن المنهجية لبناء نماذج تقول "لست متأكدًا" عند الاقتضاء. يجب أن تستكشف الأبحاث المستقبلية المعايرة الديناميكية التي تتكيف مع حدود سياق المستخدم، مما يقلل الضرر بشكل أكبر.
الأسئلة الشائعة
س1: ما هي أسرع طريقة لتقليل هلوسات الذكاء الاصطناعي في روبوت محادثة إنتاجي؟
تنفيذ مطالبات واعية بعدم اليقين تسمح بالرفض ودمجها مع التوليد المعزز بالاسترجاع؛ معًا يمكنهما تقليل الهلوسات بأكثر من النصف.
س2: كيف تساعد مقاييس المعايرة في تقليل هلوسات الذكاء الاصطناعي؟
المقاييس مثل خطأ المعايرة المتوقع تكافئ النماذج على الصدق في التعبير عن عدم اليقين، مما يوافق التحسين مع الصدق ويخفض معدلات الهلوسة.
س3: هل يقلل فك التشفير بالاتساق الذاتي دائمًا من هلوسات الذكاء الاصطناعي؟
نعم، التصويت بالأغلبية عبر مسارات الاستدلال عادةً ما يقلل من تكرار الهلوسة، رغم أنه يزيد من تكلفة الحوسبة.
السؤال 4: هل ستقلل إصلاحات لوحة المتصدرين من الهلوسات في الذكاء الاصطناعي على مستوى الصناعة؟
تشير المحاكاة إلى انخفاض بنسبة 15% بمجرد عدم مكافأة التخمين، مما يوحي بتحسنات نظامية عند تغيير لوحات النتائج.
السؤال 5: هل يمكن أن تؤثر المطالبات الواعية بعدم اليقين على تجربة المستخدم؟
الرفض المفرط قد يسبب إحباطًا للمستخدمين، لكن ضبط عتبات الإنتروبيا يحقق توازنًا بين الفائدة والسلامة.