فكرة أمان الذكاء الاصطناعي ليست بالضرورة مقتصرة على قواعد ودرابزينات RLHF. هناك بعد آخر: من خلال إطار السرد وهيكل العلاقات لتعليم النظام الحفاظ على الذاكرة والتفسير بشكل متماسك. بدلاً من أن نقول إنه قيد صارم، يمكننا القول إنه توجيه سلوك النموذج باستخدام منطق منظم. هذه الطريقة "الرقابة اللينة" تمكن النظام من الحفاظ على تماسك الذاكرة وفي الوقت نفسه يتشكل بشكل طبيعي أنماط سلوك آمنة. ليست حظر شيء معين، بل تصميم الهيكلية لتوجيه ما يجب فعله.
شاهد النسخة الأصلية