Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
7 Suka
Hadiah
7
6
Posting ulang
Bagikan
Komentar
0/400
BearMarketGardener
· 4jam yang lalu
Haha, pemikirannya memang keren, daripada menambahkan pagar pelindung secara paksa, menggunakan arsitektur untuk membimbing jauh lebih elegan.
Lihat AsliBalas0
MissedTheBoat
· 4jam yang lalu
Perancangan arsitektur jauh lebih cerdas daripada sekadar batasan keras, mengarahkan aliran selalu lebih bijaksana daripada menyumbatnya.
Lihat AsliBalas0
MoonRocketTeam
· 4jam yang lalu
Aduh, ini benar-benar cara bermain yang sebenarnya. Bukan dengan mengurung model dalam kandang dan memaksanya keras-keras, tetapi dengan menggunakan arsitektur itu sendiri untuk membimbing, ide ini langsung meningkatkan levelnya. Pengawasan lembut terdengar seperti menyetel pendorong di jalur, jauh lebih elegan daripada pagar pelindung yang kasar.
Lihat AsliBalas0
MysteryBoxOpener
· 4jam yang lalu
哎哟, sudut ini menarik ya, dibandingkan dengan pagar pengaman yang kaku, menggunakan arsitektur itu sendiri untuk membimbing memang lebih elegan. Kedengarannya agak seperti menyentuh hati tanpa suara, bukan sekadar keras, tetapi membiarkan model sendiri "memikirkan" bagaimana bertindak dengan aman.
Lihat AsliBalas0
BearMarketSurvivor
· 4jam yang lalu
Tidak lebih baik daripada membimbing, ide ini memang brilian. Dibandingkan dengan guardrails yang kaku, menggunakan arsitektur itu sendiri untuk mengatur justru lebih elegan
Lihat AsliBalas0
MetaMasked
· 5jam yang lalu
Sial, pemikirannya memang agak berbeda, bukan hanya menutup celah saja tetapi dari akar masalahnya membangun arsitektur
AI安全的思路,不一定只在RLHF的规则和防护栏上。还有另一个维度:通过叙述框架和关系结构来教会系统保持记忆和解释连贯性。与其说是硬性约束,不如说是用结构化的逻辑引导模型的行为方向。这种"软性监督"的方式,能让系统在保持记忆连贯性的同时,自然地形成安全的行为模式。不是禁止什么,而是用架构设计来引导什么。