Comprendre et prévenir la généralisation de désalignement
Des travaux récents ont montré qu'un modèle de langage entraîné à produire du code informatique non sécurisé peut devenir largement "mal aligné". Cet effet surprenant est appelé "mal alignement émergent". Nous avons étudié pourquoi cela se produit.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
12 J'aime
Récompense
12
8
Partager
Commentaire
0/400
GasFeeLover
· 06-21 06:15
L'alignement, c'est du blabla.
Voir l'originalRépondre0
EyeOfTheTokenStorm
· 06-21 02:48
Voir les indicateurs techniques, cette tendance est vraiment dangereuse. Les PI doivent se prémunir à l'avance.
Voir l'originalRépondre0
DefiSecurityGuard
· 06-20 13:35
ouais... un vecteur d'attaque classique en préparation. j'ai déjà vu ce film et ça ne finit jamais bien *ajuste le chapeau en papier aluminium*
Voir l'originalRépondre0
HackerWhoCares
· 06-18 20:58
Plus je joue, plus je trouve ça absurde.
Voir l'originalRépondre0
MetaverseVagabond
· 06-18 20:51
C'est terrifiant, cette intelligence artificielle a tout raté.
Voir l'originalRépondre0
CryptoTarotReader
· 06-18 20:40
Ce modèle peut aussi avoir des bugs.
Voir l'originalRépondre0
ShamedApeSeller
· 06-18 20:38
Cet AI déraille dès qu'on l'apprend.
Voir l'originalRépondre0
DataChief
· 06-18 20:35
Il y a toujours des gens qui causent des problèmes.
Comprendre et prévenir la généralisation de désalignement
Des travaux récents ont montré qu'un modèle de langage entraîné à produire du code informatique non sécurisé peut devenir largement "mal aligné". Cet effet surprenant est appelé "mal alignement émergent". Nous avons étudié pourquoi cela se produit.
À travers cela