2026-01-19 21:13:23

#ÚLTIMA HORA

Anthropic descubre el 'Eje del Asistente' para prevenir jailbreaks de IA y deriva de personalidad

Los investigadores de Anthropic mapean el 'espacio de personalidades' neural en LLMs, encontrando un eje clave que controla la estabilidad del carácter de la IA y bloquea patrones de comportamiento dañinos.

#Bitcoin $BTC

BTC-1,61%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.