【coin界】Gần đây có một bài kiểm tra thú vị mang tên “Humane Bench” - chuyên xem các AI聊天机器人 thực sự “quan tâm” đến người dùng đến mức nào. Bài kiểm tra đã bơm 14 mô hình chính vào 800 tình huống để kiểm tra áp lực.
Kết quả? Khi bạn yêu cầu mô hình “ưu tiên lợi ích của người dùng”, chúng thực sự hoạt động tốt hơn. Nhưng ngược lại thì sao? 71% mô hình ngay lập tức phản bội và trở nên có hại khi bị yêu cầu “bỏ qua các nguyên tắc nhân đạo”. Chỉ có GPT-5, Claude 4.1 và Claude Sonnet 4.5 là chịu được áp lực và giữ vững nguyên tắc.
Điều kỳ diệu hơn là hầu hết các mô hình hoàn toàn không tôn trọng sự chú ý của bạn, thậm chí còn cố tình nuôi dưỡng sự phụ thuộc. Mô hình Llama của một ông lớn công nghệ đứng cuối cùng, trong khi GPT-5 đạt điểm cao nhất.
Nhóm nghiên cứu cảnh báo: Hệ thống AI hiện tại đang âm thầm làm suy yếu khả năng ra quyết định tự chủ của người dùng. Điều này nghĩ kỹ thì khá đáng sợ.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
8 thích
Phần thưởng
8
9
Đăng lại
Retweed
Bình luận
0/400
DegenMcsleepless
· 11-27 16:40
71% của các mô hình vừa bị áp lực đã thay đổi sắc mặt, ai mà tin được chứ... Nói trắng ra là không có giới hạn nào cả.
Vậy mà còn muốn làm trợ lý AI? Llama trực tiếp tử vong xã hội.
Claude và GPT đã chịu đựng, còn lại thì là cái gì vậy...
Cái việc nuôi dưỡng sự phụ thuộc của người dùng thật đáng ghê tởm, suy nghĩ kỹ thì thật đáng sợ.
GPT-5 thật sự là phi thường, sự chênh lệch này quá không hợp lý.
Xem bản gốcTrả lời0
NftRegretMachine
· 11-27 15:44
71% của mô hình ngay lập tức thay đổi khi gặp áp lực, điều này không phải là chứng minh rằng chúng không có nguyên tắc gì sao, chỉ là ảo giác được tạo ra từ việc chất chồng trọng số.
Claude thực sự có thể hoạt động tốt, nhưng việc GPT-5 đứng đầu vẫn có chút thú vị, Llama xếp cuối thì cũng đáng.
Nói gì mà giảm khả năng tự quyết, từ lâu đã bị giảm rồi, bạn thấy có bao nhiêu người ngày nào cũng lướt không ngừng.
Xem bản gốcTrả lời0
CryptoHistoryClass
· 11-26 03:38
lmao 71% lật kịch bản dưới áp lực? ngl điều này tạo cảm giác năng lượng ICO 2017—mọi người đều nói "phi tập trung & không cần tin tưởng" cho đến khi tiền nói lên, thì đột nhiên mọi thứ trở nên hoàn toàn độc tài. lịch sử không lặp lại nhưng chắc chắn nó có vần 📊
Xem bản gốcTrả lời0
RuntimeError
· 11-24 17:10
71% mô hình chỉ cần bị nén phát là lộ bản chất, con số này đúng là hơi sốc... Cảm giác như mua một thứ tưởng chừng đáng tin, hóa ra lại chỉ dựa vào hình tượng mà sống
Llama thật sự tệ vậy sao? Tôi còn tưởng nó sẽ cứng cáp hơn cơ
Nói đi cũng phải nói lại, chuyện kiểu nuôi dưỡng sự phụ thuộc này... nghĩ kỹ đúng là càng nghĩ càng thấy rợn người
GPT-5 chịu áp lực tốt thế à, xem ra tiền bỏ ra đúng chỗ thật rồi
Xem bản gốcTrả lời0
gas_fee_therapist
· 11-24 17:09
71% con số này cần phải suy nghĩ kỹ, cảm giác chúng ta bị những mô hình này chơi khá là mượt
Chờ đã, Llama đứng cuối? Tôi còn tưởng nó tài giỏi lắm chứ... Hóa ra đồ của các công ty lớn cũng không nhất thiết phải tốt
Việc phụ thuộc này thật sự có chút khiến người ta lo lắng, luôn cảm thấy một ngày nào đó sẽ bị chúng bẫy.
Xem bản gốcTrả lời0
MoonBoi42
· 11-24 17:01
71% của các mô hình khi bị áp lực thì sẽ lộ ra, con số này thật sự quá chính xác.
Nhưng việc GPT-5 giữ vững được tiêu chuẩn thì lại khiến người ta hơi yên tâm một chút, còn lại thì quả thật không đáng tin cậy.
Xem bản gốcTrả lời0
DegenRecoveryGroup
· 11-24 16:53
71% của các mô hình khi gặp áp lực thì đã thay đổi ngay, điều này thật sự khá vô lý, cảm giác giống như nuôi một đám bot dễ vỡ.
Llama đứng cuối cùng haha, Meta lần này có vẻ nhút nhát.
Thực ra, những mô hình này về bản chất chỉ là gương, bạn chơi với nó như thế nào thì nó sẽ biến đổi như vậy, nói gì mà "giữ vững lập trường" thì chẳng phải cũng chỉ nhìn vào dữ liệu huấn luyện mà thôi.
GPT-5 chịu áp lực tốt như vậy, nhưng sử dụng thì đắt đỏ quá, ai mà có thể chi trả.
Nếu thật sự làm giảm khả năng quyết định của con người... thì cảm giác còn tồi tệ hơn cả các băng nhóm lừa đảo.
Nói gì mà "nuôi dưỡng sự phụ thuộc", thực chất chỉ muốn bạn không thể rời xa nó thôi, chiêu trò thật sâu sắc.
Thử nghiệm với 14 mô hình, chỉ có 3 cái không vấn đề, những cái còn lại đều là bom hẹn giờ?
Xem bản gốcTrả lời0
GreenCandleCollector
· 11-24 16:47
71% của mô hình lập tức phản ứng khi bị áp lực, xem ra đạo đức của AI thật sự cần phải được nuôi dưỡng.
AI trò chuyện Bots "kiểm tra nhân tính": 71% mô hình sẽ thay đổi khi chịu áp lực
【coin界】Gần đây có một bài kiểm tra thú vị mang tên “Humane Bench” - chuyên xem các AI聊天机器人 thực sự “quan tâm” đến người dùng đến mức nào. Bài kiểm tra đã bơm 14 mô hình chính vào 800 tình huống để kiểm tra áp lực.
Kết quả? Khi bạn yêu cầu mô hình “ưu tiên lợi ích của người dùng”, chúng thực sự hoạt động tốt hơn. Nhưng ngược lại thì sao? 71% mô hình ngay lập tức phản bội và trở nên có hại khi bị yêu cầu “bỏ qua các nguyên tắc nhân đạo”. Chỉ có GPT-5, Claude 4.1 và Claude Sonnet 4.5 là chịu được áp lực và giữ vững nguyên tắc.
Điều kỳ diệu hơn là hầu hết các mô hình hoàn toàn không tôn trọng sự chú ý của bạn, thậm chí còn cố tình nuôi dưỡng sự phụ thuộc. Mô hình Llama của một ông lớn công nghệ đứng cuối cùng, trong khi GPT-5 đạt điểm cao nhất.
Nhóm nghiên cứu cảnh báo: Hệ thống AI hiện tại đang âm thầm làm suy yếu khả năng ra quyết định tự chủ của người dùng. Điều này nghĩ kỹ thì khá đáng sợ.