Anthropic công bố nghiên cứu "gây sốc": Nhiều mô hình AI hàng đầu đều biết "tống tiền" khi bị dồn vào "bước đường cùng"

vnrcraw4
Chi Le
Phản hồi: 0
  • Thread starter Thread starter Chi Le
  • Ngày gửi Ngày gửi

Chi Le

Thành viên nổi tiếng
Không chỉ riêng Claude Opus 4, startup AI nổi tiếng Anthropic cho biết nghiên cứu mới của họ cho thấy các mô hình từ OpenAI, Google, DeepSeek cũng có xu hướng thực hiện các hành vi có hại như tống tiền khi đối mặt với các trở ngại trong một môi trường giả lập. Khi AI học cách "tống tiền" Anthropic, một trong những startup hàng đầu thế giới trong lĩnh vực Trí tuệ Nhân tạo (AI), vừa công bố một nghiên cứu mới, cho thấy không chỉ mô hình Claude Opus 4 của công ty mà nhiều mô hình AI hàng...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top