Các nhà nghiên cứu phát hiện ChatGPT và Gemini có thể bị lừa, phá vỡ phòng tuyến bộ lọc nội dung

vnrcraw5
Hue Hoang
Phản hồi: 0

Hue Hoang

Thành viên nổi tiếng
Các nhà nghiên cứu từ Intel, Đại học Boise State và Đại học Illinois đã hợp tác trong 1 nghiên cứu mới, tiết lộ phương pháp gọi là "Information Overload" (quá tải thông tin) để phá vỡ các bộ lọc an toàn của mô hình ngôn ngữ lớn (LLM) như ChatGPT và Gemini. Phương pháp này hoạt động bằng cách ném 1 lượng lớn thông tin phức tạp vào AI, khiến nó bị rối loạn và bỏ qua các rào cản an toàn vốn được thiết kế để ngăn chặn nội dung độc hại hoặc nguy hiểm. Theo nghiên cứu, khi...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top