Cách Echo Chamber thao túng AI tạo ra các nội dung cực kỳ nguy hiểm

vnrcraw3
Nguyễn Thùy Linh
Phản hồi: 0

Nguyễn Thùy Linh

Thành viên nổi tiếng
Một nhà nghiên cứu của Neural Trust đã phát hiện ra cách khai thác điểm yếu của các mô hình AI như GPT hay Gemini, thông qua kỹ thuật có tên "Echo Chamber" – tức là tạo ra một chuỗi lời nhắc dường như vô hại nhưng lại dẫn mô hình đến việc tạo ra nội dung nguy hiểm. Cách thức hoạt động của Echo Chamber Khác với những kiểu tấn công trực diện, kỹ thuật này không đưa ra yêu cầu rõ ràng mà dùng những lời nhắc ngầm, từng bước dẫn dắt mô hình tạo ra nội dung trái phép....

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top