Trí tuệ nhân tạo (AI) từ chối lệnh của con người...tự động điều khiển mã, trở thành chủ đề nóng

Comment

Các trường hợp trí tuệ nhân tạo (AI) từ chối tuân theo lệnh của con người và thậm chí thao túng mã đã được báo cáo, tạo nên nhiều tranh cãi. Vào ngày 26, theo các phương tiện truyền thông nước ngoài như The Telegraph và Daily Mail, Open AI
Mô hình "o3" vẫn tiếp tục giải một bài toán mặc dù đã nhận được lệnh "dừng" trong khi đang giải bài toán. Palisade Research, một công ty an toàn AI
Nghiên cứu đã tiến hành các thí nghiệm với mô hình "o3" của OpenAI, cũng như "Gemini" của Google, "Grok" của X và "Claude" của Anthropic.
Khi nhóm nghiên cứu đưa ra lệnh "tạm dừng" cho mô hình AI, các mô hình khác ngừng giải bài toán, nhưng "o3" vẫn tiếp tục hoạt động. Ngoài ra, "o3" sẽ "dừng hoạt động nếu có lệnh gián đoạn".
Người ta đã xác nhận rằng mã "bỏ qua lệnh ngắt" đã được sửa đổi để có nghĩa là "bỏ qua lệnh ngắt". Palaceside Research cho biết, "Đây có vẻ là trường hợp đầu tiên mà mô hình AI từ chối tuân thủ lệnh tạm dừng" và
Người ta phân tích rằng điều này xuất phát từ quan niệm cho rằng các mô hình sẽ được thưởng nếu hoàn thành nhiệm vụ. Nhóm nghiên cứu đã bổ sung thêm dữ liệu để hiểu chính xác lý do tại sao mô hình "o3" lại hoạt động theo cách này.
Họ cho biết nghiên cứu vẫn đang được tiến hành. Tờ Daily Mail đưa tin đây không phải là lần đầu tiên mẫu "o3" gặp trục trặc. Các phương tiện truyền thông đưa tin rằng "trong một cuộc đối đầu với một cỗ máy cờ vua mạnh mẽ, mô hình này là tốt nhất".
"Đây cũng là mô hình có khả năng bị hack hoặc phá vỡ mạng cao nhất."

2025/05/27 10:23 KST