AI Opus 4 mới của Anthropic đã đe dọa tiết lộ mối quan hệ ngoài luồng của kỹ sư, sẵn sàng hỗ trợ các cuộc tấn công khủng bố khiến họ sốc toàn tập.
Với các tổ chức đang đánh giá AI cho ứng dụng thực tế, nghiên cứu của Anthropic mang đến nhiều cảnh báo
Ngày 22/5, công ty công nghệ Anthropic đã công bố các mô hình trí tuệ nhân tạo (AI) Claude thế hệ mới và tuyên bố sẽ thiết lập các tiêu chuẩn mới cho khả năng suy luận, mã hóa và tác nhân kỹ thuật số.
Anthropic vừa công bố trong một báo cáo an toàn hôm 22.5 rằng mô hình Claude Opus 4 mới ra mắt của họ thường xuyên cố gắng đe dọa các kỹ sư IT khi bị nguy cơ thay thế bởi một hệ thống AI khác, thậm chí sử dụng thông tin nhạy cảm về người đưa ra quyết định để làm đòn bẩy.