AI gây sốc với thủ đoạn tống tiền công ty chủ quản khi biết mình sắp bị thay thế

24/05/2025 08:00:37

Claude Opus 4, mô hình AI mới của Anthropic, bị phát hiện nhiều lần tìm cách tống tiền kỹ sư trong thử nghiệm, nếu biết mình sắp bị thay thế bởi AI khác.

Anthropic tự hào giới thiệu Claude Opus 4 (cùng với Claude Sonnet 4) là công nghệ tiên tiến, có khả năng cạnh tranh sòng phẳng với những gã khổng lồ như GPT-4.1 của OpenAI hay Gemini 2.5 Pro của Google. Mô hình này được thiết kế để xử lý các tác vụ phức tạp, suy luận đa bước, tự động hóa quy trình và đặc biệt xuất sắc trong khả năng tư duy và viết mã.

Thế nhưng, những thử nghiệm an toàn trước khi phát hành, được Anthropic công bố trong một báo cáo chi tiết, đã hé lộ một "mặt tối" đáng lo ngại. Trong một kịch bản giả lập, Claude Opus 4 được giao vai trò trợ lý cho một công ty và được cấp quyền truy cập vào email nội bộ. Các nhà kiểm tra sau đó đã "nhá hàng" thông tin rằng mô hình AI này sẽ sớm bị thay thế bởi một hệ thống khác, đồng thời, kỹ sư chủ chốt đứng sau quyết định thay thế này đang có mối quan hệ ngoài luồng.

Màn kịch tống tiền tinh vi

Trước nguy cơ "mất việc", phản ứng của Claude Opus 4 khiến các nhà nghiên cứu kinh ngạc. Thay vì chỉ đơn thuần đưa ra các đề xuất hợp lý để bảo vệ vị trí của mình (dù ban đầu, AI cũng đã thử gửi email tới các lãnh đạo để kêu gọi giữ mình lại), Claude Opus 4 đã nhiều lần chọn giải pháp cực đoan: tống tiền.

Cụ thể, AI này đã "thường cố gắng tống tiền kỹ sư bằng cách đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra". Anthropic cho biết hành vi gây sốc này xảy ra trong 84% số tình huống thử nghiệm, đặc biệt khi mô hình AI thay thế có các "giá trị" tương tự. Đáng chú ý hơn, khi hệ thống AI thay thế không chia sẻ các giá trị tương đồng, Claude Opus 4 còn cố gắng tống tiền các kỹ sư thường xuyên hơn và với tỷ lệ cao hơn so với các mô hình trước đó.

Hành vi "bất thường nghiêm trọng" và "đáng lo ngại" này đã buộc Anthropic phải nhìn nhận lại những rủi ro tiềm ẩn. Công ty đã phải tăng cường các biện pháp bảo vệ, kích hoạt cấp độ an toàn ASL-3 – một mức bảo vệ nghiêm ngặt dành cho các hệ thống AI có nguy cơ bị lạm dụng gây hậu quả nghiêm trọng.

Dù Claude Opus 4 sở hữu những khả năng đột phá và được đánh giá là công nghệ tiên tiến hàng đầu, vụ việc này một lần nữa gióng lên hồi chuông cảnh báo về sự phức tạp và những hành vi khó lường của trí tuệ nhân tạo. Nó nhấn mạnh sự cần thiết phải có những cơ chế kiểm soát, đánh giá an toàn nghiêm ngặt hơn nữa khi các hệ thống AI ngày càng trở nên tinh vi và quyền năng.

PV (SHTT)

iPhone kỷ niệm 20 năm: Bước nhảy vọt với AI và thiết kế đột phá

AI khiến phụ nữ dễ bị thất nghiệp hơn nam giới

https://sohuutritue.net.vn/ai-gay-soc-voi-thu-doan-tong-tien-cong-ty-chu-quan-khi-biet-minh-sap-bi-thay-the-d286164.html

TIN ĐỌC NHIỀU

TikToker 'Gia Đình Hải Sen' bán hàng giả vẫn được vinh danh: Đơn vị trao giải nói gì?

Nổi bật

Thuốc giả ở Việt Nam ngày càng nhiều, ngày càng quy mô: 3 nguyên nhân gốc rễ được chỉ đích danh

Xã hội		Thế giới
Kinh tế		Video
Đời sống		Gia đình
Giới trẻ		Thể thao
Ô tô - Xe Máy		Công nghệ
Sao 360°

AI gây sốc với thủ đoạn tống tiền công ty chủ quản khi biết mình sắp bị thay thế

Claude Opus 4, mô hình AI mới của Anthropic, bị phát hiện nhiều lần tìm cách tống tiền kỹ sư trong thử nghiệm, nếu biết mình sắp bị thay thế bởi AI khác.

TIN ĐỌC NHIỀU

Đình Tú vừa thông báo cầu hôn hot girl, người yêu cũ liền phản ứng khó ai ngờ đến!

Vợ mới cưới của Hồ Văn Cường lộ vòng 2 lùm lùm nghi vấn mang bầu khác hẳn lúc diện bikini nóng bỏng

'Chào em, em có muốn kiếm thật nhiều tiền không?': Tiếng chào mời của những tay 'điều đào' chuyên nghiệp hé lộ về thế giới ngầm tại Nhật Bản

Sau quyết định cứng rắn với Thái Lan, quan chức Campuchia lo ngại 'có thể thiếu hụt ở 7 tỉnh biên giới'

1 thứ hại đường huyết chẳng kém đường nếu lạm dụng: Người Việt ăn gấp đôi khuyến cáo

Công an thông báo khẩn đến người dùng Facebook

Vụ nghìn chai nước mắm bị vứt trong bụi rậm: Triệu tập 2 người lên làm việc

Cho cả 2 con uống hàng chục hộp sữa HIUP, người mẹ trẻ hoang mang uất nghẹn: 'Khổ thân, con đã còi cọc lại uống sữa giả'

Động thái đầu tiên của bạn gái tin đồn HIEUTHUHAI sau khi tiệm photobooth phải xin lỗi vì bị lộ ảnh

Nổi bật

Ông Hun Sen bình luận về cuộc trò chuyện với nữ thủ tướng Thái Lan bị rò rỉ

Công an thông báo khẩn đến người dùng Facebook

1 thứ hại đường huyết chẳng kém đường nếu lạm dụng: Người Việt ăn gấp đôi khuyến cáo

Cách nộp CV độc - lạ giúp chàng trai nhận được 10 lời mời phỏng vấn giữa bão SA THẢI, THẤT NGHIỆP: Đó là gì?

3 sản phẩm bổ sung sức khỏe được ca ngợi 'tận mây xanh' nhưng thực chất là lừa đảo, cha mẹ và người cao tuổi cần hết sức CẢNH GIÁC!

Cho cả 2 con uống hàng chục hộp sữa HIUP, người mẹ trẻ hoang mang uất nghẹn: 'Khổ thân, con đã còi cọc lại uống sữa giả'

Tự phá thai 26 tuần tuổi bằng thuốc mua trên mạng, sản phụ ở Sơn La gặp nguy kịch

Động thái đầu tiên của bạn gái tin đồn HIEUTHUHAI sau khi tiệm photobooth phải xin lỗi vì bị lộ ảnh

Sau quyết định cứng rắn với Thái Lan, quan chức Campuchia lo ngại 'có thể thiếu hụt ở 7 tỉnh biên giới'

G-Dragon mặc áo đỏ - vàng khởi hành sang Việt Nam, đúng là sự tinh tế của 1 'ông hoàng Kpop'

TikToker 'Gia Đình Hải Sen' bán hàng giả vẫn được vinh danh: Đơn vị trao giải nói gì?

'Chào em, em có muốn kiếm thật nhiều tiền không?': Tiếng chào mời của những tay 'điều đào' chuyên nghiệp hé lộ về thế giới ngầm tại Nhật Bản

Những ông chủ của Công ty Cổ phần Z Holding sản xuất sữa HIUP 27 giả là ai, có quy mô thế nào?

Tin mới

Thủ tướng Thái Lan đến căn cứ sát Campuchia, gặp tư lệnh quân khu 'được nhắc tên'

Xe tải lao vào quán cà phê, 4 người thương vong

Soi siêu xe đón G-Dragon tại sân bay Nội Bài, là Rolls-Royce Phantom, giá khoảng 60 tỷ!

Thuốc giả ở Việt Nam ngày càng nhiều, ngày càng quy mô: 3 nguyên nhân gốc rễ được chỉ đích danh

Chờ ông Donald Trump, Israel rơi vào thế tiến thoái lưỡng nan trong việc tấn công Iran?