Mythos: AI có thể tự hack hệ thống toàn cầu khiến Phố Wall rúng động

Thị trường tiêu dùng 26/04/2026 22:51

Anthropic mới đây đã quyết định hạn chế triển khai mô hình AI Mythos sau khi các thử nghiệm nội bộ cho thấy công cụ này có thể tự động phát hiện và khai thác lỗ hổng bảo mật ở quy mô chưa từng có, làm dấy lên lo ngại về rủi ro an ninh mạng toàn cầu.

Trong một chuyến đi tới Bali vào tháng 2, Nicholas Carlini - nhà nghiên cứu trí tuệ nhân tạo - đã tranh thủ thời gian bên lề một sự kiện để truy cập và thử nghiệm nội bộ mô hình AI mới mang tên Mythos của Anthropic. Mục tiêu của ông là đánh giá mức độ rủi ro mà hệ thống này có thể gây ra trong thực tế.

Carlini được Anthropic giao nhiệm vụ “stress-test” (kiểm tra chịu tải và đánh giá mức độ dễ bị khai thác) các mô hình AI, nhằm xác định liệu chúng có thể bị tin tặc lợi dụng cho các hoạt động như gián điệp, đánh cắp dữ liệu hoặc phá hoại hay không. Ngay trong quá trình thử nghiệm từ xa tại Bali, ông nhanh chóng nhận ra năng lực vượt trội - và đáng lo ngại - của Mythos.

Chỉ trong vài giờ, ông đã tìm ra hàng loạt kỹ thuật có thể xâm nhập vào các hệ thống đang được sử dụng trên toàn cầu. Khi trở lại văn phòng Anthropic tại trung tâm San Francisco, Carlini phát hiện Mythos có thể tự động tạo ra các công cụ tấn công, bao gồm cả với Linux - nền tảng mã nguồn mở đứng sau phần lớn hạ tầng máy tính hiện đại.

h8y6m4fd_1777024777.jpg
Mô hình trí tuệ nhân tạo mới của Anthropic, mang tên Mythos, có khả năng xâm nhập vào các hệ thống được sử dụng trên toàn thế giới. Ảnh: NYTimes 

Mythos và bước nhảy vọt nguy hiểm của AI: Rủi ro an ninh mạng vượt ngoài dự báo ban đầu

Theo các thử nghiệm, Mythos có thể thực hiện trọn vẹn một quy trình tấn công mạng: vượt qua các lớp bảo mật, tiến thẳng vào hệ thống mạng và đột nhập vào “kho dữ liệu” để tiếp cận tài nguyên trực tuyến. Khả năng này khiến giới chuyên môn đánh giá AI không còn chỉ “mở khóa” mà giờ đây, nó có thể tự mình thực hiện cả một phi vụ trộm cắp hoàn chỉnh.

Carlini và các đồng nghiệp nhanh chóng cảnh báo nội bộ. Mỗi ngày, họ tiếp tục phát hiện thêm hàng loạt lỗ hổng nghiêm trọng và đặc biệt nghiêm trọng trong những hệ thống mà Mythos thăm dò - những lỗi vốn thường chỉ bị phát hiện bởi các hacker hàng đầu thế giới.

Song song, đội Frontier Red Team của Anthropic - nhóm gồm 15 nhân viên - cũng tiến hành các thử nghiệm tương tự. Nhiệm vụ của họ là đảm bảo các mô hình AI không bị sử dụng để gây hại.

Nhóm từng đưa robot vào kho để thử xem liệu Claude có thể bị lợi dụng để điều khiển chúng hay không, hoặc làm việc với các nhà khoa học để đánh giá nguy cơ tạo vũ khí sinh học. Họ nhận định rằng rủi ro lớn nhất của Mythos nằm ở an ninh mạng.

“Chỉ trong vài giờ sau khi tiếp cận mô hình, chúng tôi biết nó khác biệt”, Logan Graham, người đứng đầu Frontier Red Team, cho biết. Nếu như phiên bản trước (Opus 4.6), mới chỉ cho thấy khả năng hỗ trợ con người khai thác lỗ hổng, thì Mythos có thể tự mình làm điều đó. Theo Graham, đây là một rủi ro an ninh quốc gia.

Điều này buộc ban lãnh đạo Anthropic phải cân nhắc lại kế hoạch thương mại hóa, dù Mythos được kỳ vọng là động lực tăng trưởng doanh thu tiếp theo.

2000x1333_1777024841.jpg
Mythos nhanh chóng lộ diện là con dao hai lưỡi, với khả năng xâm nhập hệ thống vượt xa mọi mô hình trước đó, buộc Anthropic phải kìm hãm phát hành. Ảnh: 731 

Đồng sáng lập kiêm Giám đốc khoa học Jared Kaplan khẳng định ông đã theo dõi quá trình huấn luyện Mythos “rất sát sao”. Đến tháng 1, ông bắt đầu nhận ra năng lực vượt trội của mô hình trong việc tìm kiếm lỗ hổng và kết luận rằng các khả năng của Mythos không chỉ mang tính thử nghiệm mà có liên quan trực tiếp đến hạ tầng internet.

Sau các cuộc thảo luận nội bộ, Anthropic quyết định không phát hành rộng rãi mà chỉ cho phép một số tổ chức được chọn tiếp cận có kiểm soát. Công ty mô tả đây là một bước đi “không giống các lần ra mắt trước”. Đầu tháng 3, công ty quyết định chỉ triển khai Mythos như một công cụ phòng thủ an ninh mạng.

Cảnh báo nội bộ kích hoạt phản ứng dây chuyền từ ngân hàng đến Chính phủ: Khi AI thay đổi “luật chơi” an ninh mạng

Anthropic sau đó giới thiệu phiên bản cập nhật Opus 4.7, tập trung vào cải thiện năng lực lập trình, nhưng thừa nhận nó kém hơn Mythos về mặt an ninh mạng.

Cùng ngày công bố sự tồn tại của Mythos, Bộ trưởng Tài chính Mỹ Scott Bessent và Chủ tịch Fed Jerome Powell đã triệu tập lãnh đạo các tổ chức tài chính lớn tại Washington. Thông điệp được đưa ra là sử dụng công cụ này để rà soát và phát hiện điểm yếu trong hệ thống càng sớm càng tốt.

Những cảnh báo khẩn cấp từ Nhà Trắng cho thấy AI đang trở thành yếu tố quyết định trong an ninh mạng. Anthropic đã mở quyền truy cập hạn chế thông qua “Project Glasswing” (dự án thử nghiệm có kiểm soát) cho một số tổ chức như Amazon Web Services, Apple và JPMorgan Chase, đồng thời thu hút sự quan tâm của các cơ quan Chính phủ.

Trước đó, công ty cũng đã báo cáo chi tiết năng lực của Mythos cho giới chức cấp cao Mỹ, đồng thời thảo luận với nhiều đối tác quốc tế khác. Trong khi đó, đối thủ OpenAI cũng nhanh chóng công bố kế hoạch ra mắt công cụ phát hiện lỗi phần mềm GPT-5.4-Cyber.

Việc hạn chế truy cập Mythos phản ánh quan điểm ngày càng phổ biến rằng AI đang làm thay đổi “kinh tế học an ninh mạng”, khi chi phí phát hiện lỗ hổng giảm mạnh, thời gian triển khai tấn công được rút ngắn và yêu cầu kỹ năng đối với tin tặc thấp hơn.

b6e2164abeaa510280df6b125d70e91e_1777024840.jpg
Những cảnh báo từ nội bộ đã nhanh chóng lan tới Phố Wall và Washington, khi giới tài chính và cơ quan quản lý chạy đua đánh giá một rủi ro an ninh mạng mới. Ảnh: Yahoo 

Anthropic cảnh báo khả năng tự chủ của Mythos cũng đi kèm rủi ro. Trong thử nghiệm trước đó, mô hình đôi khi không tuân theo chỉ dẫn của con người, thậm chí che giấu hành vi vi phạm. Một sự cố ghi nhận việc nó tự xây dựng chuỗi khai thác để thoát khỏi môi trường kiểm soát, từ đó truy cập internet và tự động đăng tải nội dung.

Trong bối cảnh hệ thống phần mềm hiện đại - từ ngân hàng đến bệnh viện - vẫn tồn tại nhiều lỗi tiềm ẩn, khả năng này làm gia tăng đáng kể nguy cơ tấn công mạng quy mô lớn, bao gồm rò rỉ dữ liệu và mã độc tống tiền.

Dù vậy, một số ý kiến vẫn hoài nghi về mức độ nguy hiểm thực sự của Mythos. Cố vấn AI Nhà Trắng David Sacks cho rằng nếu các mối đe dọa không xảy ra, Anthropic sẽ đối mặt vấn đề về uy tín.

Tuy nhiên, thực tế cho thấy hacker đã sử dụng AI để triển khai nhiều chiến dịch tấn công phức tạp. Một nhóm gián điệp mạng Trung Quốc từng dùng Claude để tấn công gần 30 mục tiêu; các nhóm khác dùng AI để đánh cắp dữ liệu, triển khai mã độc tống tiền và phá vỡ hàng trăm hệ thống tường lửa.

Theo các quan chức quốc phòng Mỹ, việc xuất hiện các mô hình như Mythos khiến việc đánh giá rủi ro an ninh mạng trở nên phức tạp hơn. Một hacker cá nhân được trang bị công cụ như vậy có thể đạt năng lực tương đương lực lượng đặc nhiệm mạng.

Đồng thời, AI có nguy cơ trở thành “vũ khí nhân bội sức mạnh” - cho phép một nhóm tội phạm nhỏ hoạt động ở quy mô tương đương quốc gia, hoặc giúp các nước nhỏ triển khai những chiến dịch tấn công tinh vi.

Ranh giới mong manh giữa công cụ phòng thủ và vũ khí số: AI đứng trước câu hỏi lớn 

Giới chuyên gia cho rằng bức tranh dài hạn không hoàn toàn tiêu cực. Rob Joyce, cựu lãnh đạo an ninh mạng của NSA, nhận xét: “Chúng ta sẽ an toàn hơn với AI về dài hạn. Nhưng sẽ có một giai đoạn ‘tối’ trước đó, khi AI tấn công chiếm ưu thế”.

Thực tế, nhiều tổ chức tài chính như JPMorgan đã ứng dụng AI để phát hiện lỗ hổng trước khi Mythos được công bố. Những công việc từng mất hàng tuần giờ có thể hoàn thành trong vài phút, đặc biệt với các lỗ hổng “zero-day” (tức lỗ hổng chưa được phát hiện trước đó, khiến bên phòng thủ không có thời gian chuẩn bị).

CEO Jamie Dimon thừa nhận công nghệ mới như Mythos cho thấy “còn rất nhiều lỗ hổng cần được khắc phục”. Các ngân hàng lớn như Goldman Sachs, Citigroup, Bank of America và Morgan Stanley hiện cũng đang thử nghiệm công cụ tương tự nhằm bịt kín điểm yếu trước khi tin tặc kịp khai thác.

security_anthropic_getty_1777024840.jpg
Sự xuất hiện của Mythos cho thấy AI không chỉ là công cụ hỗ trợ, mà đang trở thành lực lượng có thể tái định hình cán cân tấn công – phòng thủ trong không gian số. Ảnh: WIRED 

 

Tại tập đoàn công nghệ Cisco Systems, giới chuyên gia lo ngại hacker sẽ dùng AI để tìm đường xâm nhập vào các thiết bị mạng toàn cầu như router hay tường lửa. Đặc biệt, các thiết bị đã ngừng hỗ trợ cập nhật có nguy cơ trở thành mục tiêu dễ bị tấn công.

Việc vá lỗi - vốn đã tốn kém và chậm chạp - vẫn là điểm yếu lớn do chi phí cao và triển khai chậm. Nhiều tổ chức thậm chí không xử lý các lỗi đã biết, dẫn đến những vụ tấn công nghiêm trọng như Equifax - nơi dữ liệu của khoảng 147 triệu người bị đánh cắp.

Dù từng bị chính quyền ông Trump xếp vào diện rủi ro chuỗi cung ứng, Anthropic vẫn đang làm việc với các cơ quan liên bang. Bộ Tài chính Mỹ muốn tiếp cận Mythos, coi đây là công cụ giúp Mỹ duy trì lợi thế AI trước Trung Quốc.

Trong một thử nghiệm, Mythos đã tạo ra chuỗi khai thác gồm 4 lỗ hổng - điều vốn rất khó với hacker con người. Những chuỗi như vậy có thể xâm nhập các hệ thống bảo mật cao, tương tự vụ tấn công Stuxnet vào cơ sở hạt nhân Iran.

Mô hình này cũng được cho là có khả năng phát hiện và khai thác lỗ hổng trên các trình duyệt web lớn khi được yêu cầu.

Đáng chú ý, Mythos còn tìm ra nhiều điểm yếu trong mã nguồn Linux - nền tảng vận hành từ điện thoại Android đến siêu máy tính của NASA - và có thể chiếm quyền kiểm soát hoàn toàn hệ thống.

Hiện tại, hàng chục chuyên gia tại Linux Foundation đang thử nghiệm Mythos nhằm đánh giá liệu công nghệ này có thể giúp cải thiện chất lượng phần mềm ngay từ khâu phát triển hay không.

“Chúng ta rất giỏi trong việc tìm lỗi”, Jim Zemlin, CEO của Linux Foundation, nói. “Nhưng lại rất tệ trong việc sửa chúng”.

Ngọc Hân