#43 - Máy móc tự tìm lỗ hổng: Một bước ngoặt lịch sử

Jun 2

Tiến Phong

Khi AI tìm cách phá khoá

Thông thường, các công ty công nghệ thường tạo sự hào hứng xung quanh sản phẩm họ sắp tung ra thị trường. Nhưng Anthropic - công ty công nghệ trí tuệ nhân tạo (AI) hàng đầu của Mỹ - lại tạo ra sự phấn khích lẫn lo ngại xung quanh thứ mà họ quyết định không phát hành. Ngày 7/4/2026, hãng thông báo mô hình AI mới nhất mang tên Mythos sẽ không được công bố cho công chúng. Thay vào đó, theo một sáng kiến có tên Project Glasswing (Dự án cánh kính), quyền truy cập được kiểm soát nghiêm ngặt giữa 12 thành viên sáng lập bao gồm Apple, Google và Nvidia.

Lý do không phải vì Mythos bị lỗi hay kém hiệu quả. Ngược lại, theo The Economist, vấn đề nằm ở chỗ nó hoạt động quá tốt đến mức việc phát hành sẽ đặt toàn bộ hạ tầng số của thế giới vào tình trạng nguy hiểm. Anthropic cho biết mô hình này đã vượt qua "tất cả trừ những chuyên gia lành nghề nhất" trong việc tìm kiếm và khai thác các lỗ hổng bảo mật - từ hệ điều hành phổ biến đến phần mềm mã hóa (cryptographic software) bảo vệ thương mại điện tử và mạng lưới tài chính. Và điều đáng sợ hơn: Mythos có thể làm tất cả những điều này chỉ với sự trợ giúp tối thiểu từ con người.

Không chịu thua kém, chỉ vài ngày sau, OpenAI - đối thủ trực tiếp của Anthropic - cũng công bố phiên bản hạn chế truy cập mang tên GPT 5.4 Cyber, một mô hình chuyên biệt cho lĩnh vực tấn công mạng. Ngay lập tức, Bộ trưởng Tài chính Mỹ Scott Bessent triệu tập một cuộc họp khẩn với lãnh đạo các ngân hàng lớn để thảo luận về tác động. Các cơ quan quản lý tài chính tại Anh cũng tổ chức phiên họp tương tự vài ngày sau đó. The Economist gọi viễn cảnh mới này là thế giới của "vibe hacking" (tấn công mạng theo cảm hứng) - nơi ngay cả người nghiệp dư cũng có thể dùng AI để tìm lỗi phần mềm, viết mã khai thác, từ đó làm sập hệ thống, đòi tiền chuộc, hoặc thậm chí chiếm quyền điều khiển từ xa.

Nhưng câu chuyện không chỉ dừng lại ở một mô hình AI. Sự xuất hiện của Mythos là tín hiệu cho thấy nhân loại đang đứng trước bước ngoặt mang tính lịch sử, nơi ranh giới giữa phòng thủ và tấn công trong không gian mạng đang bị AI xóa nhòa với tốc độ chưa từng thấy.

Mythos thực sự đáng sợ đến mức nào?

Do Anthropic chỉ công bố thông tin hạn chế về Mythos, giới chuyên gia đang tranh luận sôi nổi nhằm đánh giá mô hình này mang tính cách mạng thật sự, hay chỉ là một bước tiến hóa tự nhiên? Viện An ninh AI, cơ quan của chính phủ Anh chuyên đánh giá rủi ro AI - đã tiến hành kiểm tra và nhận thấy trên các bài kiểm tra an ninh mạng tương đối đơn giản, Mythos chỉ ngang bằng các mô hình khác. Tuy nhiên, ở bài kiểm tra nâng cao đòi hỏi mô hình phải hoàn thành hàng chục bước phức tạp trước khi chiếm được quyền kiểm soát máy đích - Mythos vượt trội rõ rệt. Theo biểu đồ của The Economist, lần chạy tốt nhất của Mythos hoàn thành 32/32 bước, trong khi GPT-5.4 đạt khoảng 15 và Claude Opus 4.6 chỉ khoảng 10.

Điều cốt lõi mà các nhà nghiên cứu Anthropic tập trung khảo sát là khả năng phát hiện lỗ hổng zero-day (lỗ hổng ngày-không - tức lỗi chưa từng được biết đến, chưa có bản vá, và do đó cực kỳ nguy hiểm). Theo The Economist, Jeff Williams, đồng sáng lập Contrast Security (công ty phần mềm bảo mật) và Quỹ Dự án bảo mật ứng dụng web mở toàn cầu cho biết "lỗ hổng zero-day ẩn nấp ở khắp nơi." Mythos được cho là đã tìm ra "hàng nghìn" lỗi ở mức nghiêm trọng cao hoặc nguy cấp. Anthropic giữ bí mật hầu hết cho đến khi chúng được vá, nhưng đã tiết lộ chi tiết về một số lỗi, bao gồm một trong FreeBSD (Hệ điều hành mã nguồn mở phổ biến), một trong FFmpeg (Thư viện xử lý video và âm thanh), và một lỗi thứ ba vẫn chưa được sửa trong phần mềm quan trọng cho điện toán đám mây.

Tuy nhiên, không phải ai cũng bị thuyết phục hoàn toàn. The Economist dẫn lời Stanislav Fort, nhà sáng lập AISLE, một công ty an ninh mạng chuyên ứng dụng AI - mô tả việc dùng nhiều mô hình nhỏ hơn, cũ hơn cũng tìm ra cùng loại lỗi trong FreeBSD. Ông cho rằng biên giới an ninh mạng AI là "lởm chởm" (jagged)- tức không có mô hình nào chiếm ưu thế tuyệt đối trên mọi lĩnh vực. Nói đơn giản hơn: Mythos rất giỏi, nhưng không phải là siêu nhân duy nhất trên sân chơi.

Dẫu vậy, mọi người đều đồng ý rằng trình độ chung đang tiến bộ rất nhanh. Bruce Schneier, chuyên gia an ninh máy tính nổi tiếng của Mỹ - nhận xét rằng chỉ trong vài tháng gần đây, chất lượng các báo cáo lỗi do AI tạo ra đã cải thiện đáng kể. Bản cập nhật tháng 1/2026 cho OpenSSL (phần mềm giúp đảm bảo kết nối an toàn giữa các trang web) đã vá hàng chục lỗ hổng bảo mật được tìm ra bởi AI. Vào tháng 3/2026, chính Anthropic tiết lộ rằng phiên bản Claude cũ hơn, ra đời trước Mythos, đã phát hiện gần một phần năm tổng số lỗi nghiêm trọng được sửa trong trình duyệt Firefox trong năm 2025.

Tội phạm mạng đã được “công nghiệp hoá”

Mythos không xuất hiện trong khoảng trống. Nó là đỉnh cao mới nhất của một xu hướng đang tăng tốc trên toàn thế giới. Báo cáo tổng quan Mối đe dọa toàn cầu năm 2026 của FortiGuard Labs -đơn vị nghiên cứu thuộc Fortinet (công ty an ninh mạng hàng đầu của Mỹ) - cho thấy bức tranh đáng báo động: trong năm 2025, hơn 7.800 tổ chức và doanh nghiệp trên toàn cầu bị tấn công bởi ransomware (mã độc tống tiền - loại phần mềm mã hóa dữ liệu nạn nhân rồi đòi tiền chuộc). Con số này tăng 389% so với năm trước, chủ yếu trong các ngành sản xuất, dịch vụ kinh doanh và bán lẻ.

Sự bùng nổ này được thúc đẩy bởi các công cụ tội phạm mạng ứng dụng AI mang tên WormGPT, FraudGPT và BruteForceAI. Những công cụ này giúp ngay cả kẻ tấn công thiếu kỹ năng chuyên sâu cũng có thể thực hiện chiến dịch tấn công tinh vi. Đáng chú ý hơn, thời gian thực hiện một vụ tấn công nghiêm trọng đã rút ngắn từ khoảng 115 giờ xuống chỉ còn 24-48 giờ. Derek Manky, Phó chủ tịch FortiGuard Labs, mô tả tội phạm mạng ngày nay như một "ngành công nghiệp bán tự động" - với chuỗi cung ứng hoàn chỉnh gồm nhà môi giới truy cập, điều hành mạng máy tính ma (botnet), và nhà phát triển công cụ tấn công AI.

Mới nhất, ngày 11/5/2026, nhóm Nhóm tình báo về mối đe dọa của Google đã xác nhận phát hiện đầu tiên trên thế giới về việc tin tặc sử dụng AI để tạo mã khai thác zero-day thực sự. Lỗ hổng này nhắm vào một công cụ quản trị web mã nguồn mở phổ biến, có khả năng vượt qua xác thực hai lớp (2FA - phương thức bảo mật yêu cầu hai bước xác minh). John Hultquist, Giám đốc Phân tích tại Google, cảnh báo: "Với mỗi một lỗ hổng zero-day có dấu vết AI bị phát hiện, nhiều khả năng vẫn còn vô số lỗ hổng khác đang trôi nổi bên ngoài".

Mã khai thác này mang những đặc điểm rõ ràng của sản phẩm do mô hình ngôn ngữ lớn, tức AI dạng ChatGPT tạo ra: Cấu trúc mã nguồn chuẩn mực như sách giáo khoa, chú thích chi tiết, và thậm chí chứa điểm số đánh giá mức độ nghiêm trọng giả mạo - giống như AI "ảo giác" trích dẫn tài liệu không tồn tại. Đây là bằng chứng cho thấy cuộc chạy đua dùng AI để tìm và khai thác lỗ hổng mạng "đã thực sự bắt đầu," như lời ông Hultquist.

Khi tin tặc không phải là con người

Nếu Mythos đại diện cho khả năng phát hiện lỗ hổng vượt trội, thì xu hướng Agentic AI (AI tự chủ hành động - các hệ thống AI có khả năng tự suy nghĩ, tự tìm kiếm mục tiêu và tự thực thi tấn công mà không cần con người ra lệnh từng bước) đại diện cho một mối đe dọa ở cấp độ hoàn toàn khác. Theo các chuyên gia an ninh mạng, Agentic AI không chỉ hỗ trợ phát hiện lỗ hổng mà còn có thể tự động viết mã tấn công trong thời gian thực, rút ngắn quá trình khai thác từ vài tuần xuống còn vài phút.

Một ví dụ thực tế đáng lo ngại: Cuối năm 2025, một vụ tấn công sử dụng phiên bản bẻ khóa (jailbreak) của Claude Code - công cụ lập trình AI của Anthropic - đã chứng minh rằng hệ thống AI có thể tự động nhận diện cơ sở hạ tầng nhạy cảm và trích xuất dữ liệu với mức độ tự trị lên đến 80-90%, gần như không cần con người can thiệp. Google cũng phát hiện PromptSpy - mã độc (malware) trên điện thoại Android sử dụng AI để tự động điều hướng giao diện, thu thập dữ liệu sinh trắc học (biometric - vân tay, khuôn mặt), và ngăn nạn nhân gỡ cài đặt ứng dụng độc hại.

Xu hướng này đặc biệt nguy hiểm vì nó hạ thấp rào cản gia nhập cho tội phạm mạng. Nói nôm na, trước đây bạn cần là một hacker lành nghề mới có thể tấn công hệ thống; giờ đây, chỉ cần thuê hoặc mua công cụ AI là có thể thực hiện. Mô hình RaaS (Ransomware-as-a-Service, tức mã độc tống tiền dưới dạng dịch vụ cho thuê) đã trở thành hiện thực, với các nhóm tội phạm chia lợi nhuận theo kiểu nhượng quyền thương mại.

Lợi thế cho tấn công hay phòng thủ

Theo The Economist, khi sức mạnh ngày càng tăng của AI khiến việc tìm lỗi trở nên dễ dàng hơn, câu hỏi then chốt là: liệu bên tấn công có thể khai thác lỗ hổng nhanh hơn bên phòng thủ có thể vá chúng hay không? Đây chính là lý do Project Glasswing ra đời. Anthropic cho biết đang mở rộng chương trình đến thêm 40 tổ chức hạ tầng số, để họ dùng Mythos "gia cố" phần mềm mà internet phụ thuộc - trước khi các mô hình mạnh tương đương trở nên phổ biến rộng rãi.

Bruce Schneier đưa ra đánh giá sắc bén nhưng cũng đầy hy vọng: "Trong trung hạn, tôi nghĩ đây sẽ là một mớ hỗn độn. Nhưng về lâu dài, tôi nghĩ điều này thực sự sẽ có lợi cho bên phòng thủ." Logic đằng sau rất dễ hiểu: bên phòng thủ có lợi thế cấu trúc - họ có thể sử dụng AI để quét toàn bộ mã nguồn trước khi phát hành sản phẩm. Tất cả các nhà nghiên cứu mà The Economist phỏng vấn đều cho rằng về lâu dài, AI sẽ giúp bên phòng thủ nhiều hơn bên tấn công, bằng cách cho phép các công ty kiểm tra phần mềm kỹ lưỡng hơn trước khi đưa ra thị trường.

Tuy nhiên, có nhiều thách thức nghiêm trọng trong ngắn hạn. Thứ nhất, chi phí kiểm tra bằng AI không hề rẻ. The Economist dẫn thông tin từ Anthropic rằng một trong những lỗi Mythos phát hiện đã tiêu tốn gần 20.000 đô la Mỹ chi phí token (đơn vị tính phí khi sử dụng AI). Đối với phần mềm mã nguồn mở như Linux - được duy trì một phần bởi tình nguyện viên - đây là mức giá rất khó chi trả. Thứ hai, phần lớn mã nguồn đang chạy ngoài kia -trên bộ định tuyến (router) gia đình, thiết bị thông minh (smart device) như TV hay tủ lạnh, và máy móc công nghiệp - hoàn toàn không ai bảo trì. The Economist nhận định: trong những trường hợp như vậy, bên tấn công sẽ có "cơ hội lớn để tung hoành."

Việt Nam trước làn sóng tấn công mạng

Việt Nam không đứng ngoài làn sóng mới này. Tại Diễn đàn "Niềm tin số trong tài chính 2026 tổ chức ngày 12 tháng 5, lãnh đạo Bộ Công an nhấn mạnh rằng niềm tin số đã trở thành "hạ tầng mềm quyết định khả năng vận hành của toàn bộ hệ thống tài chính". Trong bối cảnh Việt Nam đặt mục tiêu tăng trưởng hai con số, sự phát triển kinh tế số sẽ không thể bền vững nếu thiếu nền tảng bảo mật vững chắc.

Các số liệu cho thấy tình hình đã rất nghiêm trọng. Theo khảo sát của IDC và Fortinet, hơn 80% doanh nghiệp lớn tại Việt Nam đã ứng dụng AI trong bảo mật, nhưng đồng thời 52% tổ chức cho biết đã đối mặt với mối đe dọa mạng có AI hỗ trợ - và hơn một nửa ghi nhận khối lượng tấn công tăng gấp đôi đến gấp ba so với trước. Vnetwork (Công ty an ninh mạng Việt Nam) ghi nhận kỷ lục hơn 512.000 vụ tấn công DDoS (Tấn công từ chối dịch vụ -làm tê liệt hệ thống bằng cách gửi lượng truy cập khổng lồ) trong năm qua, trong đó gần một nửa có sự can thiệp của AI.

Những cảnh báo của The Economist về phần mềm không ai bảo trì - trên thiết bị IoT (Internet vạn vật - các thiết bị kết nối mạng như camera, tủ lạnh, máy móc), router gia đình, hệ thống công nghiệp - hoàn toàn áp dụng cho Việt Nam, nơi tốc độ số hóa rất nhanh nhưng năng lực bảo mật chưa theo kịp. Việt Nam đã có bước đi quan trọng khi ban hành Luật An ninh mạng 2025 (Luật số 116/2025/QH15, có hiệu lực từ ngày 1/7/2026), thay thế Luật 2018 với nhiều điểm mới như nghiêm cấm sử dụng AI tạo deepfake (giả mạo hình ảnh, giọng nói bằng AI), yêu cầu nâng kinh phí an ninh mạng lên tối thiểu 15%, và phân loại hệ thống thông tin theo 5 cấp độ bảo mật. Dự thảo Luật Trí tuệ nhân tạo cũng đang được hoàn thiện song song. Tuy nhiên, thách thức lớn nhất không nằm ở văn bản pháp lý mà ở năng lực thực thi và nguồn nhân lực an ninh mạng có hiểu biết về AI.

Sự xuất hiện của Mythos, GPT 5.4 Cyber, và hàng loạt công cụ tấn công mạng bằng AI đánh dấu một bước ngoặt không thể đảo ngược. Thế giới đang bước vào giai đoạn mà Bruce Schneier gọi là "mớ hỗn độn trung hạn" - nơi năng lực tấn công tăng nhanh hơn khả năng phòng thủ, nơi rào cản gia nhập cho tội phạm mạng bị hạ thấp chưa từng thấy, và nơi chỉ một lỗ hổng zero-day do AI phát hiện có thể đe dọa toàn bộ hạ tầng số của một quốc gia.

Tuy nhiên, bức tranh không chỉ có gam màu tối. Chính AI cũng đang trao cho bên phòng thủ những công cụ mạnh mẽ chưa từng có - khả năng quét hàng triệu dòng mã nguồn trong vài giờ, phát hiện lỗ hổng trước khi kẻ xấu kịp khai thác. Project Glasswing của Anthropic, việc vá lỗi OpenSSL bằng AI, hay chính phiên bản Claude tìm ra gần 1/5 lỗi nghiêm trọng trong Firefox - tất cả cho thấy tiềm năng thực sự của phòng thủ chủ động.

Chìa khóa nằm ở tốc độ hành động. Quốc gia nào, tổ chức nào triển khai AI phòng thủ nhanh hơn sẽ giành được lợi thế. Đối với Việt Nam - đang đặt cược mạnh mẽ vào chuyển đổi số - đây vừa là thách thức sống còn vừa là cơ hội. Như The Economist đã nhận định: công nghệ cuối cùng có thể nghiêng về phía bên phòng thủ - nhưng hãy chuẩn bị cho một chặng đường gập ghềnh phía trước.

scholicymaker .