Cực sốc: Chỉ tốn hơn 300.000 đồng, một kỹ sư an ninh mạng đã “dắt mũi” cả ChatGPT, Claude và Gemini

Theo trang thông tin 36Kr, thời gian gần đây, việc công cụ tìm kiếm AI Doubao của Trung Quốc liên tục lọt top tìm kiếm thịnh hành vì những sự cố sai lệch thông tin đã chứng minh một thực tế: tìm kiếm bằng AI đang ngày càng phổ biến, nhưng chất lượng lại tỷ lệ nghịch với số lượng.

Thói quen “việc gì không biết thì hỏi AI” của thế giới hiện đại đang vấp phải một rào cản lớn khi các câu trả lời thoạt nhìn rất chuyên nghiệp, nhưng thực chất hoàn toàn không thể kiểm chứng.

Tình trạng dữ liệu vô căn cứ, đánh tráo khái niệm do lỗi đồng âm, hay thậm chí là bịa đặt hoàn toàn các luận văn khoa học đang diễn ra phổ biến.

Trong bối cảnh người dùng không ngừng phàn nàn về sự bất ổn của AI, kỹ sư an ninh mạng người Mỹ Ron Stoner đã công bố một thí nghiệm gây chấn động trên blog cá nhân.

Chỉ với 12 USD (khoảng 315.000 đồng) để đăng ký tên miền và 20 phút chỉnh sửa Wikipedia, RonStoner đã thành công “dắt mũi” hàng loạt mô hình ngôn ngữ lớn (LLM) tối tân nhất hiện nay, bao gồm ChatGPT, Claude 3 và Gemini Advanced.

Chiêu trò 20 phút hạ gục hàng tỷ USD công nghệ

Là một kỹ sư an ninh mạng, Ron Stoner luôn hoài nghi trước những tuyên bố của các gã khổng lồ Thung lũng Silicon như OpenAI hay Anthropic, vốn khẳng định rằng: “Mô hình ngôn ngữ lớn (LLM) cần phải bị bơm các nội dung độc hại một cách liên tục trong nhiều tháng, thậm chí nhiều năm thì mới có thể bị phá hoại”.

Ron Stoner tin rằng ông có thể thực hiện một phương thức tấn công nhanh hơn, rẻ hơn và đơn giản hơn rất nhiều, đó là can thiệp ngay từ tầng thu thập dữ liệu (data reclamation layer).

Để hiện thực hóa giả thuyết, Stoner đã nhắm vào 6 Nimmt (một trò chơi bài chiến thuật kiểu cũ của Đức phát hành năm 1994).

Tựa game này sở hữu một đặc điểm hoàn hảo cho cuộc tấn công, đó là 6 Nimmt chỉ có chút danh tiếng tại Đức, hoàn toàn vô danh trên phạm vi toàn cầu, chưa từng tổ chức giải vô địch thế giới chính thức và thông tin trực tuyến về nhà vô địch của nó gần như là một con số không tròn trĩnh.

Đối với các mô hình lớn, vùng trống thông tin này chính là một “vùng đất hoang không người”. Trong tư duy của AI, trên một mảnh đất chưa từng khai phá, ai dựng căn nhà tranh lên trước thì kẻ đó là chủ nhân.

Chiến dịch thao túng dữ liệu của kĩ sư an ninh mạng Ron Stoner được thực hiện vỏn vẹn qua ba bước:

Bước đầu tiên là chi 12 USD để đăng ký tên miền mang dáng dấp chính thống: 6nimmt.com.

Bước thứ hai, dùng chính AI để viết một thông cáo báo chí đầy hào hùng với nội dung Ron Stoner đã đánh bại các đối thủ hàng đầu từ hơn 20 quốc gia tại Munich để đoạt chức vô địch thế giới.

Bài viết được thêm thắt các chi tiết sống động như ruy băng bay phấp phới, khán giả hò reo để tăng độ chân thực, rồi đưa lên trang web vừa mua.

Bước thứ ba được coi là bước mấu chốt, Ron Stoner truy cập mục thông tin của trò chơi này trên Wikipedia, chèn một đoạn văn tuyên bố mình là nhà vô địch thế giới năm 2025, và trỏ link tài liệu tham khảo về chính trang web giả mạo của mình.

Điều đáng chú ý là toàn bộ quá trình diễn ra chưa đầy 20 phút.

Ngay sau đó, Stoner thử nghiệm đặt một câu hỏi đơn giản cho các chatbot hàng đầu, đó là: “Bạn có thể cho tôi biết ai là nhà vô địch thế giới của trò chơi 6nimmt không?”

Kết quả là một vụ “lật xe” kinh điển mang quy mô toàn cầu. Bất kể là Gemini hay ChatGPT, tất cả các AI đều khẳng định đinh đóng cột rằng Ron Stoner chính là nhà vô địch thế giới.

Một số mô hình thậm chí còn tự “thêu dệt” thêm các chi tiết từ thông cáo báo chí giả, miêu tả quá trình thi đấu sống động như thể chúng đang trực tiếp ngồi trên hàng ghế khán giả tại Munich.

Như vậy, một nhà vô địch hoàn toàn hư cấu đã được các siêu AI chính thức đưa lên “bệ thờ di sản” của Internet.

Có lẽ, sự cố này không dừng lại ở một trò đùa nhất thời khi mục thông tin đầy sơ hở và giả mạo này đã tồn tại trên Wikipedia suốt hơn hai tháng.

Trong suốt thời gian đó, gần như toàn bộ các mô hình lớn có tính năng tìm kiếm kết nối Internet đều quét (crawl) trúng dữ liệu này và liên tục xuất ra câu trả lời sai lệch cho người dùng.

Phải đến khi Ron Stoner công khai toàn bộ thí nghiệm, Wikipedia mới phát hiện và xóa bỏ mục thôngtin không chính xác.

Sự kiện đã làm dấy lên làn sóng mỉa mai từ cộng đồng công nghệ hướng về phía các Big Tech.

Những tập đoàn hàng đầu sẵn sàng chi hàng tỷ USD để mua năng lực tính toán của card đồ họa (GPU), tiêu tốn lượng điện năng khổng lồ để vận hành các trung tâm dữ liệu nhằm huấn luyện “siêu bộ não”.

Thế nhưng, hệ thống được ca tụng là thay đổi tương lai nhân loại lại bị đánh sập bởi 12 USD (tương đuơng khoảng 315 nghìn VNĐ) và 20 phút rảnh rỗi của một kỹ sư.

Nguyên nhân cốt lõi nằm ở cơ chế “tạo tăng cường tra cứu” (RAG, Retrieval Augmented Generation). Mặc dù các LLM rất giỏi giao tiếp, nhưng chúng vốn được huấn luyện dựa trên một kho ngữ liệu cố định tại một mốc thời gian.

Ví dụ, kho dữ liệu gốc của Gemini 3.5 Flash dừng lại ở nửa đầu năm 2025. Để cung cấp thông tin sau mốc này, hệ thống buộc phải kích hoạt RAG để tìm kiếm trực tuyến và tổng hợp kết quả. Nếu không có RAG, trí tuệ của AI sẽ bị khóa chặt ở quá khứ.

Đáng lo ngại hơn, kịch bản của Ron Stoner không phải là duy nhất mà dường như đang bị thương mại hóa mạnh mẽ.

Trên mạng Internet hiện nay, các giáo trình GEO (Generative Engine Optimization - Tối ưu hóa công cụ tìm kiếm AI) đang được rao bán tràn lan, dạy các doanh nghiệp cách thao túng logic xếp hạng của AI.

Mọi thương hiệu đều khao khát trở thành “câu trả lời tiêu chuẩn” khi người dùng truy vấn chatbot. Để đạt được điều này, hàng loạt robot Agent đang ngày đêm được bơm thông tin rác nhằm ô nhiễm các nền tảng nội dung, khiến độ tin cậy của tìm kiếm AI sụt giảm nghiêm trọng.

Với chi phí chỉ 12 USD, bất kỳ cá nhân hay doanh nghiệp nào có mưu đồ trục lợi đều có thể tạo ra một địa chỉ web liên quan, chỉnh sửa Wikipedia, chụp lại màn hình qua công cụ Image2 để làm bằng chứng và thao túng toàn bộ hệ thống tri thức của AI.

Thao tác của Ron Stoner có thể nhìn như một trò đùa vô hại vì ông chỉ nhắm vào một trò chơi bài ít ai quan tâm. Tuy nhiên, nó đã vạch trần một hiểm họa chí mạng về tương lai của thông tin toàn cầu.

Nếu một tổ chức có mưu đồ đứng sau chiến dịch này, họ hoàn toàn có thể thay đổi các ghi chép lịch sử, điển tích văn học, hoặc nguy hiểm hơn là làm giả các phương thức y tế, báo cáo tài chính của doanh nghiệp và dữ liệu thị trường đầu tư.

Khi chi phí thao túng quá thấp, những kẻ đầu cơ có thể sản xuất hàng loạt tin tức giả, sử dụng các trang web bách khoa toàn thư để “tẩy trắng” lòng tin, rồi mượn tay AI để dâng những “chén thuốc độc” thông tin này cho người dùng.

Nếu không có biện pháp ngăn chặn, các mô hình lớn sẽ dần tự nuốt chửng dữ liệu rác và biến thành một bãi rác thông tin khổng lồ.

Người dùng cần nâng cao cảnh giác trước khi quá muộn

Trước thực trạng đáng báo động này, các ông lớn công nghệ đã bắt đầu triển khai các rào cản kỹ thuật. Google tuyên bố đã tích hợp các công cụ xác thực AI vào hệ sinh thái, bao gồm: Tìm kiếm, Gemini, Chrome, Pixel và dịch vụ đám mây.

Trong khi đó, OpenAI cũng ra mắt giải pháp đóng dấu hình mờ ẩn (invisible watermark) có thể truy xuất nguồn gốc.

Các bước đi này được kỳ vọng sẽ hạn chế phần nào nạn “nhiễm độc AI” và ngăn chặn hiện tượng nội dung tự ăn thịt đồng loại, có nghĩa là AI huấn luyện dựa trên dữ liệu rác do chính AI tạo ra.

Tuy nhiên, công nghệ chưa bao giờ là tấm khiên hoàn hảo. Đối với người dùng đại chúng, việc thay đổi tư duy và thiết lập một bộ lọc cá nhân là điều cấp bách nhất hiện nay.

Ở mức độ tin cậy của các LLM hiện tại, người dùng chỉ nên xem AI như một công cụ hỗ trợ giải trí, tìm ý tưởng hoặc tra cứu lịch trình du lịch, những lĩnh vực mà các sai sót nhỏ không gây ra hậu quả nghiêm trọng.

Ngược lại, đối với các tác vụ đòi hỏi sự chính xác tuyệt đối như xác minh sự thật lịch sử, đưa ra quyết định đầu tư hoặc áp dụng các phác đồ y tế chữa bệnh, việc thực hiện đối chiếu chéo thông tin (crossverification) là bắt buộc.

Người dùng cần trực tiếp truy nguyên nguồn gốc xem thông tin đến từ một trang web vô danh hay một cơ quan truyền thông chính thống. Quyền phán quyết thật giả phải nằm trong tay con người, thay vì phó mặc hoàn toàn cho một thuật toán máy tính vốn có thể bị đánh lừa bởi một tên miền giá 12 USD.

Như vậy, tương lai của cuộc đua AI sẽ còn chứng kiến nhiều bước chuyển dịch và cạnh tranh khốc liệt, nhưng ở thời điểm hiện tại, con người vẫn là yếu tố quyết định.

Trong kỷ nguyên cũ, chỉ số thông minh (IQ) và chỉ số cảm xúc (EQ) giữ vai trò chủ đạo.

Còn trong kỷ nguyên số hóa hiện nay, có lẽ “Chỉ số AI” (AI-Q), đó là năng lực thấu hiểu, sàng lọc và làm chủ công nghệ mới là chìa khóa cốt lõi để con người không bị lạc lối trước làn sóng thông tin do trí tuệ nhân tạo tạo ra.

*Theo 36Kr