Anthropic phát hiện 22 lỗ hổng Firefox bằng mô hình AI Claude Opus 4.6

Anthropic hôm thứ Sáu cho biết họ đã phát hiện 22 lỗ hổng bảo mật mới trong trình duyệt web Firefox, đây là một phần của thỏa thuận hợp tác an ninh với Mozilla. Trong số đó, 14 lỗ hổng được phân loại là mức độ nghiêm trọng cao, bảy lỗ hổng mức độ trung bình và một lỗ hổng mức độ thấp. Các vấn đề này đã được khắc phục trong Firefox 148, phát hành vào cuối tháng trước. Các lỗ hổng này được xác định trong khoảng thời gian hai tuần vào tháng 1 năm 2026.

Mô hình AI Claude Opus 4.6 của Anthropic phát hiện lỗ hổng Firefox — Mô hình AI Claude Opus 4.6 của Anthropic đang quét mã nguồn Firefox.

Anthropic hôm thứ Sáu cho biết họ đã phát hiện 22 lỗ hổng bảo mật mới trong trình duyệt web Firefox như một phần của hợp tác an ninh với Mozilla.

Trong số này, 14 lỗ hổng được phân loại là nghiêm trọng cao (high), bảy lỗ hổng mức độ trung bình (moderate) và một lỗ hổng mức độ thấp (low). Các vấn đề này đã được khắc phục trong Firefox 148, phiên bản được phát hành vào cuối tháng trước. Các lỗ hổng đã được xác định trong khoảng thời gian hai tuần vào tháng 1 năm 2026.

Công ty trí tuệ nhân tạo (AI) cho biết số lượng lỗi nghiêm trọng cao (high-severity bugs) được xác định bởi mô hình ngôn ngữ lớn (LLM) Claude Opus 4.6 của họ chiếm "gần một phần năm" tổng số các lỗ hổng nghiêm trọng cao đã được vá trong Firefox vào năm 2025.

Anthropic cho biết LLM này đã phát hiện một lỗi use-after-free trong JavaScript của trình duyệt chỉ sau 20 phút khám phá, sau đó được một nhà nghiên cứu con người xác thực trong môi trường ảo hóa để loại trừ khả năng báo động giả (false positive).

Công ty cho biết: "Đến cuối nỗ lực này, chúng tôi đã quét gần 6.000 tệp C++ và gửi tổng cộng 112 báo cáo độc đáo, bao gồm các lỗ hổng nghiêm trọng cao (high-severity) và trung bình (moderate-severity) đã đề cập ở trên. Hầu hết các vấn đề đã được khắc phục trong Firefox 148, phần còn lại sẽ được sửa trong các bản phát hành sắp tới."

Công ty khởi nghiệp AI này cho biết họ cũng cung cấp cho mô hình Claude quyền truy cập vào toàn bộ danh sách các lỗ hổng đã gửi cho Mozilla và giao nhiệm vụ cho công cụ AI phát triển một exploit thực tế cho chúng.

Mặc dù đã thực hiện thử nghiệm vài trăm lần và chi khoảng 4.000 USD tín dụng API, công ty cho biết Claude Opus 4.6 chỉ có thể biến lỗi bảo mật thành một exploit trong hai trường hợp.

Hành vi này, công ty nói thêm, chỉ ra hai khía cạnh quan trọng: chi phí xác định các lỗ hổng rẻ hơn so với việc tạo ra một exploit cho chúng, và mô hình tốt hơn trong việc tìm kiếm các vấn đề hơn là khai thác chúng.

AI hỗ trợ phát hiện lỗ hổng — Minh họa về AI hỗ trợ phân tích an ninh mạng.

Anthropic nhấn mạnh: "Tuy nhiên, việc Claude có thể thành công trong việc tự động phát triển một exploit trình duyệt thô sơ, dù chỉ trong một vài trường hợp, là điều đáng lo ngại," và nói thêm rằng các exploit chỉ hoạt động trong giới hạn môi trường thử nghiệm của họ, nơi một số tính năng bảo mật như sandboxing đã bị loại bỏ một cách có chủ ý.

Một thành phần quan trọng được tích hợp vào quy trình là một trình xác minh tác vụ (task verifier) để xác định xem exploit có thực sự hoạt động hay không, cung cấp phản hồi theo thời gian thực cho công cụ khi nó khám phá codebase đang được kiểm tra và cho phép nó lặp lại kết quả cho đến khi một exploit thành công được phát triển.

Một exploit mà Claude đã viết là cho CVE-2026-2796 (điểm CVSS: 9.8), được mô tả là một lỗi biên dịch sai just-in-time (JIT) trong thành phần JavaScript WebAssembly.

Thông báo này được đưa ra vài tuần sau khi công ty phát hành Claude Code Security dưới dạng bản xem trước nghiên cứu giới hạn, như một cách để khắc phục các lỗ hổng bằng tác nhân AI.

Anthropic cho biết: "Chúng tôi không thể đảm bảo rằng tất cả các bản vá do tác nhân tạo ra vượt qua các thử nghiệm này đủ tốt để hợp nhất ngay lập tức. Nhưng các trình xác minh tác vụ (task verifiers) mang lại cho chúng tôi sự tự tin cao hơn rằng bản vá được tạo ra sẽ khắc phục lỗ hổng cụ thể trong khi vẫn duy trì chức năng của chương trình – và do đó đạt được yêu cầu tối thiểu cho một bản vá khả thi."

Mozilla, trong một thông báo phối hợp, cho biết phương pháp tiếp cận hỗ trợ AI đã phát hiện 90 lỗi khác, hầu hết trong số đó đã được khắc phục. Các lỗi này bao gồm các lỗi khẳng định (assertion failures) trùng lặp với các vấn đề thường được tìm thấy thông qua fuzzing và các loại lỗi logic riêng biệt mà các công cụ fuzzing không phát hiện được.

Nhà sản xuất trình duyệt cho biết: "Quy mô của các phát hiện phản ánh sức mạnh của việc kết hợp kỹ thuật nghiêm ngặt với các công cụ phân tích mới để cải tiến liên tục. Chúng tôi xem đây là bằng chứng rõ ràng rằng phân tích quy mô lớn, hỗ trợ AI là một bổ sung mạnh mẽ mới cho bộ công cụ của các kỹ sư bảo mật."