Nói tới việc ứng dụng trí tuệ nhân tạo (AI), các cơ quan tình báo, phản gián là nơi có rất nhiều kinh nghiệm.
Trong thập niên 1960 – 1970, thời Chiến tranh Lạnh (Cold War), Cơ quan An ninh Quốc gia Hoa Kỳ (NSA) và Tổng bộ Liên lạc Chính phủ Anh Quốc (GCHQ) đã sớm khai thác AI để hỗ trợ sao chép và biên dịch một lượng dữ liệu khổng lồ từ nghe lén điện thoại của Liên Xô. Nhưng công nghệ khi ấy còn chưa chín muồi. Theo lời một cựu đặc vụ châu Âu, cơ quan của ông đã không sử dụng máy để tự động ghi hay dịch ở Afghanistan hồi thập niên 2000, mà thay vào đó vẫn dựa vào người bản địa. Mấy năm gần đây, AI đã đạt được nhiều tiến bộ đáng kể: dữ liệu phong phú hơn, thuật toán ưu việt hơn, năng lực xử lý mạnh hơn,… và mang lại cho các cơ quan phản gián vô vàn ý tưởng mới.
Đầu năm 2021, GCHQ công bố một báo cáo về cách AI đang làm thay đổi ngành tình báo thế giới. Nhờ công nghệ học máy (machine learning), chẳng hạn trong nhiệm vụ xác thực thông tin,… mà chúng ta giờ đây có thể ngăn chặn các hành vi giả mạo (hình ảnh, fake news, …), nguy cơ tấn công mạng, phát hiện chuỗi hoạt động giao dịch tài chính bất thường hoặc điều tra những đường dây phạm tội có tổ chức,… hiệu quả hơn trước kia.
Mặc dù không sở hữu nhiều quyền hạn và nguồn lực như các cơ quan tình báo, song một số tổ chức khác cũng đang tìm cách khai thác AI. Nuclear Threat Initiative (Sáng kiến Mối đe dọa hạt nhân), một NGO tại Mỹ nhận định: việc ứng dụng học máy trong phân tích dữ liệu thương mại [công khai] đã giúp cải thiện hiệu quả xác minh sự dính líu của các công ty hoặc tổ chức trong diện bị tình nghi với hoạt động buôn lậu trang thiết bị, nguyên vật liệu, linh kiện,… phục vụ mục đích chế tạo vũ khí hạt nhân.
AI sẽ cách mạng hóa ngành tình báo. Đó là nhận định trong báo cáo hôm 01/03 của Ủy ban An ninh Quốc gia Hoa Kỳ về Trí tuệ nhân tạo (NSCAI) do một nhóm nghiên cứu chuyên sâu dưới sự dẫn dắt của Eric Schmidt (cựu chủ tịch Alphabet, công ty mẹ của Google) và Bob Work (cựu thứ trưởng quốc phòng) thực hiện. Báo cáo phác thảo một viễn cảnh tham vọng: tới năm 2030, toàn bộ 17 cơ quan tình báo của nước Mỹ sẽ xây dựng xong một “kiến trúc liên hợp” bao gồm nhiều công cụ phân tích với khả năng học hỏi liên tục để xử lý mọi thứ, từ tin tức do con người thu thập cho đến các hình ảnh vệ tinh cảnh báo nguy cơ. NSCAI đã đồng tình trước phản ứng của Lầu Năm Góc (Pentagon) trước Covid-19 khi cho tích hợp hàng chục bộ dữ liệu để xác định các điểm nóng và quản lý nhu cầu cung ứng vật tư.
Không dễ để những thành tựu y tế công cộng tái hiện lại với lĩnh vực an ninh quốc gia. Các cơ quan tình báo phương Tây cần phải tuân thủ chặt chẽ những quy định điều chỉnh hoạt động thu thập và sử dụng dữ liệu cá nhân. Báo cáo của GHCQ cho biết họ sẽ lưu tâm tới vấn đề thiên vị mang tính hệ thống (systemic bias), chẳng hạn: phần mềm nhận diện giọng nói hoạt động hiệu quả hơn với một nhóm đối tượng nhất định,…; đồng thời cam kết đảm bảo minh bạch về biên độ sai sót và tính thiếu chắc chắn của các thuật toán học máy. Nhiều đặc vụ Mỹ cũng nói họ tôn trọng “phẩm giá và quyền tự do của con người”. Tuy nhiên, còn quá nhiều khác biệt cần được giải quyết. Mới đây, một báo cáo do Trung tâm Nghiên cứu Chiến lược Quốc tế (CSIS) tại Washington DC công bố đã trích dẫn đề xuất của nhiều cựu đặc vụ Mỹ về việc thành lập liên minh tình báo chiến lược Five Eyes (bao gồm 5 nước Mỹ, Úc, Anh, Canada, New Zealand) chia sẻ chung dữ liệu đám mây.
Những hạn chế ràng buộc AI trong ngành tình báo cũng thiết thực không kém gì vấn đề đạo đức. Các ứng dụng học máy tỏ ra cực kỳ xuất sắc trong việc phát hiện mẫu, ví dụ: thói quen sử dụng smartphone,… song lại rất kém khi cần dự đoán hành vi cá nhân. Điều này đặc biệt đúng bởi dữ liệu là khan hiếm. Như trong sứ mệnh chống khủng bố, nếu những mô hình dự báo chính sách có thể thu thập dữ liệu từ hàng ngàn vụ trộm mỗi năm thì tần xuất của các vụ khủng bố lại thấp hơn nhiều, và vì vậy cũng khó rút kinh nghiệm hơn.
Còn một vấn đề khác vốn rất quen thuộc với nhiều chuyên gia y tế khi xem xét áp dụng chương trình tầm soát trên quy mô lớn trước những bệnh hiếm gặp. Bất cứ mô hình dự đoán nào cũng có thể cho ra kết quả dương tính giả (false positives), trong đó người thực tế không mắc bệnh lại bị dán nhãn thuộc diện cần theo dõi. Tỷ lệ này có thể giảm xuống nhờ sự tỷ mỉ khi thiết kế mô hình. Nhưng trong lĩnh vực tình báo, ngay cả các hệ thống được thiết kế hoàn hảo cũng có nguy cơ “gửi nhầm” một số lượng lớn điệp viên đi theo đuổi những nhiệm vụ viển vông.
Sau cùng, dữ liệu thu thập được có thể lại không phù hợp. Chẳng hạn, dữ liệu từ flycam, vệ tinh do thám, nghe lén điện thoại,… không được định dạng hoặc gắn nhãn phù hợp để huấn luyện máy học. Công việc khắc phục tình trạng này thường khá “tẻ nhạt, tốn kém thời gian, tiền bạc, và nhất là nhân lực do sự khác biệt giữa các cơ quan tình báo.” Những điệp viên chắc chắn sẽ chẳng thích điều này.