Những kẻ lừa đảo trên mạng xã hội thường sử dụng tài khoản giả để phát tán thư rác, chia sẻ đường link hoặc phần mềm độc hại. Facebook mới đây đã tiết lộ về cách họ sử dụng AI để chống lại tình trạng này.

Năm 2019, Facebook xóa gần 2 tỷ tài khoản giả mỗi quý. Những kẻ lừa đảo sử dụng các tài khoản giả mạo này để phát tán thư rác, liên kết lừa đảo hoặc phần mềm độc hại.

Facebook tiết lộ các chi tiết về hệ thống học máy mà họ sử dụng để giải quyết thách thức này.

Mọi người ngày càng lo ngại về khả năng thao túng và trục lợi trên nền tảng mạng xã hội.

Gã khổng lồ công nghệ phân biệt giữa hai loại tài khoản giả. Đầu tiên, có các "tài khoản người dùng bị phân loại sai" - đây là các hồ sơ cá nhân của doanh nghiệp hoặc vật nuôi đáng nhẽ nên lập Trang (Page) nhưng người dùng lại lập tài khoản hồ sơ cá nhân. Những tài khoản này khá dễ đối phó, Facebook chỉ cần chuyển các tài khoản này sang dạng Trang.

Thứ hai là các "tài khoản vi phạm" - đây là những hồ sơ cá nhân liên quan đến lừa đảo và spam (gửi nhiều thư rác) hoặc vi phạm các điều khoản dịch vụ của Facebook. Các tài khoản vi phạm cần phải bị xóa càng nhanh càng tốt trước khi thông tin mà các tài khoản này đưa ra kịp lan rộng, nhưng cũng cần cẩn trọng để tránh xóa nhầm các tài khoản thật của người dùng.

Để làm điều này, Facebook sử dụng các quy tắc được lập trình sẵn và các bước xác nhận để chặn tài khoản giả ngay trước khi nó được tạo ra hoặc trước khi nó kịp hoạt động và có thể gây hại cho người dùng thật.

Nhưng nếu tài khoản giả vượt qua 2 vòng này và bắt đầu hoạt động, việc phát hiện và ngăn chặn trở nên khó khăn hơn rất nhiều. Khi đó hệ thống học máy mới, được gọi là Phân loại thực thể sâu (Deep Entity Classification - DEC), vào cuộc.

DEC học cách phân biệt người dùng giả và người dùng thật thông qua các mẫu hành vi kết nối của họ trên mạng, được gọi là các "đặc tính sâu". Facebook sử dụng hơn 20.000 đặc tính sâu để phân loại bốn loại tài khoản giả, với sự kết hợp của các quy tắc và các mô hình học máy: tài khoản bất hợp pháp không đại diện cho một người dùng nào, tài khoản của người dùng thật đã bị kẻ tấn công chiếm đoạt, tài khoản gửi thư rác lừa đảo chiếm đoạt tài sản, và tài khoản lừa đảo thao túng người dùng tiết lộ thông tin cá nhân.

Kể từ khi triển khai DEC, Facebook cho biết họ đã kiểm soát số lượng tài khoản giả trên nền tảng ở mức khoảng 5% số người dùng hoạt động hàng tháng.

Các chi tiết về các nỗ lực dọn dẹp Facebook được đưa ra trong bối cảnh mọi người lo ngại về khả năng thao túng cuộc bầu cử tổng thống Mỹ sắp tới thông qua mạng xã hội, đặc biệt với các công nghệ như deepfakes (công nghệ dựa trên học máy để tạo ra hình ảnh và video giả với mức độ "chân thực" rất cao và khó phân biệt).

Facebook cho biết, không nhắm mục tiêu cụ thể vào bất kỳ loại chủ đề bầu cử nào, nhưng DEC sẽ góp phần vào những nỗ lực khác của công ty nhằm kìm hãm sự can thiệp bầu cử.

Aviv Ovadya, người sáng lập dự án phi lợi nhuận Thoughtful Technology Project và nghiên cứu thiết kế và quản trị nền tảng, nói rằng việc Facebook nói một cách chi tiết về cách thức hoạt động của các hệ thống bảo mật để các công ty khác có thể mô phỏng thực sự có tác động mạnh mẽ. "Vì các công ty như Facebook có nhiều nguồn lực để đầu tư hơn các công ty nhỏ, nên việc chia sẻ kiến thức là rất hữu ích."

Nhưng để dọn dẹp nền tảng này cũng còn nhiều việc phải làm. Học máy chỉ đạt đến một mức độ nào đó: cho dù mô hình được đào tạo với bao nhiêu dữ liệu, nó sẽ không bao giờ bắt được mọi tài khoản xấu với độ chính xác hoàn hảo. Facebook có thể sẽ cần phải kết hợp cả hoạt động kiểm duyệt của con người để cải thiện tình trạng này.

Nguồn:

https://www.technologyreview.com/s/615313/how-facebook-uses-machine-learning-to-detect-fake-accounts/

https://www.theguardian.com/technology/2020/jan/13/what-are-deepfakes-and-how-can-you-spot-them