Học máy có thể đưa ra các đánh giá tốt hơn qua việc xử lý khối lượng lớn dữ liệu an toàn.
Trong một số trường hợp, phần mềm học máy có thể dự đoán được độc chất chính xác hơn cả thử nghiệm trên chuột hoặc một số loại động vật khác. Nguồn: Nature
Một nhóm nhà nghiên cứu mới công bố về việc phát triển một phần mềm học máy sử dụng khối lượng lớn các dữ liệu an toàn hóa học để dự đoán chính xác độc tố ở mức tương đương và đôi khi vượt qua các thử nghiệm tốn kém trên động vật.
Theo lời nhà độc học Thomas Hartung từ Đại học Johns Hopkins - Hoa Kỳ, các mô hình máy tính có thể thay thế hàng triệu con vật hàng năm sử dụng trong các nghiên cứu và thí nghiệm, ví dụ như việc thả các hợp chất vào mắt thỏ để kiểm tra xem chúng có gây kích ứng hay không, hay việc cho chuột ăn hóa chất để đo độc tính. “Sức mạnh của big data có nghĩa là chúng ta có thể thiết kế công cụ có khả năng dự đoán tốt hơn động vật thí nghiệm”.
Trong một bài báo được công bố trên tạp chí Toxicological Sciences vào ngày 11/7, nhóm nghiên cứu Hartung công bố việc phát triển một thuật toán mới có thể dự đoán chính xác độc tính của hàng chục nghìn hóa chất - phạm vi rộng hơn nhiều so với các mô hình đã công bố khác - qua chín loại thử nghiệm từ thử nghiệm hô hấp đến sinh thái thủy sinh.
Bài viết sẽ giúp “thu hút chú ý đến khả năng mới của big data”, Bennard van Ravenzwaay, một nhà độc học tại công ty hóa chất BASF ở Ludwigshafen - Đức nói: "Tôi tin tưởng 100% đây sẽ là nền tảng cho sự phát triển của độc chất học tương lai." Tuy nhiên, ông nói thêm, phải mất nhiều năm nữa để các nhà quản lý chấp nhận phương pháp mới thay cho các thử nghiệm động vật, bởi loại hình thử nhiệm này vẫn có ưu thế trong đánh giá các yếu tố độc hại phức tạp hơn như xác định xem hóa chất có gây ung thư hay gây trở ngại cho khả năng sinh sản hay không.
Phương pháp có hiệu quả
Từ lâu, các nhà nghiên cứu và sản xuất đã sử dụng các mô hình máy tính để dự đoán độc tính. Các mô hình này thường kết hợp phân tích cấu trúc hóa học phân tử, phân tích cách hóa chất có thể phản ứng trong cơ thể và dữ liệu từ các thử nghiệm trên động vật hoặc các nghiên cứu trong ống nghiệm. Người ta cũng có thể suy luận độc tố của các chất chưa kiểm định bằng cách so sánh chúng với các hợp chất có cấu trúc tương đồng đã biết đến - một phương pháp được gọi là “đọc chéo”. Tuy nhiên, các nhà quản lý vẫn dè dặt khi chấp nhận những phương pháp này và có xu hướng đặt ra yêu cầu chính xác cao cho phương pháp hay đề nghị thí nghiệm trên động vật để thay thế.
Để cải thiện phần mềm, nhóm Hartung tập hợp một cơ sở dữ liệu khổng lồ với thông tin về khoảng 10.000 hóa chất dựa trên khoảng 800.000 thí nghiệm động vật. Những dữ liệu này ban đầu được thu thập bởi Cơ quan Hóa chất Châu Âu (ECHA) ở Helsinki như một phần của Luật REACH 2007 (Luật đăng ký, đánh giá, ủy quyền và cấm đoán hóa chất) trong đó yêu cầu các công ty phải gửi các dữ liệu an toàn cho hầu hết các hóa chất được bán trong Liên minh Châu Âu. Cho đến tháng 5/2018 - ngày kết thúc đăng ký - cơ quan đã nhận được thông tin về hơn 20.000 loại hóa chất.
Dù ECHA đã cho mở những các dữ liệu này nhưng định dạng của chúng không dễ để máy tính phân tích. Vì vậy nhóm của Hartung trong năm 2014 đã trích xuất dữ liệu có sẵn thành cơ sở dữ liệu có thể đọc được bằng máy. Điều này kéo theo một cuộc tranh chấp pháp lý giữa Hartung và ECHA khi cơ quan này cho rằng các thông tin trên thuộc bản quyền các công ty đã tiến hành thí nghiệm. Vấn đề tạm thời được giải quyết trong năm 2017 với việc nhóm Hartung đồng ý không tự xuất bản dữ liệu và ECHA sẽ chỉ công khai những kết quả nghiên cứu chính - chứ không phải toàn bộ dữ liệu - trong một tập tin mở cho công chúng.
Sử dụng phương pháp đọc chéo, phần mềm của Hartung so sánh một hóa chất mới với các hợp chất có liên quan nhất đã biết, tham chiếu các thông số của hóa chất đã biết để đánh giá xác suất của các tác động độc hại. Phương pháp này mô phỏng nhà độc chất học phân tích hóa chất mới.
Phân tích dữ liệu của Hartung cũng chỉ ra tính thiếu ổn định của các thí nghiệm trên động vật: cùng một loại hóa chất thí nghiệm đôi khi cho các kết quả khác nhau, bởi thực tế không phải tất cả các động vật đều phản ứng giống nhau với hóa chất. Với một số loại độc tính, phần mềm do đó cung cấp dự đoán đáng tin cậy hơn so với bất kỳ thử nghiệm động vật riêng lẻ nào. Theo lời Craig Rowlands, đồng tác giả nghiên cứu, thì thành công này: “Không thể thực hiện được cách đây 5 năm. Quy định về dữ liệu hóa chất đã giúp xây dựng một cơ sở dữ liệu rất lớn về độc chất và tác dụng của chúng.”
Quyền sử dụng sản phẩm của nhóm nghiên cứu Hartung thuộc về cơ quan chủ quản là Công ty Thí nghiệm an toàn Underwriters tại Northbrook, Illinois - Mỹ. Theo kế hoạch, công ty này sẽ sớm bán sản phẩm phân tích dữ liệu ra thị trường. Hartung và các đồng sự sẽ nhận được một phần lợi nhuận thu được. Tuy nhiên, GS. Hartung khẳng định các dữ liệu gốc vẫn sẽ được chia sẻ với nhà nghiên cứu hay cơ quan chính phủ quan tâm.
Thỏa hiệp với quy định
Hiện nay, các nhà nghiên cứu và công ty khác cũng đang phát triển các thuật toán riêng biệt dù chưa công bố. Ở Maryland tháng Tư rồi, Ủy ban điều phối liên ngành về Kiểm nghiệm các phương pháp thay thế được sự ủy nhiệm của 16 cơ quan chính phủ Hoa Kỳ, sau thời gian phát triển các phương pháp thay thế thử nghiệm an toàn động vật đã công bố với giới khoa học về một phần mềm mới có thể dự đoán độc tính cho 40.000 loại hóa chất vốn chỉ trước đây chỉ có thể thử nghiệm trên chuột.
Việc kết hợp các phần mềm chất lượng (như của Hartung) đã tạo ra được một mô hình tính toán đồng thuận “có hiệu quả [trong phát hiện độc chất] tương đương thí nghiệm động vật”, theo lời Nicole Kleinstreuer, người phối hợp thực hiện và phát triển các phương pháp thử nghiệm độc tính thay thế cho Chương trình Độc học quốc gia Hoa Kỳ tại North Carolina. Đến cuối năm nay, Cơ quan Bảo vệ Môi trường Hoa Kỳ (EPA) sẽ công bố mô hình đồng thuận trực tuyến miễn phí trên internet.
Kể từ năm 2016 khi luật yêu cầu các loại hóa chất phải được chứng nhận an toàn trước khi đưa vào thị trường, các công ty Mỹ đã quan tâm hơn đến các phương pháp thử nghiệm không sử dụng động vật. Tháng trước, EPA đã công bố một bản kế hoạch để thúc đẩy các phương pháp thử nghiệm không có động vật, bao gồm việc sử dụng phần mềm.
Tuy nhiên, theo Mike Rasenberg, trưởng bộ phận đánh giá điện tử của ECHA, cơ quan này hiện cũng khuyến khích các công ty hóa chất nếu có thể thay thế việc thí nghiệm động vật bằng phương pháp kiểm tra chéo hay thí nghiệm phân tích tế bào.
Những gì bài báo nói là “một sáng kiến tốt”, Rasenberg nói, nhưng "về mặt khoa học, có rất nhiều việc phải làm. Thí nghiệm trên động vật là điều không ai muốn nhưng máy tính chưa thể làm được mọi thứ."