Thay vì gửi mẫu đến các phòng thí nghiệm và chờ đợi, giờ đây người mua có thể kiểm tra nông sản bị pha trộn một cách nhanh chóng, dễ dàng và tiết kiệm chi phí hơn nhờ phương pháp quang phổ cận hồng ngoại do các nhà nghiên cứu ở trường ĐH Công nghiệp Thực phẩm TP.HCM phát triển.
Khi gạo ST25 của Việt Nam đoạt giải nhất cuộc thi World’s Best Rice năm 2019, không ít người đã đổ xô đi mua và thất vọng vì thấy hương vị gạo ngon nhất thế giới chẳng khác mấy so với thông thường. Thực ra, lỗi không phải do gạo ST25. Vào thời điểm đó, nơi bán gạo ST25 chuẩn không nhiều vì ST25 là giống mới, chưa có nhiều người trồng. Như vậy, người mua đã rơi vào “ma trận” các loại gạo pha trộn giả mạo là gạo ST25.
“Việc trộn các loại gạo như vậy sẽ ảnh hưởng lớn đến chất lượng và giá trị thương hiệu gạo Việt Nam trên thị trường”, PGS.TS. Lê Nguyễn Đoan Duy, Trưởng khoa Công nghệ thực phẩm (trường ĐH Công nghiệp Thực phẩm TP.HCM) nhận xét trong hội thảo về xác thực chất lượng nông sản do Trung tâm Thông tin và Thống kê KH&CN TP.HCM (Sở KH&CN TP.HCM) tổ chức vào cuối năm 2021. Ngoài những ảnh hưởng đến sức khỏe của người tiêu dùng nếu trộn gạo kém chất lượng, hành vi này còn gây thiệt hại lớn về mặt kinh tế. Đơn cử như khi vụ việc một số doanh nghiệp Việt trộn gạo chất lượng thấp để xuất khẩu bị phanh phui vào năm 2021, giá gạo xuất khẩu của Việt Nam đã giảm tới 50 USD, đơn hàng cũng ngày càng ít vì các đối tác vẫn nghi ngờ gạo Việt Nam.
Người mua khó có thể phân biệt các loại gạo bị pha trộn bằng mắt thường, vì chúng thường bị trộn một cách rất tinh vi, chẳng hạn kết hợp những loại gạo có hình dạng gần giống nhau. Nếu có một phương pháp phân biệt chính xác và nhanh chóng để ứng dụng trong công tác giám định gạo trước khi xuất khẩu thì việc kiểm soát tình trạng gian lận sẽ hiệu quả hơn.
Đó là lý do dẫn PGS.T Lê Nguyễn Đoan Duy và các cộng sự ở trường ĐH Công nghiệp Thực phẩm TP.HCM đến với nghiên cứu sử dụng quang phổ cận hồng ngoại để xác thực chất lượng nông sản.“Mục tiêu của nghiên cứu là sử dụng thiết bị quang phổ cận hồng ngoại cầm tay kết hợp với phương pháp chemometrics và xử lý đa biến để xác thực nhanh giống gạo và phân biệt gạo giá trị thấp và gạo giá trị cao. Đây là một nghiên cứu hoàn toàn mới ở Việt Nam và có thể hỗ trợ cho việc xây dựng thương hiệu gạo Việt, góp phần gia tăng giá trị của gạo Việt Nam”, nhóm nghiên cứu viết trong công bố trên tạp chí Nông nghiệp & Phát triển nông thôn.
Xây dựng mô hình phân biệt
Quang phổ cận hồng ngoại không phải là công nghệ duy nhất để phân tích và xác thực chất lượng nông sản. Một số phương pháp như sắc ký lỏng cao áp (HPLC), sắc ký khối phổ (GC- MS)... đã được ứng dụng rộng rãi trên thế giới từ lâu. Tuy nhiên, các nhà nghiên cứu nhận thấy các kỹ thuật này chưa thực sự phù hợp với điều kiện Việt Nam. “Hạn chế của các phương pháp trên là tương đối đắt tiền, tốn thời gian, gây tổn thất mẫu và sử dụng hóa chất nhiều, có thể ảnh hưởng đến môi trường. Hơn nữa, các phương pháp này cũng đòi hỏi nhân lực có trình độ cao”, PGS.TS Lê Nguyễn Đoan Duy cho biết.
Với ưu điểm nhanh chóng, tiết kiệm chi phí, không cần sử dụng hóa chất và không cần chuẩn bị mẫu, kỹ thuật quang phổ hồng ngoại có thể xóa bỏ hoàn toàn những rào cản trên. Đây là kỹ thuật đo phổ ánh sáng phản xạ từ các mẫu sinh học, các giá trị phổ này sẽ được phân tích bằng phần mềm máy tính, cho ra kết quả là ma trận các giá trị phổ. Sau đó, người ta sẽ áp dụng mô hình thống kê đa biến để mô tả mối quan hệ giữa phổ hấp thụ và thành phần hóa học. Phương pháp này thường dùng để xác định thành phần trongcác loại nông sản, dược phẩm, rượu...
Nguyên lý của phương pháp phổ hồng ngoại khá đơn giản: “Dựa trên các hợp chất hóa học có khả năng hấp thụ chọn lọc bức xạ hồng ngoại, sau khi hấp thụ các bức xạ này, các phân tử của hợp chất hóa học dao động với nhiều vận tốc khác nhau và xuất hiện dải phổ hấp thụ bức xạ hồng ngoại. Bước sóng thông thường của phổ cận hồng ngoại (near infrared - NIR) là giữa 750 và 2500 nm”, nhóm nghiên cứu giải thích. “Vì phương pháp quang phổ là gián tiếp, cần sử dụng chemometrics để trích xuất thông tin liên quan đến hóa học từ quang phổ bằng các công cụ thống kê, toán học và máy tính. Chemometrics là kỹ thuật thông tin chiết xuất hóa học sử dụng phương pháp toán học và thống kê để xử lý, phân tích, giải thích và dự đoán dữ liệu hóa học, nhằm đơn giản hóa các tập dữ liệu lớn và phức tạp, phân loại các đối tượng hoặc dự đoán các tham số phân tích”.
Thay vì sử dụng máy quang phổ cận hồng ngoại thông thường được đặt cố định, để tiết kiệm chi phí và thuận tiện cho ứng dụng, các nhà khoa học đã sử dụng máy cầm tay nhỏ gọn (SCiO) có dải phổ từ 740-1070 nm ở độ phân giải 1 nm. Sau đó nhóm nghiên cứu trích xuất dữ liệu phổ từ hệ thống dữ liệu đám mây của SCiO và tiến hành các quá trình tiền xử lý theo phương pháp chemometrics với phần mềm SIMCA 15 của Đức. Số liệu sau khi tiền xử lý sẽ được dùng để xây dựng mô hình phân biệt gạo.
Thực chất, cả quy trình tiền xử lý lẫn xây dựng mô hình đều là những “nút thắt” không dễ gỡ. Mục đích chính của tiền xử lý là chuyển đổi các ma trận tín hiệu phổ thành những số liệu cụ thể ở từng bước sóng nhằm xác lập mối tương quan giữa phổ hồng ngoại và các thuộc tính nghiên cứu, đồng thời loại bỏ các tác nhân gây nhiễu thông tin. “Khi thu được phổ cận hồng ngoại, nếu không tiến hành các bước tiền xử lý thì gần như chúng ta không thể sử dụng được dạng số liệu này để xây dựng mô hình. Tuy nhiên, về mặt thuật toán, có rất nhiều phương pháp tiền xử lý, câu hỏi đặt ra là nên chọn phương pháp nào phù hợp với sản phẩm và mô hình do chúng ta xây dựng?”, TS. Nguyễn Quốc Cường ở trường ĐH Bách khoa TP.HCM, đồng tác giả nghiên cứu, giải thích.
Cơ sở quan trọng nhất để lựa chọn phương pháp tiền xử lý là độ sai số, bởi phương pháp tiền xử lý nào có sai số càng thấp thì số liệu sẽ diễn đạt được càng nhiều thông tin. Sau khi phân tích kĩ càng, dựa trên các tiêu chí này, họ quyết định lựa chọn hai phương pháp tiền xử lý là hiệu chuẩn phân tán nhiều lần (MSC) và biến thiên đã chuẩn hóa kết hợp với đạo hàm bậc một theo Savitzky-Golay. “Các phương pháp tiền xử lý đã cho thấy hiệu quả giảm thiểu sóng nhiễu đáng kể so với dữ liệu thô. Trong đó, xử lý bằng MSC mang lại hiệu quả cao nhất, chỉ giữ lại những thông tin phổ liên quan trực tiếp đến chất lượng gạo”, nhóm nghiên cứu viết.
Việc xây dựng nguồn dữ liệu chất lượng đã giúp nhóm nghiên cứu phát triển thành công mô hình phân biệt chất lượng gạo. Từ cơ sở dữ liệu về 216 mẫu gạo thu thập tại Long An, Cần Thơ, Đồng Tháp, Kiên Giang và Sóc Trăng, họ đã kết hợp với thuật toán nhận dạng PLS-DA (bình phương tối thiểu từng phần - một thuận toán thường được kết hợp với phương pháp phổ cận hồng ngoại trong nhận dạng và phân tích) để huấn luyện và kiểm tra hoạt động của mô hình. Các mẫu gạo này được chia thành ba loại: gạo chất lượng cao (ST 24 và Đài Thơm 8); chất lượng trung bình (OM 5451 và OM 6979) và chất lượng thấp (IR 50404). Kết quả cho thấy mô hình có thể phân biệt rõ ba nhóm gạo này. “Khi chiếu mẫu kiểm chứng và mẫu chuẩn lên cùng một mặt phẳng, có thể thấy các mẫu huấn luyện và mẫu kiểm tra phân bố trùng nhau theo các giống và theo các nhóm”, nhóm nghiên cứu cho biết. “Điều này thể hiện rằng mô hình đa biến xây dựng từ phổ cận hồng ngoại có thể phân nhóm chính xác các giống gạo dựa vào sự tương quan của các biến”.
Mở rộng cho nhiều loại nông sản
Bên cạnh phân biệt gạo, nhóm nghiên cứu cũng đã thử nghiệm mô hình này để phân biệt cà phê nguyên chất và cà phê trộn. Tương tự như gạo, cà phê cũng là một sản phẩm dễ bị pha trộn, thậm chí còn nghiêm trọng hơn so với gạo pha trộn vì cà phê thường bị pha trộn bằng đậu nành và ngô rang cháy, ảnh hưởng không nhỏ đến sức khỏe của người tiêu dùng. Cuộc khảo sát năm 2016 của Hội Tiêu chuẩn và bảo vệ người tiêu dùng Việt Nam (Vinastas) đã khiến nhiều người uống cà phê lo ngại: Trong 253 mẫu cà phê đen được khảo sát tại Hà Nội, TP.HCM, Bình Dương và Sóc Trăng, có 30% mẫu cà phê có hàm lượng caffeine (thành phần chính của cà phê) không đáng kể, thậm chí có chín mẫu hoàn toàn không có caffeine. Kết quả cho thấy, mô hình có thể phân biệt được chính xác cà phê nguyên chất và cà phê trộn, tỉ lệ trộn càng cao thì độ chính xác càng lớn.
Trước sự quan tâm của các doanh nghiệp trong hội thảo kết nối công nghệ, nhóm nghiên cứu cho biết họ sẵn sàng hợp tác để phát triển ứng dụng trong sản xuất thực tế. “Chúng tôi rất muốn mở rộng ứng dụng, không chỉ với gạo, cà phê mà còn nhiều sản phẩm như nước mắm, rượu vang, yến... Yếu tố quan trọng nhất của phương pháp này là cơ sở dữ liệu chuẩn của mỗi loại nông sản, nếu thu thập được càng dữ liệu để đào tạo thì mô hình sẽ càng chính xác hơn”, PGS.TS. Lê Nguyễn Đoan Duy nói.