TS. Đào Hải Yến (Viện Hóa học, Viện Hàn lâm KH&CN Việt Nam) và cộng sự đã xây dựng được phương pháp để truy xuất nguồn gốc địa lý của gạo Séng Cù với độ chính xác từ 80 - 99%. Phương pháp này cũng hứa hẹn sẽ đem lại nhiều ứng dụng hữu ích cho các sản phẩm nông sản có giá trị cao khác của Việt Nam.

Sau khi gạo ST25 của Việt Nam đoạt giải gạo ngon nhất thế giới vào 2019, nhiều cá nhân và doanh nghiệp trong nước đã vi phạm quy định sở hữu trí tuệ và tài sản thương hiệu của The Rice Trader (TRT) - đơn vị tổ chức cuộc thi World’s Best Rice như sử dụng trái phép logo của TRT trong các sản phẩm, thậm chí còn trộn gạo không phải ST25 nhưng vẫn quảng cáo là gạo ngon nhất thế giới. Hậu quả là dù chưa bị “cấm thi” vào năm 2021, gạo Việt Nam vẫn đứng trước nguy cơ không được tham dự World’s Best Rice vào những năm tiếp theo nếu tình trạng này vẫn còn tiếp diễn.

Câu chuyện trên nói riêng và việc nhập nhèm xuất xứ nông sản nói chung có thể liên quan đến nhiều vấn đề như xâm phạm quyền sở hữu công nghiệp, giả mạo nhãn hiệu, chỉ dẫn địa lý. Song, nó cũng cho thấy việc cần phải có các công cụ để truy xuất được nguồn gốc địa lý thực sự của các mặt hàng nông sản - một yếu tố mà các giải pháp quen thuộc là quét mã QR để đọc các thông tin về sản phẩm khó lòng giải quyết được, nếu như không đảm bảo được tính chính xác của thông tin về quá trình sản xuất từ lúc còn ở đồng ruộng cho đến khi ra thị trường.

Đáp ứng nhiều mức độ truy xuất

Đây cũng là lý do mà từ năm 2019, TS. Đào Hải Yến (Viện Hóa học, Viện Hàn lâm KH&CN Việt Nam) và các đồng nghiệp đã đi tìm các phương pháp để xác định nguồn gốc, chất lượng và tính an toàn của nông sản Việt Nam. Và một trong những giải pháp mà nhóm TS. Yến hướng đến là kỹ thuật phân tích đa nguyên tố kết hợp với xử lý dữ liệu thống kê trong lĩnh vực hóa học (chemometric) - một trong những phương pháp là xu hướng trên thế giới hiện nay - để truy xuất nguồn gốc. “Phương pháp này là một kỹ thuật phân tích rất hữu ích trong việc cung cấp thông tin nguồn gốc địa lý, thông qua việc phân tích các nguyên tố kim loại, được dùng làm ‘dấu vân tay’ để xác định nguồn gốc xuất xứ”, nhóm nghiên cứu cho biết.

Thu hoạch lúa trên cánh đồng Séng Cù ở Lào Cai. Ảnh:infonet.vietnamnet.vn

Đối tượng đầu tiên mà nhóm lựa chọn để phân tích là gạo bởi đây là một trong những mặt hàng xuất khẩu chủ lực của Việt Nam. Tuy nhiên, phương pháp chemometric và phân tích đa nguyên tố vốn đòi hỏi phải có một cơ sở dữ liệu ổn định để so sánh, vì vậy muốn tăng độ chính xác của kết quả thì phải thu được cơ sở dữ liệu rất lớn. Trong khi đó, TS. Yến và đồng nghiệp khó có thể đến khắp các tỉnh thành để thu thập mẫu gạo với kinh phí có giới hạn của đề tài nghiên cứu.

Để có thể giảm thiểu tác động của các yếu tố môi trường và tập quán canh tác đến độ chính xác của phương pháp truy xuất nguồn gốc, nhóm của chị đã quyết định lựa chọn gạo Séng Cù - “một loại gạo ngon nổi tiếng của Việt Nam nhưng có đặc trưng là không thể trồng được ở nhiều nơi mà chỉ ở các vùng có thổ nhưỡng và khí hậu ‘ngày nắng, đêm lạnh’ như ở Lào Cai, Điện Biên”, TS. Yến cho biết. “Nhờ đó, chúng tôi có thể khoanh vùng và đi tìm câu trả lời cho bài toán nhỏ này trước khi mở rộng ra các sản phẩm khác”.

Thực tế, trước đây cũng đã có một số nghiên cứu nhằm truy xuất nguồn gốc địa lý của sản phẩm ở Việt Nam, song các nghiên này thường lấy mẫu ở các địa điểm cách khá xa nhau, đồng thời chỉ thực hiện truy xuất một lần duy nhất, do đó khó có thể xác định được sự biến đổi của dữ liệu theo thời gian.

Nhằm khắc phục nhược điểm của các nghiên cứu trước đó, bên cạnh việc đo lường các nguyên tố trong gạo Séng Cù và các loại gạo khác, TS. Yến và đồng nghiệp còn đặt mục tiêu: xác định độ ổn định của các nguyên tố trong gạo Séng Cù qua nhiều mùa vụ; đồng thời xây dựng một mô hình sử dụng phương pháp phân tích đa biến để phân biệt gạo Séng Cù được trồng tại các cánh đồng ở Lào Cai với các loại gạo khác nhằm ngăn ngừa việc người bán trộn gạo hoặc giả danh sản phẩm nối tiếng.

Để thực hiện mục tiêu, nhóm nghiên cứu đã thu thập 259 mẫu gạo từ ba cánh đồng ở Mường Vi, Bản Qua, Bản Xen (Lào Cai), cùng 86 mẫu gạo khác từ miền Bắc, Trung, Nam trong ba vụ mùa từ 2019 - 2020. Đồng thời, nhóm cũng lấy 13 mẫu đất và 22 mẫu nước ở các cánh đồng để phân tích. “Do thổ nhưỡng, địa chất của từng vùng là đặc trưng, không thể thay đổi nên những chỉ tiêu kim loại trong đất và gạo có thể trở thành những dấu ấn (marker) giúp phân biệt được nguồn gốc địa lý ở các vùng khác nhau”, TS. Yến lý giải.

Kết quả phân tích 44 nguyên tố trong gạo cho thấy, “các nguyên tố vi lượng và một số kim loại đa lượng có ảnh hưởng rõ rệt đến sự khác biệt của gạo theo vùng, còn các nguyên tố đất hiếm gần như không đóng góp đến sự khác biệt giữa các mẫu gạo được phân tích”, ThS. Trần Lâm Thanh Thiện (Viện Hóa học) - thành viên nhóm nghiên cứu - cho biết.

Cụ thể, trong kết quả nghiên cứu “Geographical origin traceability of Sengcu rice using elemental markers and multivariate analysis” vừa được công bố trên tạp chí Food Additives & Contaminants: Part B, nhóm của TS. Yến đã xác định được asen, bari, stronti, chì, canxi, seleni là yếu tố quan trọng để truy xuất nguồn gốc địa lý của ba vùng canh tác gạo Séng Cù ở Lào Cai; đồng thời khẳng định được nhôm, canxi, sắt, ma-giê, bạc, asen là những yếu tố chính để phân biệt giữa gạo Séng Cù và các loại gạo khác.

Dù phương pháp này đã được thực hiện ở nhiều quốc gia trên thế giới, song để áp dụng thành công ở Việt Nam, cái khó đầu tiên lại nằm ở việc xác định được mục tiêu nghiên cứu và “xây dựng phương pháp phù hợp với tiềm lực của đơn vị cũng như điều kiện thực tiễn trong nước”, ThS. Thiện nhớ lại.

Chưa kể đến, lĩnh vực phân tích này có một điểm đặc thù là sự thành bại của kết quả đều phụ thuộc phần lớn vào trình độ chuyên môn, sự thành thạo tay nghề của người thực hiện và độ ổn định của máy móc. Ngay cả khi đã có kết quả phân tích của tất cả các mẫu, việc xử lý các dữ liệu thu được “lại cũng là một điểm khó và là yếu tố quan trọng ảnh hưởng trực tiếp đến độ chính xác của mô hình”, anh Thiện cho biết. Dữ liệu sẽ phải được tiến hành đánh giá lần lượt trên các mô hình có giám sát hay không giám sát, từ dạng đơn giản nhất cho tới phức tạp nhất để tìm ra mức độ xử lý chính xác của mỗi mô hình.

“Hiện nay, thế giới đang sử dụng phương pháp phân tích đồng vị bền như một phương pháp trọng tài để thực hiện việc truy xuất nguồn gốc nông sản thực phẩm, song chi phí thực hiện vô cùng đắt đỏ. Để phù hợp với các điều kiện thực tế của Việt Nam, chúng tôi phải tìm các kỹ thuật khác trên cơ sở hướng tới mục tiêu là kết quả nghiên cứu chính xác và giá thành phải phù hợp để ứng dụng được trên quy mô rộng”.

Phòng thí nghiệm của Viện Hóa học. Ảnh: Mỹ Hạnh

Với cách tiếp cận này, nhóm của TS. Yến không sử dụng một phương pháp hay một nguyên tố kim loại duy nhất để phân tích mà sử dụng nhiều kỹ thuật khác nhau tùy thuộc vào điều kiện đầu bài đặt ra, chẳng hạn như cần phân biệt tính thật giả, chất lượng của sản phẩm, hay chỉ cần phân biệt các vùng trồng của mỗi mặt hàng.

Sau quãng thời gian dài thử nghiệm, nhóm của TS. Yến đã nhận được trái ngọt. Khi sử dụng mô hình phân tích biệt thức tuyến tính (linear discriminant analysis) và mô hình bình phương tối thiểu từng phần (partial least squares discriminant analysis), nhóm nghiên cứu đã phân biệt được gạo Séng Cù và các loại gạo khác với tỉ lệ chính xác gần 100% cả trong quá trình thẩm định và kiểm tra xác nhận. Khi thử nghiệm thực tế với các mẫu gạo, phương pháp của nhóm TS. Hải Yến truy xuất được nguồn gốc địa lý với độ chính xác từ 80 - 99%, dù các cánh đồng này chỉ cách nhau khoảng 30km.

Hướng đến bộ cơ sở dữ liệu

Do nhiều nước trên thế giới đã ý thức được việc xây dựng các cơ sở dữ liệu từ lâu nên “hàng xuất khẩu của mình khi vào nước họ mà có vấn đề gì thì chỉ cần phân tích một mẫu là họ biết ngay vấn đề ở đâu”, TS. Yến nói. “Trong khi đó, Việt Nam là một trong những nước xuất khẩu gạo đứng đầu thế giới nhưng ngân hàng dữ liệu về gạo lại chưa được xây dựng một cách bài bản và hoàn chỉnh. Hơn nữa khả năng tiếp cận các thông tin hữu ích từ cơ sở dữ liệu này để phục vụ cho sản xuất kinh doanh của doanh nghiệp còn gặp rất nhiều khó khăn”.

Theo TS. Yến, có rất nhiều yếu tố ảnh hưởng đến kết quả truy xuất, càng thử nghiệm trong thời gian dài thì kết quả mới càng chính xác và có giá trị. “Để làm được như vậy cần có sự phối hợp của nhà nước, các cơ quan có thẩm quyền và các nhà khoa học, cùng với các yêu cầu thật cụ thể, ví dụ như nhà nước đặt hàng một bộ dữ liệu cơ sở quốc gia về các giống lúa gạo chủ lực. Tuy nhiên, các nhà quản lý nhiều khi lại chưa đi sâu vào các vấn đề công nghệ cụ thể để đặt hàng như vậy”, TS. Yến chia sẻ.

Bên cạnh đó, việc có các chương trình nghiên cứu lớn, hợp tác liên ngành giữa các đơn vị cũng đóng một vai trò quan trọng không kém. “Chẳng hạn, chúng tôi làm về phân tích hóa học nhưng có thể lại chưa hiểu biết rõ về bản chất của gene, giống lúa như bên làm về di truyền - trong khi đây là một yếu tố hoàn toàn có thể sử dụng được để truy xuất nguồn gốc”, TS. Yến nói. Tuy nhiên “để liên kết được như vậy thì vướng phải rất nhiều vấn đề từ cơ chế đến sự cởi mở để hỗ trợ nhau”, chị thẳng thắn nói.


Việt Nam là một trong những nước xuất khẩu gạo đứng đầu thế giới nhưng ngân hàng dữ liệu về gạo của mình là gần như chẳng có gì. Do vậy, để có một bộ dữ liệu cơ sở quốc gia về các giống lúa gạo chủ lực, cần có sự phối hợp của nhà nước, các cơ quan có thẩm quyền và các nhà khoa học, cùng với các yêu cầu thật cụ thể.


Cũng bởi chỉ có các nghiên cứu nhỏ lẻ, các nhà khoa học như TS. Yến gặp rất nhiều khó khăn trong việc tiếp cận một nguồn mẫu đa dạng trên phạm vi cả nước để tạo dựng được cơ sở dữ liệu đủ lớn.

“Chúng tôi cũng muốn nhận mẫu và phân tích miễn phí nhưng vấn đề này không phải đơn giản vì việc thu thập mẫu còn gặp phải nhiều vướng mắc về tính xác thực của thông tin nguồn mẫu như: cách thức canh tác, nguồn gốc giống, các hóa chất bảo vệ thực vật, kích thích tăng trưởng sử dụng trong canh tác”, TS. Yến nói.

"Trong khi nếu được phân tích, các doanh nghiệp, nhà sản xuất sẽ thu được thông tin về sản phẩm để phục vụ cho hoạt động nuôi trồng và xuất khẩu sau này. Khi có cơ sở dữ liệu về mặt hàng suốt nhiều năm với một chất lượng sản phẩm đồng đều, việc bán hàng cho đối tác cũng sẽ dễ dàng hơn hẳn”.