Lần đầu tiên ở Đông Nam Á có một dự án khôi phục thành công mộc bản đã mất từ bản in của nó.
“Đây là câu hỏi vừa hay vừa có những thách thức về mặt khoa học” – Anh Nguyễn Xuân Hùng - Giám đốc Trung tâm Lưu trữ Quốc gia IV, Đà Lạt, nhớ lại câu trả lời của PGS. TS. Lê Thanh Hà, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội, khi anh hỏi về việc liệu có thể dựng lại các tấm mộc bản triều Nguyễn đã mất từ bản in của nó hay không.
Mộc bản nói đến ở đây là các tấm ván gỗ khắc chữ Hán, chữ Nôm ngược được dùng để in các pho sách quý về lịch sử, văn hóa, giáo dục – mang tính biểu trưng của vương triều nhà Nguyễn. Để in, người ta sẽ bôi mực đều lên bề mặt mộc bản, trải giấy dó lên để mực thấm vào giấy, chữ sẽ hiện lên rõ nét. Năm 1960, hơn 50 nghìn tấm mộc bản triều Nguyễn được chuyển từ Huế vào Đà Lạt – nơi có điều kiện khí hậu thích hợp hơn cho việc bảo quản. Trung tâm Lưu trữ Quốc gia IV hiện giữ hơn 34 nghìn tấm. Gần 16 nghìn tấm còn lại đã bị hư hỏng hay thất lạc và may ra chỉ còn bản in trên giấy.
Nếu nghiên cứu về nội dung, có thể chỉ cần bản in trên giấy là đủ. Nhưng mộc bản không chỉ có thế, nó là “chứng nhân” của kĩ thuật – công nghệ in “hàng loạt” từng phát triển rực rỡ nhằm lưu hành tài liệu rộng rãi từ hàng thế kỉ trước. Mỗi tấm mộc bản đều có thể được coi là một tác phẩm thủ công mỹ nghệ đỉnh cao với những nét chữ uyển chuyển, thanh thoát như thể người nghệ nhân đang thảo thư pháp bằng con dao khắc trên gỗ. Bản thân tấm gỗ cũng có một vẻ đẹp riêng. Những chiếc ván thô sau khi trải qua nhiều công đoạn ngâm tẩm, phết sơn, phơi khô, ép phẳng để tối ưu cho việc khắc chữ, lúc trông óng ả như đá, lúc lại thấy đằm và lì như gốm chưa tráng men.
Anh Nguyễn Xuân Hùng đã nghĩ đến việc nhờ nghệ nhân tạo ra một mộc bản mới. Tuy nhiên, làng nghề Thanh Liễu, Hải Dương – cái nôi làm ra các mộc bản thời xưa đã bị mai một, không dễ để lần lại kĩ thuật đã sử dụng hàng trăm năm trước. Kể cả làm ra được với rất nhiều công sức, thì tấm ván mới cũng “lạc điệu” trong kho bảo tồn, không có giá trị lưu trữ. Bởi vậy, với anh Hùng, làm ra một mộc bản số lưu trên máy tính là lựa chọn khả dĩ nhất.
Việc chuyển từ chữ in 2D trên giấy thành chữ nổi 3D đơn thuần thực ra không có gì khó. Nhưng làm sao kết quả cuối cùng tạo ra được tấm mộc bản gần sát nhất với bản gốc, đem lại cho người xem ấn tượng nghệ thuật như đang chiêm ngưỡng tác phẩm thật mới là thách thức lớn. Theo chia sẻ của PGS.TS Lê Thanh Hà, đã có nhiều đơn vị thử sức, nhưng vì chỉ tập trung vào khía cạnh công nghệ mà bỏ qua, không cảm nhận được những mục tiêu về mặt mỹ thuật của mộc bản nên thất bại.
PGS.TS Lê Thanh Hà dường như là con người “đo ni đóng giày” cho nhiệm vụ này. Anh chia sẻ: “Mình là người ở giữa, là dân làm khoa học nữa, lại còn thích lịch sử, văn hóa, lại hiểu biết về công nghệ nên tạo ra được tiếng nói chung [giữa người làm công nghệ thông tin và người làm bảo tồn]”.
Một giải pháp khéo léo
Mỗi tấm mộc bản có thể dùng hai mặt để in, tương đương với hai tờ văn bản. Khi đóng quyển, mỗi tờ văn bản sẽ được gấp lại, thành hai trang sách. Dự án thử nghiệm này* đặt mục tiêu khôi phục năm tấm mộc bản trong cuốn Đại Nam thực lục, bộ sử ghi chép về triều đại các chúa Nguyễn và vua nhà Nguyễn.
Nội dung của năm tấm này thể hiện tư tưởng trị nước xuyên suốt của triều đình: “thương nhân dân là việc trước tiên trong chính sự của vương giả” - mà thời đại bây giờ có lẽ vẫn thấy đồng cảm. Các tấm này còn có ghi chép về chủ quyền Hoàng Sa và Trường Sa của Việt Nam.
Theo tư duy thông thường, khi dùng AI để tạo ra các mộc bản từ bản in trên giấy, dữ liệu để huấn luyện trí tuệ nhân tạo sẽ là rất nhiều mộc bản và các bản in trên giấy tương ứng của nó. Hiểu một cách đơn giản, AI sẽ học và hiểu được mối liên hệ giữa hai vật thể này, từ đó có khả năng “suy ngược” ra mộc bản từ một bản in cho trước.
Nhưng mọi thứ không diễn ra trơn tru như vậy. Để có thể đào tạo AI theo cách như trên sẽ đòi hỏi một nguồn dữ liệu cực lớn (hàng chục, hàng trăm nghìn tấm mộc bản và bản in tương ứng) và hệ thống máy tính lưu trữ rất mạnh mà nhóm nghiên cứu của PGS.TS Lê Thanh Hà không kham nổi.
Thực tế, với dự án này, anh chỉ có đủ nguồn lực quét ảnh 3D và lưu giữ được khoảng 200 tấm mộc bản với độ phân giải cao. Mỗi tấm ảnh 3D này có dung lượng khoảng 4GB (để tiện so sánh, năm tấm là tương đương với một bộ phim hai tiếng với chất lượng có thể chiếu ở màn ảnh rộng tại rạp phim). Hơn nữa, theo PGS.TS Lê Thanh Hà, kích thước của một tấm mộc bản khá lớn – tương đương với tờ giấy khổ A3 mà các mô hình AI hiện tại chưa có khả năng xử lý.
Phương án mà nhóm của PGS.TS Lê Thanh Hà đưa ra là chia nhỏ các thành phần của tấm mộc bản để huấn luyện AI. Một tấm mộc bản sẽ được chia thành ba phần gồm: tay cầm (phần gỗ hoàn không được khắc nằm ở hai bên phải – trái của mộc bản), các ký tự (gồm chữ viết, hoa văn), dòng kẻ (các đường thẳng phân tách giữa các dòng chữ) và phần nền giữa các chữ. Trong đó, chỉ có kí tự và dòng kẻ là những gì được thể hiện trên bản in.
Với ảnh 3D và bản in của 200 tấm mộc bản, nhóm của PGS.TS Lê Thanh Hà sẽ tiến hành “bóc tách” từng kí tự và dán nhãn, tạo ra tổng cộng hơn 90 nghìn cặp ký tự “gỡ rời” ra từ ảnh 3D ván in và hình ảnh 2D tương ứng của nó trên giấy. Mỗi cặp phải đảm bảo mức độ tương thích cao về vị trí, tỉ lệ và góc xoay. Nhóm đã mất hơn một năm rưỡi để hoàn thành bộ dữ liệu này nhưng cái giá phải trả cũng “xứng đáng” khi nó đủ tốt để có thể huấn luyện AI. Nói cách khác, với lượng dữ liệu này, AI giờ đây có thể “tự tin” nhận diện các chữ trên bản in để rồi tạo ra các chữ khắc nổi 3D bằng gỗ “rồng bay phượng múa” không kém người nghệ nhân ngày xưa.
Một mô hình AI khác sẽ học từ 200 tấm mộc để tái tạo ra nền và tay cầm mộc bản với những nét dao khắc và các đường vân gỗ mờ ảo. Trước hết, nền sẽ được ghép nối với chữ. Tuy nhiên, đến bước này, kết quả vẫn khá “thô sơ”. Việc lắp ráp này để lại những “vết nứt” khó hiểu: có những khoảng trống giữa các ký tự và nền, và có những khoảng trống khác trong lòng các kí tự, do các vết dao đục, khắc sượt ngang qua trên mộc bản nên khi in không thấm mực. Lại cần thêm một AI khác “ra tay”, được đào tạo chuyên để phát hiện ra và tìm cách “điền” vào những khoảng trống này. Nền và các kí tự sau khi được ghép lại và tinh chỉnh, sẽ được ghép với tay cầm một cách thủ công.
Do dữ liệu dành cho tay cầm và nền rất khiêm tốn, lại phải trải qua quá trình lắp ghép các thành phần riêng rẽ với nhau nên không tránh khỏi sự xô lệch. Vẫn cần các chuyên gia như “chốt chặn” cuối cùng để xử lý đồ họa cho tác phẩm cuối cùng trở nên mượt mà.
Sự kì diệu của công nghệ
Với riêng anh Nguyễn Xuân Hùng - người đặt bài toán cho PGS.TS Lê Thanh Hà thì những tấm ván khắc được khôi phục bằng công nghệ vẫn chưa thể có “hồn” và độ tinh tế như những bản anh vẫn hằng ngày “cảm nhận bằng tay, nhắm mắt lại để xem từng vết khắc, thậm chí độ nặng nhẹ của tấm mộc bản”. Tuy vậy, anh cho rằng, kể cả vậy thì nó vẫn đủ để đại chúng “nhìn vào và cảm nhận sự kỳ diệu của khoa học, của công nghệ”.
Đây là lần đầu tiên ở Đông Á có một dự án khôi phục thành công mộc bản từ các bản in đã mất. Trên thế giới, các công bố về dự án tương tự cũng rất hiếm hoi. 19 chuyên gia làm việc và tiếp xúc trực tiếp với mộc bản đến từ Trung tâm Lưu trữ Quốc gia IV, Viện Nghiên cứu Hán Nôm và nghệ nhân khắc mộc bản làng Thanh Liễu đều trân trọng phiên bản 3D của mộc bản khôi phục từ bản in, đặc biệt là độ tinh tế của các ký tự và ký hiệu.
Trên thang điểm năm cho các tiêu chí về ký tự, kí hiệu, nền và khuôn dạng của tấm một bản, họ đều chấm 4 - 4.5 cho kết quả dự án. Dĩ nhiên, để đạt được mức hoàn hảo, để những người ngoài ngành công nghệ thông tin cũng có thể sử dụng phần mềm để tái tạo lại các mộc bản đã mất chỉ từ bản in trên giấy, nhóm nghiên cứu biết rằng cần một chặng đường dài phía trước.
“Nếu sau này chúng ta có hệ thống máy tính thật xịn, thật to xử lý được dữ liệu của mấy chục ngàn tấm thì mới có thể được” – PGS.TS Lê Thanh Hà bộc bạch.
___________
*Dự án của PGS. TS Lê Thanh Hà do Chương trình Nghị định thư của Bộ Khoa học và Công nghệ tài trợ năm 2021. Trong dự án này, PGS.TS Lê Thanh Hà hợp tác nghiên cứu với người bạn cùng làm về số hóa 3D khi còn là nghiên cứu sinh ở Hàn Quốc.
Đăng số 1314 (số 42/2024) KH&PT