Sự cố này ảnh hưởng đến dữ liệu nghiên cứu của 14 nhóm khác nhau, trong đó ít nhất 4 nhóm có thể sẽ không thể phục hồi dữ liệu.

Sao lưu là công việc thường thấy trong các hệ thống máy tính | Ảnh minh họa: Getty Image
Sao lưu là công việc thường thấy trong các hệ thống máy tính | Ảnh minh họa: Getty Image

Sao lưu dữ liệu là một quy trình bắt buộc và có ý nghĩa cực kỳ quan trọng đối với bất cứ tổ chức, doanh nghiệp nào trong thời đại số hóa như hiện nay. Đối với các cơ sở giáo dục, nghiên cứu khoa học, việc đồng bộ và sao lưu dữ liệu càng có ý nghĩa quan trọng hơn. Tuy nhiên, chỉ lên kế hoạch hay đưa ra lộ trình sao lưu dữ liệu hợp lý thôi là chưa đủ, làm thế nào để quy trình sao lưu diễn ra chính xác, an toàn mới là vấn đề đáng quan tâm.

Đại học Kyoto, một trong những cơ sở nghiên cứu khoa học hàng đầu tại Nhật Bản, vừa gặp phải một “thảm họa” tồi tệ khi hệ thống siêu máy tính vô tình xóa sạch 77 TB dữ liệu trong quá trình sao lưu thông thường mà họ vẫn thực hiện định kỳ, theo báo cáo của trang BleepingComputerhồi cuối tháng 12/2021.

Sự cố xảy trong khoảng thời gian từ ngày 14/12 đến ngày 16/12 vừa qua và đã xóa khoảng 34 triệu file của 14 nhóm nghiên cứu khác nhau. Đại học Kyoto hiện đang sử dụng hệ thống siêu máy tính Hewlett Packard Cray và hệ thống lưu trữ DataDirect ExaScaler - đều là những hệ thống thường được các nhóm nghiên cứu sử dụng để phục vụ nhiều mục đích khác nhau. Do đó, sự cố này không chỉ là câu chuyên của riêng Đại học Kyoto.

Chưa rõ những loại file nào đã bị xóa bỏ, và file nào trực tiếp gây ra sự cố. Tuy nhiên, Đại học Kyoto cho biết dữ liệu nghiên cứu của ít nhất 4 nhóm sẽ không thể khôi phục được. Các siêu máy tính có chi phí không hề thấp, chỉ 1 giờ vận hành cũng có thể tiêu tốn hàng trăm USD.

Đại học Kyoto vốn là một trong những ngôi trường hàng đầu tại Nhật Bản và thường xuyên nhận được những khoản tài trợ lớn để phục vụ cho mục đích nghiên cứu khoa học. Vì vậy, vụ việc lần này được đánh giá là đặc biệt nghiêm trọng, khiến họ phải nhanh chóng công bố thông tin chi tiết về sự cố.

Trong thông báo chính thức của mình, Đại học Kyoto có viết: “Kính gửi người dùng dịch vụ siêu máy tính. Vào ngày hôm nay, một lỗi trong chương trình sao lưu hệ thống lưu trữ đã gây ra sự cố ngoài ý muốn, khiến cho một số file trong /LARGE0 bị xóa bỏ. Dù đã xử lý sự cố này, nhưng rất có thể chúng tôi đã để mất đến 100TB dữ liệu và sẽ tiếp tục điều tra thêm về mức độ ảnh hưởng mà nó gây ra”.

Để tránh mất mát hơn nữa, Đại học Kyoto đã dừng hoàn toàn quy trình sao lưu và sẽ nâng cấp hệ thống sao lưu vào đầu năm 2022.

Trong khi đó, nhà cung cấp siêu máy tính Hewlett-Packard (HP) đã gửi báo cáo về mất dữ liệu cho Đại học Kyoto, giải thích việc mất dữ liệu là do sự cố kỹ thuật trong hệ thống tệp của siêu máy tính khi nâng cấp. Họ đã không nhận thức được tác dụng phụ của quy trình mới, kết quả là các lệnh mới ghi đè lên kịch bản cũ trong khi nó vẫn đang chạy, khiến hệ thống xóa hầu hết các tệp cũ hơn 10 ngày trong thư mục lưu trữ /LARGE0, thay vì chỉ xóa các tệp trong thư mục nhật ký.

Công ty này nhận 100% trách nhiệm về mình, đồng thời hứa sẽ bảo đảm việc bồi thường cho người dùng bị mất tệp tin và cải tiến để các trục trặc tương tự không xảy ra trong tương lai.

Khác với máy tính thông thường, siêu máy tính sở hữu tốc độ nhanh hơn rất nhiều và khả năng tận dụng nhiều hệ thống máy tính để xử lý các phép toán phức tạp trong thời gian ngắn nhất. Đó là lý do vì sao nó là một công cụ giá trị đối với giới nghiên cứu trong các lĩnh vực khác nhau, bao gồm cả mô phỏng khí hậu và khí quyển để dự báo bão và sóng thần, vật lý, khoa học vaccine cùng nhiều mảng khác.

Nhưng cũng như nhiều loại máy móc điện tử khác, mọi tính năng dù cao cấp đều có khả năng gặp sự cố hoặc hoạt động không đúng cách.


Nguồn: