Khi tải một tệp tin lên đám mây, chúng ta thường có suy nghĩ rằng nó sẽ ở đó mãi mãi, sẵn sàng để tải xuống và có thể truy cập bất kỳ lúc nào, ít nhất là khi có kết nối internet tốt.
Nhưng sự thật về lưu trữ đám mây là chúng thực tế chỉ là một đám các ổ đĩa cứng và bạn chỉ thực sự truy cập được các tệp tin của mình khi nhà cung cấp của bạn vẫn hoạt động và các định dạng dữ liệu của các tệp tin chạy được trên các phần mềm hiện có.
Việc giữ tất cả các tệp tin đó trong tầm tay cần nhiều suy nghĩ và nỗ lực hơn chúng ta tưởng. Đúng là tất cả các tệp kỹ thuật số chỉ là các bit và byte được phân biệt bởi cách tổ chức, nhưng thực tế không đơn giản chỉ có vậy.
Ví dụ: một tệp text cơ bản có phần đuôi mở rộng cho biết đó là tệp văn bản, và được đọc bằng tiêu chuẩn ACSII hoặc Unicode khiến các bit ghi số 01101000 01101001 được đọc là "Hi". Quy tắc tương tự cũng áp dụng cho các định dạng tệp tin phức tạp hơn.
Mọi thứ đều hoạt động tốt, cho đến khi những định dạng không được ưa chuộng hoặc phần mềm bị bỏ đi, hoặc cả hai.
Rốt cuộc, lần cuối cùng bạn bật một bài hát bằng định dạng .ram hoặc .wma là khi nào? Bạn tải xuống bao nhiêu tệp .mov hoặc .wmv để xem video?
Với công nghệ chuyển từ các định dạng phương tiện độc quyền như Real Media, Windows Media và QuickTime sang các tiêu chuẩn chia sẻ được như MPEG-4 và MP3, các phần mềm để phát loại tệp [cũ] đó đã biến mất hoặc lỗi thời.
Ngay cả các định dạng hiện tại cũng không an toàn. Viện Fraunhofer IIS (Đức), nơi cung cấp cho chúng ta định dạng MP3, cũng đã rút chân khỏi loại file nhạc đang phổ biến này và vận động cho việc áp dụng các định dạng như AAC và FLAC.
Tương lai của các tệp tin lỗi thời
Rõ ràng là chúng ta sẽ cần duy trì khả năng đọc dữ liệu hoặc tự động chuyển đổi các định dạng lỗi thời để duy trì quyền truy cập liên tục vì càng ngày càng có nhiều người phụ thuộc vào lưu trữ và sao lưu đám mây.
Các trình chuyển đổi trực tuyến có thể sẽ giải quyết công việc này, mặc dù thực sự điều đó có nghĩa là người dùng sẽ phải tải tệp lên máy chủ, máy chủ sẽ thực hiện công việc phức tạp là định dạng lại cấu trúc của các bits và bytes trong tệp đó, thêm đuôi mở rộng mới và cho phép người dùng tải xuống kết quả ở định dạng họ muốn khi cần.
Những việc như thế sẽ trở nên phổ biến, các định dạng mới hơn sẽ dần dần được sử dụng bởi các hệ sinh thái phần mềm đủ lớn.
Sau hơn một thập kỷ lưu trữ đám mây trở nên phổ biến rộng rãi và hàng Petabytes (10^6 gigabytes) dữ liệu được tải lên bởi hàng trăm triệu người, chắc chắn một số định dạng trong đó đã trở nên lỗi thời.
Ta có thể có dữ liệu của mình ngay?
Vậy làm thế nào để tất cả những Petabyte dữ liệu mà chúng ta đang tải lên cho các nhà cung cấp dịch vụ đám mây được bảo mật và truy cập được? Rốt cuộc, máy tính cũng sẽ cũ đi và máy chủ có thể gặp sự cố, hỏng hóc và bị thay thế. Bằng cách nào các trung tâm dữ liệu đối phó với cả các vấn đề thường xuyên xảy ra và những thảm họa bất ngờ để duy trì được tiêu chuẩn thời gian máy chủ hoạt động liên tục, không "chết máy" lên tới 99.9% mà họ hứa hẹn với khách hàng?
Câu trả lời là cần nhiều máy chủ hơn, đặc biệt là các máy chủ chuyển đổi dự phòng (failover) để theo sát các máy chủ khác đang hoạt động thông qua việc đồng bộ hóa định kỳ và sẽ tiếp quản trực tuyến khi cần.
Nhưng đôi khi, ngay cả những máy dự phòng này cũng chưa đủ và các trung tâm dữ liệu chuyển sang dùng băng từ. Băng từ không chỉ không trở thành di sản của lịch sử máy tính thời đầu, mà còn sống khỏe và phát triển mạnh mẽ với tư cách là phương tiện lưu trữ.
Mặc dù điều này nghe thật kỳ quặc - đoạn phim của bạn được quay bằng smartphone đời mới nhất có chất lượng 4K lại nằm trong một tủ lưu trữ, được sao lưu bởi một công nghệ mà bạn có thể nghĩ rằng chỉ được dùng trong các văn phòng chính phủ bụi bặm và trưng bày trong các bảo tàng - nhưng đó lại là thực tế.
Các công ty lớn như HP, IBM, Seagate hay Quantum đều thường xuyên làm như vậy bằng cách dùng chuẩn công nghệ băng từ LTO (Linear Tape Open).
Cuối cùng thì lưu trữ đám mây cũng chỉ là làm thế nào để chúng ta có thể truy cập các tệp của mình dù cho bất kỳ điều gì xảy ra hoặc bằng bất kỳ thiết bị nào. Băng từ có thể được mã hóa và giữ các tệp của bạn an toàn trong 30 năm mà không bị hư hỏng trong khi ổ cứng của máy chủ có thể bị hỏng chỉ trong vòng 5 năm. Các băng từ bị lỗi thời
là bởi việc tải và đọc dữ liệu từ chúng khá rắc rối. Quy trình đó khá
chậm chạp và phức tạp so với tốc độ đáng kinh ngạc của các ổ cứng hiện
đại. Nhưng nếu chỉ dùng để lưu trữ các tệp trong trường hợp máy chủ chuyển
đổi dự phòng bị hỏng hoặc vì lý do tuân thủ pháp luật, thì băng từ là
một giải pháp thay thế hoàn toàn khả thi.
Như vậy, ẩn sau sự tiện dụng và phổ biến của các dịch vụ lưu trữ đám mây là cả một hệ thống lưu trữ dữ liệu trên vô số ổ cứng và băng từ khá phức tạp và ít hào nhoáng. Các đám mây chỉ cung cấp một mặt tiền có tính năng đơn giản là kéo và thả cho người dùng. Điều này đã được chứng minh có kết quả cực kỳ hữu ích và các trung tâm lưu trữ dữ liệu vẫn được điều hành bởi các chuyên gia hiểu được những thách thức liên quan và liên tục tăng cường khả năng để đáp ứng những đòi hỏi đó. Chừng nào nhà cung cấp còn hoạt động, dữ liệu của bạn vẫn có cơ hội được an toàn và dễ dàng truy cập, được sao lưu trên hàng tá máy chủ, và thậm chí có thể được sao lưu ở một hai băng từ cất trong hầm kiểm soát nhiệt độ.
Trong năm 2017, người dùng internet trên toàn thế giới đã tạo ra 2,5 tỷ tỷ byte dữ liệu mỗi ngày, theo báo cáo “Dữ liệu không bao giờ ngủ 5.0” của DOMO năm 2017 . Điều đó có nghĩa là hơn 90% tất cả các thông tin được ghi lại về loài người và các hoạt động của chúng ta đã được tạo ra chỉ trong 3 năm qua. |
Nguồn: