Được mệnh danh là một trong “bốn con rồng công nghệ AI” của Trung Quốc, song Megvii đang chật vật để vừa vươn mình ra quốc tế, vừa giữ vững vị thế của mình tại thị trường nội địa.

Trung Quốc vẫn luôn ấp ủ tham vọng trở thành quốc dẫn đầu thế giới về trí tuệ nhân tạo. Vào tháng 7/2017, Hội đồng Nhà nước nước này đã ban hành “Kế hoạch phát triển trí tuệ nhân tạo thế hệ mới”, trong đó vạch ra chiến lược trở thành cường quốc AI hàng đầu vào năm 2030. Nhằm đạt được mục tiêu này, các công ty nội địa - đặc biệt trong lĩnh vực học sâu (deep learning) - đã phát triển nhanh như vũ bão, nhờ sự ra đời của dữ liệu lớn và những tiến bộ trong công suất tính toán.

Hệ thống nhận dạng khuôn mặt Face++. Ảnh: Simon Song

Một trong những điểm nhấn về đổi mới sáng tạo đó là Brain++, một nền tảng AI giúp các doanh nghiệp xây dựng khả năng triển khai các thuật toán tùy chỉnh trên quy mô lớn và đẩy nhanh quá trình chuyển đổi kỹ thuật số của riêng họ. Brain++ là sản phẩm của Megvii, một trong “bốn con rồng công nghệ AI” Trung Quốc - bên cạnh Cloudwalk, Yitu và SenseTime.
Được thành lập vào năm 2011, đặt trụ sở tại Bắc Kinh, Megvii nổi danh là nhà phát triển công nghệ học sâu đã tạo ra phần mềm nhận dạng khuôn mặt Face++, nền tảng thị giác máy tính mã nguồn mở lớn nhất thế giới. Phần lớn những đột phá về công nghệ của Megvii trong những năm gần đây là công lao của TS. Sun Jian, nhà khoa học quá cố đã qua đời vào sáng ngày 14/6 vừa qua ở tuổi 46. Ông phụ trách bộ phận nghiên cứu của công ty, chuyên về thị giác máy tính và nhiếp ảnh điện toán.

Công nghệ nhận diện khuôn mặt của Megvii.

TS. Sun Jian gia nhập Megvii vào năm 2016, ông đảm nhiệm vị trí giám đốc nghiên cứu. Ông đã xây dựng các thuật toán giúp các mạng neuron sâu tiên tiến của Megvii có thể được triển khai trên các nền tảng điện toán đám mây, điện thoại di động và điện toán biên với hiệu suất cao hơn, tốc độ đào tạo nhanh hơn.

Ông còn được biết đến là “cha đẻ” của ResNet, một mạng neuron sâu dựa trên nền tảng đám mây. Nhiều chuyên gia đánh giá đây là bước đột phá lớn trong công nghệ xử lý hình ảnh. Nhờ những kinh nghiệm này, trong thời gian làm việc tại Megvii, TS. Sun đã góp phần quan trọng trong việc tạo ra ShuffleNet - một mạng neuron sâu được thiết kế để sử dụng trên các thiết bị có khả năng tính toán tương đối hạn chế như điện thoại di động, và DorefaNet - một mô hình mạng neuron sâu phù hợp với chip.

Những đột phá trên đã đưa danh tiếng của Megvii lên đỉnh cao, họ phát triển các công nghệ nhận dạng khuôn mặt cho các dự án giám sát của chính phủ; cung cấp công nghệ thị giác máy tính Face++ cho nhiều doanh nghiệp nổi tiếng như Lenovo, Foxconn, Ant Financial, Xiaomi và Vivo; cung cấp dịch vụ quản lý an ninh tại nơi làm việc, các tổ chức giáo dục và các sự kiện lớn.

Bên cạnh đó, Megvii còn cung cấp các thiết bị IoT hỗ trợ sản xuất, hậu cần và quản lý đô thị tại Trung Quốc. Hoạt động như một cấu trúc nền tảng hỗ trợ cho quá trình đào tạo thuật toán và cải tiến mô hình, Brain++ giúp giải quyết các nút thắt mà các doanh nghiệp gặp phải khi cố gắng số hóa hoạt động của họ trên quy mô lớn. Nền tảng có thể xây dựng toàn bộ vòng đời của sản xuất thuật toán, từ quản lý dữ liệu đến tối ưu hóa mô hình và lập kế hoạch phát triển.

Điều này sẽ tiết kiệm cho doanh nghiệp rất nhiều thời gian, công sức, tiền bạc, bởi việc phát triển các thuật toán AI là một nhiệm vụ khó khăn, đòi hỏi nhiều nỗ lực trong nghiên cứu và phát triển kỹ thuật hệ thống. Brain++ không chỉ tạo điều kiện phát triển thuật toán nhanh chóng mà còn giúp đào tạo thuật toán quy mô lớn. Nhờ đó, nó giúp rút ngắn 80% thời gian phát triển thuật toán và giảm 55% chi phí sản xuất thuật toán tổng thể. Đáng chú ý, nền tảng học sâu có thể xây dựng các thuật toán tùy chỉnh để phù hợp với nhu cầu của từng công ty khác nhau.

Theo ông Tang Wenbin, đồng sáng lập và cũng là CTO của Megvii, bằng cách tích hợp học máy tự động vào trong hệ thống của mình, Brain ++ có thể "sử dụng các thuật toán để đào tạo các thuật toán khác và sử dụng AI để tạo ra AI".

Thách thức TensorFlow của Google và Pytorch của Facebook

Học sâu đã trải qua một chặng đường dài kể từ khi ý tưởng này được nhen nhóm vào những năm 1950. Nó là một nhánh con của Học máy (Machine learning), liên quan đến các thuật toán lấy cảm hứng từ cấu trúc và chức năng của não nhằm bắt chước trí thông minh của con người.

Trong thập kỷ qua, ngành công nghiệp AI đã trải qua quá trình phát triển nhanh chóng, dẫn đến các mô hình học tập mới. Năm 2012 là một năm đột phá của học sâu với sự phát triển của AlexNet, một mạng neuron đa lớp phức tạp có thể nhận diện các mẫu trực quan trực tiếp từ hình ảnh pixel mà không cần xử lý trước.

Sự ra đời của TensorFlow - do Google phát triển - vào năm 2015 đã đánh dấu một cột mốc quan trọng khác trong quá trình phát triển khung (framework) AI. Thư viện mã nguồn mở được viết bằng C++ và Python cho phép các doanh nghiệp kinh doanh cung cấp dữ liệu vào các mô hình AI và đào tạo hệ thống của họ mà không cần phải xây dựng từ đầu.

Cũng giống như TensorFlow, Brain++ sử dụng các đồ thị tính toán để tạo ra các thuật toán cho mạng neuron sâu của nó. Tuy nhiên, những nhà sáng lập đã định hướng phát triển Brain++ theo một con đường khác. Ban đầu, Brain++ được phát triển như một ứng dụng nội bộ của Megvii, nhằm hỗ trợ các nhân viên R&D trong công ty truy cập vào dữ liệu và triển khai ứng dụng AI dễ dàng hơn. Tuy nhiên, vào năm 2020, Megvii quyết định tung dịch vụ ra thị trường, bởi họ biết các doanh nghiệp khác cũng đang cần nền tảng này để tối ưu hóa hoạt động kinh doanh.

Nhận thức được rằng dữ liệu lớn rất quan trọng đối với việc cải tiến AI và tối ưu hóa hiệu suất đào tạo, Megvii đã nỗ lực đầu tư vào các bộ dữ liệu mới và cải thiện chất lượng dữ liệu. Đầu năm nay, với sự hợp tác của tổ chức phi lợi nhuận Viện Trí tuệ Nhân tạo Bắc Kinh, công ty AI đã xây dựng Objects365, một trong những bộ dữ liệu phát hiện đối tượng (object) lớn nhất thế giới. Tập dữ liệu chứa 365 danh mục, hơn 638.000 hình ảnh.

Đồng thời, Megvii đã kết hợp học đa nhiệm trong kiến ​​trúc học sâu của mình, cho phép giải quyết một số nhiệm vụ cùng một lúc để nâng cao hiệu quả học tập. Trong một cuộc phỏng vấn vào năm 2017, người đồng sáng lập Megvii, Yin Qi cho biết, “Chúng tôi đang nỗ lực hết sức để phát triển một hệ thống ‘tất cả trong một’”.

Bằng cách thiết kế Brain++ như một mô hình học sâu phát triển các thuật toán hoàn chỉnh từ đầu đến cuối, hàng trăm chuyên gia có thể thực hiện đồng thời hàng chục nghìn nhiệm vụ đào tạo trên hàng nghìn đơn vị xử lý đồ họa thông qua nền tảng.

Những thách thức đối với Megvii

Với ba phân khúc kinh doanh chính - IoT tiêu dùng, IoT thành phố thông minh và IoT chuỗi cung ứng - Megvii đã tận dụng các công nghệ AI độc quyền của mình để thúc đẩy tăng trưởng.

Nhưng phần lớn sự tăng trưởng của Megvii còn nhờ vào những chính sách thúc đẩy ứng dụng công nghệ AI trong xây dựng thành phố thông minh của Chính phủ Trung Quốc. Việc Megvii phụ thuộc quá nhiều vào các hợp đồng cung cấp dịch vụ giám sát cho chính phủ khiến nhiều chuyên gia không khỏi nghi ngờ liệu Megvii có đủ sức trở thành một công ty AI toàn cầu thực sự trong tương lai.

Ngoài ra, mặc dù Megvii ghi nhận tăng trưởng doanh thu trong những năm gần đây, nhưng công ty chưa thu được lợi nhuận, bởi họ đang đầu tư rất nhiều tiền vào R&D. Công ty đã báo lỗ 6,64 tỷ NDT (1 tỷ USD) trong năm 2019 và 2,85 tỷ NDT (437,9 triệu USD) trong ba quý đầu năm 2020. Trong nửa đầu năm 2021, Megvii cũng báo cáo khoản lỗ 1,86 tỷ NDT (268 triệu USD).

Megvii còn phải đối mặt với nhiều thách thức ở phía trước. Công ty hiện phải cạnh tranh gay với các đối thủ trên khắp toàn cầu như PyTorch của Meta và TensorFlow của Google, những bộ thư viện học sâu đã được áp dụng rộng rãi trên toàn thế giới.

Ở thị trường nội địa, Brain++ phải nỗ lực tranh giành thị phần với các ông trùm công nghệ khác, bao gồm MindSpore của Huawei và X-DeepLearning của Alibaba, cả hai công ty này đều tiếp cận được nhiều nguồn lực tài trợ, cơ sở hạ tầng công nghệ và nhân tài.

Một đối thủ lớn khác mà Brain++ phải dè chừng là PaddlePaddle của Baidu. Ra mắt vào năm 2016, PaddlePaddle là nền tảng học sâu mã nguồn mở đầu tiên của Trung Quốc ra mắt tại Trung Quốc. Nền tảng này hiện đang được 4 triệu nhà phát triển và hơn 157.000 doanh nghiệp từ vô số lĩnh vực sử dụng.

Tương lai của Megvii vẫn còn là một câu hỏi mở, liệu họ có thể vươn tầm ra quốc tế, hay chỉ dừng lại là một trong những công ty AI lớn tại Trung Quốc?

Theo Kr-Asia