Thị trường trí tuệ nhân tạo (AI) đang thúc đẩy một chiến trường mới: chip dành cho AI có khả năng suy luận. Những con chip chuyên dụng này đang biến đổi cách thức hoạt động của AI. Các ông lớn trong ngành chip như Nvidia, IBM, Qualcomm liệu có lung lay trước sự thách thức từ hàng loạt đối thủ mới?

AI suy luận là gì?

Cần rất nhiều sức mạnh tính toán để tạo ra được một chatbot AI. Quá trình này bắt đầu với một quy trình gọi là đào tạo hoặc tiền đào tạo (pretraining – chữ P trong ChatGPT), quy trình này bao gồm các hệ thống AI “học tập” từ các mẫu của kho dữ liệu khổng lồ. Con chip xử lý đồ họa (GPU) thực hiện rất tốt công việc đó, bởi lẽ chúng có thể chạy nhiều phép tính cùng một lúc trên mạng lưới các thiết bị giao tiếp với nhau.

Tuy nhiên, sau khi được đào tạo, công cụ AI tạo sinh vẫn cần chip để thực hiện công việc. Chẳng hạn, khi bạn yêu cầu một chatbot soạn thảo tài liệu, nhận dạng hay tạo ra hình ảnh, dịch ngôn ngữ và xử lý giọng nói thành văn bản, thì đây là lúc chip suy luận phát huy tác dụng. Sau khi tiếp nhận thông tin, nó sẽ dựa trên mô hình đã được đào tạo để suy luận, để rồi đưa ra dự đoán hoặc quyết định mới. Những con chip này ưu tiên hiệu quả, tốc độ và không mất nhiều chi phí để triển khai trong thực tế.

GPU cũng có thể làm được những tác vụ này. Tuy nhiên, việc dùng nó giống như “dùng dao mổ trâu để giết gà” vậy. Do đó, cuộc đua chip cho AI suy luận tập trung vào các loại chip hiệu quả hơn cho các loại tác vụ cụ thể đã mở ra.

Là công ty tiên phong sản xuất các chip máy tính chuyên dụng làm nền tảng cho việc xây dựng các chatbot trí tuệ nhân tạo, Nvidia đã thống trị thị trường và trở thành biểu tượng cho sự bùng nổ AI.

Nhưng Nvidia đang gặp thách thức khi những đối thủ đầy tham vọng tung ra chip cho AI suy luận: loại chip được điều chỉnh nhiều hơn để phù hợp với việc các công cụ AI được sử dụng hằng ngày, đồng thời nó được thiết kế để giảm bớt chi phí tính toán khổng lồ của AI tạo sinh.
“Những công ty này đang nhìn thấy cơ hội trong sản xuất phần cứng chuyên dụng”, Jacob Feldgoise, một nhà phân tích tại Trung tâm An ninh và Công nghệ mới nổi của Đại học Georgetown cho biết. “Khi các mô hình này càng được áp dụng rộng rãi thì sẽ càng cần nhiều máy tính để suy luận, dẫn tới nhu cầu về chip suy luận sẽ cao hơn”.

Trong khi Nvidia vẫn tập trung vào việc đáp ứng nhu cầu khổng lồ cho phần cứng cao cấp hơn từ các công ty công nghệ lớn hơn, thì các công ty khởi nghiệp như Cerebras, Groq và d-Matrix, cũng như các đối thủ sản xuất chip truyền thống của Nvidia — như AMD và Intel — đang tung ra nhiều loại chip suy luận thân thiện hơn, có khả năng đáp ứng được nhu cầu đa dạng hơn và hiệu quả, tiết kiệm hơn.

Ta có thể điểm tên một số “tay chơi” mới đang làm dậy sóng lĩnh vực chip suy luận:

- Cerebras Systems tập trung vào hiệu quả với các chip trên tấm wafer. Công nghệ của họ xử lý các mô hình AI lớn trong khi giảm mức tiêu thụ điện năng.

- d-Matrix đang đổi mới với trọng tâm là AI-as-a-Service (AIaaS). Con chip của họ tối ưu hóa các ứng dụng AI dựa trên đám mây cho doanh nghiệp.

- Groq ưu tiên sự đơn giản và tốc độ. Các con chip của họ cung cấp khả năng xử lý tinh giản, cho phép suy luận nhanh hơn với chi phí điện năng thấp hơn. Cụ thể, loại chip này cho thấy hiệu quả tăng 20% với khối lượng công việc suy luận so với GPU truyền thống.

Chip suy luận có thể là nhân tố thay đổi cuộc chơi trên thị trường trí tuệ nhân tạo. Nguồn: tlciscreative
Chip suy luận có thể là nhân tố thay đổi cuộc chơi trên thị trường trí tuệ nhân tạo. Nguồn: tlciscreative

Bên trong phòng thí nghiệm chip cho AI suy luận

Vào ngày 19/11 vừa qua, Công ty d-Matrix đã cho ra mắt sản phẩm đầu tiên của mình. Tuy chậm chân trong việc tham gia cuộc chơi chip AI (công ty này chỉ mới thành lập vào năm 2019), nhưng tầm nhìn của CEO Sid Sheth đã giúp d-Matrix có thể là đối thủ nặng ký trên đường đua này. Sheth cho biết mình đã nhìn thấy một thị trường rộng lớn ở AI suy luận, trong khi lĩnh vực này vẫn chưa được đánh giá đúng mức. Ông so sánh giai đoạn sau này của học máy với cách con người vận dụng kiến thức đã học ở trường vào thực tế.

“Chúng ta đã dành 20 năm đầu đời để đi học, tự giáo dục bản thân. Đó là đào tạo, đúng không nào? Và rồi trong 40 năm tiếp theo, bạn sẽ vào đời và áp dụng những kiến thức đó – sau đó nhận được phần thưởng nhờ làm việc hiệu quả”, ông nói.

Sản phẩm của d-Matrix có tên là Corsair, bao gồm hai chip với bốn chiplet ở mỗi chip, do Công ty Sản xuất Chất bán dẫn Đài Loan (TSMC) thực hiện – đây cũng là nhà sản xuất hầu hết các chip của Nvidia. Và các chip này được đóng gói cùng nhau theo cách đảm bảo chúng luôn mát.

Những con chip này được thiết kế tại Santa Clara, lắp ráp tại Đài Loan và sau đó được thử nghiệm trở lại tại California. Quá trình thử nghiệm sẽ mất nhiều thời gian và có thể lên tới sáu tháng – nếu có bất kỳ sai sót nào thì nó sẽ được gửi trở lại Đài Loan.

Nhu cầu chip suy luận AI tới từ đâu?

Trong khi những gã khổng lồ công nghệ như Amazon, Google, Meta và Microsoft đang thâu tóm nguồn cung cấp GPU đắt đỏ trong cuộc đua phát triển AI, thì các nhà sản xuất chip AI suy luận đang hướng đến các đối tượng khách hàng rộng hơn.

Ông Alvin Nguyen từ Công ty Nghiên cứu thị trường Forrester cho biết những đối tượng này có thể bao gồm các công ty thuộc bảng xếp hạng các công ty lớn nhất của Mỹ (Fortune 500) muốn sử dụng công nghệ AI tạo sinh mới mà không cần phải xây dựng cơ sở hạ tầng AI của riêng mình. Còn Sheth cho biết ông dự kiến sẽ có mối quan tâm mạnh mẽ với việc tạo ra video AI.

“Với nhiều công ty này, giấc mơ AI của họ là có thể sử dụng dữ liệu doanh nghiệp của riêng mình. Việc mua (chip suy luận AI) sẽ rẻ hơn so với mua GPU tối ưu từ Nvidia và các công ty khác. Nhưng tôi cho rằng sẽ có một đường cong học tập về mặt tích hợp nó”.

Còn nhà phân tích Feldgoise nói rằng không giống như chip tập trung vào đào tạo, AI suy luận ưu tiên tốc độ phản hồi mà một người nhận được từ chatbot. Ông cho biết một nhóm công ty khác đang phát triển phần cứng AI cho suy luận không những có thể chạy trong các trung tâm dữ liệu lớn, mà chúng còn có thể chạy cục bộ trên máy tính để bàn, máy tính xách tay và điện thoại.

Vì sao chip cho AI suy luận quan trọng?

Những con chip được thiết kế tốt hơn có thể giúp các doanh nghiệp giảm được chi phí khổng lồ khi vận hành AI. Điều này cũng có thể ảnh hưởng tới chi phí môi trường và năng lượng cho tất cả mọi người.

Ông Sheth cho biết mối quan tâm lớn hiện nay là “liệu chúng ta có thiêu rụi hành tinh này trong hành trình tìm kiếm AGI - trí thông minh giống con người hay không?”

Hiện nay, có nhiều dự đoán về thời điểm AI đạt tới mức trí thông minh tổng quát (có khả năng suy luận như con người), các dự đoán dao động từ vài năm sau tới cả thập niên nữa.

Nguồn:

techxplore, tlciscreative

Bài đăng KH&PT số 1320 (số 48/2024)