Vi xử lý NorthPole của IBM không cần truy cập vào bộ nhớ ngoài, tăng cường sức mạnh tính toán và tiết kiệm năng lượng.

Nghiên cứu mô tả NorthPole được xuất bản trên Science cho thấy có thể tích hợp khả năng tính toán và ghi nhớ trên một con chip, thay vì tách khả năng tính toán được thực hiện trên chip và khả năng ghi nhớ được thực hiện trên bộ nhớ ngoài (RAM) như hiện nay.

NorthPole không mất thời gian và năng lượng để truy xuất thông tin từ bộ nhớ ngoài, do đó thực hiện các tác vụ như nhận dạng hình ảnh nhanh hơn so với các kiến trúc hiện tại trong khi tiêu thụ năng lượng ít hơn rất nhiều. “Tôi cảm thấy bài báo sẽ làm lung lay tư duy chung về kiến trúc máy tính", Damien Querlioz, nhà nghiên cứu điện tử nano tại Đại học Paris-Saclay (Pháp), nói.

NorthPole được thiết kế để chạy các mạng thần kinh - hàng loạt các lớp xếp chồng, mỗi lớp gồm nhiều đơn vị tính toán đơn giản, được lập trình để nhận dạng các mẫu lặp lại trong dữ liệu. Lớp dưới cùng lấy dữ liệu, chẳng hạn như các điểm ảnh trong một hình ảnh. Mỗi lớp kế tiếp sẽ phát hiện các mẫu lặp lại và chuyển thông tin sang lớp tiếp theo để tiếp tục tìm các mẫu lặp lại trong thông tin đã có, và độ phức tạp sẽ tăng dần. Kết quả, từ một kho hình ảnh, lớp trên cùng của mạng thần kinh có thể xác định những hình ảnh có chứa một con mèo, một chiếc ô tô hoặc các vật thể cụ thể.

Một số chip máy tính hiện có xử lý các phép tính này một cách hiệu quả, nhưng chúng cần gửi dữ liệu mỗi lớp trong mạng thần kinh tính toán được sang RAM, và lại lấy dữ liệu về từ RAM để cho lớp tiếp theo thực hiện tính toán. Việc truyền dữ liệu giữa chip và RAM làm cả quá trình chậm lại, hiện tượng này được gọi là nút thắt cổ chai Von Neumann, theo tên nhà toán học John von Neumann, người đầu tiên tạo ra kiến trúc tiêu chuẩn của máy tính ngày nay gồm một bộ xử lý và một bộ nhớ riêng biệt.

Chip NorthPole do IBM phát triển kết hợp bộ nhớ và khả năng xử lý, cải thiện đáng kể khả năng nhận dạng hình ảnh và các tác vụ mạng thần kinh khác.

Nút thắt cổ chai Von Neumann là một trong những yếu tố quan trọng nhất làm chậm các ứng dụng máy tính, bao gồm cả AI. Quy trình vận chuyển dữ liệu qua lại cũng tiêu tốn năng lượng. Đồng tác giả nghiên cứu, Dharmendra Modha, kỹ sư máy tính tại IBM, cho biết để mô phỏng được bộ não con người bằng loại kiến trúc này sẽ cần năng lượng từ khoảng 12 lò phản ứng hạt nhân.

NorthPole được tạo thành từ 256 lõi hay đơn vị tính toán, mỗi lõi chứa bộ nhớ riêng. Bằng cách này, tác động của nút thắt cổ chai Von Neumann bị giới hạn trong một lõi, theo Modha, nhà khoa học trưởng về điện toán lấy cảm hứng từ não bộ tại Trung tâm nghiên cứu Almaden của IBM. Các lõi được nối với nhau thành một mạng lưới, lấy cảm hứng từ các kết nối chất trắng giữa các phần của vỏ não người.

Nguyên tắc thiết kế này giúp NorthPole đánh bại các chip AI tiên tiến nhất hiện có với tỷ số đáng kể trong các bài kiểm tra tiêu chuẩn về nhận dạng hình ảnh, trong khi chỉ sử dụng 1/5 năng lượng. Các tác giả ước tính nếu thiết kế của NorthPole được sản xuất bằng quy trình hiện đại nhất hiện nay, tạo ra kích thước bóng bán dẫn nhỏ hơn, thì hiệu quả của nó sẽ tốt hơn 25 lần so với các chip AI hiện nay.

Tuy nhiên bộ nhớ của NorthPole không lớn như RAM riêng biệt. Vi xử lý này hiện chỉ có 224 megabyte bộ nhớ, không đủ cho các mạng thần kinh khổng lồ như ChatGPT, cần đến ít nhất vài nghìn megabyte dữ liệu. Ngoài ra, NorthPole chỉ có thể chạy các mạng thần kinh đã được đào tạo trước trên một máy tính riêng biệt. Nhưng các tác giả từ IBM nói rằng kiến trúc NorthPole có thể hữu ích trong các ứng dụng đòi hỏi tốc độ xử lý cao thay vì lượng dữ liệu lớn, chẳng hạn như mạng thần kinh vận hành xe tự lái.

Nguồn: