Các nhà nghiên cứu tại Microsoft đã phát triển một công nghệ dựa trên trí tuệ nhân tạo (AI) để người dùng có thể yêu cầu vẽ một con chim màu vàng với đôi cánh màu đen và mỏ ngắn bằng… văn bản.

Đánh giá ban đầu của nhóm Microsoft AI cho thấy hệ thống của công ty có thể tạo hình ảnh từ mô tả trong văn bản với số lượng đường nét cùng độ chính xác khá ngạc nhiên. Về cơ bản, hệ thống sẽ không tạo ra hình ảnh như bức ảnh chụp mà thay vào đó nó tạo ra bản vẽ thực.

Hệ thống AI của Microsoft có thể giúp vẽ ra bức hình một con chim theo mô tả của bạn.
Hệ thống AI của Microsoft có thể giúp vẽ ra bức hình một con chim theo mô tả của bạn.

Nhà nghiên cứu Microsoft AI, Xiaodong He, nói trong một tuyên bố rằng nếu đi đến Bing và tìm kiếm một con chim, bạn sẽ có một bức tranh chim. Nhưng ở đây, những hình ảnh được tạo ra bởi máy tính, theo từng điểm ảnh và chi tiết. He cho biết: “Những con chim này có thể không tồn tại trong thế giới thực - chúng chỉ là một khía cạnh trong trí tưởng tượng của chúng ta đối với chim”.

Trong khi hình thức hiện tại của công nghệ vẽ này vẫn chưa thực sự hoàn hảo nhưng sẽ không khó để tưởng tượng về một tương lai mà nó có thể hoạt động như một trợ lý phác hoạ cho họa sĩ và nhà thiết kế nội thất, hoặc một công cụ để tinh chỉnh hình ảnh dựa trên đầu vào bằng giọng nói. Xa hơn, He tưởng tượng những bộ phim hoạt hình có thể được tạo ra từ một kịch bản viết.

Nhóm nghiên cứu của Microsoft đã bắt đầu nghiên cứu về viễn cảnh máy tính kết hợp hệ thống xử lý ngôn ngữ tự nhiên CaptionBot - một hệ thống AI tự động viết các phụ đề cho ảnh - sẽ giúp tạo ra hệ thống SeeingAI có thể trả lời những câu hỏi của mọi người về hình ảnh, rất hữu ích nếu bạn bị mù.

Công nghệ hiện tại bao gồm hai phần: một tạo ra các hình ảnh được biết đến như là một Generative Adversarial Network (GAN), và một đánh giá chất lượng của các hình ảnh được tạo ra gọi là phân biệt. Các bot vẽ được huấn luyện theo cặp hình ảnh và chú thích, dạy AI học những từ nào đi kèm với ảnh nào.

Nhóm nghiên cứu cũng tạo ra một mô tả toán học về sự chú ý của con người, đó là những gì chúng ta sử dụng khi vẽ các bức tranh từ các mô tả phức tạp như một cánh đỏ, một cánh vàng trên chim.