Các nhà khoa học đã sáng tạo ra một phương pháp gọi là Quixote. Theo đó, họ để trí tuệ nhân tạo đọc và hiểu các câu chuyện từ Internet. Sau đó, phương pháp Quixote sử dụng các "tín hiệu phần thưởng" để củng cố hành vi tốt và trừng phạt hành vi xấu trong các thử nghiệm.