Google Research đang tổ chức một cuộc thi, trong đó các đội thi sẽ định vị khoảnh khắc... con mèo hắt xì trong các video.

Hãy tưởng tượng bạn có thể tìm kiếm đến chính xác khoảnh khắc một người đang thổi nến hoặc đang xả rác trong bất kỳ video nào giữa hàng trăm ngàn video, mặc dù người xuất bản video không hề đặt tiêu đề hoặc mô tả video với dữ liệu liên quan đến khoảnh khắc đó.

Ý tưởng này cũng có thể được áp dụng để nhận diện các sự kiện, khoảnh khắc quan trọng về giao thông, an ninh, hành vi xã hội, v.v... đang lẩn khuất trong kho dữ liệu video khổng lồ của Youtube. Công nghệ này được gọi là định vị khoảnh khắc tức thời trong video và Google Research đang tìm kiếm các đội nghiên cứu để phát triển công nghệ này xa hơn nữa.

Trong hầu hết các tìm kiếm trên web, việc truy xuất và xếp hạng video được thực hiện bằng cách khớp các thuật ngữ truy vấn với các dữ liệu mà nhà xuất bản video cung cấp. Tuy nhiên, trên thực tế mỗi video có thể chứa một loạt các khoảnh khắc, chủ đề mà người tải lên không nhắc đến trong dữ liệu mô tả. Định vị khoảnh khắc tức thời có thể cải thiện khả năng tìm kiếm video và trích xuất khoảnh khắc nổi bật.

Việc phát hiện những khoảnh khắc hành động nhất định cũng sẽ giúp đảm bảo chặt chẽ hơn tính an toàn của nội dung video (chẳng hạn như tìm kiếm và loại bỏ các video chứa các hành động, khoảnh khắc bạo lực).

Google Research đang tổ chức một cuộc thi, trong đó các đội sẽ định vị khoảnh khắc xuất hiện một sự kiện nhất định trong các video, giữa một kho dữ liệu video lớn chưa từng có trong các cuộc thi tương tự. Sự kiện cụ thể mà cuộc thi đưa ra là: con mèo hắt hơi vào thời điểm nào trong các video?

Nếu thành công, các mô hình học máy mới này sẽ cải thiện đáng kể sự hiểu biết và khả năng phân tích, chọn lọc khoảnh khắc trong video; không chỉ xác định các chủ đề, sự kiện liên quan đến video mà còn xác định chính xác mốc thời gian trong video mà sự kiện đó diễn ra.

Tổng giải thưởng cho cuộc thi lần này là 25.000 USD, các đội chiến thắng sẽ được tham gia workshop về phân tích video do Youtube tổ chức tại ICCV 2019 tại Seoul (Hội nghị quốc tế về tầm nhìn máy tính). Các đội tham gia cuộc thi phải đăng ký trước ngày 6/9/2019, chi tiết về thể lệ, yêu cầu xem tại https://www.kaggle.com/c/youtube8m-2019/overview/timeline.