Copy для картинки: теперь от Яндекса

yan1.pngМультимедийный поиск — это одна из тех задач, которая до сих пор не решена на достаточно высоком уровне поисковыми системами. Хотя поисковики уже умеют искать не только по текстовым тегам, а еще и по другим параметрам картинок и видео, по сравнению с текстовым поиском эту задачу еще предстоит решить.

Новость, объявленная компанией Яндекс несколько дней назад, состоит в серьезном обновлении своего раздела поиска по изображениям. Новые функции, появившиеся у сервиса Яндекс.Картинки, позволяют находить одинаковые изображения.

При этом проводится поиск не только абсолютно схожих изображений, а еще и картинок измененных различными способами. Яндекс утверждает, что умеет искать картинки и после изменения размера, добавления надписей, и даже изменения степени сжатия.

Найденные картинки-дубликаты не отображаются в выдаче — наличие копий можно увидеть на странице предварительного просмотра картинки.

При этом сервис предлагает список сайтов, на которых размещена копия, рядом указываются размеры найденных дубликатов.

В пресс-релизе о запуске этого сервиса сказано, что «в Рунете из 600 млн картинок половина уникальна (300 млн), вторая половина склеивается в отношении 3:1, 200 из 300 млн имеют дубликаты только на своем сайте». Данные более чем впечатляют.

Также в пресс-релизе Яндекса описаны некоторые статистические закономерности, обнаруженные в результате поиска изображений. Так разработчики сервиса утверждают, что «самый многочисленный класс картинок, оказавшийся в выигрыше, это пары — исходное изображение и его уменьшенная копия, лежащие на одном сайте. Оказывается, что маленькие картинки гораздо чаще хорошо подписаны, но они не попадают на первые страницы поисковиков из-за своих размеров. Благодаря новой технологии мы научились находить маленькую картинку, а показывать ее большой оригинал».
Задача поиска картинок-дубликатов с разной степенью результативности решается многими поисковыми системами. Среди них — Picollator, TinEye, Picitup.

В ближайших записях мы проведем тест сервисов поиска похожих изображений и определим наиболее качественные из них.

  • Rinadoo

    Найти идентичные картинки — задача, конечно, довольно сложная. Но она значительно проще, чем задача распознавания содержания изображений, когда нужно понять, что именно изображено на фото и подобрать контент с похожим содержанием. Из перечисленных систем это пытается сделать только picollator.com.