/ /

Яндекс создал свой датасет изображений на базе CTR

Яндекс создал свой датасет изображений на базе CTR

09 июня 2017, 18:15    4773
Яндекс создал свой датасет изображений на базе CTR

Специалисты Яндекса создали свой датасет изображений, использовав для нанесения семантической разметки показатель CTR и нейронные сети, об этом рассказал ведущий специалист Яндекса в области глубинного обучения и компьютерного зрения Константин Лахман на саммите «МАШИНЫ МОГУТ ВИДЕТЬ» (STRELKA, 9 июня 2017 года).

Спикер отметил, что перед компьютерным зрением сегодня стоят многие задачи, одна из которых консолидация изображений  для использования поисковой системой. Сотрудники Яндекса решают задачу поиска изображений по запросам пользователей, а также по сходствам с другими изображениями. Для решения данной задачи необходимо производить разметку изображений, присваивать им теги. В то же время, база размеченных изображений не удовлетворяет запросы пользователей, поделился Лахман.

Для сокращения, затрачиваемого на присвоение тегов времени и создания собственного датасета, Яндекс использовал технологии transfer learning, которая позволяет верифицировать классификации разных датасетов и для облегчения сворачивать слои нейронной сети.

По словам Лахмана, датасет Яндекса создавался с использованием ImageNeta на тысячу классов изображений, ImageNeta на 10 тыс классов, баз Yahoo flickr и т.д. В качестве дополнительного параметра была взята «кликабельность» изображения, т.н. рейтинг CTR. В итоге точность совпадения поискового запроса с предложенным изображением превысила 86%.

Отвечая на вопросы собравшихся, Лахман сказал, что компания пока не имеет планов по публикации датасета.

RUБЕЖ в vk RUБЕЖ на dzen RUБЕЖ на youtube RUБЕЖ в telegram+ RUБЕЖ-RSS

Контакты

Адрес: 121471, г. Москва, Фрунзенская набережная, д. 50, пом. IIIа, комн.1

Тел./ф.: +7 (495) 539-30-20

Время работы: 9:00-18:00, понедельник - пятница

E-mail: info@ru-bezh.ru


Для рекламодателей

E-mail: reklama@ru-bezh.ru

тел.: +7 (495) 539-30-20 (доб. 103)

total time: 0.2543 s
queries: 166 (0.0206 s)
memory: 6 144 kb
source: database
Выделите опечатку и нажмите Ctrl + Enter, чтобы отправить сообщение.