NtechLab, мировой лидер в области решений для видеоаналитики на основе нейронных сетей и технологический партнёр Госкорпорации Ростех, сообщает, что алгоритм компании занял третье призовое место по итогам международного соревнования Deepfake Detection Challenge по распознаванию дипфейков на видео. В конкурсе, проводившемся Amazon, Facebook и Microsoft, приняло участие более 2200 команд со всего мира. Исходный код алгоритма NtechLab будет опубликован в свободном доступе для продвижения мировой борьбы с неконтролируемым производством дипфейков.
Дипфейк (deepfake) — методика синтеза изображения, основанная на технологии нейросетей. Дипфейки используются для соединения и наложения существующих изображений и видео на исходные изображения или видеоролики. Дипфейки могут быть использованы для замены определённых элементов изображения на желаемые образы, в частности для создания роликов, которые в дальнейшем могут быть использованы для политической манипуляции, личной выгоды или мести. Опасность неконтролируемого производства дипфейков признана на международном уровне. В частности, в США и Китае был принят ряд законов, регулирующих производство подобных видеороликов.
Конкурс Deepfake Detection Challenge проводился в течение 4 месяцев на популярной платформе для технологических соревнований в области машинного обучения Kaggle. Участники соревнования должны были представить алгоритмы, в автоматическом режиме определяющие, использовалась ли при производстве видеоролика технология Deepfake. Алгоритмы тестировались на серии 10-секундых роликов, на части из которых лица людей были заменены с помощью Deepfake. Для тестирования использовались как ролики, специально созданные организаторами для конкурса, так и реальные видео с дипфейками, которые можно встретить на интернет-площадках.
На части видеороликов специально использовались приглушенное освещение и ракурсы, осложняющие выявление Deepfake. Таким образом, определить ролики, при производстве которых использовалась технология Deepfake, без применения алгоритмов на основе нейросетей было невозможно. Общий призовой фонд конкурса составил 1 млн. $. Команда NtechLab заняла третье место со стоимостью приза в 100 000 $.
«Благодаря накопленной нашей командой экспертизе NtechLab представила в рамках конкурса одно из наиболее стабильно работающих решений, показавшее отличный результат как роликах, созданных специально для конкурса, так и на «реальных» видео с различных интернет-площадок. Залогом нашего успеха стал талант инженера Азата Давлетшина, применившего оригинальный способ обучения нейросетей, в равной степени основанный на результатах проведённых экспериментов и творческой интуиции. В соответствии с условиями конкурса, исходный код алгоритма NtechLab будет опубликован в свободном доступе для продвижения мировой борьбы с неконтролируемым производством дипфейков» - сказал со-основатель NtechLab и директор R&D компании Артём Кухаренко.
Алгоритм, разработанный инженерами NtechLab в рамках конкурса, будет использован для дальнейшего развития технологий компании. В частности, эти наработки помогут для выявления сложных случаев мошенничества в сценариях распознавания лиц, используемых в банковско-финансовой сфере.
NtechLab – мировой лидер по скорости и точности распознавания лиц, силуэтов и действий на видео. Продукты компании востребованы в сферах общественной и корпоративной безопасности, розничной торговли, финансового сектора, индустриях развлечений и гостеприимства. Алгоритмы NtechLab неоднократно доказывали свое техническое превосходство в рамках репрезентативных международных конкурсов. В 2017 году разработка NtechLab была признана лучшей Национальным институтом стандартов и технологий (NIST) Министерства торговли США, а также заняла первое место по итогам соревнования американского Агентства передовых исследований в сфере разведки в категориях «самый точный» и «самый быстрый» алгоритм. В 2018 году NtechLab вошла в тройку победителей конкурса WIDER Pedestrian Challenge по детектированию пешеходов на основе их силуэтов, в 2019 году – заняла второе место на международном конкурсе ActEV-PC по распознаванию действий на видео.