Илья Пытков: «Первый на рынке систем безопасности бот R-GPT начнет работу осенью»
О первом в сфере систем безопасности специализированном боте-помощнике на базе лингвистической нейросети, тонкостях ее обучения, а также специфике проекта, релиз которого запланирован на осень этого года, рассказал журналу RUБЕЖ Илья Пытков, руководитель проекта R-GPT компании «Рубеж».
– Что собой представляет проект R-GPT и какие функции он выполняет?
Илья Пытков: Мы все существуем в эпоху цифровизации, и компании, помимо производства основной продукции, развивают сопутствующие сервисы. Проект R-GPT, над которым мы сейчас работаем, — это интеллектуальный помощник на основе нейросети, который позволяет отвечать на часто задаваемые вопросы, предоставлять нормативные консультации, технические характеристики устройств для клиентов и сотрудников компании, а также имеет обширную базу данных. Нейросеть с лингвистической моделью работает так: получает входящий запрос пользователя, преобразовывает информацию в числовые векторы, ищет векторные соответствия в базе данных, генерит ответ и выдает результат.
Большой плюс R-GPT — обучаемость. То есть, если специалисты не смогли ответить на какой-то вопрос, им может понадобиться много времени, чтобы проработать информацию. С R-GPT все обстоит по-другому. На вопросы, на которые он не знает ответа сегодня, обязательно ответит завтра. Такие запросы падают в базу данных, нейросеть генерирует ответы, которые затем корректируют и закрепляют IT-специалисты.
В первую очередь такой проект нужен внешнему рынку. Это круглосуточная поддержка, доступ ко всей информации нашей базы данных, быстрый ответ в течение 10−60 секунд. Еще один плюс — он всегда под рукой, его могут использовать как интеграторы и сторонние компании, так и менеджеры нашей компании.
R-GPT аккумулирует аналитику внешнего рынка. Все вопросы, которые к нам попадают, классифицируются. И мы уже знаем, какие темы интересуют рынок. R-GPT будет интегрирован на сайтах компаний-партнеров, а также в мессенджерах WhatsApp и Telegram.
– Как сохранить управляемость информацией, чтобы нейросеть не начала «выдумывать» что-то от себя?
И. Пытков: Нейросети обучаются на огромном количестве данных, которые есть в сети. Если мы фокусируемся на определенной сфере, лишняя информация отсекается, и уже, следовательно, из нее берется только сам генеративный модуль речи, а информация, которая доступна для обработки и аналитики, уже только та, которую в нее добавляют IT-специалисты и жестко ее закрепляют.
– Это сделано на основе чата GPT?
И. Пытков: Не совсем. GPT — это чат, серверы которого расположены в других государствах. То есть это сразу потеря конфиденциальности, это угроза безопасности. И в нынешней ситуации мы в любой момент можем потерять к нему доступ. Наш бот разработан на основе многоязыковых моделей, которые находятся в свободном доступе. В них загружено определенное количество символов, и их можно дообучать на основе своих данных, в том числе на русском языке. Сервер находится у нас, и никто посторонний к нему доступа не имеет.
– Расскажите подробнее о техническом решении Livetex.
И. Пытков: Сейчас сервис R-GPT проходит тестирование, им уже пользуются наши сотрудники. И уже этой осенью первый на рынке систем безопасности бот R-GPT будет доступен для всех через сервис Livetex. Это омниканальная платформа для работы с клиентами в любых цифровых каналах. Работает она так. Запрос сначала попадает к боту. Если пользователь не удовлетворен ответом или ему нужна более глубокая проработка вопроса, Livetex направляет его к нашему оператору.
– Какая сеть работает у вас?
И. Пытков: Mistral. Разработана она в США, потом переобучена на разные языки, в том числе русский. Почему было решено взять многоязыковую модель? Практика показывает, что пока русскоязычные нейросети плохо «разговаривают» — у них намного меньше обучающих символов. Например, у Mistral их около миллиарда. А у нейросетей Сбербанка или Яндекса — несколько миллионов. Потому что информация, которая загружается в российские нейросети, проходит постобработку и корректируется. А многоязычные сети используют всю информацию, которая загружена в интернет, и за счет этого их диалоговость выше.
– Какие кадровые и временные ресурсы потребовались для разработки такого продукта как R-GPT?
И. Пытков: Потребовалось три-четыре программиста разных специализаций. Мы не просто строим нейросеть, а работаем с сайтом, мессенджерами, различными интеграциями и т.д.
С нуля до релиза нужно около 6−7 месяцев. И надо понимать, что запуск на сайте — это условное альфа-тестирование, нейросеть будет постоянно корректироваться, дорабатываться, дообучаться.
– Если говорить об экономическом эффекте от внедрения такого инструмента. Очевидно, что это потребовало определенных затрат. Как вы для себя выстраиваете выход на точку безубыточности либо компенсации издержек?
И. Пытков: Механизм прозрачен. Снижение запросов физическим операторам — понятный и прозрачный критерий. По этому показателю мы и будем оценивать его эффективность. Плюс к этому, не нужно забывать, что удобство работы с нашими системами привлекает клиентов, повышает их лояльность — в R-GPT очень много актуальной информации по оборудованию компании, нормативно-правовым актам, которые можно получить в течение 10 секунд.
Полную версию интервью смотрите на нашем youtube-канале RUБЕЖ.TV