Из пресс-релиза компании
Яндекс анонсировал нейросети YandexGPT 3 — третье поколение языковых моделей Яндекса. Первая доступная языковая модель линейки — YandexGPT 3 Pro, которая уже доступна на сайте Yandex Cloud. Она лучше работает со сложными запросами и точнее следует заданному формату ответов, поэтому будет полезна при решении реальных задач компаний и в IT-продуктах. Кроме того, бизнес-пользователи смогут дообучить новую нейросеть самостоятельно.
YandexGPT 3 Pro можно встроить в продукты бизнеса через API. Перед этим качество работы нейросети можно оценить в деморежиме. Новым зарегистрированным пользователям доступно 100 бесплатных запросов в час.
Новые возможности YandexGPT 3 Pro
YandexGPT 3 Pro эффективнее решает сложные задачи и лучше понимает контекст беседы по сравнению с YandexGPT 2. Языковая модель хорошо обрабатывает инструкции с несколькими условиями, а ещё — корректнее работает с фактами, даёт более точные и полные ответы и допускает меньше стилистических ошибок. При этом YandexGPT 3 Pro может обрабатывать существенно больше запросов за единицу времени, чем языковые модели прошлого поколения YandexGPT.
Новая нейросеть особенно хорошо проявляет себя в таких сферах, как клиентская поддержка, онлайн-продажи, цифровые коммуникации, маркетинг, реклама и управление персоналом. Также языковая модель лучше работает с документами: например, составляет договоры, счета, нормативную документацию, должностные инструкции и не только. Задачи, связанные именно с перечисленными отраслями, составили значительную часть набора данных для обучения YandexGPT 3.
Стоимость использования нейросети снизилась почти в два раза. Заказчики смогут самостоятельно дообучить YandexGPT 3 Pro в сервисе ML-разработки Yandex DataSphere для того, чтобы она ещё лучше соответствовала потребностям конкретного бизнеса. Чтобы запустить процесс дообучения, нужно загрузить в DataSphere файл с примерами запросов и эталонными ответами на них. Такая нейросеть будет доступна только дообучившей её компании.
Качество ответов YandexGPT 3
Для оценки качества работы YandexGPT 3 Pro разработчики использовали несколько тестов. Первый из них — YaMMLU_ru, локализованная на русский язык версия международного бенчмарка MMLU.
Также разработчики применили методику тестирования Side by Side (SBS) для того, чтобы оценить, как новая модель справляется с генерацией идей, обобщением информации, задачами классификации, созданием контента и другими бизнес-задачами. В среднем YandexGPT 3 отвечала лучше, чем YandexGPT 2 в 67% случаев. При работе с пользовательскими запросами и обработке бизнес-запросов новая нейросеть отвечала лучше в 69% и 60% случаев соответственно.
Новый стандарт в следовании формату запроса
Для проверки того, насколько хорошо ответы первой нейросети из линейки YandexGPT 3 соответствуют заданному в запросе формату, разработчики создали русскоязычный тест на базе бенчмарка IFEval. При этом они значительно расширили список решаемых задач и усложнили их.
В сравнении с YandexGPT 2 качество ответов YandexGPT 3 улучшилось на 10 процентных пунктов, а их консистентность увеличилась в два раза. Это значит, что нейросеть научилась лучше понимать, какими именно должны быть ответы на одинаковые по сути, но сформулированные по-разному запросы.
Кроме того, новая языковая модель значительно реже ошибается. По сравнению с YandexGPT 2 количество фактических ошибок сократилось с 16,4% до 13,5%, а доля неподтверждённой информации в ответах снизилась с 6,4% до 5%. Количество ситуаций, когда модель не дает ответ на вопрос пользователя, уменьшилось в 5 раз. Все эти проверки проводились с помощью специального набора особенно сложных запросов, применимых в реальном бизнесе.
О YandexGPT
YandexGPT — нейросеть, которая умеет создавать и перерабатывать тексты, предлагать новые идеи и учитывает контекст беседы с пользователем. YandexGPT кратко пересказывает статьи из интернета в Яндекс Браузере и на 300.ya.ru, обобщает информацию из отзывов о товарах в Поиске и на Маркете, помогает создавать описания товаров продавцам Маркета, пишет рекламные объявления для пользователей Яндекс Бизнеса и не только. Нейросеть можно протестировать в бизнесе — для этого нужно зарегистрироваться в Yandex Cloud и использовать API.