В России появилась платформа для оценки генеративных нейросетей

В России появилась первая независимая платформа на русском языке для оценки качества больших языковых моделей на основе пользовательских задач – LLM Arena. Ее создал Роман Куцев в коллаборации с экспертами по нейросетям и бывшими разработчиками TrainingData.ru. Рейтинг показывает, как генеративные нейросети справляются с реальными задачами пользователей – это один из самых популярных способов оценки качества ответов в мире. Платформа позволяет в режиме реального времени тестировать русскоязычные нейросети и оценивать качество их ответов в соответствии с запросом. Для сравнения пользователю предлагаются две случайные модели — при оценке он не будет знать, кем разработаны нейросети. Можно написать любой запрос, сравнить ответы моделей и выбрать тот, который пользователь посчитает лучшим (например, если он содержит больше фактов или является более развернутым и подкрепленным примерами и т.д.). Если ответы нерелевантные или похожие, это также можно отметить. На основе полученных оценок формируется рейтинг генеративных нейросетей на русском языке. Сейчас пользователям платформы доступны для тестирования 21 наиболее популярная генеративная нейросеть, среди которых как иностранные модели (ChatGPT, LLaMa), так и российские (YandexGPT, GigaChat, Saiga). Список доступных нейросетей регулярно пополняется: новые модели смогут добавить и их разработчики. «Наша цель — создать объективный, открытый и актуальный рейтинг языковых моделей на русском языке. Даже несмотря на...

00:17, 31.07.2024

Источник: itzine.ru

Рубрика: «Наука и Технологии» Поделиться:

Китай стал лидером по патентам в сфере генеративных нейросетей — больше всех у Tencent и Baidu Китай доминирует в глобальной гонке патентов в сфере генеративных нейросетей. Опубликованн ...

Разработан метод оценки эффективности нейросетей в работе с длинными текстами Исследователи из Института AIRI, МФТИ и Лондонского института математических наук (LIMS) с ...

Нейросети встраиваются в арт-рынок // Как работает ИИ-платформа для оценки современного искусства Искусственный интеллект научили оценивать современное искусство. Платформу для расчета рын ...

В экосистеме ПО Группы Астра появилась платформа для управления данными В экосистеме ПО «Группы Астра» появилась платформа для управления данными «Группа Астра» продолжает реализацию запущенной несколько лет назад стратегии M&A и объявл ...