В России появилась платформа для оценки генеративных нейросетей

В России появилась платформа для оценки генеративных нейросетей

В России появилась первая независимая платформа на русском языке для оценки качества больших языковых моделей на основе пользовательских задач – LLM Arena. Ее создал Роман Куцев в коллаборации с экспертами по нейросетям и бывшими разработчиками TrainingData.ru. Рейтинг показывает, как генеративные нейросети справляются с реальными задачами пользователей – это один из самых популярных способов оценки качества ответов в мире. Платформа позволяет в режиме реального времени тестировать русскоязычные нейросети и оценивать качество их ответов в соответствии с запросом. Для сравнения пользователю предлагаются две случайные модели — при оценке он не будет знать, кем разработаны нейросети. Можно написать любой запрос, сравнить ответы моделей и выбрать тот, который пользователь посчитает лучшим (например, если он содержит больше фактов или является более развернутым и подкрепленным примерами и т.д.). Если ответы нерелевантные или похожие, это также можно отметить. На основе полученных оценок формируется рейтинг генеративных нейросетей на русском языке. Сейчас пользователям платформы доступны для тестирования 21 наиболее популярная генеративная нейросеть, среди которых как иностранные модели (ChatGPT, LLaMa), так и российские (YandexGPT, GigaChat, Saiga). Список доступных нейросетей регулярно пополняется: новые модели смогут добавить и их разработчики. «Наша цель — создать объективный, открытый и актуальный рейтинг языковых моделей на русском языке. Даже несмотря на...
00:17, 31.07.2024
Источник: itzine.ru  
Рубрика: «Наука и Технологии»   Поделиться: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Китай стал лидером по патентам в сфере генеративных нейросетей  больше всех у Tencent и BaiduКитай стал лидером по патентам в сфере генеративных нейросетей — больше всех у Tencent и Baidu Китай доминирует в глобальной гонке патентов в сфере генеративных нейросетей. Опубликованн ...

Разработан метод оценки эффективности нейросетей в работе с длинными текстамиРазработан метод оценки эффективности нейросетей в работе с длинными текстами Исследователи из Института AIRI, МФТИ и Лондонского института математических наук (LIMS) с ...

В экосистеме ПО Группы Астра появилась платформа для управления даннымиВ экосистеме ПО «Группы Астра» появилась платформа для управления данными «Группа Астра» продолжает реализацию запущенной несколько лет назад стратегии M&A и объявл ...

Метки ставить негде // Как могут маркировать контент от нейросетей в РоссииМетки ставить негде // Как могут маркировать контент от нейросетей в России Российские власти задумались о необходимости маркировки контента, который создан с помощью ...

CHASPIK.SPB.RU Поиск в новостях