Компания Anthropic, специализирующаяся на искусственном интеллекте (ИИ) и "общественной пользе", 11 июля запустила Claude 2, что стало еще одной вехой в году, когда, казалось бы, не прекращался прогресс в секторе генеративного ИИ.

Представляем вам Клода 2! Наша новейшая модель обладает улучшенными характеристиками в области кодирования, математики и рассуждений. Она может давать более длинные ответы и уже доступна на новом бета-сайте https://t.co/uLbS2JNczH в США и Великобритании. pic.Twitter.com/jSkvbXnqLd

- Anthropic (@AnthropicAI) 11 июля 2023 г.

Как сообщается в блоге компании, Claude 2 демонстрирует улучшения практически по всем измеряемым категориям. Пожалуй, наиболее заметным отличием Claude 2 от предшественника является то, как исследователи обсуждают свою работу.

В сообщении блога, анонсирующем Claude 2, нет никаких упоминаний о традиционных бенчмарках машинного обучения или вычислительных оценках в сравнении с аналогичными моделями. Вместо этого компания Anthropic протестировала Claude и Claude 2 в многочисленных тестах, отражающих реальные знания, навыки и решения задач.

Claude 2 превосходит своего предшественника по знаниям, кодированию и другим экзаменам и, по данным Anthropic, даже превосходит средние человеческие показатели:

"По сравнению со студентами колледжей, поступающими в аспирантуру, Claude 2 набирает выше 90-го процентиля баллов на экзаменах GRE по чтению и письму, а по количественному анализу - аналогично медианному абитуриенту".

Следует отметить, что, по мнению многих экспертов, сравнение результатов тестирования человека и ИИ неэффективно в силу природы человеческого когнитивного мышления и вероятности того, что большой набор обучающих данных языковой модели содержит тестовую информацию. По сути, тесты, разработанные для людей, не могут в действительности "проверить" способность ИИ к рассуждениям или должным образом продемонстрировать реальные знания или навыки.

Одновременно с запуском Claude 2 компания Anthropic представила бета-версию веб-интерфейса "Talk to Claude", обеспечивающего общий доступ к чат-боту для пользователей в США и Великобритании.

Cointelegraph провел краткое тестирование новой версии, и, судя по отзывам, улучшения были заметны сразу. Claude 2 практически мгновенно отвечал на запросы Cointelegraph четкими и лаконичными ответами.

Пообщаться с Клодом 2. Источник: Anthropic
Пообщаться с Клодом 2. Источник: Anthropic

По данным Anthropic, предел оперативности новой модели составляет 100 000 лексем, что примерно эквивалентно 75 000 слов. В пользовательском интерфейсе сайта указано, что пользователи могут загружать для анализа документы в форматах PDF, TXT, CSV и других, однако в ходе ограниченного тестирования, проведенного Cointelegraph перед публикацией данной статьи, эта функция не работала.

Соберите эту статью в качестве NFT, чтобы сохранить этот момент истории и продемонстрировать свою поддержку независимой журналистике в криптопространстве.

Источник