Французская компания Mistral представила Pixtral Large — новую мультизадачную модель. Она может работать с текстом и изображениями, а также искать информацию в сети. ИИ доступна бесплатно в обновленной платформе Le Chat и уже продемонстрировала превосходные результаты в тестах с конкурентами.
Что делает Pixtral Large уникальной
Новая ИИ-модель с 124 миллиардами параметров создана на базе Mistral Large 2. Она отличается не только внушительными размерами, но и способностью интегрировать текстовые данные с визуальной информацией. Например, нейросеть уверенно справляется с анализом сложных математических графиков, документов и обычных изображений. Особенностью является расширенное окно контекста на 128 тысяч токенов, что позволяет обрабатывать до 30 изображений в высоком разрешении одновременно.
Модель также оснащена отдельным декодером для мультимодальных задач со 123 миллиардами параметров и специализированным визуальным энкодером, в котором 1 миллиард параметров. Такой подход обеспечивает баланс между скоростью работы и точностью анализа.
Одним из главных направлений использования Pixtral Large стала обновленная версия платформы Le Chat. Теперь пользователи могут:
- Сканировать и анализировать сложные документы и изображения, включая графики, таблицы и формулы;
- Генерировать изображения высокого качества благодаря партнерству с Black Forest Labs;
- Создавать автоматизированные рабочие процессы с помощью «агентов», которые упрощают повторяющиеся задачи, например обработку счетов или составление отчетов.
Le Chat также получил новую функцию Canvas для совместной работы, как в ChatGPT и Calude. Этот инструмент позволяет редактировать текст, код и визуальные элементы в режиме реального времени, что делает платформу особенно удобной для креативных и аналитических задач.
Достижения в тестах
ИИ уже зарекомендовал себя как лидер на таких тестовых платформах, как MathVista, DocVQA и VQAv2. Например, в тесте MathVista, оценивающем математическое мышление, она достигла 69,4%, оставив позади GPT-4o и Gemini-1.5 Pro. В области анализа документов и графиков модель превосходит предыдущие версии, демонстрируя глубокое понимание сложных структур данных.
На тестах MM-MT-Bench, моделирующих реальные сценарии использования, Pixtral Large обогнала Claude-3.5 Sonnet и другие популярные модели. Это делает ее подходящим решением для бизнес-аналитики, обработки документов и научных исследований.
Влияние на рынок
Компания делает продвинутые технологии доступными как для исследователей, так и для бизнеса. Mistral AI подчеркивает, что их миссия — предоставить мощные инструменты пользователям, а не преследовать недостижимые цели искусственного общего интеллекта.
Пока функции Pixtral Large доступны в бесплатном режиме бета-тестирования, но в будущем компания планирует запуск премиальных тарифов с более широкими возможностями и гарантиями.
Также в этом месяце была представлена нейросеть, которая в корне отличается от Pixtral, ChatGPT и других чат-ботов. Ученые создали ИИ для работы с геномами, чтобы предсказывать генетические мутации.
Источник: hi-tech.mail.ru