Grok (нейросеть)

Продукт
Разработчики: XAI
Дата премьеры системы: ноябрь 2023 г.
Отрасли: Интернет-сервисы

Содержание

Основная статья: LLM (Большие языковые модели)

2025: Илон Маск запустил в публичный доступ новую LLM - Grok 3

Это событие произошло 18 февраля 2025 г. По предварительным тестам думающая Grok 3 Reasoning Beta достигает феноменальных показателей в бенчмарках, адаптированных под тестирование LLM.

Интегральный показатель производительности ГИИ (включает в себя бенчмарки MMLU-Pro, GPQA Diamond, Humanity's Last Exam, SciCode, AIME, MATH-500 и другие) вывел Grok 3 Reasoning Beta на уверенное 1 место среди публичных моделей с 67 баллами опережая o3-mini с 63 баллами, DeepSeek-R1 с 60, но это для размышляющих/думающих моделей.

Результаты получены в агрегации тестов от artificialanalysis.ai.

Обычные (не рассуждающие модели) также выводят в лидеры Grok-3 с 53 баллами, опережая формально лучшую из публичных «обычных» LLM – Gemini 2.0 PRO - 47, следом идет DeepSeek V3 – 46, Qwen 2.5 Max – 45, Claude 3.5 – 44 и крайне устаревшая ChatGPT-4o – 41.

Плотность конкуренции феноменальная, разрывы минимальные, все решает гибкость LLM, глубина настройки и умение решать специфические задачи.

Идеальных LLM не существует, у каждой есть сильные и слабые стороны, поэтому лучше использовать комбинацию LLMs под разные типы задач.

По формальным показателям, Grok-3 это лучшая из существующих LLM в сопоставимой категории, как среди думающих, так и среди «обычных», хотя не самая лучшая, т.к более сильная модель – это OpenAI o3, которая в ограниченной версии доступна за $200 в месяц, но ее сложно назвать публичной.

Grok 3 в это время стоит около $30 в месяц.

Илон Маск начал позже всех, выпуская относительно слабые LLM (в сравнении с конкурентами), но сумел всех обогнать, подчеркивая экстраординарный темп инноваций в этой индустрии.

Grok 3 использует архитектуру Mixture-of-Experts (MoE), что позволяет стратегически активировать подмножества параметров для различных задач, что делает его эффективнее в обработке и анализе данных. Он включает в себя 314 миллиардов параметров, что делает его крупнейшей из доступных моделей, хотя не самую крупную, но качество модели не имеет линейной зависимости от количества параметров, на результат влияет очень много факторов.

Для обучения Grok 3 использовался суперкомпьютер Colossus, оснащенный 200 тысячами графических процессоров Nvidia H100.

В Grok 3 были введены новые функции, такие как режимы Think и Big Brain для сложных задач, а также инструмент DeepSearch для анализа информации из интернета и из социальной сети X. Также были добавлены возможности генерации изображений и голосового режима.

Илон Маск подчеркнул, что Grok 3 ориентирован на "поиск истины", даже если она идет вразрез с политкорректностью, стремясь к политическому нейтралитету.

Развертывание функционала должно идти на протяжении 2-3 месяцев.

2024: Открытие исходного кода LLM Grok-1

В марте 2024 года стартап xAI Илона Маска, занимающийся разработкой технологий искусственного интеллекта, объявил об открытии исходного кода своей большой языковой модели (LLM) Grok-1. Воспользоваться платформой могут разработчики, компании и энтузиасты по всему миру.

Модель Grok-1 выполнена на архитектуре Mixture of Experts (MoE), которая позволяет значительно увеличить скорость и повысить качество обработки запросов. Количество используемых параметров составляет 314 млрд. Базовая модель обучена на большом объеме текстовых данных, но при этом не настроена для выполнения какой-либо конкретной задачи, например, на ведение диалогов. Процесс предварительного обучения Grok-1 завершился в октябре 2023 года.

Открыт исходный код языковой модели Grok-1

Доступ к исходному коду модели предоставляется по условиям лицензии Apache 2.0, которая дает право использовать программное обеспечение для любых целей, свободно изменять и распространять измененные копии, за исключением названия. На середину марта 2024 года Grok-1 является одной из самых крупных ИИ-моделей с открытым исходным кодом. В сообщении xAI отмечается, что релиз включает «веса базовой модели и архитектуру».

Отмечается, что из-за большого количества параметров для использования модели Grok-1 требуются значительные аппаратные ресурсы, включая ИИ-ускорители на основе графических процессоров. Опубликовав код Grok-1, Маск надеется побудить других разработчиков ИИ-систем передать свои продукты сообществу open source. С другой стороны, доступность кода мощных ИИ-моделей вызывает обеспокоенность со стороны некоторых критиков, которые говорят о возможном неэтичном и опасном применении таких платформ. В частности, системы ИИ могут использоваться для генерации дипфейков, вводящих пользователей в заблуждение.[1][2]

2023: Запуск нейросети

6 ноября 2023 года компания xAI, которая принадлежит американскому предпринимателю Илону Маску, анонсировала и запустила в эксплуатацию свою первую нейросеть. Она получила название Grok.

Как сообщила пресс-служба xAI, искусственный интеллект Grok был создан вдохновленный путеводителем из книги и фильма «Автостопом по Галактике», рассказывающих о захватывающих приключениях в космосе.

xAI анонсировала и запустила в эксплуатацию свою первую нейросеть
«
Наш ИИ Grok обладает способностью остроумно отвечать на вопросы и имеет склонность к бунтарству, поэтому, пожалуйста, не используйте его, если вы не цените юмор! — подчеркнули в компании.
»

По словам разработчиков, основным преимуществом новой модели ИИ в xAI является то, что он получает информацию о мире в режиме реального времени через платформу Х (ранее известную как Twitter). Предполагается, что Grok сможет давать ответы на провокационные вопросы, на которые другие системы не могут ответить.

Сообщается, что разработка алгоритма началась с создания прототипа большой языковой модели (LLM) Grok-0 с 33 млрд параметров. Эта тестовая модель по своим возможностям сопоставима с показателями LLaMA 2 от Meta Platforms (компания признана экстремистской в России, ее деятельность запрещена в РФ) в стандартных тестах, но использует при этом только половину своих обучающих ресурсов. За последние два месяца разработчики сумели добиться существенных улучшений в плане возможностей логического анализа и кодирования, что привело к созданию значительно более мощной языковой модели Grok-1.

По словам Илона Маска, к 6 ноября 2023 года доступ к Grok можно получить только при приобретении подписки Premium+ на платформе X. О том, когда нейросеть будет доступна всем желающим, не уточняется.[3]

Примечания



СМ. ТАКЖЕ (1)