2025/12/29 16:10:35

Николай Никитин, ИТМО: Мы создаем open source для науки и бизнеса

Университет ИТМО активно развивает сообщество научного open source, объединяя разработчиков, ученых и компании для создания открытых ИИ-инструментов и фреймворков. Николай Никитин, к.т.н., руководитель группы научно-технического развития Института ИИ ИТМО, рассказывает, как открытые проекты университета помогают бизнесу и науке, какие преимущества дает открытый код и как сотрудничество с платформой GitVerse ускоряет обучение студентов и разработку новых решений.

Николай
Никитин
Сегодня часть проектов разрабатывается для научных задач, другая же будет полезна в первую очередь бизнесу.

ИТМО известен своим активным вкладом в развитие open source, включая создание специализированного сообщества научного open source. Расскажите, что это значит для университета и почему открытый код так важен в современном мире?

Николай Никитин: Предлагаю начать с определения самого понятия. Open source — это подход к созданию и распространению программного обеспечения, когда исходный код программы открыт и доступен под свободной лицензией. На практике такой подход позволяет не только использовать программу, но и изучить ее внутреннюю работу, модифицировать, адаптировать под свои нужды и создать на ее основе новое решение. Обычно понятие open source трактуют достаточно широко и к нему относят также открытые данные, веса открытых моделей ИИ и другие ресурсы.

В области ИИ-технологий практически все инструменты — библиотеки, фреймворки и значительная часть моделей — открытые, ведь их развитие невозможно без вклада большого сообщества. Сегодня в России создается множество открытых инструментов, которые используются как внутри страны, так и во всем мире. Они востребованы в технологическом стеке крупных компаний и частных пользователей. Их авторы — как «бигтех», так и небольшие команды, в том числе академические.

Компании и научные учреждения все чаще размещают свои разработки в открытом доступе. Какие преимущества это дает им в долгосрочной перспективе?

Николай Никитин: Для одних компаний открытые проекты становятся бизнес-моделью, которая привлекает заказчиков за счет демонстрации экспертизы и готовых решений. Для других — это возможность привлечь к разработке и поддержке проекта независимых контрибьюторов. В науке open source помогает обеспечить воспроизводимость и переиспользуемость исследований — сегодня одной только статьи редко бывает достаточно. Выкладывая код и данные, ученые обеспечивают воспроизводимость своих результатов, что укрепляет доверие к исследованиям и ускоряет научный прогресс, тем самым позволяя другим коллективам не начинать с нуля, а развивать уже сделанное. В итоге выигрывают все: бизнес получает ускоренное развитие и новые рынки, а наука — более прочный фундамент для будущих открытий.

Расскажите, как в ИТМО появилось сообщество открытого кода — что послужило импульсом для его создания?

Николай Никитин: Учитывая масштабы и количество научных групп в ИТМО, проекты с открытым кодом существовали и раньше. Но даже актуального перечня открытых разработок не существовало — одна команда не знала, что делает другая. Были трудности и с обменом опытом, лучшими практиками и поиском участников для проектов.

Чтобы решить эту проблему, в 2022 году в ИТМО решили создать сообщество энтузиастов открытого кода ITMO OpenSource. Конечно, в нем участвуют не только студенты и сотрудники ИТМО, но в представители академии и индустрии со всей страны. Сейчас в сообществе уже более 1,5 тыс. участников.

Как сегодня выглядит экосистема открытого кода в ИТМО? Какие ключевые элементы в нее входят?

Николай Никитин: Сегодня экосистема ИТМО включает несколько десятков проектов — библиотек и фреймворков, — которые в сумме набрали более полутора тысяч «звезд», десятки контрибьюторов и сотни тысяч скачиваний. Для помощи в их создании мы разработали ИИ-инструмент OSA — он позволяет автоматизировать создание описания репозитория (от документации до комментариев к коду). Сам код инструмента также открыт.

Консолидацию открытых решений ИТМО и вовлечение в их разработку новых участников мы производим с помощью открытых митапов, создания руководств и ИИ-инструментов для помощи в создании open source-проектов. Основные анонсы публикуются в канале «Научный опенсорс».

В каких сферах и для каких специалистов могут быть полезны open source-решения ИТМО?

Николай Никитин: Сегодня часть проектов разрабатывается для научных задач, другая же будет полезна в первую очередь бизнесу. То, что создается в центре «Сильный ИИ в промышленности», полезно прежде всего специалистам в области машинного обучения: исследователям, ML-инженерам, аналитикам данных. Например, фреймворк автоматического машинного обучения FEDOT позволяет автоматизировать процесс подбора структуры и гиперпараметров модели машинного обучения. Это полезно как для изучения ML, так и для более широкого круга задач: научных исследований, промышленных приложений (для этого есть даже отдельное расширение фреймворка — FEDOT.Industrial). Другой инструмент — ProtoLLM — помогает создавать решения на основе больших языковый моделей в различных предметных областях. Фреймворк CoScientist позволяет создавать ИИ-ассистентов для различных областей науки (например, ChemCoScientist — для химии и материаловедения). Упомянутый ранее инструмент OSA поможет и авторам научного кода, и «индустриальным» программистам.

Какие компании сотрудничают с сообществом ИТМО, и как это помогает развитию open source?

Николай Никитин: Мы активно сотрудничаем с платформой для работы с кодом GitVerse (СберТех) и OpenScaler — например, проводим митапы сообщества открытого кода. Кроме этого, студенты и исследователи ИТМО используют GitVerse для размещения своих проектов и совместной работы над кодом. Там же с помощью ИИ-ассистента GigaCode и среды разработки GigaIDE студенты автоматизируют написание и отладку кода, генерируют его по текстовым описаниям и тестируют идеи в реальном времени. Это делает обучение более практическим, помогает быстрее осваивать программирование и работать над курсовыми или научными проектами в командах. Еще мы организуем трек Open Source на конференции DataFest от сообщества Open Data Science. Есть у нас и совместные с бигтехом открытые разработки, например — инструмент для обучения моделей ИИ для рекомендательных систем Stalactite, созданный совместно лабораторией ИИ Сбера и Институтом ИИ ИТМО. Конечно, это не исчерпывающих список — проекты разные и их очень много. Также мы сотрудничаем с другими компаниями: недавно выпустили исследование применимости ИИ-агентов в разработке с участием более 600 респондентов. И, наконец, мы организуем трек Open Source на конференции DataFest от сообщества Open Data Science.