Заказчики: Кномикс (Knomics) Москва; Фармацевтика, медицина, здравоохранение Подрядчики: HPC HUB Продукт: HPC HUB Виртуальный суперкомпьютер HPCaaSДата проекта: 2017/05 — 2017/11
|
Технология: Cloud Computing
Технология: IaaS - Инфраструктура как услуга
Технология: PaaS - Platform As A Service - Бизнес-платформа как сервис
Технология: Виртуализация
Технология: Суперкомпьютер
|
Компания «Кномикс», входящая в биомедицинский холдинг персонализированной медицины «Атлас», в ноябре 2017 года запустила вычисления на облачной платформе суперкомпьютеров HPC Hub для масштабирования своего R&D и развития научной базы проекта генетических тестов.
Данный проект — не первый опыт сотрудничества компаний. Среди других примеров взаимодействия Knomics и HPC Hub — настройка на распределённой архитектуре необходимого исследователям ПО (в том числе пакета Qiime), оптимизация параллельных алгоритмов, например, алгоритма де-ново сборки Trinity, использование которого легло в основу серии исследований.
Решение в основе проекта
HPC Hub представляет собой облачную суперкомпьютерную платформу по требованию (HPC as a service / HPCaaS) для решения задач наукоемкого бизнеса. HPC Hub в несколько кликов дает доступ к суперкомпьютерной вычислительной мощности с предустановленным прикладным ПО, что позволяет бизнесу экономить средства не только на покупке и обслуживании суперкомпьютерного кластера и на лицензиях коммерческого ПО, но и время на интеграцию и подготовку инфраструктуры.
Пилотный проект
Ранее в 2017 году «Кномикс» уже завершил успешный пилот с HPC Hub, запустив на облачной платформе суперкомпьютеров по требованию вычисления для своего проекта по изучению кишечного метагенома, то есть совокупности геномов всех микробов, обитающих в кишечнике человека. По словам Дмитрия Алексеева, директора по R&D биомедицинского холдинга «Атлас», команда ученых-микробиологов и биоинформатиков «Кномикс» провела большое исследование, в ходе которого было проанализировано несколько тысяч российских образцов биоматериала, или более 10 ТБ данных. В результате сложных вычислений, делегированных мощностям платформы HPC Hub, удалось сформулировать целый ряд научных гипотез, согласно которым микрофлора кишечника в значительной степени определяет не только физическую составляющую человеческой жизни, но и психическую. К примеру, было обнаружено, что отходы жизнедеятельности бактерий в кишечнике могут непосредственно влиять на мозг, провоцировать депрессию и даже аутизм. Для обеспечения успешного выполнения данного исследования специалисты HPC Hub перенесли метагеномный пайплайн (набор ПО для обработки метагеномных данных, разработанных исследователями Knomics) в облако и ускорили его работу более чем в 8 раз за счёт оптимизации процесса записи данных на разделяемое хранилище. Помимо прочего, тесное сотрудничество компании «Кномикс» с HPC Hub позволило опубликовать ряд научных статей в журнале PLOS ONE.
Развертывание конвергентной среды
Сотрудничество «Кномикс» и HPC Hub не ограничилось этим одним проектом. Для целей расширения исследовательской программы компании было закуплено собственное вычислительные оборудование для осуществления накопления геномных данных и первичное тестирование своих пайплайнов, которые впоследствии должны будут применяться на суперкомпьютерной инфраструктуре. Для настройки и формирования оптимального вычислительного окружения компания обратилась в HPC Hub. Специалисты HPC Hub провели ревизию оборудования, помогли купить недостающие комплектующие и более эффективно настроить уже имеющееся.
В итоге была развёрнута высокопроизводительная конвергентная среда (функция хранилища и вычислителя совмещаются в единой серверной архитектуре) с элементами Private Cloud организации. Данный подход органично согласуется с сервисами HPC Hub, что позволит «Кномикс» легко масштабировать распределенную обработку данных в облаке HPC Hub, реализуя гибридный сценарий: подготовка на собственных мощностях, а ресурсоемкая распределенная обработка данных — в HPC облаке.
Подобный гибридный сценарий позволяет значительно более гибко подходить к решению наукоемких задач и проводить исследования с огромным количеством данных, не перерасходуя средства в период накопления данных и апробации алгоритмов обработки данных, — отметил генеральный директор HPC Hub Вильгельм Битнер. |