Платформа текстовой аналитики на основе интеллектуальных систем сбора и обработки текстов

Продукт
Разработчики: ФИЦ ИУ РАН - Информатика и управление Федеральный исследовательский центр РАН, Центр компетенций НТИ на базе МГУ, Технологии системного анализа
Дата премьеры системы: 2020/04/14
Технологии: Big Data,  Data Mining

2020: Разработка решения для интеллектуального анализа больших массивов текстов

В Центре компетенций НТИ на базе МГУ по направлению «Технологии хранения и анализа больших данных» совместно с Институтом проблем искусственного интеллекта ФИЦ «Информатика и управление» РАН и ООО «Технологии системного анализа» разработана платформа текстовой аналитики на основе интеллектуальных систем сбора и обработки текстов на русском и английском языках. Проект является первым в мире промышленным решением, обладающим возможностями кросс-языковой аналитики. Об этом 14 апреля 2020 года сообщил РВК.

Разработанное решение может анализировать и обрабатывать любой тип информации, представленной в текстовом виде на русском, английском, белорусском, казахском и татарском и языках. Преимуществом проекта является возможность кросс-языковой аналитики текстов: не требуется повторный поиск одних и тех же сведений, представленных в документах на разных языках и описанных терминами из разных языков. Внедрение решения существенно упростит работу специалистов, работающих с анализом больших объемов текстов, и значительно повысит эффективность патентного и исследовательского поиска.

Решение позволяет проводить анализ больших объемов научно-технической информации, анализ социальных сетей на предмет выявления материалов нежелательной тематики, девиантного поведения, анализ психологического состояния пользователей и социальной напряженности слоев общества. Кроме того, решение может выполнять задачи по извлечению информации, анализу медицинских документов, технической информации по закупкам для перевода больших полуструктурированных массивов текстов в форму структурированной информации.

В дальнейшем потребителями разработки могут стать аналитические центры, научные и научно-образовательные организации, предприятия, оказывающие услуги защиты интеллектуальной собственности, государственные корпорации. Также потенциальными потребителями могут стать нормативно-правовые справочные системы и консалтинговые бюро.

«
Симбиоз нескольких научных подходов, предложенный президентом Российской академии социальных наук, доктором философских наук, профессором Г.В. Осиповым, позволяет описывать тематику документов через словосочетания и анализировать смысл, отдельных высказываний в форме неоднородных семантических сетей. В совокупности с современными методами компьютерной лингвистики, дистрибутивной семантики и машинного обучения созданное решение позволяет достигать большей точности и полноты в задачах текстовой аналитики,
комментирует разработку руководитель проекта Илья Соченков, научный сотрудник Центра компетенций НТИ на базе МГУ по большим данным
»

Решение на апрель 2020 года уже прошло стадию пилотных внедрений в таких организациях, как: ИНФРА-М, НЦР Руконт, НТИМИ, Дирекция научно-технических программ, Минобрнауки РФ, что позволило собрать базу технологических запросов заказчиков в области текстовой аналитики.

Стоимость разработки и внедрения готового решения варьируется от 5 до 25 млн рублей в каждом конкретном случае в зависимости от потребности заказчика в услугах по интеграции, кастомизации и глубокой настройке программного обеспечения.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  БизнесАвтоматика НПЦ (118)
  Инфосистемы Джет (13)
  Marketing Logic (Маркетинг Лоджик) (9)
  Сбербанк (8)
  Другие (575)

  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  NLogic (2)
  Сапиенс солюшнс (Sapiens solutions) (2)
  Сбербанк (2)
  Другие (48)

  БизнесАвтоматика НПЦ (13)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Яндекс (Yandex) (2)
  Московский центр инновационных технологий в здравоохранении (2)
  Другие (58)

  БизнесАвтоматика НПЦ (7)
  Департамент информационных технологий Москвы (ДИТ) (3)
  Яндекс.Облако (Yandex.Cloud) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (2)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  Другие (58)

  БизнесАвтоматика НПЦ (3)
  Мобильные ТелеСистемы (МТС) (2)
  Университет Иннополис (2)
  Максимум, Maximum (ГБУ МО ЦРЦТ - Центр развития цифровых технологий) (1)
  Моделирование и цифровые двойники (МЦД) (ранее CADFEM CIS, КАДФЕМ Си-Ай-Эс) (1)
  Другие (19)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2, 236)
  БизнесАвтоматика НПЦ (2, 117)
  Oracle (12, 14)
  IBM (10, 14)
  Полиматика (Polymatica) (3, 11)
  Другие (284, 143)

  БизнесАвтоматика НПЦ (1, 3)
  Полиматика (Polymatica) (1, 2)
  Dell EMC (1, 2)
  Rambler Group (Рамблер Групп) (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  Другие (5, 5)

  БизнесАвтоматика НПЦ (1, 13)
  Сбербанк (2, 2)
  К-Скай (K-SkAI) (1, 2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
  Другие (14, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  Сбербанк (2, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 2)
  Другие (12, 12)

  БизнесАвтоматика НПЦ (1, 2)
  Мобильные ТелеСистемы (МТС) (1, 1)
  Т1 (1, 1)
  Napoleon IT (Наполеон Айти) (1, 1)
  Полиматика (Polymatica) (1, 1)
  Другие (3, 3)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Deductor - 226 (226, 0)
  Visary BI Платформа бизнес-аналитики - 117 (117, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 25 (0, 25)
  Polymatica Analytics Аналитическая платформа - 11 (11, 0)
  IBM SPSS Decision Management - 10 (10, 0)
  Другие 108

  Visary BI Платформа бизнес-аналитики - 3 (3, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  EMC Greenplum Data Computing Appliance - 2 (2, 0)
  Polymatica Analytics Аналитическая платформа - 2 (2, 0)
  Minit Система класса Process Mining - 1 (1, 0)
  Другие 1

  Visary BI Платформа бизнес-аналитики - 13 (13, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 4 (0, 4)
  Loginom Аналитическая платформа - 2 (2, 0)
  Platforma и HFLabs: Технология безопасного метчинга данных - 2 (2, 0)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  Другие 4

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 3 (0, 3)
  CM.Expert Data Mining платформа - 2 (2, 0)
  ЦРТ: Speech Analytics Lab - 2 (2, 0)
  Магнит Datalab: Сервис работы с обезличенными данными ритейлера - 1 (1, 0)
  Другие 7

  Visary BI Платформа бизнес-аналитики - 2 (2, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Polymatica Analytics Аналитическая платформа - 1 (1, 0)
  МТС DataOps Platform - 1 (1, 0)
  Сфера. Интеллектуальный анализ процессов - 1 (1, 0)
  Другие -1

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (118)
  Большая Тройка (46)
  Умная Логистика (14)
  Доверенная среда (13)
  Инфосистемы Джет (11)
  Другие (418)

  Доверенная среда (5)
  Большая Тройка (4)
  Цифра (4)
  Ростелеком (3)
  БизнесАвтоматика НПЦ (3)
  Другие (54)

  БизнесАвтоматика НПЦ (13)
  OneFactor (Уанфактор) ЕдиныйФактор (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс (Yandex) (2)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (45)

  БизнесАвтоматика НПЦ (7)
  Департамент информационных технологий Москвы (ДИТ) (3)
  РИР (Росатом Инфраструктурные решения) (3)
  Axenix (ранее Аксенчер Россия) Аксеникс (2)
  CM.Expert (АвтоЭксперт) (2)
  Другие (61)

  БизнесАвтоматика НПЦ (3)
  Университет Иннополис (2)
  Синара-Транспортные Машины (СТМ) (1)
  Axenix (ранее Аксенчер Россия) Аксеникс (1)
  Синимекс (Cinimex) (1)
  Другие (22)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  БизнесАвтоматика НПЦ (2, 117)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Доверенная среда (1, 13)
  РИР (Росатом Инфраструктурные решения) (3, 8)
  Другие (246, 109)

  Доверенная среда (1, 5)
  Большая Тройка (2, 4)
  Цифра (1, 4)
  БизнесАвтоматика НПЦ (1, 3)
  Умная Логистика (2, 2)
  Другие (6, 8)

  БизнесАвтоматика НПЦ (1, 13)
  РИР (Росатом Инфраструктурные решения) (2, 3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (1, 2)
  МегаФон (2, 1)
  Netrika (Нетрика) (1, 1)
  Другие (6, 6)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (3, 4)
  Цифра (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Датакаталог (1, 2)
  Другие (12, 12)

  БизнесАвтоматика НПЦ (1, 2)
  Exodrive (Экзодрайв) (1, 1)
  Softline (Софтлайн) (1, 1)
  Датакаталог (1, 1)
  РИР (Росатом Инфраструктурные решения) (1, 1)
  Другие (6, 6)

Распределение базовых систем по количеству проектов, включая партнерские решения (проекты, партнерские проекты)

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 117 (117, 0)
  Большая Тройка: АИС Редактор территориальных схем - 39 (39, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 19 (0, 19)
  Доверенная среда: Триафлай BI-платформа - 13 (13, 0)
  Росатом Цифровое ресурсоснабжение - 8 (3, 5)
  Другие 79

  Доверенная среда: Триафлай BI-платформа - 5 (5, 0)
  ZIIoT Платформа для работы с промышленными данными - 4 (4, 0)
  Visary BI Платформа бизнес-аналитики - 3 (3, 0)
  Большая Тройка: АИС Редактор территориальных схем - 2 (2, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  Другие 7

  Visary BI Платформа бизнес-аналитики - 13 (13, 0)
  Росатом Цифровое ресурсоснабжение - 3 (1, 2)
  PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2 (2, 0)
  СберАналитика - 1 (1, 0)
  МТС: Цифровой водоканал - 1 (1, 0)
  Другие 1

  Visary BI Платформа бизнес-аналитики - 7 (7, 0)
  Росатом Цифровое ресурсоснабжение - 4 (1, 3)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 2 (0, 2)
  ZIIoT Платформа для работы с промышленными данными - 2 (2, 0)
  Arenadata Catalog - 2 (2, 0)
  Другие 5

  Visary BI Платформа бизнес-аналитики - 2 (2, 0)
  Наносемантика NLab Marker - 1 (1, 0)
  Искусственный интеллект (ИИ, Artificial intelligence, AI) - 1 (0, 1)
  Softline Digital: RozniTech Платформа для сетевого ритейла (ранее Retailix.Ai) - 1 (1, 0)
  ZIIoT Платформа для работы с промышленными данными - 1 (1, 0)
  Другие 1