2017/03/10 14:02:41

"Текстовая аналитика"
Information intelligence

Информация становится одним из основных активов компаний в 21 веке, умение извлекать полезные знания и затем их монетизировать становится ключевым фактором успеха на рынке. Компании получили доступ к терабайтам, петабайтам, эксабайтам информации. Источники информации разделены на 3 типа: структурированные, неструктурированные и частично структурированные.

Что можно делать с данными доступными в Интернет, в соц. сетях, или внутри предприятий?

  • Отправлять, пересылать, публиковать, редактировать, архивировать.
  • Искать и индексировать
  • Категорировать и классифицировать в соответствии с задачами предприятия
  • Извлекать информацию и анализировать
  • Проверять гипотезы и моделировать[1]

Что такое «текстовая аналитика»?
ТА неотъемлемая часть решения ADVANCED BI


Основные возможности ТА

Добывание данных

  • Извлечение данных из множества различных источников. Смещение акцента от поиска к обработке извлеченных данных
  • Поиск и извлечение информации в режиме реального времени
  • Адаптация коннектора к источнику данных при изменении структуры данных. Автоматический разбор неструктурированных документов, выделение заголовка, основной части документа, анализ структуры документа и ссылок
  • Определение типов данных. Выбор обработчика в зависимости от типа данных. Обработка аудио, и видео информации
  • Широкие возможности по извлечению данных из соц. сетей, публичных источников данных, наиболее посещаемых сайтов и специализированных источников

Категоризация

  • Кластеризация документов, создание и наполнение категорий в документах. Выделение параграфов и разделов документов с использованием алгоритмов кластеризации
  • Поддержка Pull (авторубрикация) и Push (предопределенные рубрики) сценариев для категорий
  • Группировка и категоризация документов и частей документов в соответствии с заданными сценариями
  • Использование комплексных алгоритмов для категоризации. Использование самообучаемых (статистических) алгоритмов и алгоритмов обучения с учителем
  • Ведение [разных] категорий для разных ролей пользователей
  • Использование категорий для последующего извлечения информации из неструктурированного текста

Извлечение информации

  • Извлечение значимой информации из текста
  • Выделение собственных имен, людей, организаций, географических мест, наименований, ссылок на сайты, e-mail, сообщения на форумах, сообщения в соц. сетях и пр.
  • Выделение продуктов/услуг и их характеристик, в т.ч. характеристик связанных с обслуживанием клиентов
  • Наполнение данными CRM-систем. Поиск и наполнение данными о профилях клиентов, отношениях между клиентами, выявление родственных связей, выявление степени влияния между клиентами
  • Извлечение прочей информации релевантной для маркетинга (брендтрекинг, позиционирование по сравнению с конкурентами и пр.)

Анализ мнений

  • Анализ мнений используется для дополнительного извлечения скрытой информации, которую сложно извлечь используя классические методы
  • Анализ мнений включает выявление тональности сообщений, определение эмоциональной составляющей высказывания, выделение суждений, мечтаний и намерений клиента
  • Использование тональности для сценариев активного снятия негатива со стороны клиента
  • Разделение фактов и суждений
  • Анализ желаний и мечтаний клиентов для разработки новых продуктов и новых маркетинговых стратегий

Машинное обучение

  • Использование математических алгоритмов для обучения компьютера анализу текстовой информации
  • Использование комплексных методов обучения: статистических методов, нейронных сетей, метода энтропии, дерева решений и пр.
  • Использование машинного обучения вместе с ручным разбором для повышения качества работы ТА
  • Разработка новых алгоритмов машинного обучения направленных на «подражание» человеку для автоматизации «диалога с клиентом»

Применение ТА для «Голоса Клиента»

Область применения

Ускоренное удовлетворение потребностей, повышение лояльности клиентов

  • Срез клиентских впечатлений, позволяющий определить потребности клиентов и возможности повышения удовлетворенности клиентов
  • Определение ключевых позитивных и негативных драйверов
  • Активный контроль отношений с клиентом при взаимодействии с компанией

Повышение эффективности управления брендом и репутацией

  • Оперативное выявление случаев негативных для компании ситуаций и реакция на них, прежде чем клиенты поделятся опытом со своими друзьями или информация попадет в масс-медиа
  • Реакция на негатив со стороны клиента в тот момент когда все еще можно исправить

Современный подход к управлению жизненным циклом продуктов

  • Сбор информации о предпочтениях клиентов в отношении продуктов и их преимуществ
  • Использование сильных и слабых особенностей конкурирующих продуктов
  • Сбор и углубленный анализ зарождающихся тенденций, их выявление и использование
  • Увеличение жизненного цикла продуктов за счет выявления возможностей использования продуктов «no name», сегментов клиентов и линеек продуктов
  • Выявление реакции клиентов на выход продукта в реальном времени

Повышение эффективности продаж и маркетинга

  • Выявление возможностей up sale и cross sale
  • Персонализированное предложение для клиентов, использующих Интернет канал
  • Измерение влияния от акций и кампаний
  • Измерение эффекта от изменения цены

Выявление наиболее резонансных трендов

Существенное улучшение клиентского сервиса

  • Сокращение «посредников» слушающих клиента, сокращение искажений, снижение оттока
  • Сокращение объема внутренних коммуникаций, автоматизация и повышение эффективности обработки клиентских запросов
  • Раннее выявление повторяющихся запросов и выработки приемлемого решения
  • Повышение качества базы знаний для самостоятельного решения проблем клиентом

Повышение эффективности планирования и проектирования

  • Автоматизация задач сбора, категоризации и отчетности по обратной связи
  • Сокращение неизбежных ошибок от ручной категоризации и обработки обратной связи
  • Снижение стоимости обработки обратной связи
  • Больше времени и усилий тратиться на развитие бизнеса и увеличение выручки, а не на обработку обратной связи

Смотрите также

Примечания

  1. Презентация "Текстовая аналитика для анализа большого объема неструктурированных данных" Илья Вигер Генеральный директор Vesolv (Висолв)