Предикативная (предиктивная) аналитикаPredictive Analytics. Присоединение к сенсорной модальности

Это третья публикация в рамках помощи участникам конкурса «SAP Кодер-2017» .

Каждое предприятие в процессе своей жизнедеятельности генерирует значительное количество данных, как «больших», так и не очень. Эти данные часто можно использовать для получения нового знания, которое, в свою очередь может оказать существенное влияние на стратегию развития бизнеса или тактику поведения в некоторые локальные моменты работы. Сейчас, в связи с развитием вычислительной техники и ростом объема накопленных данных, большое развитие получили численные методы, позволяющие извлекать полезную информацию из массива «сырых» данных и использовать ее в различных бизнес-сценариях.



SAP Cloud Platform имеет, наряду с другими встроенными сервисами, инструментарий предиктивной аналитики, позволяющий строить и использовать построенные модели в созданных на платформе (и вне ее) бизнес-задачи. Набор прогнозных инструментов, входящий в сервис на дату публикации поста, состоит из следующих элементов:

  • Clustering – классический кластерный анализ и сегментация базы объектов с большим количеством атрибутов-классификаторов;
  • Forecasts – построение прогнозов на базе временных рядов;
  • Key Influencers – поиск наиболее влияющих на целевую функцию параметров;
  • Outliers – поиск нестандартных паттернов в наборе данных (выявление мошенничеств, ошибок ввода и пр.);
  • Recommendation – построение моделей продуктовых рекомендаций на базе истории покупок (чеков);
  • Scoring Equation – построение и экстракция уравнения, позволяющего вычислять целевую функцию аналитически и встраивать ее в собственное приложение;
  • What If – анализ «что-если», позволяющий предполагать последствия совершения тех или иных действий, базируясь на истории поведения объекта
Актуальный список методов и их описание можно посмотреть по ссылке .
  • UserColumn – поле с номером участника программы лояльности
  • itemColumn – SKU
  • dateColumn – дата транзакции
  • startDate – дата начала данных для расчета
  • endDate – дата окончания данных для расчета
Дополнительно можно менять параметры, описывающие математику модели. Для нашей модели мы возьмем следующие параметры:

Запускаем построение модели и получаем отклик. Ключевой момент – записать ID модели

Видим, что количество SKU, встречающихся в одной корзине с другими составляет 2777 штук, на базе чего удалось найти 9633 правил рекомендаций. С помощью ссылки /api/analytics/recommendations можно протестировать полученную модель. Здесь необходимо ввести следующие параметры:

  • itemList – SKU, уже лежащие в корзине
  • maxItems – максимальное количество возвращаемых рекомендаций
  • recommenderID – ID модели, построенной на предыдущем шаге
  • userID – номер участника программы лояльности
Указывать можно либо оба параметра itemList и userID, либо только один из них. При указании только одного параметра система выдаст предупреждение, но позволит продолжить работу.

Проверим модель с SKU 5000267097428

В ответ получаем

Посмотрим, что это такое

Таким образом, получаем, что при покупке виски неплохо бы порекомендовать покупателю еще и сухого вина.

Рекомендательная модель может также быть запущена в пакетном режиме, сгенерировав таблицу рекомендаций для всех пользователей программы лояльности. Для этого нажимаем закладку POST на ссылке /api/analytics/recommendations/batch

Затем указываем таблицу, в которую надо поместить наши рекомендации

И запускаем расчет. Сервис создает таблицу и для каждого пользователя рассчитывает рекомендованный товар, который может быть приобретен с большей вероятностью.

Таки образом, Predictive service позволяет очень быстро настроить и использовать некоторые наиболее часто употребляемые математические методы для построения предиктивных моделей, годных к применению в реальном бизнесе.

Участники упражнения разбиваются на пары. Затем один из участников в течение 10 минут проводит интервью с партнером на заданную тему, стремясь задавать такие вопросы, которые позволили бы составить представление о типе личности партнера. После окончания первого интервью партнеры меняются ролями и проводится второе интервью.

По завершении этапа интервью участники сообщают о том, каков, по их мнению, тип личности партнера, и сравнивают его с типом, определенным по анкете. При этом необходимо обосно­вать свое суждение и прояснить причины возможных расхождений.

Если вы умеете определить тип личности вашего собесед­ника, то сможете соответствующим образом адаптировать ваш стиль общения, чтобы сообщаемая вами информация воспринималась им наилучшим образом. Эта техника не является абсолютной гарантией успеха, но она дает вам еще одну возможность его добиться.

Рис. 3.9. Описание шкал предпочтений

3.5. Психофизиологические основы общения

Обладание человеком несколькими органами чувств, по­средством которых он может получать информацию, при­водит к тому, что разные люди в разной степени опирают­ся на эти каналы восприятия. В последние десятилетия это почти очевидное утверждение легло в основу весьма эффективной психологической теории - нейролингвистического программирования.

Технология нейролингвистического программирования (НЛП) разработана в США в период с 1975 по 1979 г. Нейролингвистическое программирование представляет собой новую технологию эффективных коммуникаций.

Создатели новой коммуникационной технологии Джон Гриндер и Ричард Бендлер, используя экспертную систему и экологический подход к мышлению Грегори Бейтсона, изучили систему работы выдающихся «сверхкоммуникато­ров» Вирджинии Сатир в психотерапии и Милтона Эриксона в гипнозе, а затем синтезировали их коммуникатив­ные приемы в социокультурную технологию НЛП.

Упрощенно НЛП можно определить как систему средств для познания и изменения человеческого поведения и мыш­ления.

Основные положения НЛП :

Люди воспринимают, думают и вспоминают по-разному.

Эти внутренние процессы происходят в трех модальнос­тях, различия соответствуют трем основным сферам сен­сорного чувственного опыта.

Модальности :

визуальная (внешняя и внутренняя информация пред­ставляет собой комплекс зрительных образов);

аудиальная (при этом информация представляет собой комплекс звуков);

кинестетическая (информация представляет собой ком­плекс ощущений: вкус, осязание, обоняние и другие ощущения тела).


Каждый человек способен передавать информацию, исполь­зуя визуальную, аудиальную и кинестетическую модально­сти. Необходимое условие эффективной коммуникации - передача информации в той модальности, в которой готов ее воспринимать партнер по коммуникации.

Отсюда ясно, что полезно научиться определять доминант­ную модальность собеседника. Одним из индикаторов модаль­ности являются так называемые словесные предикаты, т.е. слова и выражения, характерные для данного человека:

Предикаты визуальной модальности - представьте, ви­дишь, какая прекрасная, ярко, красиво, прозрачно, пре­красно, посмотрите, мне кажется, вижу и т.п.;

Предикаты аудиальной модальности - послушайте, со­звучно, громко, тихо, хрустящий, логично и т.п.;

Предикаты кинестетической модальности - легко, чув­ствовать, тяжело, тепло, уютный, мягкий, притраги­ваться и т.п.

Еще одним индикатором модальности являются глазные сигналы доступа. По движению глаз партнера по коммуни­кации можно определить, в какой модальности происхо­дит у него процесс обработки информации.

Условно поле зрения партнера по коммуникации, смотря­щего на вас, можно разделить на 9 зон, показанных на рис. 3.11. Если вы задаете партнеру вопрос, связанный с воспо­минанием, в первые мгновения при активизации памяти его глаза делают непроизвольное движение - это и есть глазной сигнал доступа. Доминантная модальность и опре­деляет, в какую из 9 зон происходит это движение.

Рис. 3.11. Схема глазных сигналов доступа

Предикативная или прогностическая аналитика (Predictive analytics) - это прежде всего множество методов статистики, анализа данных и теории игр, которые используются для анализа текущих и исторических данных/событий для прогноза данных/событий в будущем.

Наиболее известный способ использования прогностической аналитики – это применение скоринговых моделей для оценки платежеспособности клиента при выдаче кредитов в банке. Любая скоринговая модель строится на исторических данных, и если в прошлом, какая-либо группа клиентов была уличена в несвоевременном гашении кредитов, а вы по каким-либо характеристикам схожи с этой группой, то скорее всего в выдаче кредитов вам откажут.

Однако это не все области, где применяется предикативная аналитика, ее можно применять для разработки продуктов, для выбора потенциальной аудитории, для выбора следующего продукта, который вы можете предложить клиенту (Next Best Offer) и множестве других.

Родственным по отношению к предикативной аналитике является понятие data mining, так как предикативная аналитика использует частично подобные методы. Центральной же сущностью предиктивной аналитики является задача определение предиктора или нескольких предикторов (параметров или сущностей, которые влияют на прогнозируемое событие). Например, страховые компании выделяю такие предикторы, как возраст, стаж вождения при определении страховой премии. Множество этих предикторов образует модель предиктивной аналитики, которая предсказывает определенное событие в будущем с какой-то степенью вероятности.

  • Прогнозирование ежедневного потребительского спроса на уровне магазин/товар на 28 дней
  • Прогнозирование акционного спроса
  • Учет товарного замещения (каннибализации) во время акций
  • Учет изменений в цене, сезонного изменеия спроса
  • Учет температуры и погодных условий по городам расположения магазинов, размерам магазинов и пр.
  • Прогнозирование для новых товарных позиций, новых магазинов
  • Учет открытий конкурентов

Выведение значимых товарных позиций для покупателей (Key Value Item Analysis)

  • Выделение товаров имеющих непропорционально большое влияние на восприятие покупателей
  • Выявив эти товарные позиции ритейлер может влиять на потребительское восприятие адаптировав свою ценовую стратегию
  • Используя агрессивную ценовую стратегию, ритейлеры могут влиять на трафик, общее представление о ценах, прибыльность, долю рынка и пр.

Оптимизация регулярной и акционной цены

  • Рекомендации по оптимальной цене
  • Учет ограничений по выкладке, марже, обороту, поставкам и пр.
  • Расчет эластичности цены
  • Рекомендации по временным ценам для ускорения продаж
  • Прямые предложения для клиентов
  • Многоканальные продажи

Сегментирование покупателей

  • Поведенческая и маркетинговая сегментация,
  • Целенаправленные маркетинговые кампании
  • Анализ потребительской корзины,
  • Рекомендации по товарам
  • Перекрестные продажи и повышение уровня продаж,
  • Стратегия наилучшей альтернативы,
  • Предотвращение оттока клиентов путем расчета потребительского риска

Выделение групп покупателей со схожими поведенческими характеристиками путем многомерного анализа данных
Customer Segmentation, Behavioral Targeting, Churn Prevention

  • Повышение конверсии по акциям путем формирования целевых групп (сегментов) покупателей для направленных акций
  • Повышения прибыльности путем рекомендаций по уровню скидок для различных целевых групп покупателей
  • Повышение лояльности путем раннего выявления покупателей с наибольшей вероятностью ухода и последующих действий (акций)

Предиктивная аналитика на производстве

  • Анализ и прогнозирование влияния воздействий факторов на параметры продукции
  • Прогнозирование отказов оборудования - переход от обслуживания по регламенту к обслуживанию по состоянию
  • Прогнозирование производства продукции и потребления энергии и ресурсов
  • Онлайн упреждающие оповещения о будущих внештатных ситуациях

Для промышленных предприятий, где требуется обработка и понимание огромного количества данных и есть высокие риски при принятии решений, предсказательная аналитика имеет особое значение .

Данные о протекании технологического процесса не всегда используются эффективно, в то время как их можно использовать для оптимизации операционных процессов и повышения технико-экономических показателей производства. Оптимизацию можно выполнить на любом типе производства с серьезным уровнем автоматизации, организованным сбором и длительным хранением информации. Для этого успешно применяются интеллектуальные системы, которые могут проанализировать состояние технологического процесса в реальном времени, спрогнозировать дальнейшее протекание процесса, определить уровень оптимальности и, при необходимости, изменить управляющие параметры или дать рекомендации диспетчеру. Для решения данных задач с помощью средств машинного обучения создается предиктивная математическая модель технологического процесса. Она анализирует входные параметры, в реальном времени выдает прогноз протекания процесса и предложения по его оптимизации. Эта модель объединяется с АСУТП , MES и ERP-системами предприятия.

Еще одна задача для предиктивных алгоритмов – это техническое обслуживание и ремонт оборудования. В основном, предприятия используют базовые механизмы контроля, предоставленные производителями оборудования. Но потенциал этих средств ограничен, поскольку они не позволяют проанализировать дополнительные факторы, влияющие на состояние оборудования, и заранее спрогнозировать критическую ситуацию. Таким образом, сотрудники отдела технического обслуживания получают множество данных, но не знают, как эти данные связаны между собой. В итоге реакция от ремонтных служб следует только после отказа оборудования, что ведет за собой простои, и, следовательно, дополнительные расходы. Прогнозная аналитика средствами машинного обучения и искусственного интеллекта проводит непрерывный анализ больших данных, выполняет визуализацию данных о состоянии оборудования на текущий момент и прогнозирует сценарии возникновения отказов оборудования. В результате сокращаются внеплановые простои, оптимизируются работы по ТОРО , уменьшается время техобслуживания, а управляющий персонал получает углубленный анализ причин отказов оборудования.

Мировой рынок

Прогноз Transparency Market Research 2017 года в 2019й

Рынок предикативной аналитики достигнет $6,5 млрд к 2019 году, согласно прогнозу Transparency Market Research от ноября 2013 года. По мнению аналитиков этой компании, рост рынка управляется такими драйверами как увеличение спроса на пользовательскую аналитики и интеллектуальный софт для информационной безопасности и защиты от фрода. Отдельное отмечается бурное развитие сегменте облачных решений для предикативного анализа .

Для сравнения, по итогам 2012 года, по данным той же фирмы, мировой рынок систем для предикативного анализа составил в объеме $2,08 млрд, а среднегодовой его прирост в период с 2013 по 2019 год составит 17,8%.

Наиболее востребована предикативная аналитика в отраслях, работающих с конечными потребителями, таких как банковские и финансовые сервисы, страхование, госсектор, фармацевтика, телеком и ИТ, ритейл. На эти сегменты пришлось 71,8% объема внедрений в 2012 году. На протяжении прогнозного периода максимальная доза проектов придется на банковский сектор, финансовые сервисы, страхование. Впрочем, наиболее быстро число проектов будет расти в рознице и на производстве.

Аналитики отмечают, что рост случаев мошенничества, неплатежей, угрозы несоответствия многочисленным правилам и регламентам вынуждают бизнес все чаще обращаться к предикативному анализу с целью построения футуристических моделей, позволяющих принимать превентивные меры по отношению к неблагоприятным событиям.

Такие разные типы программного обеспечения как системы пользовательской аналитики, аналитики информационной безопасности и управлениям кампаниями составили около 50% рынка предикативной аналитики в 2012 году. Эти решения используются для оптимизации организационных процессов в продажах и маркетинге, управления клиентами и каналами продаж, финансового и риск менеджмента и так далее.

Среди региональных рынков крупнейшим рынком систем предикативного анализа будет Северная Америка, причем здесь спрос на прогнозные решения придет со стороны компаний, активно решающих вопросы работы с большими данными (big data). Именно поэтому в скором времени на аренду предикативной аналитики выйдет все ключевые вендоры решений для big data, включая , SAP , Oracle , IBM , Microsoft , Teradata и Tableau Software .

Рынок при этом остается во многом поделен между крупнейшими игроками: на первую пятерку поставщиков пришлось 80% объема рынка в 2012 году. Среди других заметных игроков отмечаются Fair Isaac, Tibco , Information Builders , Alteryx , Qlik (QlikTech) и MicroStrategy .

Системы прогнозной аналитики

системы предикативного анализа :

  • KNIME
  • Orange
  • Python
  • RapidMiner

Коммерческие системы предикативного анализа .