Как большие данные завоевывают огромные рынки

Данные играют все большую роль в бизнесе. Однако очень важно не собирать избыточную информацию и максимально использовать то, что есть. При помощи искусственного интеллекта, машинного обучения и других технологий можно получить от больших данных очень ощутимую выгоду, считают участники секции «BI и большие данные» организованного CNews Conferences и CNews Analytics очередного CNews Forum 2018.

Отношение к данным зачастую определяет успех бизнеса, а готовность к внедрению новых технологий становится важнейшим фактором победы над конкурентами. Как собирать данные и как их анализировать? Об этом говорили участники секции «BI и большие данные» на CNews Forum 2018.

Открыта она была докладом о том, как прийти к стратегии управления корпоративными данными Data Governance. Модератор секции, ведущий архитектор по данным банка ВТБ Сергей Федечкин, рассказал о том, какой должна быть организационная структура при использовании такого подхода, а также дал несколько советов компаниям. По его мнению, все организационные уровни Data Governance и любых инициатив в области качества и защиты данных должны быть сосредоточены на действительно критически важных для организации сведениях.

Корпоративная функция управления данными

pic_1.png

Источник: ВТБ, 2018

«Ключевые рекомендации, которые помогут CDO перейти к целостной модели Data Governance, такие: определить инициативы развития и монетизации актива данных, создать совместные команды из бизнеса и ИТ для реализации инициатив, разработать сначала политики Data Governance для создания и изменения данных, а потом — комплексную программу проектов, — советует Сергей Федечкин. — Пятый шаг — внедрение политики Data Governance для повышения управляемости системами, создающими данные и установление ответственности за их качество и полноту».

Не экономить на технологиях

Актуальность работы с данными для современной экономики — в названиях компаний-докладчиков. Секцию продолжил представитель IBM, что позволило всем следующим спикерам шутить о том, как непросто выступать, когда на разогреве у тебя такой гигант. Эта часть секции скорее практическая: на примере собственной разработки IBM PowerAI, компания рассказала о современных тенденциях рынка решений для управления данными. В том числе, с использованием искусственного интеллекта (ИИ). Тем более, что мировой рынок ИИ в ближайшие 12 лет будет расти невиданными темпами.

В качестве примера он привел внедрение решения по контролю за работой солнечных батарей. Специальная система анализирует их поведение, сведения обрабатываются и быстро передаются оператору, который видит, что что-то вышло из строя и необходимо провести починку. «По большому счету, сегодня все чаще те работы, которые раньше выполнял человек, выполняет машина, – говорит руководитель направления по продажам серверных решений IBM в России и СНГ Константин Мозговой. – Эта машина уже не просто производит вычисления, но и анализирует данные. И это один из основных трендов рынка».

Представитель IBM настоятельно советовал бизнесу не экономить на технологиях. Дешевая разработка — это почти всегда дорогое тиражирование и использование. Тренд сегодняшнего дня — относительно высокие затраты на разработку при очень дешевой эксплуатации.

Технологии и люди

«Данных стало так много, что справиться с таким объемом уже практически невозможно», – такого мнения придерживается исполнительный директор компании Naumen Игорь Кириченко. Он предлагает расширить использование роботов для обработки и анализа данных. Впрочем, аналитика пока остается вне поля зрения многих руководителей компаний, у них проблемы серьезнее: низкая средняя рентабельность по России (5,3%), в три раза меньшая эффективность в сравнении с конкурентами из США и Европы, в два раза меньшая производительность труда.

По мнению спикера, именно использование искусственного интеллекта при работе с большими данными могло бы стать источником развития компании. Ведь современная компания — это цифровой персонал, диалоговые роботы, дополненный интеллект, рекомендательные системы, предсказательные модели и хранители знаний. «Опрошенные нами пользователи считают, что с роботом говорить удобнее, — приводит пример Игорь Кириченко. — Потому что если вам положена скидка, то оператор-робот ее обязательно предложит. А если оператор – человек, то все может зависеть от того, с какой ноги он сегодня встал».

Стоит ли брать на работу роботов?

pic_2.png

Источник: Naumen, 2018

Спикер рассказал о новой разработке Naumen – интеллектуальной платформе для создания голосовых и текстовых роботов Erudite. Благодаря таким решениям пользователь больше никогда не будет «висеть» на линии, с чат-ботом смогут поговорить 90% клиентов вне зависимости от возраста и уровня подготовки, а эффективность в сравнении с тем же IVR вырастет в 50 раз. Еще одни бонус — финансовый: оптимизация затрат на сервисные процессы и персонал после роботизации контакт-центра может достигать 40%.

О том, какие решения будут популярны завтра, предложил поговорить руководитель департамента поддержки информационных технологий «Почты России» Сергей Синегубкин. Он рассказал о концепции хьюманизации данных. «К данным можно относиться как к популяции неких существ, например, людей, – пояснил спикер. – В этой концепции несколько ключевых аспектов. Первый — обычная теория эволюция: слабые и ненужные данные должны умирать. Второй — общение: если к данным кто-то обращается, то их ценность увеличивается. Третий — данные могут порождать себе подобных, то есть какие-то новые объекты. Кроме того, данные работают, получают за это вознаграждение, могут умирать, оставаясь в памяти других систем».

Что мешает цифровизации

С докладом о моделях цифровой интеграции выступил Вячеслав Солопов, директор по консалтингу «Консист Бизнес Групп». По его словам, цифровой аналог реальной действительности пока не создан, но попытки предпринимаются, сама цифровизация немного хаотична из-за большого количества новых цифровых процессов и активов, но большие данные постепенно становятся элементами системы цифрового управления. Развитию мешают изоляция данных, разрозненный инструментарий и сложность внедрения большинства моделей.

«Когда мы говорим про «цифру», то должны понимать, что придется склеивать совершенно разные процессы, автоматизированные совершенно разными системами. И во всей этой модели не совпадает не технология, а сама модель данных, — говорит Вячеслав Солопов. — Самой проблемной является шлюзовая сторона, которой предстоит обеспечить интеграцию разрозненных данных».

В качестве примера он привел крупный холдинг, имеющий производственные активы во всем мире. Для того чтобы связать их в единый цифровой процесс, существует три подхода. Первый – создать комплексную информационную систему и объединить в ней все процессы. Второй —наладить обмен данными между разными системами. Третий — внедрить решение, которое позволит просто забирать нужные данные для аналитического контура, а потом их возвращать.

Направление развития платформ данных

pic_3.png

Источник: X5 Retail Group, 2018

Как превращать данные в конкретные знания, рассказал участникам секции Эдуард Федечкин, ведущий эксперт по системам бизнес-аналитики «Терн». Самый верный путь — многоаспектная аналитика, которая должна включать в себя все сферы, с которыми соприкасается компания: от клиентской базы и производства до логистики и оценки рисков. Это даст бизнесу финансовую эффективность, предсказуемость и безопасность.

«Эффективнее всего сначала анализировать внутренние источники данных, после чего совместить эти результаты с внешними источниками, такими как соцсети. Это позволяет видеть своего клиента как изнутри, так и во всем пространстве, где он успел наследить», — советует Эдуард Федечкин. С помощью специальных ИТ-средств эти данные очищаются и упаковываются в «витрины». К этому «аналитическому сердцу» прикручивается модуль бюджетирования и планирования, а затем и средства семантического моделирования. После этого строится семантический слой, чтобы руководители компаний могли получать данные в понятном виде.

Лишние данные — лишние траты

Большая компания, у которой нет заводов, производства и торговых сетей. Может ли она стоить миллиарды долларов? Может, считают в компании Avito. «Вам не нужны большие данные. Вам нужны алгоритмы машинного обучения, вам нужен искусственный интеллект, но при этом большая часть времени почему-то уходит на инфраструктурную подготовку», — говорит глава отдела обработки баз данных Avito Николай Голов. По его мнению, менять будущее компании можно не столько с помощью огромных хранилищ, сколько посредством цифровой площадки, на которой можно проводить сотни экспериментов. Такая площадка управляется бизнес-аналитиками и аналитиками данных (data scientist), которые и разрабатывают новые сервисы.

Большие данные — это технологии хранения и обработки структурированных и неструктурированных данных, управление их качеством и предоставление их потребителям, а анализ данных (data scientist) — это распознавание видео, текстов и речи, построение рекомендательных моделей, сегментация и кластеризация. В X5 Retail Group подчеркивают, что это различие важно понимать. «При этом, с точки зрения организации, бизнесу не всегда нужен data scientist», — говорит Андрей Молчанский, директор департамента разработки и сопровождения продуктов больших данных X5 Retail Group. В качестве примера он привел Facebook. Когда-то компания пошла в сторону демократизации данных и предоставила доступ к ним все сотрудникам. Стажер Facebook в свободное от работы время разработал карту взаимоотношений людей между собой. Она была простая, но понятная. Так появился блок «Возможно, вы знакомы».

По словам Льва Рагулина, начальника управления систем отчетности и бизнес-анализа X5 Retail Group, отношение бизнеса к большим данным неоднозначно. «Сейчас многие озера данных заболачиваются. Одни считают, что данные — это ценность, а другие — что их невозможно собирать бесконечно. Универсального рецепта не существует, — отмечает Лев Рагулин. — Но когда вы наполняете свое озеро данных, нужно руководствоваться несколькими принципами. Например, данные должны быть релевантны бизнес-процессам, бизнес-сущностям, чтобы не собирать лишнее, иначе стоимость инфраструктуры может быть неимоверной».

Рост объемов данных вынуждает компании менять свои подходы. Ключевые тренды на этом рынке – симбиоз хранилищ и озер данных, аналитика в режиме реального времени, слияние с интернетом вещей и использование больших данных маленькими компаниями с помощью облаков.

Как использовать данные для роста бизнеса

Последние доклады секции были посвящены конкретным кейсам. Компания «ЛокоТех» появилась на свет после реорганизации РЖД, ее задача — ремонтные работы, обслуживание и модернизация оборудования. «Мы должны знать о локомотиве все: как он спроектирован, как изготовлен, как его эксплуатировали и как обслуживали. И эта информация должна храниться на протяжении всего жизненного цикла локомотива, – рассказывает Дмитрий Сергиенко, управляющий директор по развитию цифровых технологий «ЛокоТех». – А локомотив — достаточно сложная конструкция, он состоит из 30 тысяч элементов и деталей. И практически с момента его выпуска начинается сбор и обработка информации из различных систем: РЖД, бортовых и так далее. Все эти данные отправляются в хранилище вместе со сведениями о том, какие работы выполнялись, какие дефекты обнаруживались».

Компания приступила к созданию платформы, которая будет выстроена на микросервисной инфраструктуре с последующей интеграцией всех существующих в компании платформ (ERP, BI, PLM, MDMи других) в единое целое. Она станет основой для совместной работы всех заинтересованных сторон и обеспечит рост бизнеса предприятия, уверены в «ЛокоТех».

Руководитель отдела разработки CarPrice Юрий Буйлов рассказал о платформе, которая позволяет упростить процесс продажи и покупки автомобиля. «Наша компания работает фактически на стыке онлайн- и офлайн-процессов. Мы используем данные для роста бизнеса и повышения качества предоставляемых услуг. Нами создана внутренняя система, которая позволяет качественно сэкономить время: за 2-3 часа вы можете продать автомобиль», — говорит спикер.

Кроме того, платформа позволяет получать данные о загруженности центров осмотра: пользователям доступны управление записью, подбор удобного времени и возможность назначить выездной осмотр. Насыщенные данные о сделке (демография, класс автомобиля, подбор инспектора) поднимают конверсию ресурса на 2-5%, а маржинальность — на 10-15%. Компания активно использует технологии машинного обучения. Основываясь на сведениях об автомобиле, дилере и самом аукционе, нейронной сетью рассчитываются и повышаются ставки. По итогам работы рекомендательной системы средняя стоимость авто при продаже выросла на 2%.

Вячеслав Солопов: Пока построение полностью цифровых процессов – это единичные случаи
solopov.jpg

О том, как движется процесс цифровой трансформации и какую роль в этом играют большие данные, рассказал CNews Вячеслав Солопов, директор по консалтингу «Консист Бизнес Групп».

CNews: Как соотносятся цифровизация и управление большими данными?

Вячеслав Солопов: Цифровые данные сегодня появляются вне зависимости от наличия или отсутствия цифровых процессов, потому что часть из них так или иначе переходит в ИТ. После этого у нас появляются данные. Гаджетизация, большое количество социальных сетей, процессы автоматизации бизнес-процессов и сообществ — все это генерируют большие данные, но при этом, они появляются и сами по себе.

Читать далее

[page]

Вячеслав Солопов: Пока построение полностью цифровых процессов – это единичные случаи

О том, как движется процесс цифровой трансформации и какую роль в этом играют большие данные, рассказал CNews Вячеслав Солопов, директор по консалтингу «Консист Бизнес Групп».

CNews: Как соотносятся цифровизация и управление большими данными?

Вячеслав Солопов: Цифровые данные сегодня появляются вне зависимости от наличия или отсутствия цифровых процессов, потому что часть из них так или иначе переходит в ИТ. После этого у нас появляются данные. Гаджетизация, большое количество социальных сетей, процессы автоматизации бизнес-процессов и сообществ — все это генерируют большие данные, но при этом, они появляются и сами по себе.

Правильно говорить об эффекте симбиоза, когда одно порождает другое. Мы можем цифровизировать субъект или объект, что является катализатором того, чтобы в последующем с ними происходили какие-то цифровые процессы. Большие данные и цифровизация имеют одну и ту же природу. Например, когда мы фотографируем, делаем несколько снимков, программа в смартфоне автоматически обрабатывает кадры и получается новый коллаж из фотографий. В процессе получения этого коллажа у нас было три фотографии, а с получением коллажа их стало четыре. И это вот тот естественный прирост данных, который дает цифровизация.

Рост цифровизации и большие данные связаны с цифровизацией реальной жизни, реальных объектов и субъектов. У нас уже сейчас есть и появляются абсолютно цифровые активы: аккаунты в социальных сетях, количество подписчиков, специализированные базы данных. Это все некие цифровые активы, появление и наличие которых позволяет существенно изменять цифровые процессы.

Чем больше данных собирает или генерирует процесс, чем с большим количеством информации он связан, тем более качественно образуется и управляется сам цифровой процесс. Чем качественнее он управляется, тем больше данных он собирает и генерит. Поэтому, если говорить о том, что влияет больше, данные на цифровые процессы или цифровые процессы на данные, ответа нет. Это некая третья, необычная история.

CNews: Идет или не идет цифровая трансформация сейчас? В чем она конкретно выражается?

Вячеслав Солопов: В свое время у нас была революция автоматизации, когда мы некие рутинные операции, которые выполнялись человеком, переводили в ИТ. Мы получали отсутствие человеческого фактора, устойчивость воспроизводства тех или иных результатов, гораздо большую скорость в вычислительных операциях. Мы уменьшали человеческий труд.

Цифровизация – следующий шаг в этом же направлении, но здесь мы уменьшаем не человеческий труд сам по себе, а сокращаем человеческое влияние, зависимость процесса от наличия или отсутствия специалиста. Например, при автоматизированном процессе продажи билетов в кассе автовокзала часть задач висит на кассире. Как только мы убираем сотрудника, фактически получаем целиком цифровой процесс. Он автономен по своей сути, а человек вносит туда лишь изменения. В рамках цифрового процесса происходит взаимодействие совершенно разных систем: и технологических, и технических, и организационных.

Основной элемент цифровизации – это наличие автоматизированных элементов каждого процесса и единой модели общих данных, которыми оперируют все участники или все элементы этого процесса. Цифровая трансформация невозможна в случае, если хотя бы один из двух пунктов будет нарушен: нет цифрового образа, то есть цифровой модели субъекта и объекта, в отношении которого идет процесс или нет самой автоматизации и того элемента, который действует в конкретный момент.

Цифровая трансформация основывается на трех составляющих. Должны быть цифровые образы реальных субъектов и объектов, которые принимают участие в цифровом процессе. Сейчас, как правило, это дубликаты или цифровые двойники объектов и субъектов.

С цифровым образом должна быть возможность автоматизировано производить некоторые изменения, отражающие или не отражающие действительность. Это зависит от того, какой процесс мы пытаемся перевести цифровизовать. Третья очень важная составляющая – это модельная связь между этапами в цепочке процессов на этой цифре.

Поэтому сейчас, если мы говорим о трендах, нужно отметить образование цифровых активов, накопление этих цифровых активов. Второй тренд — это активное появление различных сервисов для систем, людей или компаний в зависимости от их пользователей.

Пока построение полностью цифровых процессов – это единичные случаи, но идет массированная подготовка. Самое слабое звено – это цифровизация как раз субъектов и объектов. То есть в России пока сложно сделать цифровым, к примеру, объект строительства. Технически все понятно, а физически этого пока нет.