Борис Эвельсон, ныне занимающий должность вице-президента Forrester Research и отвечающий за направление Business Intelligence (BI), успел поработать в таких компаниях, как Pricewaterhouse, Citibank и JPMorgan, в том числе и на ключевых позициях. И везде его работа была связана с использованием информационных технологий в бизнесе. Интервью, данное нашему изданию, посвящено вопросам построения и использования аналитических приложений в бизнесе.

Intelligent Enterprise: Область, которой вы занимаетесь, называется Business Intelligence. Какую смысловую нагрузку в этом термине несет слово «business»? Означает ли оно некую привязку именно к бизнесу, или тут что-то иное?

Борис Эвельсон: Продукты Business Intelligence мо­­гут использоваться и в научных приложениях, и в технических. Я думаю, что определение «бизнес» было включено сюда где-то в 90-х годах, когда эти системы стали доступны не только для технологов и программистов, но и для простых смертных, для бизнес-аналитиков и бизнес-пользователей. И в это время BI-системы стали уже не программировать на каких-то языках, а использовать для создания моделей эффективные приемы, реализуемые средствами графического интерфейса пользователя GUI — point&click, drag&drop. То есть аналитика стала более доступной для бизнеса, и это отразилось на термине.

Разумеется, бизнесменов гораздо больше, чем ученых, и надо было как-то донести до них идею, что они тоже могут пользоваться аналитическими инструментами, — можно ли так сказать?

Конечно.

И все же есть ли какое-то отличие инструментов для бизнеса от инструментов для научных исследований, или это одни и те же аналитические пакеты, которые можно применять для разных целей?

Вы знаете, во-первых, фирма Forrester в основном работает с заказчиками от бизнеса. Ученые обычно сами знают, какие продукты им нужно применять, и к нам за советом не обращаются. В большинстве своем, я думаю, употребляются одни и те же программы. Потому что в итоге — делаю ли я это для бизнеса или для науки — процесс один и тот же: мне нужно найти данные, извлечь их, интегрировать, почистить, а потом смоделировать, построить отчет или дашборд. Будет ли это отчет по исследованию каких-то лекарств или по финансам, процесс все равно один и тот же.

Сегодня все говорят о социальности, о социальных сетях, социальных технологиях. Имеет ли в аналогичном контексте смысл термин «Social Intelligence»?

Да, конечно, такой термин существует. Эта сфера становится все более популярной, но очень важно не забывать, что прежде чем мы сделаем космический корабль — Social Intelligence, мы должны научиться хорошо ходить по земле. А Business Intelligence — рынок еще не очень зрелый, в нем много проблем. И поэтому пока вы не почистите свои данные, пока не сделаете правильные процессы, думать про Social Intelligence еще рано. Но те, кто готов к этому, могут получить очень большие преимущества.

Мы раньше говорили о такой ве­­щи, как 360-градусный обзор наших покупателей. Это означает необходимость понимать, что каждый покупатель покупает в Интернете, что он покупает в магазине, через мобильный телефон, что он покупает в одной стране, в другой… Сегодня мы говорим о 720-градусном обзоре. То есть если в социальных медиа вы и я как-то соединены — может, мы общаемся в Facebook или отметились в одном кафе, — эти данные можно посмотреть и понять, что мы с вами, наверное, друзья или коллеги. Тогда маркетинг уже может основывать рекламу в мой адрес на вашем поведении, потому что оно повлияет на меня.

Сколько таких метрик нужно для крупного предприятия?

На всё предприятие нужно около сотни метрик. Каждый отдел, допустим, отдел финансов или отдел кадров должен иметь не больше двадцати метрик или параметров. В частности, интересная метрика, особенно для ритейла — насколько прибылен каждый продукт и каждый покупатель. Может быть, мои продажи увеличиваются, может, я продаю больше продуктов, но если маржа уменьшается и если на этот продукт и на этого потребителя я трачу больше денег, чем зарабатываю на нем, то какой смысл в таком бизнесе?

И все-таки: люди сами должны дойти до того, какие вопросы задать, или есть методики, рекомендации?

Есть, конечно. Вот то, что мы сейчас обсуждаем, метрики, параметры — это отрасль, которая называется Performance Management, в ней имеются различные методики, одна из них называется balanced score cards (сбалансированная система показателей). Существует множество учебников, классов, где вам расскажут, что в такой-то индустрии, в таком-то отделе — вот такие самые популярные метрики и параметры, по которым вы должны управлять своим бизнесом.

Давайте обратимся к неструктурированным данным, они также очень важны для анализа. Часто цитируют высказывание, что неструктурированная информация составляет 80% всех корпоративных данных. Как вы это прокомментируете?

Эта цифра, возможно, кем-то выдумана. Мы пытались проследить, откуда она появилась, но так и не смогли найти первоисточник. Но это не важно — есть более интересные цифры, которые мы можем подтвердить: из всех структурированных данных каждой организации где-то 30% используется для аналитики, а из неструктурированных данных — всего 8%. Действительно, неструктурированным данным все еще уделяется мало внимания, и чтобы подойти к их анализу, нужно понимать две вещи. Во-первых, для того чтобы анализировать неструктурированные данные, им необходимо дать какую-то структуру. Этот процесс называется semantic entity extraction (выделение сущностей и построение семантического портрета текста). По каждому предложению вы должны понять, кто объект, кто субъект, какое действие выполняется и где всё происходит; это требует серьезного лингвистического анализа. Таким образом мы вытягиваем структуру из этих неструктурированных данных, а потом уже начинается точно такой же процесс, как в обычном Business Intelligence, — мы загружаем эти структуры в базу данных и начинаем их анализировать.

Существуют ли границы применимости BI как концепции в целом? Есть ли области, где такой анализ не работает и лучше полагаться на интуицию?

Давайте скажем так, что Business Intelligence и управление бизнесом на основе данных, а не по интуиции — это сегодня базис. Потому что во всем мире происходит коммодитизация, то есть если вы производите компьютеры и я произвожу компьютеры, мы их делаем на одной и той же фабрике и покупаем запчасти в одном и том же месте в Китае, то добиться разной прибыльности и получить разное качество в одном и том же продукте двум разным фирмам очень-очень сложно. Поэтому мы сегодня конкурируем уже не на продуктах, не на качестве, не на марже, а на информации. Так что без Business Intelligence, без управления по данным сегодня выжить нельзя.

А потом уже ответ на ваш вопрос: если есть две такие конкурирующие фирмы — у меня хорошая информация и у вас хорошая информация, — то тут, естественно, уже имеют значение и опыт, и интуиция, и навык, и, как говорится, выигрышный лотерейный билет.

Встречаются ли ситуации, когда не следует полагаться на анализ? Когда это в принципе противопоказано?

Естественно. Полно таких примеров на финансовом рынке, поскольку любой анализ прошлого не дает правильного предсказания на будущее. Есть такая теория, не знаю, насколько в России она популярна: Черный Лебедь говорит, что непредвиденное все равно может произойти и происходит гораздо чаще, чем обещает нам статистика. Поэтому сколько бы вы ни анализировали, вы можете разве что немного минимизировать риск, но если это произойдет, то последствия могут быть даже катастрофическими.

Вот, например, кто бы мог предположить, что такая финансово стабильная страна, как Кипр, потерпит крах. Поэтому есть, конечно, такие вещи, где нужно полагаться на интуицию, которая основана на опыте. Но все равно даже интуицию нужно основывать на каких-то данных.

Это анализ, который мы просто не можем формализовать?

Давайте скажем так, что базовый анализ все равно должен быть. А потом, если он дает вам, допустим, три разных вывода и уже не может вам помочь в выборе, тут уже начинается интуиция.

А как консьюмеризация влияет на индустрию BI? Сегодня пользователям стало проще скачивать приложения, особенно на мобильных устройствах. Не может ли здесь быть такого эффекта, что они начнут применять эти приложения без должной подготовки, без знания, попросту играть данными и на этой основе принимать решения?

Давайте то, что касается консьюмеризации, разобьем на две части. Первая — просто использование этих данных, и тут, наверное, проблемы большой нет, потому что все-таки их доставку на мобильные устройства обеспечивают профессионалы, и они предоставят вам эти данные в таком виде, чтобы минимизировать потенциал ошибки. Второй вопрос состоит в том, что благодаря консьюмеризации сегодня BI позволяет даже малоопытным людям самим строить все эти базы данных — самим построить, самим найти данные, самим поиграться с ними и все-таки сделать какие-то выводы.

То есть в консьюмеризации ско­рее есть позитивный эффект?

Давайте и это поделим на две части. Есть позитивный эффект, и есть процессы, которые нельзя отдавать в руки неопытных людей. Например, анализом налогов или оценкой серьезных финансовых рисков все-таки должны ведать профессионалы и не допускать ошибок. А если я нахожусь в отделе маркетинга и мне нужно проанализировать сегментацию моих потребителей, чтобы послать им электронные сообщения, то если даже я сделаю не совсем правильные выводы, это будет совсем не плохо. Потому что намного хуже будет, если я неделю буду ждать своего коллегу из ИТ-отдела, а через неделю мне это уже будет поздно. Так что если я сделаю это сам, пусть с точностью только на 80%, но зато сегодня, когда мне это важно, то это будет лучше, чем ждать неизвестно сколько, пока этим займется ИТ-специалист.

Выходит, что есть ситуации, когда скорость важнее, чем полнота и глубина проработки вопроса?

Да, конечно!

Теперь тема, которую никак нельзя обойти вниманием. Большие данные — каково ваше определение?

Для этого понадобится больше времени, чем у нас есть сегодня. Forrester определяет большие данные как минимум по десяти параметрам. Некоторые из них очень извест­ны и популярны, как, например, объем данных и скорость их изменения. Популярность других гораздо ниже. Скажем, мы только недавно начали учитывать, насколько сложны ваши данные, может, у вас их не очень много, но они очень сложные. Возьмем магазин «Ашан», который продает и сотовые телефоны, и домашнюю посуду. Вы не можете описать эти товары единообразно, не можете сделать одинаковую атрибутику для этих групп. Сегодняшние базы данных не приспособлены для этого, вам понадобятся новые приложения, как, например, система Hadoop или базы данных с инвертированным индексом.

Еще один параметр больших данных — стоимость, она должна быть относительно невысокой. Ведь Hadoop — это open source, вам не надо покупать лицензии, но придется разобраться с этой платформой самостоятельно или нанять опытных консультантов и программистов.

И когда наши клиенты интересуются большими данными, мы задаем им десять вопросов по этим десяти параметрам и потом делаем общую оценку. Это, конечно, будут разные значения для разных компаний и отраслей.

Кому-то мы говорим, что вы еще в каменном веке и к большим данным не готовы. Какой-то показатель может сказать нам, что вы уже на границе между традиционным BI и большими данными, поэтому вам нужно к этому готовиться. И пока лишь в минимальном количестве случаев говорим, что да, вы уже находитесь в больших данных, обычные подходы к аналитике работать у вас уже не будут, вы должны смотреть на какие-то новые технологии.