Сейчас много говорят о больших данных. И, несмотря на то, что некоторый, скажем так, скептицизм в отношении этой темы сохраняется, новые методы аналитики уже используются. Причем настолько широко, что даже нашли отражение в массовой культуре. Если быть совсем точным, то в телесериалах. Пока только детективных.

Но при этом в телешоу аналитики больших данных начинают играть в действии все более и более значимую роль, иногда даже ключевую. Например, в поздних сезонах телешоу «Мыслить как преступник» подозреваемого определяют именно таким образом, причем список оказывается весьма коротким. Главное в том, чтобы определить характерные особенности маньяка, по которым будет определяться поиск. А, что важно, именно на отлове массовых и серийных убийц специализируется команда экспертов ФБР по поведенческому анализу, работе которых на ниве раскрытия и предотвращения преступлений и посвящен сериал.

А особенности эти могут быть весьма и весьма разнообразными и часто неожиданными. Но все они, в конце концов, и позволяют однозначно определить преступника по выявленным экспертами признакам. Обычно этого оказывалось достаточно для того, чтобыочертить круг таких людей и в итоге однозначно определить подозреваемого, соответствующего этим признакам и максимально похожего на фоторобот, если он есть. Ну а определить домашний и рабочий адрес и вовсе тривиальная задача. Иногда даже фоторобота оказывается не нужно.

Причем часто эти признаки не содержаться в структурируемых базах данных. Например, в одном из эпизодов все того же «Мыслить как преступник» одним из таких признаков стала собака, которую имел подозреваемый. И определить ее владельца удалось с помощью анализа информации с сайтов клубов владельцев животных данной породы. В российском процедурале «След» также, пусть и периодически, используется анализ социальных сетей, в основном для выявления возможных связей между подозреваемыми и жертвами.

Естественно, тут, конечно, есть преувеличение. Так, например, аналитик выдает результаты слишком быстро, буквально за минуты. В реальности речь будет идти о часах, и то в лучшем случае. И список кандидатов в подозреваемые будет куда больше. Но уж таковы законы жанра, зрелище должно быть динамичным и держать зрителя в напряжении. Да и хронометраж серии вещь неумолимая. Но все равно, в реальной жизни все происходит, скорее всего, примерно также, пусть и несколько медленнее. Но для того, чтобы объяснить «на пальцах» как работает аналитика на основе больших данных, просмотр эпизода из такого сериала может быть неплохим, и, главное, хлрошо понятным для простого смертного решением.

И методе аналитики на основе больших данных используют не только правоохранительные органы. Так, например, согласно недавнему исследованию Ernst and Young, каждая седьмая компания использует такого рода инструменты для выявления злоупотреблений и коррупции. А 72% респондентов считают, что развитие технологий обработки больших массивов данных способно сыграть ключевую роль в противодействии мошенничеству и его обнаружению. 90% опрошенных полагают, что технологии интеллектуального анализа данных сделают оценку рисков более совершенной, при этом 82% отмечают, что они будут содействовать более раннему обнаружению незаконных действий.

Точка зрения автора может не совпадать с позицией редакции.