Аналитик Big Data

Уметь работать с непрекращающимся потоком данных – задача аналитика Big Data

Современный мир – это огромное количество данных, генерируемых каждым из нас. Каждый клик, каждое просмотренное в интернете видео, прослушанный на стриминговом сервисе трек и лайкнутый в социальной сети пост, каждая оплаченная банковской картой покупка – все это может многое рассказать о нас, наших предпочтениях и желаниях. И это весьма ценная информация, не только для бизнеса, пытающегося лучше понять своего потенциального покупателя, но и для государственных структур, анализирующих поведение тех или иных групп населения и делающих на основе полученных данных соответствующие прогнозы.

Однако если получить подобные данные относительно несложно (мы сами охотно оставляем за собой цифровой след, пользуясь различными гаджетами и сервисами), то интерпретировать их – задача уже совсем иного уровня сложности. Как минимум потому, что массив анализируемой информации не только огромен, но и постоянно увеличивается. Уметь работать с непрекращающимся потоком данных, уметь находить в нем закономерности и делать достоверные прогнозы – задача аналитика Big Data.

Чем занимается аналитик Big Data

Если говорить максимально простыми словами, то задача аналитика Big Data – объяснить понятным языком, что именно значат полученные данные, и дать на их основании определенные прогнозы.

Пример: в распоряжении аналитика есть большое количество данных о транзакциях, совершаемых с помощью банковских карт определенного банка. Характер этих данных самый различный – количество транзакций, их сумма, время проведения, географическое распределение, характер трат и т. д. В первую очередь аналитик должен суметь правильно отсортировать полученные данные, очистить их от «мусора». Затем ему нужно придумать, каким образом полученные характеристики можно связать в единую картину – разработать теорию поведения клиентов банка на основе полученных данных. Отталкиваясь от теории, полученной на основе данных, аналитик не только выясняет, как именно клиенты банка пользуются его услугами, но и делает предположения о том, что им нравится или не нравится в предлагаемом сервисе. Сложные схемы, теории и вычисления аналитик должен обобщить в относительно простые заключения, которые смогут понять люди, далекие от анализа данных, в данном случае – владельцы и сотрудники банка.

Какие качества необходимы аналитику Big Data

Какие качества необходимы аналитику Big Data

Индустрия Big Data еще весьма молода, и люди приходят туда из самых разных сфер. Однако все сходятся в том, что успешный аналитик должен иметь навыки из самых разных областей.

В первую очередь, он должен обладать развитыми аналитическими способностями, поскольку его главная цель – понять, что именно означают те или иные данные, уметь их правильно интерпретировать. Здесь ему не обойтись без глубоких знаний по математике (как правило, аналитики Big Data приходят в профессию именно из неё), статистике и отчасти социологии.

Также обязательны навыки в области программирования и разработки ПО. Да, аналитики не занимаются созданием программ для обработки данных напрямую, это задача data engineer. Но после того, как аналитическая модель создана, её практически всегда приходится дополнительно настраивать и корректировать. В целях оперативности аналитикам нередко приходится делать это самим. Ну и, само собой, им необходимо понимать, как работают те или иные аналитические инструменты, каковы их программные ограничения, каким образом получаются и обрабатываются данные – без этого построить релевантную модель будет невозможно.

Аналитик также должен держать руку на пульсе новых технологий – более совершенные методы обработки и анализа данных появляются каждый месяц. У каждого из них своя специфика, свои области применения. Аналитик должен уметь понимать, как то или иное новое программное обеспечение можно адаптировать к конкретной задаче, над которой он в данный момент работает.

Не менее важным для аналитика является умение видеть свою работу с точки зрения бизнеса. При разработке модели аналитик должен максимально четко понять, какую именно информацию хочет получить заказчик, какие инструменты для этого нужно задействовать. Нередко владельцы бизнеса не вполне понимают, каким образом они могут использовать получаемые ими данные. Задача аналитика – разъяснить им это, зачастую, предвидеть своеобразные «точки интереса» заказчика.

Как уже было сказано выше, аналитик должен не только интерпретировать данные, но и описать свои умозаключения языком, понятным для далекого от статистического анализа человека. Почти всегда он прибегает для этого к помощи инфографики. Придумать информативную и при этом не перегруженную лишними деталями визуализацию – еще одна из его задач.

Где учиться на аналитика Big Data

Где учиться на аналитика Big Data

Если вы приняли решение связать свою судьбу с анализом больших данных еще в школе, то лучше всего приналечь на математику и информатику. Хорошее знание английского языка также критически важно, поскольку вся актуальная периодика по теме и 95% технической документации на русском недоступны.

Правда, поступить на программу, связанную с анализом Big Data, сразу после школы будет весьма проблематично. Образование – очень консервативная сфера, новые специальности проникают в учебные планы университетов крайне медленно. На данный момент большинство российских вузов могут предложить бакалаврам лишь краткий курс, связанный с анализом Big Data (либо не предлагают по данной теме вообще ничего). Исключение составляет НИУ «Высшая школа экономики», реализующая англоязычную программу бакалавриата «Прикладной анализ данных» совместно с Лондонским университетом.

Наиболее разумной стратегией видится получение бакалаврского диплома в одной из IT-сфер или же в области математической статистики, а затем – продолжение обучения в магистратуре по уже более узкой специальности. Программы магистратуры в области анализа Big Data уже сейчас предлагают многие крупные российские технические университеты – Московский физико-технический институт, Университет ИТМО, Московский государственный университет им. М.В. Ломоносова, Санкт-Петербургский государственный университет и другие.

Где работают аналитики Big Data

На сегодняшний день главные работодатели специалистов в области Big Data – это крупные интернет-компании, такие как «Яндекс», Mail.ru («ВКонтакте»), Rambler и несколько фирм поменьше. Они занимаются сбором самых различных данных через свои сервисы и заинтересованы в том, чтобы понимать привычки и предпочтения своих пользователей как можно лучше.

В этом же заинтересованы и многие другие, менее технологичные отрасли – ретейлеры, банки (хотя вопрос об их технологической отсталости достаточно спорный), службы доставки и т. д. Они пока только начинают активно пользоваться технологиями Big Data, но эксперты прогнозируют, что с каждым годом оперативный и качественный анализ данных будет играть все большую роль буквально в любом бизнесе.