«Урок цифры» - всероссийская образовательная акция, в рамках которой школьники с 1 по 11 класс смогут в игровой форме познакомиться с основами программирования и погрузиться в увлекательный мир цифровых технологий.
«Урок цифры» продлится с 13 февраля по 12 марта 2023 года! Уроки пройдут в каждой школе во всех учебных параллелях с 1 по 11 класс. Попробуй свои силы на «Уроке цифры»!
Почему сегодня так популярна специальность аналитика данных? С какими данными работают аналитики? Почему важно уметь работать с данными? Что можно узнать анализируя данные? Зачем необходима аналитика данных в бизнесе и при создании продуктов? Как данные помогают сделать программные продукты востребованными пользователями?
Что такое анализ в бизнесе
Анализ данных в бизнесе или бизнес-анализ - это анализ данных, который позволяет определять текущее состояние бизнеса или проекта и формировать рекомендации, как улучшить деятельность предприятия.
В современном мире, когда существуют различные способы накопления данных и извлечения из них полезной информации, уже редко можно увидеть, что руководитель, основываясь только на своей интуиции, принимает какое-то важное решение. Компании всё чаще принимают решения на основе данных.
Организации используют бизнес-анализ по следующим причинам:
Понять структуру и динамику организации или проекта.
Понять текущие проблемы в организации и выявить возможности улучшения.
Чтобы клиент, конечный пользователь и разработчики имели общее представление об организации.
Кто такой бизнес-аналитик
Бизнес-аналитик - это тот, кто анализирует работу организации или проекта и документирует её бизнес-процессы или системы, оценивая бизнес-модель или ее интеграцию с технологией.
В крупной ИТ-организации, особенно в среде разработки, можно найти «бизнес-аналитика», который выступает в роли ключевого человека: иногда он взаимодействует с бизнес-пользователями, а иногда и с техническими пользователями, и, наконец, со всеми заинтересованными сторонами в проектах, чтобы получить одобрение и окончательное одобрение, прежде чем приступить к документации. Следовательно, роль бизнес-аналитик очень важна для эффективного и успешного запуска любого проекта.
Данные накапливаются во всех системах - от магазинов и ресторанов до компаний-монополистов и приложений с миллионной аудиторией. В бизнес-приложениях – данные о производстве и продажах, в онлайн-кинотеатрах - просмотры фильмов и отзывы, в социальных сетях – лайки, репосты и просмотры контента. Любой продукт, у которого есть аудитория, собирает данные. Аналитика есть в онлайн-магазинах, банках, играх, в образовании. Там, где есть возможность сохранять данные о продукте и поведении пользователя, требуются аналитики. Бизнес-аналитик помогает сделать так, чтобы собранная информация приносила пользу бизнесу, поэтому ему нужно разбираться в бизнес-процессах не хуже владельца компании.
Бизнес-аналитик – важный участник бизнеса, потому что обеспечивает уверенность в принятии решений. Создавать новый продукт очень дорого, а ошибка при внедрении новой функции может стоить компании репутации и прибыли. Бизнес-аналитики проводят тесты и строят модели, чтобы проверить, как пользователи или клиенты реагируют на нововведения, и оценить перспективы того или иного проекта. Это дешевле и снижает риски бизнеса. Чтобы делать свою работу хорошо, аналитик должен видеть бизнес-процессы и влиять на процесс принятия решения, основываясь на результатах своих исследований.
«Бизнес-аналитик может глубже исследовать проблему. Например, в данных по ДТП в России есть доля водителей, которые нарушили правила ОСАГО. Зная эту долю и то, как она менялась в разные годы, можно сделать выводы о социально-экономической ситуации в регионе — увидеть тенденцию, когда водители перестают покупать полисы, потому что не хватает денег.
Из того же датасета можно вытащить информацию про скрывшихся водителей. Оказалось, что в Омской области 20% водителей покидают место ДТП. Получив эту информацию, можно задать дополнительные вопросы: почему так происходит, что это за социальные и культурные процессы» (Сергей Устинов, аналитик данных и проджект-менеджер).
Продуктовая аналитика
Продуктовая аналитика позволяет бизнесу увидеть, как пользователи взаимодействует с продуктом: как именно его используют, в какой последовательности совершают действия, на какие нажимают кнопки. На основе этих данных клиентов можно разделить на сегменты. Понимая, что именно в продукте интересно разным сегментам аудитории, можно понять, что в нем стоит исправить или улучшить.
Продуктовая аналитика помогает:
сделать продукт удобнее для пользователей;
привлечь новую аудиторию;
удержать интерес к продукту;
сократить расходы;
поднять продажи.
Под «продуктом» могут пониматься разные вещи. Скажем, в банковской сфере это и финансовые продукты, к примеру потребительское кредитование, и программные продукты, например мобильный банк. У того и у другого есть продуктовые команды, есть определенные цели, задачи и метрики эффективности, а значит, везде нужна продуктовая аналитика, чтобы отслеживать достижение показателей.
Для начала необходимо понять целевую аудиторию, то есть какому кругу людей будет необходим данный продукт. Обычно целевая аудитория является портретом пользователя, который включает в себя такие признаки, как: возраст, пол, город проживания.
Интерфейс - это посредник между человеком и программой, он часто включает в себя расположение кнопок, цветовой дизайн, меню и многое другое.
Когда разрабатывается интерфейс, нужно быть уверенными, что именно этот вариант интерфейса будет удобен и понятен пользователю.
Чем занимается аналитик
Аналитик собирает, структурирует, интерпретирует данные так, чтобы они отвечали на конкретные вопросы и запросы организации, а также давали возможность прогнозировать деятельность или улучшать продукты компании. Анализу могут подвергаться как внутренние данные организации, так и внешние данные, собранные по открытым источникам, партнерам, или с помощью проведения опросов целевой аудитории. Другими словами, аналитик читает данные, переводит набор цифр в слова, тренды, подтверждает или опровергает гипотезы и делает это не субъективно, а полагаясь на цифры. Он учитывает все связанные аспекты тестирования программного обеспечения, анализа и постпроцессного обслуживания. Аналитик ищет полезные закономерности, проверяет гипотезы и презентует результаты исследований.
Задачи аналитика данных
Для каждого бизнеса задачи будут свои, а порядок действий общий. Аналитик данных работает так:
собирает данные (формирует запрос сам или получает задачу от менеджеров);
знакомится с параметрами набора (какие типы данных собраны, как их можно отсортировать);
проводит предварительную обработку (очищает от ошибок и повторов, упорядочивает);
интерпретирует (анализирует, собственно решает задачу);
делает вывод;
визуализирует (так, чтобы на основе вывода можно было принять решение, подтвердить или опровергнуть гипотезу).
Методы и инструменты аналитика
А/B тестирование
Метод А/B тестирование - исследование, которое позволяет выявить, нравится ли пользователю новое изменение в продукте или нет.
Например: Нужно выяснить, как пользователи реагируют на то, какого цвета кнопка, желтого или голубого. Аналитик тестирует два прототипа. Часть пользователей видят прототип с желтой кнопкой, другие - с голубой. Он смотрит, как реагировали пользователи, проверяет, было ли различие статистически значимо. В итоге - рекомендует решение, которое проверил в ходе теста: внедрить желтую или голубую кнопку.
Метод проверки гипотезы
Метрика показывает некоторую характеристику продукта. Например, количество лайков под фотографией - это метрика.
Гипотеза - это предположение о чем-либо. Необходимо это сформулировать гипотезу, а затем подтвердить или опровергнуть её.
Например: Сделать расчет определенной метрики - сколько сотрудников уволилось до конца испытательного срока в этом году и сколько в предыдущем. Если компания вводит новую систему адаптации, то изменения такой метрики покажут результат.
или
Проверить гипотезу и выяснить, какой товар и в какое время больше покупают: взять группу товаров и посмотреть, есть ли сезонные всплески интереса, сравнить с другими группами.
Кроме того, аналитик может решать следующие задачи:
Получить выгрузку данных для определенных целей, например, когда бухгалтерии нужен список сотрудников, у которых в семье трое детей, - специалист делает выгрузку из базы данных.
Провести исследования, например, взять внешние или внутренние данные, исследовать, найти аномалии или инсайты.
Просчитать, какой вариант выгоднее, например: рассчитать ROI (коэффициент возврата инвестиций), оценить окупаемость рекламной кампании или скорректировать бизнес-модель.
Все эти действия аналитик выполняет с помощью специальных инструментов.
Статистический анализ
Статистика - это наука, которая занимается анализом числовых данных о разнообразных массовых явлениях, происходящих в природе и обществе.
Статистика и статистический анализ позволяют сделать общие выводы по конкретному вопросу. С помощью методов статистики можно найти ответы на такие вопросы: какие яблоки в магазине самые вкусные, какова средняя цена этих яблок в магазинах города, а где можно купить самые дешевые, можно даже найти взаимосвязь между количеством продажи яблок и составом семьи.
Электронные таблицы
Электронные таблицы - это доступный инструмент для работы с большими рядами числовых данных. Электронные таблицы используются во многих компаниях, и позволяют хранить и анализировать данные. В таблице есть строки и колонки. Зная наименования колонок и строк, а также координату ячейки каждого числа, можно рассчитывать различные показатели. Например, с помощью функции СРЕДНЕЕ ЗНАЧЕНИЕ можно узнать среднюю цену продукта.
Базы данных и SQL
У электронных таблиц есть некоторые ограничения, одно из них - это количество строк. Поэтому программисты разбивают большие данные на несколько таблиц и организуют между ними связи. Так таблицы превращаются в базы данных, которые имеют свой язык общения - SQL.
База данных (БД) - это это программа, которая позволяет хранить и обрабатывать информацию в структурированном виде. БД - отдельная независимая программа, которая не входит в язык программирования. В базе данных можно сохранять любую информацию, чтобы позже получать к ней доступ. Базы данных позволяют обрабатывать, хранить и структурировать намного большие объёмы информации, чем таблицы. Отличия таблиц от баз данных основаны на главном свойстве последних: информацию можно связать, даже если она находится в разных таблицах. Удалённый доступ и система запросов позволяет множеству людей одновременно использовать базы данных.
SQL - это язык запросов, который применяют, чтобы работать с базами данных, структурированных особым образом. Зная его, можно получать ответы на разные вопросы. Например, узнать сколько яблок находится на складе магазина. Для этого нужно воспользоваться языком SQL и получить ответ на запрос.
Язык SQL нужен аналитикам, чтобы выгружать и обрабатывать большие объёмы данных. Правильно организованные запросы помогают извлекать полезную информацию о клиентах и пользователях, сортируют её по определённым категориям, анализируют работу бизнеса.
Например: интернет-магазин доставляет товары по всей стране. У него обширная база клиентов. Владелец магазина хочет понять, как улучшить доставку и на какие регионы обратить внимание. Для этого он ставит задачу аналитику, который с помощью SQL-запросов выгружает данные о каждом регионе и сортирует их по объёму заказов.
Трендовые линии
С помощью анализа данных можно предсказывать будущее. Анализ в бизнесе основан на гипотезе о том, что цены придерживаются трендов, будучи движимыми силами предложения и спроса.
Тренд - это устойчивая во времени тенденция или направленность изменения показателей (объема рынка, расходов, количествоа покупок, количество визитов и т.д)
Например: руководителю отдела закупок необходимо рассчитать, сколько яблок нужно закупить на следующий месяц, чтобы они были все проданы и не испортились, и какую цену установить на этот продукт. Для решения этой задачи бизнес-аналитик использует метод трендовых линий.
Линии тренда являются важным элементом анализа, она используется для составления прогнозов и в обычной жизни. Линия тренда есть ни что иное как линия, проведенная через две (или более) точки графика, и растягивающаяся по графику.
В бизнесе линии тренда используются для обнаружения и подтверждения направленного движения цены, так называемого тренда. Например, на основе предыдущих данных можно предсказать, какова будет стоимость яблок в магазине в следующем месяце и будут ли они распроданы.
Восходящие линии тренда означают, что спрос на продукт растет несмотря на растущую цену. Растущий спрос и растущая цена означают, что все яблоки будут проданы по хорошей цене.
Нисходящие линии тренда означают, что предложение на продукт растет растет несмотря на падающую цену. Повышенное предложение и падающая цена означают, что яблок в магазине слишком много и даже уменьшение цены не позволит их распродать.
Языки программирования и программное обеспечение (ПО)
Проводить анализ данных можно с помощью языков программирования, например Python и R. Аналитики со всего мира используют готовые библиотеки для анализа данных и делятся своими решениями с другими аналитиками. Для анализа данных используется среда программирования на Python Jupiter Notebook, Oracle или MySQL, а также современное аналитическое ПО Tableau, Power BI.
Визуализация данных
Цифры в таблицах и документах не показывают наглядно взаимосвязи между процессами, периоды роста или спада, зависимости показателей. Визуальный формат представляет информацию и вырисовывает цельную картину происходящего. Аналитик умеет превращать результаты анализа данных в понятную информацию с помощью средств визуализации данных.
Визуализация данных - это графическое представление информации и аналитики. Этот инструмент приводит огромное количество информации в порядок, помогает быстрее понимать её, подчёркивает тренды. В бизнесе визуализация помогает на многих этапах - от кадровых решений до предоставления скидки конкретному покупателю.
В визуализации используются наборы графиков и диаграмм, карты. Столбчатая диаграмма и гистограмма используются для представления числовых различий между категориями. Линейная диаграмма демонстрирует изменения данных за непрерывный интервал времени. Круговая диаграмма используется для представления соотношения различных классификаций. Она подходит в основном только одной серии данных, но ее можно сделать многоуровневой, чтобы отображать долю данных в разных категориях.
График - линия, дающая наглядное представление о характере зависимости какой-либо величины от другой. График позволяет отслеживать динамику изменения данных. Значения зависимой величины изображаются: в виде кривых; в виде точек; в виде кривых и точек.
Диаграмма - графическое изображение, дающее наглядное представление о соотношении нескольких величин или нескольких значений одной величины.
Круговая диаграмма служит для сравнения нескольких величин в одной точке.
Столбчатые диаграммы позволяют сравнивать несколько величин в нескольких точках.
Лепестковая диаграмма - диаграмма в которой для каждой точки ряда данных предусмотрена своя ось.
Дашборд - это интерактивная аналитическая панель, графический интерфейс. Смысл в том, что на одном экране расположены все ключевые метрики, показатели цели или процессов. С помощью этих метрик можно выявить и проанализировать тренды и изменения. Пользователи могут панель индикаторов, меняя анализируемые данные или подгружая их в реальном времени.
Дашборды помогают увидеть достижения и провалы, анализировать их причины, находить инсайты. Аналитические дашборды — это вид отчетов, которые содержат уже гораздо больше данных, и именно здесь на помощь приходят визуализация и интерактив.
Дашборды позволяют объединять данные и обобщать основную информацию по различным параметрам. Они не просто визуализируют основные показатели, но позволяют отслеживать тенденции для разных временных отрезков. В этом основное преимущество дашбордов в сравнении с другими инструментами визуализации.
Профессия аналитик
По данным компании Statista, объём данных, создаваемых, фиксируемых, копируемых и потребляемых во всём мире, растёт по экспоненте. К 2025 году у нас будет 181 зеттабайт данных. (1 Зеттабайт = 1 099 511 627 776 Гигабайт)
Это значит, что специалисты, которые умеют ориентироваться в этом потоке и извлекать из него пользу, становятся всё более востребованными на рынке труда. Очень важны бизнес-аналитики особенно в крупных компаниях, где ошибки стоят дорого. Практически в любом направлении, где есть возможность сохранять данные о продукте и поведении пользователей и клиентов, будут появлятся задачи и работа для аналитика. Бизнес-аналитик ставит эту задачу и переводит результаты на понятный бизнесу язык.
Кроме бизнес-аналитиков во всех, компаниях, которые производят продукты, в том числе и IT-продукты требуются продуктовые аналитики.
В чем разница между бизнес- и продуктовым аналитиком? Продуктовый аналитик помогает запускать и развивать цифровые продукты: приложения, интернет-сервисы и сайты. Он следит за поведением пользователей, собирает данные и переводит их на язык бизнеса. Продуктовый аналитик исследует все важные метрики продукта и даёт рекомендации, как их улучшить. В результате сервисы становятся более удобными, а прибыль компании растёт. Основные функции продуктового и бизнес-аналитика схожи: сбор требований, ведение документации, составление жизненного цикла продукта или плана проекта, связь между техническими и бизнес-командами, управление сферой деятельности и ожиданиями заинтересованных сторон и т.д.
Без аналитика продуктовая команда не сможет выстроить важные процессы:
Выбрать метрики, на которые направлены задачи команды. Не все данные одинаково важны для развития продукта, поэтому аналитик помогает команде расставить приоритеты и выделить ту область знаний, на которую стоит обратить внимание. Такой подход экономит бюджет компании на хранение и обработку данных.
Провести пилоты и эксперименты. Интерпретация результатов - самая важная часть тестирования, за которую тоже отвечает аналитик; здесь важны правильная подготовка к тестированию и корректное статистическое обоснование результатов эксперимента.
Рассчитать экономическую модель и оценить прибыльность произведенного продукта. Создание нового продукта, перезапуск или внедрение новых возможностей в бизнесе должны быть финансово обоснованы. Аналитик устанавливает взаимосвязи между характеристиками продукта и управляет изменениями и процессами планирования.
В профессии есть одно жесткое требование - склонность к аналитическому мышлению, аналитику потребуется постоянно погружаться в массивы информации, смотреть на них комплексно, будут нужны компетенции на стыке маркетинга, экономики и программирования.
Аналитик
знает хотя бы один язык программирования: Python или R;
умеет писать запросы к базам данных SQL;
может показать выводы и метрики в виде понятного дашборда (Tableau, Power BI, Amplitude);
хочет разбираться в бизнес-процессах, мыслит в терминах бизнес-задач.
Аналитику данных нужно понимать, что такое статистика и гипотеза. В зависимости от запроса компании могут понадобиться навыки работы с Яндекс.Метрикой или программным обеспечением.
Профессиональные компетенции
В работе аналитика большое значение имеют soft skills:
Любопытство. Желание во всем разобраться и понять, почему происходит именно так, а не иначе.
Умение искать и находить данные, интерпретировать эти данные, строить прогнозы, находить зависимости между событиями, строить и проверять гипотезы, критически мыслить.
Отсутствие страха перед цифрами, таблицами, отчетами, кодами, текстами.
Объективность. Нельзя притягивать свое личное мнение к данным. Важно сохранить нейтралитет к полученным результатам анализа, показать их, как есть, и описать, какие могут быть причины такого результата.
Внимательность. Дело не только в ошибках расчета, но и в интерпретации данных. То есть мало просто показать динамику, важно понимать, точно ли она такая и какое у нее объяснение.
Умение писать простым, понятным языком, визуализировать данные.
Умение разбираться в документах, законах и нормативно-правовых актах.
Терпение.
Коммуникабельность. Аналитик много общается с коллегами, экспертами и стейкхолдерами.
В зависимость от отрасли, размера бизнеса и других работы набор навыков будет отличаться. Вот ориентир - то, к чему стоит стремиться, чтобы стать дата-аналитиком.
КАРТИНКА!!!!
Какие задачи выполняет аналитик?
Основная часть рабочего времени бизнес-аналитика уходит на общение с командой, чтобы донести требования заказчика, проговорить варианты реализации, ответить на имеющиеся и собрать новые вопросы. Во-вторых, общение с клиентом: выявление требований, фиксация договоренностей, определение приоритетов. В-третьих, бумажная работа: подготовка спецификаций, анализ документов, которые являются источниками требований.
Главный результат работы бизнес-аналитика — снижение неопределенности у заказчика и команды: появляется понимание, куда и как двигаться. Продукт аналитика - документы: перечень функциональных и нефункциональных требований, пользовательские истории, модели, дашборды. Команда видит, что в каком порядке делать и действия согласованы с заказчиком. Еще один результат - база знаний, которая нужна, чтобы понимать, на основе каких требований система была построена. Она пригодится для сопровождения системы и переиспользования в других проектах.
Продуктовый аналитик собирает данные, анализирует их, строит гипотезу, презентует ее, проверяет и так по кругу. Такой круг HADI-циклам. Данных много, поэтому после одной гипотезы обязательно идёт другая.
Если смотреть на работу с точки зрения задач, то можно выделить три направления:
Определение действий и параметров пользователей для отслеживания. Чтобы выстроить гипотезу или оценить проблему, нужно выбрать правильную информацию.
Настройка сбора релевантной информации. Это одно из условий успешной проверки гипотезы, ведь ее надо с чем-то сравнивать.
Визуализация данных для принятия решений. Сюда входят отчеты, графики и другие наглядные изображения, ведь гипотезу надо верно подать руководству.
Любому аналитику, будь то продуктовый или бизнес-аналитик, безусловно нужны базовые знания, которые дают школьные предметы такие как математика, информатика, обществознание. В основе инструментов анализа данных лежат разделы математики, изучаемые в средних и старших классах школы: комбинаторика, теория вероятностей, элементы статистики, линейная алгебра, начала математического анализа. Понимание законов бизнеса, экономики и рынка даёт обществознание. Понимание, что такое информация, и как её обрабатывать; умение работать с электронными таблицам, базами данных - создавать их, обрабатывать и извлекать информацию, строить графики и диаграммы, создавать дашборды, знание основных алгоритмов и умение строить модели и проверять их - всё это даёт информатика и информационные технологии.
Математика
Разделы математики, которые необходимо изучать, чтобы преуспеть в аналитике данных:
Линейная алгебра (Векторы. Нормы. Матрицы)
Начала математического анализа (Функции и графика функций. Пределы, производные)
Теория вероятностей и элементы статистики.
Информатика
Знания, умения и навыки, которые потребуются для освоения специальности аналитика данных.
уметь:
выполнять базовые операции над объектами: цепочками символов, числами, списками, деревьями; проверять свойства этих объектов; выполнять и строить простые алгоритмы;
создавать и использовать различные формы представления информации:
формулы, графики, диаграммы, таблицы (в том числе динамические, электронные, в частности – в практических задачах), переходить от одного представления данных к другому; создавать записи в базе данных;
искать информацию с применением правил поиска (построения запросов) в базах данных, компьютерных сетях, некомпьютерных источниках информации (справочниках и словарях, каталогах, библиотеках) при выполнении заданий и проектов по различным учебным дисциплинам;
использовать приобретенные знания и умения в практической деятельности и повседневной жизни для:
создания простейших моделей объектов и процессов в виде изображений и чертежей, динамических (электронных) таблиц, программ (в том числе в форме блок-схем);
проведения компьютерных экспериментов с использованием готовых моделей объектов и процессов.
Обществознание
Разделы обществознания, которые необходимо изучать, чтобы быть готовым изучать аналитику данных:
Экономика и ее роль в жизни общества. Товары и услуги, ресурсы и потребности, ограниченность ресурсов. Альтернативная стоимость. Экономические системы и собственность. Разделение труда и специализация. Обмен, торговля. Формы торговли. Реклама.
Деньги. Инфляция. Банковские услуги, предоставляемые гражданам. Формы сбережения граждан. Страховые услуги. Неравенство доходов и экономические меры социальной поддержки. Экономические основы прав потребителя.
Рынок и рыночный механизм. Предпринимательств.. Производство, производительность труда. Факторы, влияющие на производительность труда. Малое предпринимательство и фермерское хозяйство. Издержки, выручка, прибыль. Заработная плата и стимулирование труда. Налоги, уплачиваемые гражданами. Безработица и профсоюз.
Экономические цели и функции государства. Международная торговля.
Материал для работы с тренажёром обучающихся 1-11 классов.