Связаться с нами
Закрыть
Назад в блог
Назад в блог

Как анализировать данные продаж с помощью Google BigQuery и Data Studio

#аналитика
18 февраля 767 просмотров 10 минут на чтение

Обработка большого количества данных в Гугл Таблицах может стать целым испытанием: медленная работа и подвисание здесь неизбежны. Однако выход есть. BigQuery поможет быстро обработать информацию из таблиц, с которой дальше будет легко работать в Google Data Studio. Мы сделали перевод подробной инструкции, как использовать эту связку инструментов, и снабдили ее большим количеством скриншотов. Так что, разобраться с этой задачей не составит труда.

Согласно Google Cloud, «BigQuery – это безсерверное, высокомасштабируемое и экономичное хранилище облачных данных со встроенным компонентом BI Engine и машинным обучением».

В этой статье мы покажем, как BigQuery может помочь обрабатывать большие объемы данных, находящиеся в Гугл Таблицах, которые Google Data Studio не сможет обрабатывать, будучи подключенной непосредственно к таблице.

Ниже приведен пример данных. В нем показаны данные о продажах гипотетического бизнеса в Южной Африке, продающего различные продукты питания.

Вот, как будет выглядеть отчет Data Studio. Мы видим, что фильтрация данных и работа с ними происходит очень быстро, несмотря на большое количество строк (более 20 000) в источнике данных.

В нашей Гугл Таблице есть следующие данные:
  •  ID покупки;
  • дата покупки;
  • предмет;
  • количество купленных предметов;
  • город, в котором произошел заказ;
  • страна, где произошел заказ.

Здесь более двадцати тысяч строк, что делает работу с данными мучительно медленной, если мы будем делать ее прямо в Гугл Таблицах.

Чтобы получить отчет в Data Studio, который можно быстро фильтровать и с которым будет комфортно работать, нам нужно поместить эти данные в BigQuery.

Скачать пример данных

Ниже приведены данные в виде электронной таблицы Excel, если вы хотите повторить этот отчет.

Пример данных для загрузки BigQuery (2019-11-05)

Загрузив этот файл, вы можете добавить его в Google Таблицу и потренироваться, повторив шаги, которые мы будем делать в этой инструкции.

Шаг 1. Создайте учетную запись Google BigQuery

Ссылки ниже помогут вам начать работу.

Установить BigQuery

Начало работы с BigQuery

BigQuery – Уроки

Теперь можно приступать.

Шаг 2. Создание проекта BigQuery

Первое, что нужно сделать, – это создать проект в рамках BigQuery.

После создания проекта можно перейти к созданию набора данных.

Шаг 3. Создание набора данных BigQuery

В новом проекте BigQuery будет отображать сообщение «Запросов нет. Создайте запрос».

Для этого нужно нажать на кнопку «Создать набор данных».

Даем ему название. В примере это будет «Sales_data_example». У вас также есть возможность выбрать, где данные будут расположены. Можно выбрать «По умолчанию».

После того, как вы назвали свой набор данных и внесли какие-либо корректировки (окончание срока хранения таблицы, шифрование), нажмите на кнопку внизу, чтобы создать набор данных.

Теперь мы видим в нашем тестовом проекте, что у нас есть набор данных «Sales_data_example». Следующим шагом является создание таблицы в этом наборе данных.

Нажав на название проекта, в правом верхнем углу вы увидите кнопку «Создать таблицу». Нажмите на нее, чтобы начать работу.

Шаг 4. Создание таблицы в наборе данных BigQuery

Нажмите на кнопку «Создать таблицу».

Ниже показано, что вы увидите после того, как ее нажали. Теперь нужно заполнить поля.

Первым делом нужно выбрать, откуда мы будем получать данные. Как упоминалось ранее, у нас есть большая Гугл Таблица, содержащая более двадцати тысяч строк данных. Мы хотим подключиться к этому листу.

Поэтому создаем таблицу на основе «Диска», как показано ниже.

*Если вы тренируетесь с примером данных, ссылка на который была дана в начале статьи, то перенесите эту таблицу Excel в таблицу на Гугл Диск. 

Нам нужна ссылка на конкретный документ в Гугл Таблицах. Чтобы получить ее, откройте Google Диск, найдите таблицу и нажмите «Копировать ссылку общего доступа». 

Далее мы увидим, что доступ по ссылке включен.

Studio14.jpg

Теперь мы можем создать нашу таблицу:
  • Создать таблицу на основе: Диск.
  • Выберите Drive URI: наша ранее скопированная ссылка.
  • Формат файла: Таблица Google.

Вы также должны назвать свою таблицу. В примере назовем ее «Sales_data_sheets».

Далее нужно поработать со схемой таблицы. Сделать это можно, нажав на кнопку «Добавить поле». Основываясь на столбцах в Google Таблице, мы разметим схему следующим образом:
  • ID (целое число)
  • Дата (дата)
  • Предмет (строка)
  • Количество (целое число)
  • Город (строка)
  • Страна (строка)

После того, как мы разметили схему, мы можем щелкнуть «Создать таблицу», чтобы создать ее в нашем наборе данных.

Итак, ниже мы видим в нашем проекте набор данных и вновь созданную таблицу.

В настройках таблицы (если щелкнуть на ее название) мы видим, что схема соответствует той, что мы добавили при создании.

Следующим шагом будет отправка запросов.

Шаг 5. Отправка запросов к таблице

Нажмите кнопку «Отправить запрос к таблице», чтобы начать процесс.

Мы получаем SQL-запрос. Скорее всего, потребуется добавить звездочку *, чтобы запрос читался.

SELECT * FROM ‘project_name.dataset_name.table_name’ LIMIT.

SELECT * означает выбрать все из таблицы.


 


 

Следующий шаг – нажать «Выполнить» под запросом. Обработка данных займет около минуты.

Ниже – конечный результат завершенного запроса в разделе «Результаты запроса». Мы видим, что наши метки схемы точно отражают содержимое столбцов. Также мы видим, что у нас есть 21825 строк в наших результатах запроса.

Следующим шагом является сохранение результатов. Есть различные варианты сохранения файла, но нам необходимо сделать это в виде таблицы BigQuery.

В качестве названия в этом примере пишем «BigQuery_Sales_data».

Таким образом, в нашем проекте мы имеем наш набор данных Sales_data_example, Sales_data_sheets (который связан с Гугл Таблицей) и BigQuery_Sales_data (который основан на результатах запросов к таблице).

Шаг 6. Добавление сохраненных результатов в отчет Data Studio

Мы хотим связать наш отчет в Google Data Studio с нашей таблицей результатов запросов, а не с таблицей на основе Google Таблиц.

Нам нужно подключиться к результатам запроса, чтобы получить скорость, необходимую для анализа этого объема данных. Таким образом, в этом примере мы хотим подключить Data Studio к BigQuery_Sales_data, а НЕ Sales_data_sheets. 

Создайте новый отчет в Data Studio и выберите BigQuery в качестве коннектора.


Находим правильную таблицу. В данном случае это «BigQuery_Sales_data». Нажимаем кнопку «Связать». 

Затем мы можем увидеть поля в нашей таблице. Data Studio правильно догадалась, какой тип данных они представляют (город, число и т.д.). Также добавлена метрика количества записей (Record Count).

Теперь мы можем добавить наши данные BigQuery в отчет и начать работать с ними. Для этого нажмите кнопку «Добавить к отчету».


Шаг 7. Создайте отчет Data Studio и проанализируйте данные

Теперь у нас есть данные в нашем отчете. Мы можем их фильтровать и работать с ними с более высокой скоростью, чем это было бы возможно при использовании Google Таблиц. 


Несмотря на то, что у нас более двадцати тысяч строк, это небольшой набор данных по сравнению с тем, что возможно анализировать с помощью Big Query!

Источник: «How to analyse sales data using Google BigQuery and Data Studio» by Michael Howe-Ely

Хотите получать статьи и новости в удобном формате? Подписывайтесь на наш Телеграм-канал.  
Другие статьи по теме
15 января 982 просмотра 6 минут
#аналитика
Цели в Google Analytics: как создать, настроить и установить
06 октября 528 просмотров
#аналитика
Что такое Big Data простыми словами
Большие данные становятся неотъемлемой частью нашей жизни. Все мы ежедневно используем какие-либо технологии и контактируем с продуктами и крупными компаниями. Компании предлагают нам свои продукты и, в свою очередь, используют данные, которые мы им предоставляем (начиная от отслеживания переходов на сайте и заканчивая персональной информацией при оформлении заказов). Настал момент подробнее разобраться, как собираются эти огромные потоки информации и что с ними делают.
10 сентября 345 просмотров
#аналитика
Customer Journey Map: что это, зачем, источники информации, где и как визуализировать
«Клиент редко покупает то, что бизнес ему продает», – сказал Питер Друкер, один из известных теоретиков менеджмента. Многие клиенты вкладывают другие смыслы в ваши товары и приходят к покупке с помощью тех каналов, которым вы, возможно, не уделяли внимание.
22 июля 2187 просмотров 4 минуты
#аналитика
CRM-системы: что это такое и зачем они нужны
Автоматизация рабочих процессов сейчас – это привилегия не только крупного бизнеса. IT-технологии развились до такой степени, что различные аналитические системы и другие нужные продукты стали доступны малым и средним компаниям. В том числе и программы для автоматизации работы с клиентами. Если вы все еще сомневаетесь в необходимости внедрения CRM-системы, то эта статья для вас.
20 июля 306 просмотров 4 минуты
#аналитика
Применение машинного обучения в Google таблицах с помощью библиотеки Tensorflow.js и Google Apps скрипта
Тема машинного обучения сейчас очень актуальна и продолжает набирать обороты. Машинное обучение — это алгоритм, с помощью которого система распознает данные и их закономерности, предсказывает значения на основе обученной модели.
02 июня 391 просмотр 3 минуты
#аналитика
Сервис передачи расходов из Яндекс.Маркета в Яндекс.Метрику
MediaNation начала работу над созданием собственного сервиса стриминга данных – StreamMyData. Первый коннектор, который представлен в системе, позволяет передавать данные о расходах из Яндекс.Маркета в Яндекс.Метрику. Это означает, что в Метрике вы сможете видеть расходы по Яндекс.Маркету, сопоставлять их с данными по продажам и доходу и принимать решения о том, как повысить эффективность размещения на Яндекс.Маркете.
27 мая 300 просмотров 1 минута
#аналитика
Как в Google BigQuery разделить значение столбца по символу
Часто в UTM-метках используется символ вертикальной черты (|), который разделяет параметры визуально. В результате при передаче таких данных в базу два важных параметра попадают в один столбец, что затрудняет их дальнейший анализ. Возникает вопрос: как их “физически” разделить, если работа с данными ведется в Google BigQuery?
20 мая 1120 просмотров 8 минут
#аналитика
Кейс: сквозная аналитика для Tilda-сайта и нестандартной CRM
Мы привыкли, что сквозная аналитика востребована в крупном ритейле, и для ее обеспечения используются большие сложные CRM. Однако этот кейс демонстрирует, что связь транзакций и источников лидов интересует всех, кто хочет грамотно подходить к маркетингу. Даже модных блогеров, чьи сайты созданы на Tilda, а используемая CRM ограничена в функционале.
23 апреля 282 просмотра 8 минут
#аналитика
Маркетинговая аналитика во времена COVID-19 – опыт Google
На днях Thinkwithgoogle.com опубликовал материал своего руководителя отдела стратегической аналитики, Авинаша Кошика, где тот рассказывает, от какой аналитической работы его отдел отказался на период пандемии, а какую продолжает вести. Любопытный материал с точки зрения отношения (очень) крупного бизнеса к текущей ситуации. Приводим наиболее интересные тезисы.
19 декабря 282 просмотра 7 минут
#аналитика
Как А/Б-тестирование заявки на звонок увеличило конверсию на 17%. Кейс
Внешность имеет значение. Особенно, если мы говорим о сайте. Но как именно влияют внешние элементы сайта? Маркетологи MediaNation решили провести эксперимент и выявить, как визуал страницы изменит показатели конверсий. Подробнее об эксперименте и его результатах читайте в кейсе.
Давайте работать?
Мы верим в ваш бизнес
Наверх