Связаться с нами
Закрыть
Назад в блог
Как в Google BigQuery разделить значение столбца по символу

Как в Google BigQuery разделить значение столбца по символу

#аналитика
27 мая 897 просмотров 1 минута на чтение
Рассказывает
Иван Барченков
Коммерческий директор

Часто в UTM-метках используется символ вертикальной черты (|), который разделяет параметры визуально. Например, нередко мы можем встретить такое оформление UTM рекламной кампании и ее идентификатора: 

utm_campaing = g_search_brand_msk|5692553230

В результате при передаче таких данных в базу два важных параметра попадают в один столбец, что затрудняет их дальнейший анализ. Возникает вопрос: как их “физически” разделить, если работа с данными ведется в Google BigQuery?

В качестве решения можно использовать следующий код, написанный на Legacy SQL

В примере ниже column1 - это название столбца в вашей базе данных, где содержатся данные, которые необходимо разделить по символу разделителя. 

SELECT


  CASE

    WHEN INSTR(REGEXP_REPLACE(column1, r'%7C', '|'),"|") = 0 THEN column1

    ELSE subSTRING(column1,

    1,

    INSTR(REGEXP_REPLACE(column, r'%7C', '|'),"|")-1)

  END AS CampaignName,

  CASE

    WHEN INSTR(REGEXP_REPLACE(column, r'%7C', '|'),"|") = 0 THEN ""

    ELSE subSTRING(REGEXP_REPLACE(column, r'%7C', '|'),

    INSTR(REGEXP_REPLACE(gcolumn, r'%7C', '|'),"|")+1)

  END AS CampaignId


FROM


WHERE


GROUP BY

  CampaignName,

  CampaignID 

Вы получите два столбца: CampaignName и CampaignId. В первый попадет текст до символа-разделителя, а во второй - идентификатор кампании. 

Вы можете заметить, что в коде используется регулярное выражение, которое также производит разделение столбцов по символу %7C, который является эквивалентом | в URL-кодировании.

Разделителем может быть любой символ (запятая, точка, дефис, нижнее подчеркивание, слэш, любая буква, цифра, символ или их набор). Чтобы предложенный выше сценарий реализовать с другим разделителем, замените в коде вертикальную черту (|) на ваш символ-разделитель. 

Удачи!

Другие статьи по теме
30 декабря 138 просмотров 15 минут
#аналитика
Борьба за внимание пользователей: как улучшить поведенческие факторы на сайте
22 октября 595 просмотров 10 минут
#аналитика
Кейс Литрес: снимаем ограничения Google Analytics и разрабатываем собственную систему сквозной аналитики
15 октября 1817 просмотров 7 минут
#аналитика
Как найти ядро клиентов, на которых вы точно заработаете деньги
08 октября 1243 просмотра 7 минут
#аналитика
Проверка на идеальность
17 сентября 10235 просмотров 7 минут
#аналитика
Что такое веб-аналитика, а также сервисы и системы для её проведения
Почти все сайты подключены к системам Яндекс.Метрики и Google Analytics. Счетчики установлены, отчеты создаются. Правда, во многих случаях аналитика заканчивается именно на этом этапе. Как организовать действительно эффективную работу по веб-аналитике сайта и сделать ее важной частью бизнеса – в нашем лонгриде.
15 января 5314 просмотра 6 минут
#аналитика
Цели в Google Analytics: как создать, настроить и установить
06 октября 2532 просмотра 5 минут
#аналитика
Что такое Big Data: как работать с большими данными
Большие данные становятся неотъемлемой частью нашей жизни. Все мы ежедневно используем какие-либо технологии и контактируем с продуктами и крупными компаниями. Компании предлагают нам свои продукты и, в свою очередь, используют данные, которые мы им предоставляем (начиная от отслеживания переходов на сайте и заканчивая персональной информацией при оформлении заказов). Настал момент подробнее разобраться, как собираются эти огромные потоки информации и что с ними делают.
10 сентября 1132 просмотра
#аналитика
Customer Journey Map: что это, зачем, источники информации, где и как визуализировать
«Клиент редко покупает то, что бизнес ему продает», – сказал Питер Друкер, один из известных теоретиков менеджмента. Многие клиенты вкладывают другие смыслы в ваши товары и приходят к покупке с помощью тех каналов, которым вы, возможно, не уделяли внимание.
22 июля 3506 просмотров 4 минуты
#аналитика
Что такое CRM системы и как они помогают бизнесу
Автоматизация рабочих процессов сейчас – это привилегия не только крупного бизнеса. IT-технологии развились до такой степени, что различные аналитические системы и другие нужные продукты стали доступны малым и средним компаниям. В том числе и программы для автоматизации работы с клиентами. Если вы все еще сомневаетесь в необходимости внедрения CRM-системы, то эта статья для вас.
20 июля 1052 просмотра 4 минуты
#аналитика
Применение машинного обучения в Google таблицах с помощью библиотеки Tensorflow.js и Google Apps скрипта
Тема машинного обучения сейчас очень актуальна и продолжает набирать обороты. Машинное обучение — это алгоритм, с помощью которого система распознает данные и их закономерности, предсказывает значения на основе обученной модели.
Давайте работать?
Мы верим в ваш бизнес
Наверх