Продвижение бизнеса в интернете
Связаться с нами
Закрыть
Как в Google BigQuery разделить значение столбца по символу

Как в Google BigQuery разделить значение столбца по символу

#аналитика
27 мая 2665 просмотров 1 минута на чтение

Часто в UTM-метках используется символ вертикальной черты (|), который разделяет параметры визуально. Например, нередко мы можем встретить такое оформление UTM рекламной кампании и ее идентификатора: 

utm_campaing = g_search_brand_msk|5692553230

В результате при передаче таких данных в базу два важных параметра попадают в один столбец, что затрудняет их дальнейший анализ. Возникает вопрос: как их “физически” разделить, если работа с данными ведется в Google BigQuery?

В качестве решения можно использовать следующий код, написанный на Legacy SQL

В примере ниже column1 - это название столбца в вашей базе данных, где содержатся данные, которые необходимо разделить по символу разделителя. 

SELECT


  CASE

    WHEN INSTR(REGEXP_REPLACE(column1, r'%7C', '|'),"|") = 0 THEN column1

    ELSE subSTRING(column1,

    1,

    INSTR(REGEXP_REPLACE(column, r'%7C', '|'),"|")-1)

  END AS CampaignName,

  CASE

    WHEN INSTR(REGEXP_REPLACE(column, r'%7C', '|'),"|") = 0 THEN ""

    ELSE subSTRING(REGEXP_REPLACE(column, r'%7C', '|'),

    INSTR(REGEXP_REPLACE(gcolumn, r'%7C', '|'),"|")+1)

  END AS CampaignId


FROM


WHERE


GROUP BY

  CampaignName,

  CampaignID 

Вы получите два столбца: CampaignName и CampaignId. В первый попадет текст до символа-разделителя, а во второй - идентификатор кампании. 

Вы можете заметить, что в коде используется регулярное выражение, которое также производит разделение столбцов по символу %7C, который является эквивалентом | в URL-кодировании.

Разделителем может быть любой символ (запятая, точка, дефис, нижнее подчеркивание, слэш, любая буква, цифра, символ или их набор). Чтобы предложенный выше сценарий реализовать с другим разделителем, замените в коде вертикальную черту (|) на ваш символ-разделитель. 

Удачи!

Узнайте больше про сквозную и предиктивную аналитику. Посмотрите выпуск с руководителем отдела аналитики MediaNation Александром Вахтиным и аналитиком больших данных Романом Святовым:


Другие статьи по теме

27 июня 5081 просмотр 7 минут
#аналитика
Выгрузка данных из Яндекс.Директ с указанием условия подбора (корректировки) трафика
Зачастую перед аналитиком встает задача глубокого исследования данных о производительности рекламных кампаний в Яндекс.Директе.
30 декабря 2486 просмотров 15 минут
#аналитика#Веб-аналитика
08 октября 4319 просмотров 7 минут
#аналитика
17 сентября 48861 просмотр 7 минут
#аналитика#Веб-аналитика
Что такое веб-аналитика и как настроить веб-аналитику для сайта
Почти все сайты подключены к системам Яндекс.Метрики и Google Analytics. Счетчики установлены, отчеты создаются. Правда, во многих случаях аналитика заканчивается именно на этом этапе. Как организовать действительно эффективную работу по веб-аналитике сайта и сделать ее важной частью бизнеса – в нашем лонгриде.
15 января 15168 просмотров 6 минут
#аналитика
06 октября 7687 просмотров 5 минут
#аналитика#Разработка#Веб-аналитика
Что такое Big Data: как работать с большими данными
Большие данные становятся неотъемлемой частью нашей жизни. Все мы ежедневно используем какие-либо технологии и контактируем с продуктами и крупными компаниями. Компании предлагают нам свои продукты и, в свою очередь, используют данные, которые мы им предоставляем (начиная от отслеживания переходов на сайте и заканчивая персональной информацией при оформлении заказов). Настал момент подробнее разобраться, как собираются эти огромные потоки информации и что с ними делают.
Центральный офис в Москве
8 (495) 215-10-97 Пн-Пт: с 10:00 до 19:00
Наверх