Узнайте больше про сквозную и предиктивную аналитику. Посмотрите выпуск с руководителем отдела аналитики MediaNation Александром Вахтиным и аналитиком больших данных Романом Святовым:
В нашем случае все клиенты будут распределены по 27 сегментам. Это позволит направлять digital-инструменты на более узкую аудиторию, а не целиться рекламой на общую массу клиентов с разными целями и отношением к бренду.
Для автоматизации RFM-анализа потребуется библиотека RFMizer на языке программирования Python. Она была создана сотрудником Google Александром Приходько и размещена по ссылке https://github.com/Slony/rfmizer.
Предоставляем пошаговую инструкцию для запуска скрипта.
Шаг 1. Скачать архив библиотеки RFMizer и распаковать его.
Шаг 2. Установить язык программирования Python, точнее его интерпретатор версии 3 и выше.Выбираем версию Python 3.7 version (доступна на момент статьи) или выше
RFMizer - это библиотека на языке Python, которая позволяет автоматизировать процесс произведения RFM-анализа. На данном этапе необходимо обозначить собственные показатели для последующего запуска скрипта.
Шаг 3. Подставить в файл config.yaml данные для RFM-анализа.
Внутри файла config.yaml вместо строк-подсказок подставляем собственные значения или значения клиента.
Ниже приводим содержимое файла в текстовом виде:
input_columns: # указываете название столбцов в исходном файле, который будете анализировать. Он же выгрузка из CRM
- order_date
- user_id
- order_value
segments_count:
recency: 3 # указываете количество сегментов по данному показателю
frequency: 3 # указываете количество сегментов по данному показателю
monetary: 3 # указываете количество сегментов по данному показателю
rfmizer:
look_back_period: 365 # указываете количество дней от сегодняшней даты для анализа
output_columns: # указываете столбцы, которые будут в результате работы. Вы можете указать больше столбцов, но их название должно совпадать с названием из input_coloms
user_id: user_id
recency: recency
frequency: frequency
monetary: monetary
predictor:
prediction_period: 182 # lookback window for RFMestimator (number of days)
output_path: . # путь к файлу с результатами. По умолчанию та же папка, где и файлы скрипта
output_file_prefix: RFM_3-3-3-365-182 # задаете название файла
Шаг 4. Сохранить измененный файл.
Шаг 5. Добавить в папку со скриптом файл выгрузки из CRM.
Выгрузка из CRM должна содержать следующие столбцы:Важно!
Необходимо соблюдать требования к файлу из CRM (формат csv). Все они обозначены в документе readme.txt (файл также доступен по ссылке https://github.com/Slony/rfmizer), содержащемся в библиотеке RFMizer.
Выдержка из файла readme.txt
Для запуска скрипта требуется выполнить команду python rfmizer.py config.yaml input-file
Сделать это необходимо из папки, в которой находится файл.
На заметку!Шаг 1. Выполнить команду pwd в командной строке для определения директории. Получаем ответ /Users/ibarchenkov.
Шаг 2. Выполнить команду для перехода в папку со скриптом.
После нажатия “Ввод” последует смена директории и запуск скрипта.
В результате в папке со скриптом появятся три файла:
Напомним!
RFM_3-3-3-365-182_borders.csv - это текстовый файл в формате CSV, который содержит числовые значения вычисленных границ между сегментами. С большой долей вероятности вы не будете никак работать с данным файлом
Пример содержимого файла:
dimension,segment,border
frequency,1,2
frequency,2,3
frequency,3,4
frequency,4,6
monetary,1,23.7
monetary,2,35.95
monetary,3,51.0
monetary,4,82.0
recency,1,-252
recency,2,-192
recency,3,-137
recency,4,-80
Это наиболее важный файл. Он позволяет соединить результаты RFM-анализа и персональные данные пользователя, которые в последующем нужны для работы в рекламных системах.
Обязательными являются поля:Пример содержимого файла:
user_id,recency,frequency,monetary,geo
274223,1,3,4,1
826746,2,2,1,5
734242,4,1,2,7
RFM_3-3-3-365-182_ratios.csv - файл содержит большое количество строк.
Количество строк должно быть равно следующему числу 1 (строка с названием столбцов) + R*F*M + 1 (строка с значением 0,0.0). Получаем 29 строк.
Пример нескольких строк файла:
Наибольший интерес в данном файле представляет столбец bid ratio. Bid ratio является мультипликатором ставки для каждого из пересечений сегментов пользователей, который создает скрипт RFMizer. Это означает, что если ранее ставка для закупки трафика была равна 10 рублям, то при работе с отдельными сегментами, например для сегмента 1,2,1, ставку 10 рублей необходимо умножить на мультипликатор 0,47 (значение округлено до сотых).
Применять данные полученного RFM-анализа можно в любых рекламных сервисах при проведении ремаркетинговой кампании или для формирования исключающих списков аудитории. Но важно помнить, что они требуют регулярного обновления, т.к. аудитория покупателей пребывает в постоянной динамике. Насколько часто это приходится делать, зависит от специфики бизнеса. Например, для крупного интернет-магазина с широким ассортиментом обновление списков и новый RFM-анализ можно проводить один в месяц. Учитывая, что теперь вы освоили процесс автоматизации, сделать это будет не сложно. Особенно после пары повторений.
Коллеги, приходите к нам за услугой аналитики для бизнеса!