关于用户标签的一些思考

Posted by zluckyH on April 27, 2019

本文涉及的用户标签,指的是业务数据中提取出来的用户标签,这些标签用于对用户进行分析

目前的标签生产方式

目前DMP的用户标签分为2类:

1.属性标签:指用户固定不变的属性,如性别、年龄等;

2.行为标签:指用户实际发生的行为,如某个时间在某个地点买了某个产品,那么可以提取出购买门店、购买产品、购买价格相关的标签

属性标签在提取时目前主要有两种方式:

  • 将原始数据中的某些字段直接提取为标签,例如将数据中的性别字段直接提取为gender、将来自微信小程序的会员打上微信小程序会员标签
  • 基于聚合后的user_profile计算用户属性,这种方式目前较少,在晶赞画像库生产过程中主要是将不同来源但是表示同一个含义的数据进行合并计算,例如对age_aage_b等赋予不同的权重,最后计算得出age标签

行为标签目前提取的方式主要是:

  • 直接提取,例如直接提取数据中的产品字段为product标签
  • 通过知识库翻译,例如通过知识库将product_id翻译为product_name

思考

当前标签提取主要还是基于原始数据,将原始数据中的某个字段映射为一个标签,其实最终进入到user_profile的标签还是大量的原始业务数据中的字段,例如购买门店购买产品客单价

实际上真正需要的标签大多数是需要基于用户的所有行为进行计算的标签,例如:

  • 首次消费时间,{fixed customer_id:min(order_date)}
  • 首次消费门店
  • 消费最多的产品

所以,目前的大多数行为标签,应该默认直接进入到user_profile中,使用者基于user_profile进行自定义标签,而不是需要经过两步,因此需要进行如下改进:

1.所有后续可能用到的字段都应该自动进入user_profile中,这一步不需要太多的人工参与;

2.基于生产后的user_profile对一个用户的历史数据进行计算获得最终需要的业务标签,这一步应该由业务人员进行操作,并且界面需要简单方便