第四类是购物偏好,购物时段、偏好品牌等。
第五类是客户服务,用户评价等级、退换货次数(金额)等,这里包括两层含义,有些人经常退货或者拒收,有些人买一件东西时会下两个单,货到后挑一挑,收一个退一个,对于这两类用户的成本是非常大的,通过分析定位这类用户。电商行业还有一个概念叫“占单”,比如说iphone7马上要推出,有可能几千个库存刚放出来几分钟就没有了,其中有些是被正常用户买了,有些可能是被竞争对手战术性的占住了,还有些是用机器下单给恶意占住了。正常一个订单,需要24小时之内支付的,超过24小时不支付,订单就取消。如果分析出的这一类用户,就可以给他们限定10个小时或者半个小时甚至10分钟不支付就取消订单。
第六类是业务场景,用户DNA和用户特权等标签。前面提到的订单取消是用户特权的一个特例,负向的特权。对于分析出正向标签的,贡献额比较大的用户,比如国美在线用户等级从G1到G5,一个G5用户,有可能就给免邮或者会员生日礼物等特权。
4、规则与模型
标签是基于规则和模型出来的,而基本的规则是根据时段偏好、站点偏好、访问偏好(用手机APP,还是用微信,还是用PC)、消费周期,然后基于基本的生成购买力算法、用户群体画像算法、促销敏感度算法等生成标签。这些出来的标签会不断地形成一个标签体系,同时,加上一些业务、营销的因素,或者加一些其他的权重来人工干预更新标签,从而建立起基于数据规则和算法模型的标签。
另一种方法就是通过用户采样进行标签扩散,对于经常去浏览、购买的老用户,通过大量采集用户数据进行分析,然后是标签抽取和用户行为建模及以生成标签规则。对第一次登录国美在线或者就来过一次的用户,可以推荐什么商品呢?这时就需要统计学中的采样来进行标签扩散,就是拿出了其中某一类用户或者某几个用户的行为标签,作为这一类人的公共行为标签。所以大家会发现,第一次登录或者只登陆过一次的用户,最终推荐的商品,可能有些跟这个用户的上次浏览相关,有些就不相关,其中不相关的这类推荐,就是基于采样把用户归到一类里面,据此来做的推荐。
5、推荐
国美在线上“猜你喜欢”个性化应用,包括网站的底部、列表页、搜索页还有首页等页面位置。首页是在正中的位置,转化率非常高,另外不同的人登录APP,每个人获得的推荐商品都不一样的。
在国美在线APP“用户中心”的界面,通过用户的购物行为,推出用户DNA的页面,会给用户打上基本的标签,例如喜欢什么类型的商品,经常“海淘”的用户可能就有“海淘达人”的标签,这样建立了每个用户的购物圈画像和商品专属推荐。
还可以基于气候与天气进行推荐,例如深圳,天气比较热时,页面上会推荐“空调”等类似的消暑商品;若出现“雾霾”天气时,则会推荐“空气净化器”。这类规则不复杂,而且天气数据都是公开可以拿到的,只要在原来的基础是增加一些标签。
关于视觉的推荐,也就是基于图片的搜索,目前使用的还比较少。当用户输入一张图片,结果会根据这个图片给出相关的推荐。比如逛街的时候,看到别人穿的衣服或者拿的东西不错,可以直接拍下照片,通过相应的图片计算和搜索算法,相关的商品就可以搜索出来。
前面介绍了推荐系统的应用,那推荐系统的技术架构是怎样的呢?大数据平台的底层是各种数据平台,数据源包括会员数据、商品数据、订单数据等结构化的数据,以及行为日志等是非结构化的数据,包括浏览日志、点击日志、客户和客服的对话记录等。数据源上面是数据同步,通过“Sqoop”、“Flume”、“Kafka”等技术来实现,它的特点是存储的数据和交换的数据比较多。然后是数据存储,用的比较多的是“MySQL”、“Hbase”等。接着是计算框架,如“MapReduce”、“gome_realtime”、“spark”和“sparkstreaming”等。再接着数据平台之上就是算法引擎和推荐引擎,通过许多的算法模型,如“协同过滤”、“关联规则”、“矩形分解”,形成用户画像,结果可以是数据形式,报表形式、或者Excel表形式等。最后是各种应用端,“网站”、“APP”、“WEB”或其他营销应用端。
6、广告
DSP广告系统连接广告主和用户两端,以前的广告是购买广告位,现在基于DSP广告系统,可以做到不同人、不同时段在同一个位置看到的广告是不一样的,或者,同一个时间点,同一个位置,不同人看到的广告也是不同的。比如有100个商家的广告需求和素材,整个DSP平台的过程,首先是不同用户的行为日志进行分析,把用户的URL请求和用户cookie相关的记录传过,在中间Ad Exchange上基于统计规则和算法模型等进行计算,并将计算结果反馈给广告主,广告主根据用户画像的结果通过实时竞价系统RTB进行竞价,最后结合计算和竞价结果给不同的用户展示不同的广告。
国美在线通过很多外部和内部媒体实现DSP广告的个性化投放。金融理财产品也像其他商品一样根据客户的标签进行推荐,效果非常好。
关于比价,跟精准营销有一些关系,但主要是大数据方面。比价平台需要实时地把同行各电商网站的数据爬下来,爬下来之后做一个比对,再帮助用户划分好类别,如果消费者通过这个比价平台看到的价格基本上是比同行低的,而且是他们想要的商品,购买转化率就比较高。
热力图工具主要是内部使用的一个工具,针对网站的首页,实时的把首页的每个资料位,有多少点击,流量是增加还是减少,后面的转化是怎么样的,会实时的展示出来,从而实现智能化的选品和智能化的运营,帮助业务调整买品和价格。商品销量不理想或者库存告急的商品是需要更换,热销商品要是太靠后了,就要往上放一下。这些通过热力图工具页面就可以显示出来。
其实后台的标签系统做好之后,可以有很多其他的应用,例如,将标签应用API接口,给其他应用端提供支持,可以与推荐、搜索、广告和第三方新闻等对接;或者是跟营销去对接,提供可视化的分析,城市的人群分布,不同性格的人群分布,成果实时的生成等。
(转自:数据派)