免费论文查重: 大雅 万方 维普 turnitin paperpass

简述用户画像技术把脉营销难题

最后更新时间:2024-03-04 作者:用户投稿原创标记本站原创 点赞:8268 浏览:32333
论文导读:
大数据的灵魂
我们处于一个信息大爆炸的时代,海量消费者和商品产生了从浏览、搜索、评价、交易到支付、收货、等多维度、全覆盖的数据体系。用户画像就是基于各种用户行为数据进行大数据分析,使用数据挖掘的策略对用户的基础属性、兴趣爱好、心理特征、购买能力、社交关系等进行定量与定性刻画的技术。用户画像对于洞察消费者行为与需求具有重要作用,是大数据挖掘的核心和灵魂所在。
通过用户画像,挖掘出用户的购物习惯、兴趣和偏好等,针对用户在品类间的差异化比较,挖掘出每类用户特征,进而建立模型,把用户特征抽象成短语标签。海量数据下,用户的行为越多,可抽取的特征越明显,用户标签就越丰富,可以据此描述用户的属性特征、社会背景、兴趣喜好,甚至还能揭示内心需求、性格特点、社交人群等潜在属性。这样就把原本冷冰冰的数据复原成栩栩如生的用户形象,从而指导和驱动业务场景及运营,发现和把握蕴藏在细分海量用户中的巨大商机。用户画像主要目的在于两方面:
洞察用户,提升企业运营效率
在精准营销架构中,其底层是明细数据的收集,包括用户产生的各种日志数据、用户交易数据和其他相关数据(见图1)。在用户数据的基础上,我们进行了用户行为的建模,包括用户属性的识别、用户兴趣、用户关系模型、用户生命周期、用户信用模型等。在用户建模之上,我们抽象出用户画像,作为底层数据提供给各营销系统,这样就解决了广告营销精准性的理由。比如我们通过用户画像知道用户为男性,26-35岁,常住北京,家里有小孩,之前多次购买婴儿钙片、辅食、童书等母婴产品,结合这些用户特征,在运营的时候就可以针对性精准营销。
优化后台,让客户端更智能
用户画像也是大数据发展的需要,IT系统需要通过用户差异化信息构建,实现网站和APP客户端的优化。通过标签化,将用户行为数据转化为机器可理解的语言,比如性别用0和1分别代表男性和女性,计算机就可以识别出来,并可以很好应用到电商的各种场景中去,通过系统的计算来代替大量人工操作,实时高效地为用户提供各种贴心的商品和服务。
以京东为例,随着电商体量的飞速壮大,一方面是海量信息的汇聚和业务场景的日益复杂,另一方面是亿级用户个性多变的购物需求,用户在不同品类下的购买、浏览、搜索、等行为,积累下丰富的数据金矿。用户画像所要解决的理由就是:把特定业务场景的用户精准细分出来,并用人和计算机所能理解的语言描述用户特征。迄今为止京东已经有200余个用户画像标签,覆盖用户基本属性、购买能力、行为特征、社交网络、心理特征、兴趣爱好等6大方面,用于支持集团研发、运营、市场、采销各条业务线(见图2)。
把大数据玩小
把大数据玩“小”,让大数据落地,才能真正指导企业的运营管理。传统的大数据是按照主题组织的,包括商品、订单、物流、广告等不同的主题,存在缺陷。而京东“把大数据做小”的理念是按照用户来组织数据,每个用户都有一个数据银行,围绕着用户进行数据存储和处理。
以用户为中心,看起来小,其实很大,因为每个用户的数据价值链特别长,用户在网站上的所有行为都有记录,包括浏览、咨询、加关注、加购物车、下单、评价、售后等等,全部过程都被记录下来。因此,围绕用户的数据链很完整,大而全,更加容易了解和洞察用户。
用户画像实现路径
用户画像实现的其实是从数据抽象映射到用户粒度,把数据语言转化成简洁、形象、可理解的短语标签,便于人和计算机识别和理解,可以通过多种技术和策略综合实现。具体来说,一是用机器学习解决细粒度密集计算理由,这类理由通常计算粒度细小,具有海量样本、高维特征空间,计算复杂度高;二是用经济统计策略解决粗粒度非密集计算理由,这类理由通常反映统计作用上的某种社会、生态或经济规律;三是用自然语言处理解决非结构化文本挖掘理由;另外还有深度学习等最前沿的技术探索。
机器学习策略
针对微小粒度的数据,用户特征数据会很精细,机器学习是一个相当有效的策略。针对性选择合适的算法方案,比如对于可以找到已知用户标签的情况,通过有监督的机器学习策略进行建模,这就要选取规模足够、可信度高的训练数据。我们通常有两种策略去实现,一种是从大规模数据库中依据可靠的业务规则或逻辑去校验筛选出数量较多的数据集;另一种方式是通过人工标注来收集,后一种方式成本较高但相对更为精准。另外,还有一套模型反馈系统,所有建立的模型都会上线到模型反馈系统,让用户来对模型的准确度进行实时反馈,便于我们更好地测试和校正模型。
有了足够的训练数据,我们就可以收集用户各方面数据并通过特征工程来抽取对模型训练表现好的特征。比如人口统计数据、购物行为数据、网站浏览数据、社交评论数据、售后数据等,然后基于这些特征来构建分类或回归模型进行机器学习算法的训练、测试、优化和部署。这些措施在一些模型上取得了良好效果,比如对用户性别的预测,基于机器学习的模型准确率能达到80%以上。
对于海量高维空间的机器学习,经常会遇到单一策略准确率不佳的情况,这时候就需要对多种分类或回归学习器进行组合集成来获得性能提升。集成学习,相当于多个决策者共同进行一项决策,每个决策者所擅长的领域不同,他们都进行独立的训练,得出独立的结论,最终把这些各个领域的专家结论组合起来,形成一个总的预测结果,效果的提升是很明显的。
还有一类理由,可能无法或很难找到用户标签进行训练,这就可以通过无监督的机器学习策略进行建模,主要是聚类策略。“物以类聚,人以群分”,聚类就是利用相同类内相似性强,不同类间相似性弱的原理,依据业务目标划分不同的客户群体或者发现多样性的购买模式。在实际处理中,聚类算法的选择需要考虑多种因素,比如多种形状的聚类及高维、可伸缩性的理由,另外更重要的一点是还需要解决聚类结果的可解释性、可理解性,这就需要将聚类过程和特定语义解释、业务场景应用相联系,考虑应用目标也是影响聚类策略选择的一个重要因素。 全文地址:www.7ctime.com/scyxxnlw/lw46721.html上一论文:阐述企业市场营销管理中敏捷性营销对策