如年龄段标签:18~28岁,地域标签:武汉,标签呈现出两个重要特征:语义化,人能很方便地理解每个标签含义,同时一个标签通常是人为规定的高度精炼的特征标识,这也使得用户画像模型具备实际意义,能够较好的满足业务需求,如:判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。
所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。
l 数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为静态信息数据、动态信息数据两大类。
l 静态信息数据
用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。
l 动态信息数据
用户不断变化的行为信息,如果存在“神”,每一个人的行为都在时刻被“神”那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是“神”眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多。
本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。
在互联网上,用户行为,可以看作用户动态信息的寥寥无几数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。
l 目标分析
用户画像的目标是通过分析用户行为,更终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
l 数据建模方法
下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
成都清晨网络有限科技公司主营服务包含 :美团代运营 大众点评代运营 美团外包 大众点评外包 美团医美代运营危机公关、舆情管理、网络营销、软文推广、百度营销、新闻源推广、网站seo、竞价托管、新闻营销、微信微博推广等等。大家有营销推广需求,欢迎咨询成都清晨网络。