众所周知,头条依靠强大的智能推荐算法,可以更精准的实现内容推送。所以许多做优化的人对标签非常感兴趣,你会不会有这样问题:
那么他是怎么获得准确的内容信息呢?
或者说他是怎样知道内容是什么,属于什么各类?
标签是什么
这就涉及到了标签,标签是在智能推荐系统里最常用的一个词。这里据说的标签,与我们常说的标签是一个意思,但是,它并不是我们能肉眼见到的。像我们在给自己的作品文章添加标签时,这个标签会被系统作为参考,但它不是最重要的标签。
标签从哪些方面提取
真正的标签是系统自己从我们的作品中抽取的。图文类的相对比较容易抽取,视频才是算法最强的地方。
系统通过抽取我们作品的标题、文字标签、配图、视频画面、声音,从中获取上百万计的标签。然后通过智能推荐系统进行推荐测试,推荐测试的阶段我们在其它文章讲过了,这里就不展开了。
提取到的标签信息有哪几类
系统提取出的信息极其丰富,可能被提取的内容大致有:出现人数、语言内容、国籍、名人、动物、行为运作、事物、季节、地点、品牌信息、人物基本信息,等。像人物的年龄、性别等这些肉眼可见的信息,系统也能够很好识别。
不要欺骗系统算法
智能推荐系统根据标签训练得到模型,模型能够识别我们内容的质量。垃圾内容就会被降低评分,甚至被系统屏蔽。这是我们做优化时需要特别注意的,垃圾内容没有益处。