欢迎您光临本站,如有问题请及时联系我们。唯一指定客服QQ:1518918268

「威海seo」在网站中的用户标签有什么作用?

    热度:℃      作者:互联网

“威海seo”在网站用户标签中的作用是什么?

1.jpg

网站中的推荐系统有两个基石,即用户标签和内容分析。内容分析中有一些与机器学习相关的方面。相比之下,用户标签更难。

我们现在的头条网站常用的用户标签主要包括用户想知道的话题或者极其重要的关键词。我们可以从第三方社交账号获取用户的性别信息。用户的年龄信息主要从模型中预测,主要基于用户的阅读时间和模型。经常访问的地方主要是通过授权网站访问自己的用户获得的

当然,网站中最简单最基本的用户标签就是用户浏览后的内容标签。主要分为三个方面:第一个方面是可以过滤噪音,网站根据用户停留时间长短过滤标题方。第二个方面是热点惩罚。对于网站上一些热门的张文,用户会在上面留言,但是有一些不好的留言,会受到惩罚。比如功率降低等等。第三个方面是时间衰减。随着年龄的增长,用户的兴趣会发生变化,所以网站策略更倾向于新用户。现在,随着用户动作的增加,一些权重的影响会随着时间的推移而减小。第四个方面是惩罚展示。如果一篇文章推荐给用户,但是没有人点击,那么与之相关的权重就会受到惩罚。

要知道大部分的用户标签都是找一些简单的关键词。比如今天头条的第一版就是批处理计算框架,它在这个系统中的流程比其他的都简单。

但问题是,随着用户的快速增长,兴趣模型等批处理任务的类型也在不断增加,涉及的计算量太大。2014年,数百万用户标签更新的Hadoop任务批量处理开始在同一天勉强完成。集群计算资源的不足很容易影响其他任务,集中写入分布式存储系统的压力越来越大,更新用户兴趣标签的延迟越来越高。

面对这些挑战。2014年底,今日头条推出用户标签风暴集群流媒体计算系统。更改为流后,只要有用户操作更新,标签就会更新。CPU成本相对较小,可以节省80%的CPU时间,大大降低计算资源开销。同时每天只有几十台机器可以支持几千万用户的兴趣模型更新,特征更新速度非常快,基本可以达到准实时。该系统自推出以来一直在使用。

当然,我们也发现并不是所有的用户标签都需要流媒体系统。用户的性别、年龄和居住地点等信息仍然可以每天更新,无需实时重复计算。

四.评估和分析

以上介绍了推荐系统的整体架构,那么如何评价推荐效果呢?

有句话我觉得很明智,“一个东西不能评价,就不能优化”。推荐系统也是如此。

其实很多因素都会影响推荐效果。比如候选集的改变,召回模块的改进或增加,推荐特征的增加,模型架构的改进,算法参数的优化等。不举例。评估的意义在于,很多优化最终可能会产生负面影响,而不是优化上线后效果会提高。

一个全面的评价推荐系统需要一个完整的评价体系,一个强大的实验平台,一个易用的经验分析工具。所谓完整的体系,不是用单一的指标来衡量的。不能只看点击率或者停留时间,需要综合评价。在过去的几年里,我们一直试图将尽可能多的指标综合成一个独特的评价指标,但我们仍在探索中。目前,我们要由各行各业更有经验的学生组成的评审委员会进行深入讨论后才能做出决定。

很多公司在算法方面做的不好,不是因为工程师能力不够,而是需要一个强大的实验平台和方便的实验分析工具,能够智能地分析数据指标的置信度。

建立一个好的评价体系需要遵循几个原则。首先,它既考虑了短期指标,也考虑了长期指标。之前公司主管电商的时候,我观察到很多战略调整短期内对用户来说都是新鲜事,长期来看并没有帮助。

其次,要兼顾用户指标和生态指标。今天的头条作为一个内容创作平台,不仅要为内容创作者提供价值,让他们有尊严地创作,还要有让用户满意的义务,两者要平衡。广告主的利益也要考虑,这是一个多方博弈平衡的过程。

另外要注意协同效应。实验中很难做到严格的交通隔离,要注意外部效应。

强大的实验平台的直接优势是,当同时在线有多个实验时,平台可以自动分配流量,无需人工通信,实验结束后可以立即恢复流量,提高了管理效率。这样可以帮助公司降低分析成本,加快算法的迭代效果,使整个系统的算法优化快速向前推进。

来源:本文由互联网原创撰写,欢迎分享本文,转载请保留出处和链接!部分信息来源互联网,如有侵权,请联系删除。