1. 主页 > 网络营销 >

以图片社区为例,如何利用热度算法做内容质量评估?

以图片社区为例,结合我的实践经验,从待解决问题、输入、计算逻辑、输出四要素,拆解热度算法如何设计。

以图片社区为例,如何利用热度算法做内容质量评估?

一、背景

在内容社区中,热度算法是基于实际用户反馈行为,比如内容的点赞、收藏等数据,而实时计算得到的分数。热度算法用于衡量内容的流行度,做对应的质量评估。这里的“质量”,更多代表的是内容受用户欢迎程度。热度高,表示当前内容受更多用户欢迎,十分流行;热度低,表示图片较为冷门。

热度算法为了解决什么问题而存在?

它是为了从庞大的内容库中,简单高效地发现大多数人喜欢的头部内容,推荐给其他用户,从而满足他们的内容需要。《乌合之众》提到,人们在群体生活中,多有从众心理,偏好大多数人的选择。热度算法正是应用了大众心理,热度反映的是社区内部用户大多数的口味偏好。

二、价值

热度算法的价值在哪里?

维持老用户的活跃度。热度算法能够让老用户最高效地获取头部内容,及时感知到当前社区的热点。

以新浪微博为例,热搜榜凭借热度算法,快速挖掘热点新闻,让用户获取实时热点,带动了新浪微博整体的活跃度。吃瓜群众喜欢的娱乐圈八卦,如若干明星出轨事件,在热搜爆出后,让服务器几度宕机。

以图片社区为例,如何利用热度算法做内容质量评估?

提高新用户的留存率。热度算法呈现的是社区最流行的内容,这能够让新用户第一时间感知社区作品的优质程度,大概率满足他们的内容需要,增加留下来的可能性。

以摄影社区图虫和视频社区B站为例,热门Tab的优先级很高,把当前最热的内容呈现给新用户,对提升留存是有很大帮助的。

以图片社区为例,如何利用热度算法做内容质量评估?

三、算法

以图片社区为例,结合我的实践经验,从待解决问题、输入、计算逻辑、输出四要素,拆解热度算法如何设计。请记住,以下思路是可以复用的,不止是图片,其他形式的内容如文章、视频、音频都适用。需要注意的是,输入及计算逻辑需要结合你的具体产品和业务背景而定。

1. 待解决问题及期望输出

在热度算法中,待解决问题是如何量化图片在社区中的流行度。

期望输出热度排序,用于排行榜或基于一定规则下发至用户端。

2. 输入

从图片的生命周期来看,一张图片会经过四个阶段:刚发布、被其他用户消费互动、被官方推荐、成为旧图片。依此,我们可以考虑图片热度S拆分为三部分组成:

S1-初始分,指图片刚发布,没有任何消费互动时,赋予一定的初始分数。

S2-受欢迎分,指图片发布后,被其他用户消费互动,具备一定的受欢迎分数。

S3-推荐分,指官方运营可以对图片进行正负推荐,做一定的人工干预。

其中,正推荐可以对分数低但具备潜力的图片给予扶持,负推荐可以对分数高但不符合社区规范的图片进行抑制。

这三个子分数的输入来源,可以结合以下考虑:

初始分S1:用过往图片被精选次数或该用户的身份权重。由于我所在的产品,精选是由运营判断的,相对质量较好,而用户的身份如达人等相对缺乏持续运营,所以我选取精选数作为核心指标。

受欢迎分S2:在一定展示量下,该图片被点赞、评论、收藏、分享的次数/人数。以上是较为常规的关键指标,如果你的产品有其他更为关键的行为,可以做对应增删。

推荐分S3:S1和S2是图片本身自带的数据,而S3则是预留了一个运营干预的口子。这里的分数,可以做对应的运营辅助后台,由运营同事手动设置。正推荐则加分,负推荐则减分。

3. 计算逻辑

3.1 未考虑时效性的热度计算

图片热度S=初始分S1+受欢迎S2+正推荐分S3-1+负推荐分S3-2;

初始分S1=SUM(该用户过往图片被精选次数),精选次数封顶值为max;

受欢迎分S2=(h1*点赞数+h2*评论数+h3*收藏数+h4*分享数)/展示数,h1-h4为该行为的单次得分项,分数越高,表示该行为对内容更重要;

正推荐分S3-1=运营设定值,为正数;

负推荐分S3-2=运营设定值,为负数。

以上是未考虑时效性的分数计算,当图片成为旧图片时,我们更希望它能够为其他新图片让位。也就是热度降低,热度与时间成负相关关系。这时候我们引入时间衰减函数,对S1、S2和S3分别考虑时间的影响。

3.2 考虑时效性的热度计算

本文由摸索网(http://www.lnmosuo.com)发布,不代表摸索网立场,转载联系作者并注明出处:

联系我们

工作日:9:30-18:30,节假日休息