推荐去中⼼化
郑爽抽烟
个性化推荐系统简单来说是⼀个将user和item进⾏匹配的⼀个系统。个性化推荐系统主要包括召回、排序两个典型模块:召回是指根据⽤户信息和历史⾏为,从内容池中获取与之相匹配的部分内容(item);排序是指根据⽤户、内容的特征,通过模型预估出内容的点击率情况。
⼀般来说,个性化推荐系统的召回主要有:标签召回(⽤户、内容打标签)、协同召回、热度召回(根据⾏为计算出来的内容)等,排序模型主要有lr、fm、gbdt、NN⽹络等。在现实的情况下为了强调个性化,往往过度通过⽤户的⾏为来计算召回、排序,这样就会导致⼀个严重的问题——头部内容集中。问题表现主要分两个阶段:
定时发邮件1、马太效应:头部内容获得了⼤量的推荐(流量),⽽腰部、尾部的内容只获取到了少量的流量甚⾄⽆法获取流量,并且这种情况随着时间会越来越明显(强者更强、弱者更弱)。
2、信息茧房:从⽤户⾓度出发,某个⼈看到的内容始终是那些品类,类似原地打转。
为了减轻上⾯说的两种情况,⼀般会通过算法策略来控制流量的分发——去中⼼化。接下来我们看下抖⾳算法逻辑
抖⾳算法是⾮常有魅⼒的,⽽使其产⽣魅⼒的是抖⾳的流量分配是去中⼼化。抖⾳的推荐算法逻辑可以
分为三部分:
爱国手抄报资料抖⾳与其他互联⽹产品的中⼼化流量分配不同,它是去中⼼化流量分配机制(微博就是中⼼化流量分配,刚开通微博的粉丝是没有⼈关注的,⽽抖⾳即使是0粉丝,发布的任何⼩视频都能分配⼏⼗甚⾄上百的流量)。为了确保内容的多样性,针对每个内容都会预分配⼀定的流量,从1-200到500到1000阶梯型给流量,根据权重判定给你流量⼤⼩,权重越⾼,内容获取的曝光越⾼。主要包括:
1、⼩权重:完播率、重复率;
2、中权重:点赞、转发、评论量...;
3、⼤权重:热门⾳乐、挑战话题...;
陕西中考答案
具体如下:
抖⾳对于⼀个新的内容,先对其审核,通过后根据内容属性(标签...)进⾏⼀定量的试分发(1-200);如果其播完率和重复率超过⼀定的数量,算法就会将之判断为受欢迎内容,⾃动为内容加权,分发量扩⼤到500;如果其点赞、转发、评论超过⼀定的量,算法⼜会⾃动加权,继续扩⼤分发量。
最后经过⼤量粉丝的检验,被层层热度加权之后才会进⼊抖⾳的推荐内容池,接受⼏⼗甚⾄上百万的⼤流量洗礼。其热度的评判标准包括两个⽅⾯:
1. 热度权重的参考次序:转发量>评论>点赞量。
什么牌子的粉底液好>平安夜是中国的节日吗2. 根据时间择新去旧:除⾮有⼤量粉丝模仿及跟拍,⼀条⽕爆视频的热度最多持续⼀周。