36氪领读 | 编辑、算法与社交,三分天下?

36氪领读 | 编辑、算法与社交,三分天下?

编者按:本文作者闫泽华,摘选自其新书《内容算法:把内容变成价值的效率系统》。

先抛出个人的结论:编辑(中心人工主导)分发、算法(机器主导)分发、社交(离散人工主导)分发各有千秋。内容分发服务追求的是分发所能触及的这一远景,为了达成这一远景,就需要探寻每一种分发更适合的应用场景,而不是要在“剑宗”和“气宗”间争个高下。

本节试图探讨的,就是每种分发方式适用的场景和它们在内容分发系统里的应用。

编辑分发vs算法分发

从纸质报纸、杂志到广播电视再到门户网站,尽管信息传播的载体发生了变化,但是内容传播始终保持着“中心化分发,展示位有限、千人一面”的状态,信息传播的决策权始终握在编辑手中。

编辑分发的优势在于,借助专业背景知识完成了从海量内容到有限展示位置的过滤和筛选。经过筛选的内容,其平均质量是相对较高的。然而,基于专家判断的分发难免会出现偏差,为了降低“叫好不叫座”或单个编辑偏差的情况,内容分发方也采取了相应的策略。比如:传统纸媒会有编委会投票机制,通过多人判断选题;门户网站有点击率退场机制,点击率在一定时间内不达标自动下线等。

引入了机器推荐算法的分发系统,由于达到了“千人千面”的效果,展示位数量得到了大量的扩展。在筛选人力不足以匹配展示位数量的情况下,编辑又起到怎样的作用呢?

首先,人工同机器一定不是对立的,不然,今日头条也不会吸引如此多的资深传媒背景从业者。我和组内的同事不止一次地真心赞美吴达(时任头条号运营总监):“我们的运营团队都是豪华高配的文化人。我跟吴达老师聊天是要带字典的。”

在内容层面,编辑和审核团队能够决定什么样的内容是低质的,不应被系统收录和推荐。编辑和审核评估团队就像是内容推荐系统的门神一样,对不好的内容可以说不,对低质内容背后的做号者也可以说不。

作为最大的信息和社交分发平台,脸谱网也在事实甄别和低质内容管理上强依赖编辑和审核团队的人工工作。

2016 年 12 月 16 日,脸谱网上线了Fact-Checking(事实审核)机制,将用户举报过多的信息交付机构记者来判断。如果记者判断这则内容是假新闻,该机制就会将这一内容标记为存在争议,一方面会在前端页面提示用户此内容可能失实,另一方面会从分发量的角度进行控制。

2017 年 5 月,扎克伯格发帖称脸谱网会再招聘 3000 名内容审查员,在此次招聘后内容审查员将会达到 7500 人。审查员会过滤社交媒体上的不适当内容,如恋童癖、身体暴露、种族仇恨等内容。除了说“不”之外,编辑同样会对特别值得推荐的内容说“是”。

以推送场景为例,作为强打断的场景,被推送的内容需要被审慎地筛选出来,以保证打断用户是值得的。新闻客户端一直强调筛选出“Breaking News”(突发新闻),当重点新闻发生时,编辑一定是 24小时值守的,并验证其真实性,以确定推送范围和推送级别。只为了不错过每一条值得用户关注的内容,让用户能够更准确快速地获得最新消息。在这一过程中,技术能够辅助编辑更快速地构建新闻候选集,比如追踪社交媒体、重点网站的发布情况(如气象局、交通局)等,但人工才是担任最终裁决的角色。

推送候选集的筛选逻辑

当然,为了保证系统的可扩展性和有效性,我们希望在日常推荐中尽量避免人工的直接干预,如对内容进行调权、对展示量进行干预等。但是,不直接干预并不代表缺位,编辑始终在扮演“纠偏”的角色,当发现主观上觉得好的内容没有得到应有推荐量的时候,当发现主观上觉得差的内容得到过高推荐量的时候,都会给产品和技术做出反馈。在这种情况下,产品、技术、编辑(内容运营)会坐下来探讨:第一,这是不是一个问题,如果是问题的话,是不是一个频发的问题,以此来确定解决与否和解决的优先级;第二,探讨更系统的解决方案,让这一类而不是这一个问题得到更系统的解决。

人工在内容分发流程中的参与角色

编辑不仅能够帮助推荐系统更好地理解内容,也能帮助我们更好地理解站在内容背后的创作者群体。

在创作者体系层面,我们常说:做产品要有用户视角,作为平台方,你在面对亿万用户的同时,也在面对万量级的作者。作者同样是内容分发系统的用户。编辑会更理解创作者的语境,成为创作者和作品的代言人,从而影响系统的迭代方向。与此同时,他们也能够以创作者更易理解的方式去传递平台的规则,帮助不同阶段的创作者在平台更好地成长。

社交分发vs算法分发

在脸谱网、微博、微信覆盖了越来越多的用户之后,内容的分发逐步去中心化:每个人都可以创作内容从而成长为自媒体,每个人都可以借助社交关系评论、转发从而完成内容的传播。信息的传播权从传统的精英编辑让渡到每个普通受众,相当于每个人都成了编辑,成了内容分发的中心。

社交分发首次让信息传播变成“千人千面”。每个用户都有了个性化的内容消费。2010 年,脸谱网主页访问量超过谷歌访问量,意味着社交分发已经成了主流的分发方式。援引皮尤研究中心此前的调查,美国成年人中有 62% 通过社交媒体获取新闻,有 18% 高度依赖该平台,通过脸谱网阅读新闻的人数占比高达 44%。当然,社交分发也带来了新的问题:一方面,进入稳定期后,流量出现了新的垄断:一些大号由于拥有大量的粉丝、保持了高频的发布量,实际掌握了平台的流量分配权。比如,微博上大部分流量一度被营销号和大号所占据,使新的内容生产者获取流量的成本剧增。

另一方面,随着社交关系的不断扩张,微博、微信已经成了线上名片,用户关注了越来越多的来源,基于社交分发的内容质量也逐步下降。朋友圈中盛行的养生文、微商广告、晒娃帖等就是最好的例证。

社交分发在让人们免于信息匮乏的同时,也带来了信息过载的问题。为了优化用户的信息消费体验,脸谱网率先在自己的News Feed中应用算法进行排序。

脸谱网最初的排序方式,称为边际排名算法(Edge Rank Algorithm)。该算法的核心计算公式为:E = u×w×d。

• u :用户与内容发布者之间的亲密度分数,互动越高的亲密度分数越高。

• w :不同反馈动作具有不同的权重,反馈动作包括展示、评论、点赞等。比如,评论动作的权重就会显著高于点赞动作。

• d :基于时间的衰减,越新的内容权重越高。

通过上面的公式不难看出,亲密度和用户动作的引入,极大地抑制了大号和营销号刷屏的情况。此前,企业账号一旦获得了粉丝就相当于获得了稳定的广告位,所有新广告以几乎零成本的形式展现在这些粉丝的信息流中。但此后,没有互动的粉丝就只是停留在页面上的一个数字而已,企业账号在获取粉丝之后,必须同时下力气来维护自己的粉丝群体。

在随后的日子里,脸谱网致力于借助机器学习的方式改进排序算法,除了最初的 3 个Edge Rank 因素之外,不断追加新的特征和排序方式,如Story Bumping(系统对用户错过的信息进行二次判断,如果判断为重要,则会跳过时间序进行置顶展示)、Last Actor(系统根据用户最近频繁互动的 50 人,进行信息排序的调权,放大短期兴趣的影响)等。

脸谱网改进排序算法示例

无独有偶,在国内,微博也逐步意识到自己的流量被大号和营销号所挟持的问题,开始越来越多地在信息流上应用推荐算法,将原有的时间排序调整为智能排序,以控制刷屏、广告泛滥等问题,优化用户的使用体验。

微信生态在创立伊始就刻意避免微博曾经碰到的问题,更刻意避免流量集中的问题。如果你关注过微信朋友圈的分发就会注意到,某些疑似过度传播的内容(微商广告、转发集赞)是会被微信降频过滤的。

微博、脸谱网将关注关系作为筛选因素,将用户的点击、评论行为作为调权因素,是在“关注关系产出内容”的候选集上进行算法排序。

相比起来,今日头条将关注关系也弱化为调权因素,从而获得了一个更广泛的候选集范围(相当于用户在今日头条上关注了所有头条号),在此之上进行的排序能够有更高的效率匹配性和更好的可扩展性。

关注对推荐系统而言,既是场景,又是助力。

内容推荐是一个预期不稳定的场景,用户持续地刷新、阅读内容,其内容可能是娱乐、体育、社会新闻、财经报道等,不一而足。

关注场景给了用户一个稳定预期消费的场景。用户知道这里的内容是产自一个限定候选集合(微博的订阅号列表)时,甚至会主动找寻特定发布者的内容(微信的订阅号列表)。

有效的关注依赖用户的自知自觉,即明确关注是怎么一回事,知道关注后去哪里消费,关注频道会变成什么样。如果不经平台的干预,很有可能会重蹈社交分发平台的覆辙,大量无效的关注关系会影响用户的关注信息流。

关注对内容推荐还有助力作用,内容推荐系统将关注动作视为用户表意性更强的动作。它代表了用户对某个品牌的足够认知。在这种品牌认知下,用户可能会放松对内容表现形式和内容消费价值的要求。比如,当你关注一个账号的时候,你可能会更愿意消费作者分享的私人信息,阅读那些标题封面看起来“素面朝天”的内容。

关注动作也能被内容推荐系统用来衡量作者的价值,粉丝的多寡、粉丝阅读率的高低都是作者表现的量化指标,一个垂直的、能够持续取悦粉丝群体的作者,才是系统内价值更高的作者。一种应用方式是:某订阅分发平台对某条内容的推荐会先尝试 10% 的粉丝,如果粉丝点击率高的话会再继续扩散,否则会停止内容的继续推荐。

算法分发:发的终局?

从某种角度来看,算法分发或许可以被称为终极解决方案。为什么这么说呢?因为推荐算法是个筐,什么都能往里装。算法是基于我们对现实世界的理解进行的抽象和建模,所有我们关心的因素(编辑分发、社交分发)都可以转化为算法推荐的参考因素。如果我们简化算法推荐过程,将推荐的因素收敛到编辑、社交、模型三种因素,那么,一个内容在系统中的得分可以表示为下列 公式:

内容得分= a×编辑因素 + b×社交因素 + c×模型因素

a、b、c 分别为三种因素的权重。如果我们把某种因素的权重设置为 1,其他因素的权重设置为 0,那么算法分发就能够等同于编辑分发或社交分发。

在这个公式中,各种权重的调节完全是由平台的价值感导向决定的。以脸谱网为例,其认为来自真实好友关系的生活记录内容更重要,在分发过程中就会加强真实好友生活记录内容的权重,而弱化他们转发内容的权重,并进一步弱化媒体所发布内容的权重等。

事实上,我们熟悉的各类内容分发产品,无论起步如何,如今都走上了一条多元素融合的道路:依赖中心化编辑引导和干预,依赖去中心化用户生产传播,应用机器学习提升效率。新版的微博在关注频道的旁边放置了热门频道,提供不依赖订阅关系的内容推荐服务;微信亦上线了实验室功能“看一看”,尝试推荐分发。

多分发方式的融合一定是未来分发的主流,沉迷“气宗”“剑宗”之争的看客们,还是散了吧。

《内容算法:把内容变成价值的效率系统》,(闫泽华 著;中信出版社出版)

相关文章

红米note3android耗电,大电池谁更耐用?红米Note3和魅蓝Note3电池续航功能详细对比介绍...
淘宝U站网站大集合及加入淘宝U站的好处
28365365体育投注

淘宝U站网站大集合及加入淘宝U站的好处

📅 07-04 👁️ 6262
女篮世界杯手机直播哪个平台直播 官方观看平台及注意事项
王紫嫣名字打分
28365365体育投注

王紫嫣名字打分

📅 06-28 👁️ 7317
九州通:搭建了行业稀缺的全场景物流供应链服务平台,积累了大量优质的医药仓储物流资产
《修炼爱情》歌词赏析
bet体育365冻卡么

《修炼爱情》歌词赏析

📅 06-30 👁️ 2173