前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >当你们在用算法获取流量和金钱时,微博和知乎是这样做的

当你们在用算法获取流量和金钱时,微博和知乎是这样做的

作者头像
罗超频道
发布于 2018-04-17 07:59:52
发布于 2018-04-17 07:59:52
7760
举报
文章被收录于专栏:罗超频道罗超频道

昨天,我的一条微博创造了自2010年注册以来的记录:阅读量超过1000万,且还在继续增长——然而我的微博粉丝,却只有1万人,出现这样的情况,是因为微博的Timeline不再只是基于关注,而是结合了算法推荐的“发现流”,每一个内容都有被算法推荐进而曝光和爆发的机会,坐拥千万粉丝大V和只有一万粉丝的小V,都要PK内容。事实上,整个行业,算法都在扮演着日趋重要的角色。

内容平台的算法经济学

微博在2017年先是加入了发现流,内容分发逻辑发生巨大变化,正是因为看到了算法类内容平台的强势崛起——微博,百度、UC、腾讯、搜狐、网易都推出了信息流产品,知乎2017年改版首页从基于关注的内容推荐,变为基于算法和关注的内容推荐。

将算法用在内容推荐上,国内的先行者是豆瓣——它在PC时代首页就已是基于算法推荐而形成的内容流,豆瓣FM、豆瓣阅读等产品背后的逻辑也是算法。然而,彼时深度学习技术并不成熟,豆瓣的推荐精准度一直被豆友们吐槽。近年来,随着AI技术的成熟,算法也越来越得心应手,真正意义上实现了千人千面,比用户更理解用户,不断吞噬用户时间。

结合算法,精准的广告也被不断推荐给用户,成了移动互联网商业化的最佳答案,比如微博就通过信息流广告赚得钵满盆满,2017年总营收达到77.13亿元,同比增长76%,净利润则达到27.14亿元。此外,百度、知乎等平台也都在发力信息流广告,算法正在带来真金白银。

当然,算法不是灵丹妙药,它一直被业界批评缺乏必要的正向价值观、有导致用户阅读视野变窄的“信息茧房效应”,容易形成信息孤岛,甚至导致低俗泛滥。不过,现在看来,通过与价值观、与人、与社交的融合,算法正在规避上述问题,甚至一定程度上成了内容业的看门狗。

算法成为内容平台看门狗

新闻从业者一直被视作是社会的“看门狗”——守护安全,监督环境,警惕危险,现在看来算法在内容平台上也开始扮演“看门狗”的角色:内容质量、内容审核、社区治理,算法都能帮上大忙。

上周末,微信屏蔽抖音的消息被传开,不过腾讯公关总监张军日前回应,“朋友圈一直有防刷屏机制,过了阀值就自动不可见,过凌晨12点自动恢复正常,屏蔽之说不存在。”跟此前新世相等诱导分享的卖课被屏蔽一样,微信正在将算法用在平台的治理上,事实上,公众号内容原创识别,朋友圈关键字屏蔽等等功能背后,都是算法在驱动。

今年1月,微博官方账号@微博管理员发布《关于加大力度处理热搜榜热门话题榜刷榜行为的公告》,对王乐乐微博等涉嫌参与刷榜的大V进行了处罚。微博宣称其“不断对产品本身进行算法升级并设置了以大数据识别为基础的防刷体系。对于存在作弊特征的行为,系统都会实时进行识别和拦截。在热搜榜中,每天约有40%的热搜词被系统识别为流量异常而不能上榜。”此外微博也将算法应用在内容审核等方面,相信大家对此心照不宣。

另一个受关注的内容平台知乎也一直很重视社区氛围,对社区的管理采用的是名为“瓦力”和“悟空”的AI反垃圾系统。知乎日前升级了瓦力的算法,可以实时筛查对内容创作者不友善的内容,或是对答非所问、事实错误、垃圾广告导流等行为进行识别和处理。知乎站务管理账号“知乎小管家”公布的数据是,瓦力每日可处理内容近万条,对于举报上来的不友善内容,0.3秒内就可以处理掉。

算法已成为行业标配,不只是内容平台,就连电商平台也在应用算法来推荐商品。不过,算法的价值不只是流量、时长或者变现,从一些内容平台的实践来看,算法可以比肉眼更加精准地识别不好的内容,为优质内容保驾护航,进而避免劣币驱逐良币,也一定程度规避了算法推荐的缺陷。

微博通过算法来确保热搜榜的权威价值。热搜榜和热门话题榜能够快速、准确反映出微博用户对于热点内容的关注程度和方向,对于不同角色都有其参考价值,然而一旦被“注水”这个榜单就失去了意义。正是因为此,微博要不断升级算法,来抗击刷榜大军。

知乎也在通过算法确保社区内容品质。相对于微信的生活化和微博的大杂烩而言,品质对于“中文互联网内容高地”知乎更重要。许多内容在知乎讨论后会被以链接、截图、日报等形似分享到微博微信,之前看到过一组数据,每天知乎有近50万条内容被分享到站外,二次传播浏览人数达到2亿,而且许多大事件比如最近的六六京东事件、蓝标员工事件,知乎的讨论在事件中都是重要一环。知乎在面向大众人群的同时,依然需要注重内容品质。过去这一保障依靠人,现在也靠算法,据官方数据来看,知乎今年3月的月PV达到了230亿,差不多是去年同期的2.3倍。

在内容大爆炸的时代,优质内容反而是稀缺的,将算法应用到优质内容守护上就显得尤为重要。而长期来看,当一套算法系统成为“看门狗”后,它就可以不断被训练,不断自我学习,进而变得愈发聪明,可以在后台24小时不间断运转,不给“坏内容”任何可乘之机,也节省了大量的人力成本,内容审核和社区管理人员将会越来越多地被算法取代。

算法要如何做好看门狗?

用算法来管理内容和社区对于业界来说,还是一个新的命题。先行者微博、知乎等平台的做法,也给行业提供了一些思路。

1、人机结合,不能只靠算法。

1月底,微博被相关部门约谈后,将热搜榜、热门话题榜、微博问答等功能下线一周,经过整改后上线。微博副总裁曹增辉向界面透露,整改的核心是:

“引入了编辑人工干预的模式,微博会将算法挖掘作为基础,在排序和选择上放弃纯粹算法的方式,引入编辑对违反有关法律法规的内容、社会负能量的信息、过度娱乐化的信息进行人工干预。”

人机结合是未来算法应用的趋势,因为算法还没有智能到可以全部取代人类的程度,而且算法缺乏人类才具备的价值观。对于社区内容管理而言,也只有人机结合,才能避免误伤优质内容和正常用户,形成公平的治理环境,比如知乎的瓦力机器人,对于网友们举报的不友善内容,先通过算法智能识别,再引入管理员人工核查,大大提升了处理效率和准确率,也节省了人力成本,算法也会学习用户的举报内容特点,进行模型分析,提升识别的准确率和覆盖范围。

2、众包机制,用户自治管理。

知乎前段时间面向5万用户内测了“有理由反对”功能,用户可以选择「事实错误」、「答非所问」、「煽动情绪」和「不解释」等理由,知乎瓦力根据用户信用值权重来判断这个选择的重要性,最终体现在对内容的分发上。而据“知乎小管家”专栏介绍,知乎用户平均每天举报各类违规内容约两万五千条,其中 2%来自作者举报自己内容评论区的违规行为,剩下 98% 来自其他用户看到违规行为的举报,用户的举报准确度高达 95%。微博则在最近上线了一个很有意思的功能:云黑名单。当一个用户因为热衷于谩骂等行为被多个用户举报或者拉黑后,就会被加入云黑名单,此后,这个用户的评论可能只有自己才看得到。这个做法的本质就是让用户来管理用户,或者说叫做用户自治。

理论上来说,众包机制,同样是一种人机结合,只不过它将用户变成了协管,引入了众人的价值观,同时引入算法,来形成一种中心式+去中心的多元化管理制度。长期来看,此举可以让用户体会到更加民主公平的社区氛围,也更愿意遵守和维护社区秩序,变相成为社区兼职管理员。

3、社区规则,奠定算法基础。

微博很早就上线了《新浪微博社区公约》和一些社区规则,并一直在完善这个体系,它主要对用户的内容发布、评论互动等等行为进行了规约,此后不论是微博管理员,还是不断迭代的算法,在处理问题时,都要遵照这个公约,它堪称是微博这个社区的“宪法”。知乎上的类似条款则是《知乎协议》和《知乎社区管理规定》,2014年知乎为了营造更好的讨论环境发布了《良性讨论公约》,不论是瓦力机器人还是知乎管理员,同样是在这些约定框架下运转的。当然,规则也应该根据社区成长,不断迭代完善,成为社区管理的准绳。

4、预防预测,而非事后清理。

曾经,社区管理更多是在做事后处理,比如对违规内容的删除屏蔽,对对应用户的扣分禁言等等,不过,随着算法在社区管理的中的应用,平台结合大数据,已经有能力来预测一个用户的行为,在其产生影响前就进行干预。比如当你上传一张图片后,微博首先就会进行相似度判断,涉嫌违规的突破,相似度90%以上的系统直接处理,相似度50%-90%的就有人工审核;再比如一个用户,是比较喜欢恶意攻击的“网络暴民”,其内容就很可能会被限流,甚至只有他自己可见。

在算法成为互联网行业的显学后,各个平台都在应用算法。现在看来行业不应该只是关注如何用算法来获取更多流量时长,或者提高广告转化率,同时也要更重视将算法应用在平台治理上,同时结合社区众包管理等机制,来提升算法治理的效率和效果,用算法来规避算法的缺陷。从目前各家平台的实践来看,大家要学的东西,还有很多,“在未来面前,我们还是个孩子”。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 罗超频道 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
让我们挖吧——Logminer(3)Lo
终于到了真正的操作篇,不过Logminer的操作真的是很简单,关键还是当中的一些原理和如何合理应用Logminer。
py3study
2020/01/14
8080
【DB笔试面试794】在Oracle中,LogMiner是什么?
在Oracle中,LogMiner是什么?其有哪些用途?请简述LogMiner的使用过程。
AiDBA宝典
2020/05/11
1K0
分析Oracle数据库日志文件(1)
分析Oracle数据库日志文件(1) 一、如何分析即LogMiner解释 从目前来看,分析Oracle日志的唯一方法就是使用Oracle公司提供的LogMiner来进行, Oracle数据库的所有更改都记录在日志中,但是原始的日志信息我们根本无法看懂,而LogMiner就是让我们看懂日志信息的工具。从这一点上看,它和tkprof差不多,一个是用来分析日志信息,一个则是格式化跟踪文件。通过对日志的分析我们可以实现下面的目的: 1、查明数据库的逻辑更改; 2、侦察并更正用户的误操作; 3、执行事后审计;
阿新
2018/04/12
3.2K0
Log Miner 挖挖挖
Log Miner是Oracle自Oracle 8i以后推出的一个可以分析数据库redo log和archivelog内容的工具,可以通过日志分析所有对数据库的DDL和DML操作,也可以分析出操作的时间与操作时的SCN和进行操作的机器,对于DML操作还可以查询出还原操作的sql。
沃趣科技
2018/10/31
8200
Log Miner 挖挖挖
基于Oracle LogMiner的实时采集一、Logminer简介及使用
Oracle LogMiner 是 Oracle 公司从产品 8i 以后提供的一个实际非常有用的分析工具,使用该工具可以轻松获得 Oracle 在线/归档日志文件中的具体内容,特别是该工具可以分析出所有对于数据库操作的 DML 和 DDL 语句。该工具特别适用于调试、审计或者回退某个特定的事务。LogMiner 分析工具实际上是由一组 PL/SQL 包和一些动态视图( Oracle8i 内置包的一部分)组成,它作为 Oracle 数据库的一部分来发布是 8i 产品提供的一个完全免费的工具。但该工具和其他 Oracle 内建工具相比使用起来显得有些复杂,主要原因是该工具没有提供任何的图形用户界面( GUI)。
@阿诚
2021/07/23
3.7K0
如何使用StreamSets实现Oracle中变化数据实时写入Kudu
温馨提示:如果使用电脑查看图片不清晰,可以使用手机打开文章单击文中的图片放大查看高清原图。 Fayson的github: https://github.com/fayson/cdhproject 提示:代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 在前面的文章Fayson介绍了关于StreamSets的一些文章,参考《如何在CDH中安装和使用StreamSets》、《如何使用StreamSets从MySQL增量更新数据到Hive》、《如何使用StreamSets实现MySQL中变化数据实时写入K
Fayson
2018/07/12
5.2K0
基于 Oracle LogMiner 的 CDC 日志解析
Oracle 的 Change Data Capture (CDC) 机制利用 LogMiner 解析重做日志获取数据变更。
Yunjie Ge
2025/04/27
1760
基于 Oracle LogMiner 的 CDC 日志解析
Oracle中删除的列数据可以进行恢复么?
再次闪回表,当前提示的是"无法读取数据 - 表定义已更改",说明如果表出现了定义改变,例如增列、删列等,就无法通过闪回进行表的恢复,原因就是闪回操作利用的是UNDO,但是drop column是个DDL操作,直接提交,不会记录到UNDO中,因此不能通过flashback table操作将表恢复到列删除前的状态,
bisal
2025/04/22
1830
Oracle中删除的列数据可以进行恢复么?
这样做,免费从Oracle同步数据
刘伟,云和恩墨软件开发部研究院研究员;前微博DBA,主要研究方向为开源数据库,分布式数据库,擅长自动化运维以及数据库内核研究。
数据和云
2019/05/13
2.1K0
这样做,免费从Oracle同步数据
小程聊微服务-数据抽取那点事(一)
我们在《微服务是在双刃剑 http://www.jianshu.com/p/82ec12651d2d 》中提到了当我们将应用服务化以后,很多在单块系统中能够开展的数据统计和分析业务将会受到很大程度的影响,本文将延续上一篇文章深入分析服务化后,作为后端的数据统计和分析如何做。
小程故事多
2018/08/22
8110
小程聊微服务-数据抽取那点事(一)
【Oracle】还想着花钱实现Oracle数据同步迁移?一招教你搞定!!
作者个人研发的在高并发场景下,提供的简单、稳定、可扩展的延迟消息队列框架,具有精准的定时任务和延迟队列处理功能。自开源半年多以来,已成功为十几家中小型企业提供了精准定时调度方案,经受住了生产环境的考验。为使更多童鞋受益,现给出开源框架地址:
冰河
2020/10/29
9740
LogMiner的使用
这里当前日志(current)是: thread 1 sequence 30 thread 2 sequence 25
Alfred Zhao
2019/05/24
7580
Oracle CDC详细配置(LogMiner)
在很多的数据处理任务中,我们经常会用到数据同步的需求,尤其是异构数据库同步,当然目前世面上有很多的数据同步工具,开源和商业的都有很多,当然Oracle自身也可以实现数据的实时或者异步同步。这里我们示例一下通过配置 Oracle 提供的 LogMiner 免费工具,进行数据变更的捕获。配置完成后,动手能力强的小伙伴,就可以自己写个代码,解析相应的变更,然后可以做成同构或者异构数据库的同步工具。
Yunjie Ge
2022/04/24
2.8K0
Oracle数据误操作全面恢复实战(r11笔记第78天)
对于DBA来说,面对误操作带来的数据恢复难度,其实很大。主要有以下几个方面: 误操作的影响范围极大,很可能不是删点,改点数据的操作,有时候可能是让人望而兴叹的truncate,drop操作。 数据恢复时需要确认数据损坏的时间点,依此来作为数据恢复的一个基准,该舍弃多少数据,该如何权衡,非常关键。 一旦信息提供错误,是否经得起反复折腾,我想这个对于绝大多数的数据恢复而言,基本都是一锤子买卖,能恢复已经不错了,还要反复恢复。但是一旦出现这种情况,可不能马上乱了阵脚。 灾备方案好不好,一试便知 自己也
jeanron100
2018/03/21
7860
Oracle数据误操作全面恢复实战(r11笔记第78天)
数据传输 | 如何使用 DTLE 将 Oracle 数据同步到 MySQL
爱可生测试团队成员,主要负责 DTLE 开源项目相关测试任务,擅长 Python 自动化测试开发。
爱可生开源社区
2022/04/06
1.4K0
oracle 常用命令大汇总
oracle 常用命令大汇总(第一篇)     第一章:日志管理     1.forcing log switches     sql> alter system switch logfile;     2.forcing checkpoints     sql> alter system checkpoint;     3.adding online redo log groups     sql> alter database add logfile [group 4]     sq
阿新
2018/04/12
7100
Oracle闪回原理-Logminer解读redo(r11笔记第17天)
说到闪回日志,我们都知道闪回日志中记录的都是逆操作,那么就有两个问题需要解释了。 闪回日志和回滚段保存的数据有什么差别? 如果做了truncate操作,闪回日志是怎么记录的,怎么能够通过闪回恢复数据。 第一个问题是一个同学问的,第二个问题是我偶然想起来的,当然这两个问题还是蛮有意思。我们的目标就是解释清楚下面的两个问题。 当然要深刻理解这个问题,一个重要的部分就是得先明白redo的基本情况。 借用大师Jonathan Lewis的话说,Oracle里面最重要的特性是在V6提出的改变向量,改变向量是
jeanron100
2018/03/21
1.2K0
Oracle闪回原理-Logminer解读redo(r11笔记第17天)
初识FlinkX-Oracle Logminer模块
本文作者:杨槐(花名:渡劫)袋鼠云大数据开发工程师,负责FLinkx的开发与维护。
袋鼠云数栈
2021/05/14
1.2K0
初识FlinkX-Oracle Logminer模块
Oracle LogMiner 核心 SQL 解析
在Oracle数据库变更捕获(CDC)体系中,LogMiner是极其重要的工具,它通过解析重做日志,捕捉DML、DDL变更并还原成结构化事件。LogMiner在工作过程中大量依赖底层系统视图(如VLOGMNR_CONTENTS、SYSTEM.LOGMNR系列表)以及一系列精心设计的SQL查询。本文将带你逐条深入了解LogMiner背后的关键SQL,揭开高效日志解析的秘密。
Yunjie Ge
2025/04/27
1070
Oracle LogMiner 核心 SQL 解析
Oracle 常用命令大汇总
第一章:日志管理     1.forcing log switches     sql> alter system switch logfile;     2.forcing checkpoints     sql> alter system checkpoint;     3.adding online redo log groups     sql> alter database add logfile [group 4]     sql> ('/disk3/log4a.rdo','/di
阿新
2018/04/09
9390
相关推荐
让我们挖吧——Logminer(3)Lo
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档