首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >【技术贴】物理学博士教你怎样分析微博数据,怎样涨粉

【技术贴】物理学博士教你怎样分析微博数据,怎样涨粉

作者头像
CDA数据分析师
发布于 2018-02-23 07:41:00
发布于 2018-02-23 07:41:00
1.1K0
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

网上已经有太多关于怎么增加微博粉丝数,以及怎样让我们发的微博获得更多转发的建议了。我们并不知道这些建议是否有效,因为它们大都是建立在个人感觉上,而缺乏真正有说服力的证据。实际上微博是一个非常适合进行数据分析的东西,所以想谈微博心得,你得用数据说话。

一个普通用户的微博数据

从 2012 年 8 月 24 日开始,我像个自恋者一样,每天都看看自己的粉丝数涨了多少——不但看,而且还顺手把数字记录下来。这样坚持到写作本文的时候一共过去了 86 天。这个数据的可贵之处并不在于它是人工测量的,而在于它是独一无二的:由于不管是新浪微博还是 Twitter 都不记录,或者至少是不提供“关注”这个动作的发生时间。现有的任何微博相关数据研究也都没有精确的粉丝数随时间变化记录。如果能得到更多像这样的数据,我们完全可以写一篇像本文后面要介绍的那两篇一样重要的论文。 下面这张图就是我在这86天中粉丝的增长情况。上图是总的粉丝数,下图是每天增加的粉丝数。

我曾经设想,一个人粉丝的增加应该是指数增长的:关注你的人越多,你的影响力就越大,那么就会使得有更多人来关注你。这样的微分方程是 df/dt = cf,所以 f = ect 。然而实际上的增长却大致是线性的,df/dt=常数!除了几次突然爆发之外,我大概每天增加 10 个粉丝。图中用数字标记了 4 个突然增长事件,其中 9 月 15 日 和 10 月 22 日这两次比较大。不算突发事件,我的增长速度相当稳定:图中两段近似直线中,第一段平均每天增加粉丝 9.2 个,第二段平均每天 10.5 个,这还包括了(2)和(3)两次小跳跃。如果真有指数增长,那么或者发生在账户开通的初期,或者要等到账户已经相当有知名度之后,或者本身是个极大尺度的现象难以在这么短的时间内表现。 所以如果你认为增加粉丝的最好办法是多发好的微博,结果可能会让你失望。事实是只有出现爆发事件才能让你的粉丝数上个台阶 。在图中标记的四个爆发事件中: (1)是我在果壳网发表了 近亲不如远邻:最关键的人脉是不熟的朋友 。我 9 月 15 日的相关微博被转发超过一千次,而更重要的是 @果壳网(粉丝 60 万)在微博对此文进行了介绍,结果是一天之内增长了 300 多个粉丝。 (2)这个小波动发生在 9 月 23 日,而我从 9 月 16 日到 24 日间一条微博都没发过。我不知道这是什么原因,很可能是(1)的一个余波。 (3)是我在博客发了《一个关于转世的流行病学研究》一文。从粉丝的增长情况来看这篇文章的影响力不大。此后在《上海书评》发表《四万年来谁著史》,仍然没有带来多少粉丝。 (4)是 @cnsns (粉丝3万多)在微博对我进行了 推荐 ,而这条推荐又被 @经纬张颖 (粉丝342万)转发,导致粉丝数在 33 分钟内增加了 321 个,两天增加了 800 多。 我在三个月内发了大概上百条微博。发微博对当天增加粉丝有一定的影响,但是在绝大多数情况下不会带来什么爆发。由此可见增加微博粉丝数的最好办根本不是发微博,发微博还不如少发几条微博写篇正经文章。当然最有效的办法也不是写文章,而是被大V推荐。这里没有记录到的是在我微博账号建立的初期也曾有过一次爆发,是媒体人土摩托(粉丝14万)和松鼠科学会成员等科学作者的推荐导致。

来自名人的大数据

没有多少人会像我一样每天记录自己的粉丝数,这使得大规模研究微博账户的成长过程非常困难。但是卡耐基梅隆大学和微软的研究人员仍然 想了一个没有办法的办法 。Twitter跟新浪微博一样,虽然不记录每个“关注动作”的发生时间,但它把你所有的粉丝按照关注你的先后顺序排列。同时,Twitter还提供每个账号的首次注册时间。这样对其中任何一个粉丝,研究人员找到他的注册时间,并且找到在他之前关注你的所有粉丝的注册时间,然后把所有这些时间中最晚的那个,就当成他这次关注发生的时间。可以想象这是一个非常不精确的估计,但只要数据量足够大,仍然是可以接受的。 这篇文章发现, 哪怕对于具有相当量级的名人来说 ,“被推荐”仍然是最重要的增长粉丝办法。下面这张图表现了技术博客 Anil Dash,娱乐界女星 Kim Kardashian 和纽约时报的 Twitter 账户被关注的时间曲线。他们粉丝的增长充满了突变,而其中最大的几次突变,正是因为 Twitter 对他们进行了系统推荐。

图中事件(1)是 Twitter 引入了一个系统推荐名单,而纽约时报在这张名单上。我们看到这个名单一出来,纽约时报每天增加的粉丝数立即提升了一个层次。到 2009 年 4 月,Kardashian也被加入到这份名单之中,于是她的粉丝数也开始暴涨。没进推荐名单之前,Dash的粉丝数每天增加 50 个,等到十月份被加进推荐名单之后,他的粉丝数每天增加 2500 个!一个有意思的现象是 Dash 进来之后纽约时报和 Kardashian 的成长开始放缓,研究者也不确定这是怎么回事。根据后面的变化推断,对纽约时报来说,很可能是因为 Twitter 在十月份扩大了推荐名单上的人数,使得它的重要性被稀释。而对 Kardashian 来说,则可能是她被从推荐名单上移除了。 事件(2)是 Twitter 改变了推荐方式,把推荐账户分类,让用户自己根据兴趣选择。这个变化对 Dash 和纽约时报带来了一个打击,二者每天增加粉丝数都显著减少。但 Kardashian 因为早已不在推荐名单上,她的成长没有受到影响,仍然逐步增加,甚至有点指数增长的意思。 事件(3)是 Twitter 再次改变推荐方式,变成根据每个用户的兴趣来定制推荐。这一次纽约时报和 Kardashian 都受益了,而 Dash 受到的影响不大,仍然每天增加200左右的粉丝。 仅从这张图而论,系统推荐的作用实在是太大了。技术博客 Dash 和纽约时报的粉丝层长几乎完全由系统决定,只有像 Kardashian 这样的女明星才能跑出一段不顾大盘的强势增长—— 据说 请她发一条广告微博的价格是一万美元。那这些明星们的增长靠的又是什么?得看下面这张图:

像 Oprah Winfrey 这样的大佬一在 Twitter 现身(事件1),马上就有了众多粉丝,但是最初的高潮之后加粉的速度却越来越放缓,变成跟 Ashton Kutcher 差不多的趋势。真正能做到加粉速度越来越快,好像指数增长一样的是 Lady Gaga 和 Justin Bieber 这样的偶像派!他们的粉丝是怎么来的?是因为他们发了高质量微博吗?当然不是。 这两人的粉丝成长,是他们在现实生活中事业成长的反应 。Justin Bieber 在2009年初还是个无名之辈,Lady Gaga 2010 年后才大红大紫。我们看 Lady Gaga 的几个关键事件,(2)是她得了 MTV 的音乐奖,(3)是她参演了艾美奖,(4)是她出了新MV“Telephone”。图中事件(5)很有意思,是明星 Soulja Boy 突然删除自己原有的Twitter账号又建了个新的,粉丝们忙着关注他的新账号,一时之间产生了大量的关注动作,以至于我们图上这几位明星的 relative popularity 都被抢了风头。 这样看来非常明显,哪怕是对名人而言,也是系统推荐的力量最强,其次则是看你在现实世界干了什么。明星们微博粉丝的变化很可能与他们发什么微博关系不大。在新浪微博姚晨的粉丝最多(现在已经是谢娜了),但姚晨却未必是中国最火的女明星,据此可以推测是新浪的推荐帮了大忙。 而对于我们普通人来说,既没机会被系统看上,也没机会在真实世界兴风作浪,想要涨粉丝也许只能靠发几条有意思的微博。我们期待这些微博能被广泛转发,因为只有这样才能被更多人看到,引来新粉丝。但是怎样获得更多转发?更重要的是,转发真有用么?

什么样的微博转发量惊人

Palo Alto Research Center 的几位研究者 专门研究 了Twitter上的转发。一条微博被转发的平均次数应该跟两个因素有关:微博本身的内容,以及发帖者的粉丝数。粉丝数容易测量,可是微博内容好坏很难测量,这项研究只能采用最简单的办法。 一个办法是看微博中是否包含网址链接(URL)。包含 URL 的微博至少言之有物,总比发条在哪吃饭的状态有可读性。这个研究总共统计了 7400 万条微博(对 Twitter 来说这叫 tweets),统计发现全部其中 21.1% 包含 URL,而那些纯转发的微博中则有 28.4% 含URL。这个结果似乎不怎么明显,但此文引用的另一项研究的两个数字则分别是 18.96% 和 56.69%。不论如何,介绍一个从别处看到的信息的确能够增加微博的转发几率。获得更多转发的另一个办法是参与话题,也就我们经常看到的两个“#”,这样别人只要点击这段话就能找到所有写了这段话的微博。统计表明全部 tweet 中的 10.1% 含有话题,而那些转发的tweet含话题的比例则是 20.8%。 这两个数据都平淡无奇,完全符合我们的预期。我们真正想发的是那种一出来就被迅速广为传播,乃至一层一层传出去引发爆炸式增长的微博。但正如我以前曾经在 别用“常识”理解复杂世界 中介绍过的那样,引发这种“twitter瀑布”具有极大的偶然性,就算是粉丝众多的人也未必能经常做到。 这项研究并没有明确指出,但是据我观察更为关键的一个事实是,偶尔发几条被广为转发的微博并不能给你显著增加多少粉丝。@Yaoyao521 今年四月发了一条关于出租车司机不收盲人车费的 微博 ,这条微博讲了一个很好的正能量故事,被转发次数超过一万三千,甚至还被媒体报道。作者目前为止一共发过五千多条微博,可是她的粉丝仍然只有 3608 个。像这样的例子并不罕见,很多情况下并不多——而且我一次都没有因为这个原因关注他们。换句话说,除非你能持续不断地发高质量微博,证明自己是靠能力而不是运气,粉丝才会因转发而增加。 这种人有多少?肯定非常少。下面这张图是前面提到的研究统计出来的转发数跟粉丝数的关系。二者几乎就是个线性关系!一个有 5000 粉丝的人和一个有 1000 粉丝的人,微博平均被转发次数差不多也是五倍关系。这说明平均而言,粉丝多的人发的微博质量并不比粉丝少的人更高,他们仅仅因为粉丝多而获得更多转发!这个统计还表明平均每一千粉丝带来的转发数是每条微博 1.5 次,如果你的成绩比这个好,那么你属于水平比较高的。

有人认为多发微博可以涨粉丝,有人认为微博贵精不贵多,而这项研究告诉我们的就是你的转发几率跟你发微数量根本没关系。下图是被转发几率与发微总数的关系:

如图所示,不管你已经发过 500 条还是 5000 条,你下一条微博被转发的几率,平均而言,都是差不多一次。而发微频率高的人累积的条数也多,这说明 发微薄频率完全不影响被转发几率 ,因此也就不影响通过被转发而涨粉丝。

结论

总而言之,逆天靠系统,名人靠事件,普通人没事件只能靠推荐,没人推荐则靠转发,而转发靠内容。以上获得粉丝手段的有效性是直线下降的,后面的远远不如前面。而最没用的,就是你的发微数量。这些性质说明我们之所以会关注某个人物,在大多数情况下是因为对这个人本身的关注,而绝不只是想看他发些什么。

本文只讨论了个人综合微博,以上所有分析未必适用于各种专业微博,比如专门搜集笑话的微博。也许只发某一方面内容的账号更容易获得粉丝,因为别人对你的内容有固定的期待。这种账号对读者来说虽然很重要,对写的人来说却未必有多大乐趣,相当于是微博世界里的NPC(非玩家控制角色)。

总而言之,想涨粉丝?功夫在微博之外。既然如此,索性别计较什么粉丝数了。也许我们写微博的真正乐趣不是为了吸引粉丝,而是图个说话痛快!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-04-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
王思聪庆祝iG夺冠,微博抽奖猫腻何在?
iG在英雄联盟决赛上夺冠一声炮响,将这一游戏圈内部的赛事变成了全民事件。微信朋友圈、微博等平台,懂的不懂的,都开始谈论起这件事情来。iG战队的老板王思聪为庆祝iG夺冠,在微博上也发起抽奖活动:
用户1569917
2019/01/09
9180
大碗宽面VS律师函警告,爬取10万条微博数据分析吴亦凡自黑式圈粉
“你看这个面它又长又宽,就像这个碗它又大又圆”。一直被网友们调侃的freestyle梗,没想到真的被说唱导师吴亦凡写成了自黑的歌——《大碗宽面》。由于时间点也挺凑巧,刚好赶在蔡徐坤发律师函给哔哩哔哩之后,不禁让大家对他们进行一番对比。同为我们印象中的流量明星,吴亦凡跟蔡徐坤之间有什么不一样吗?大伙儿是怎么看待他们的?又是怎么看待《大碗宽面》这首歌的呢?
CDA数据分析师
2019/05/15
6980
大碗宽面VS律师函警告,爬取10万条微博数据分析吴亦凡自黑式圈粉
爬取吴亦凡微博102118条转发数据,扒一扒流量的真假
导读:“你看这个面它又长又宽,就像这个碗它又大又圆”。一直被网友们调侃的freestyle梗,没想到真的被说唱导师吴亦凡写成了自黑的歌——《大碗宽面》。由于时间点也挺凑巧,刚好赶在蔡徐坤发律师函给哔哩哔哩之后,不禁让大家对他们进行一番对比。
IT阅读排行榜
2019/05/13
8550
爬取吴亦凡微博102118条转发数据,扒一扒流量的真假
大数据分析:全面分析18亿票房《羞羞的铁拳》传播套路
很喜欢看开心麻花的作品,沈腾和马丽真是天生适合喜剧,收放自如,潇洒自然,傻大个艾伦和矮小子王宁最近几年台风更加成熟,表演更加张弛有度。其实,他们野心不大,只是努力想通过接地气的梗让你肆无忌惮地笑,并且
沉默的白面书生
2018/05/07
8410
大数据分析:全面分析18亿票房《羞羞的铁拳》传播套路
互联网的B面:撕开虚假流量的遮羞布
1994年10月27日,Hotwired以横幅的形式在网站上首次登载了网络广告,标语上写着“你有没有曾经尝试用鼠标点在这里过?你会的。”从此,以点击量为代表的商业流量数据开始登上网络舞台。2000年10月23日,随着谷歌广告首次推出了基于按单次点击付费模式(PPC)的商业规则,流量开始成为竞相争夺的财富密码。 【互联网有史以来的第一支横幅广告】 到了今天,发达的网络信息化时代也堪称是流量的时代,当资本与流量深度绑定,每一个流量背后到底“是人非人”的问题便由来已久,网络水军、流量造假等虚假流量已成为庞大且完
FB客服
2023/05/12
6500
互联网的B面:撕开虚假流量的遮羞布
社交还是媒体?微博答案是内容
曾几何时,人们对于微博究竟是媒体还是社交应用,一直有不同的看法。微博自身亦在两条路上不断探索,进行诸多尝试,兼具两种因素。现在如果你再问微博是一款什么应用,它的答案可能会让你觉得有些意外:『是一个内容平台』。近日微博发布了Q3财报,财报显示,微博MAU(月活跃用户)继续增长,消除了一些人对微博活跃度下滑的担忧。微博之所以变得更加活跃,与其内容化转型离不开关系。 内容互联网时代已到来 移动互联网走过了『功能』时代,工具和平台的跑马圈地早已告一段落。基础设施搭建好了,在这些基础设施上运营内容是移动互联网眼下最
罗超频道
2018/04/28
8410
从头搭建一个“微博”有多难?
众所周知,微博的程序员经常不定期加班。和别的程序员不同,别的岗位的程序员可能加班是可控的,但是微博的程序员不是。为什么呢?因为程序员们无法预知明星们什么时候有新的大料产生,一旦有新料,微博崩溃是妥妥的。甚至很多粉丝用微博有没有崩溃来衡量一个明星的知名度。
TechFlow-承志
2020/04/21
5800
从头搭建一个“微博”有多难?
从72条微博热搜复盘吴亦凡事件!|社媒大数据
7月18日,都美竹在微博上发布与吴亦凡的"决战宣言”,一时之间,与吴亦凡相关的话题引爆了各大社交平台。据微信指数小程序显示,7月19日当天,吴亦凡的微信指数日环比暴涨746%,热度指数超过7千万。
八爪鱼大数据
2021/08/17
1.4K0
真正使用大数据的4个方法
大数据已经在媒体和IT企业中大量提及,但是有多少企业真正在使用大数据?又有多少企业从大数据中受益呢?真正使用好大数据是不容易的事情。 2014年,美国的中西部和东北部遭遇了最恶劣的气候。美国的西南
静一
2018/03/16
9680
微博的大V经济学,让自媒体今年赚了117亿
大洋彼岸的Twitter正在因为业绩衰败寻求卖身,它在中国的“徒弟”微博却搞了一场“2016年V影响力峰会”,带着小伙伴展望未来。1000多位各行业“大V”到场,除了第一天的论坛之外,第二天还举办了1
罗超频道
2018/04/27
7770
微博的大V经济学,让自媒体今年赚了117亿
iG.wxz微博抽奖小数据分析——男用户和狗不得中奖
微博4000w粉丝的王校长可谓自带流量,投资的iG战队夺冠后,自掏腰包113万通过微博抽奖工具抽奖,双十一开奖后却被人扒出113个中奖账号中有112个性别为女。
不二小段
2018/12/12
7460
iG.wxz微博抽奖小数据分析——男用户和狗不得中奖
周杰伦与蔡徐坤超话大战:微博即将取代贴吧?
7月21日凌晨,在历经近一周的“被迫上岗做数据”后,周杰伦的“野生中老年”粉丝们终于将周杰伦送上新浪微博明星超话排行榜第一名,力压微博第一大流量明星蔡徐坤,一时成为社交网络的热门话题。
腾讯大讲堂
2019/07/23
1.1K0
周杰伦与蔡徐坤超话大战:微博即将取代贴吧?
一个月涨粉翻倍,摄影博主慌了:照片都是假的,肖像根本不是人
白交 发自 凹非寺 量子位 | 公众号 QbitAI 一个月内涨粉翻倍,摄影博主却慌了,忍不住坦白: 我的照片都是AI生成的。 去年十月份开始,这个名叫Jos Avery的大哥(后面简称乔大哥)开始在社交网络上发照片,从此开始立起自己的摄影人设—— 主攻黑白人像,偶尔发发风景。 △乔大哥主页 现在来看,他的发博频率确实不低。每次只发一张。前期每天还都会发几次,之后都稳定保持在一天一发的发博速度。 毕竟拍摄+后期一整套流程下来也是要干不少活儿。 每每发表都有被吸引过来的网友称赞:You deserve re
量子位
2023/02/23
3890
一个月涨粉翻倍,摄影博主慌了:照片都是假的,肖像根本不是人
你发的每一条微博,背后都有一个人工智能
微博是很多人最常使用的社交平台。吐槽、追星、发自拍、看视频、开直播等,如今微博的内容和互动形式越来越多元化。由此累积下来的庞大数据和复杂的用户互动场景,也让人工智能在微博有了用武之地。微博团队是如何玩转人工智能的?如何对明星进行图像识别?近期的线上数据侠实验室中,DT君邀请了微博机器学习团队资深算法工程师杨士新,分享了微博在人工智能方面的典型应用。
DT数据侠
2018/08/08
4860
你发的每一条微博,背后都有一个人工智能
某理财社区与微博Cache模型对比分析
社交平台由于内容成本较低,重度依赖用户关系,实时互动、动态浏览。对系统整体性能要求较高。新浪微博由于较大的市场占有率,用户体量大,在这一领域有很多经验,作者之前负责的理财社区业务与其有很多相似的地方,可以借鉴。下面会做一些比较分析。
猿天地
2020/02/27
6370
当你们在用算法获取流量和金钱时,微博和知乎是这样做的
昨天,我的一条微博创造了自2010年注册以来的记录:阅读量超过1000万,且还在继续增长——然而我的微博粉丝,却只有1万人,出现这样的情况,是因为微博的Timeline不再只是基于关注,而是结合了算法推荐的“发现流”,每一个内容都有被算法推荐进而曝光和爆发的机会,坐拥千万粉丝大V和只有一万粉丝的小V,都要PK内容。事实上,整个行业,算法都在扮演着日趋重要的角色。 内容平台的算法经济学 微博在2017年先是加入了发现流,内容分发逻辑发生巨大变化,正是因为看到了算法类内容平台的强势崛起——微博,百度、
罗超频道
2018/04/17
8600
当你们在用算法获取流量和金钱时,微博和知乎是这样做的
架构师面试必考:Twitter/微博系统设计实战全解析
在技术面试的竞技场上,Twitter/微博的系统设计问题犹如一面精准的试金石,能够瞬间检验出架构师对高并发系统理解的深度与实战能力。这个日活跃用户超过5亿的社交平台,看似简单的功能背后隐藏着分布式系统设计的精髓,使其成为技术面试中经久不衰的经典考题。
用户6320865
2025/11/29
1410
架构师面试必考:Twitter/微博系统设计实战全解析
"我们做的微博数据挖掘"
作者:数控小V http://www.36dsj.com/archives/48650 新浪微博在2012年-2013年红得发紫,也是移动互联网快速成长的年代。主页君当时就读于北京邮电大学,在实验室老师的指导下,从4G研发转战数据挖掘。从此我们项目组在实验室每天的科研工作就是刷微博,看八卦,观凤姐独领风骚,赏公知互相撕逼。这篇文章,让我们尝试回忆那个时代有趣的工作和结论。 非常开放的微博接口 彼时,各大互联网公司都在发展开放数据平台,作为自媒体的翘楚新浪微博自然不例外。通过高级账号接口,几乎可以访问微博
机器学习AI算法工程
2018/03/13
1.5K0
"我们做的微博数据挖掘"
Python爬取+BI分析后,微博求助患者的眼泪,全被数据看见了
这一个多月以来,相信大部分人都跟小编我一样:早上打开手机的第一件事是看有关疫情的最新新闻,看今日有没有新增人数,新增了多少。眼看着数据从一开始的几十发展到现在的快8W,渐渐地数据在我们眼里就只是一串数字。
大数据分析不是事儿
2020/02/27
6570
谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍,在实际应用中的算法比介绍的要复杂的多。当然,本文覆盖的主题并不全,比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”,希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。 微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作:原创、转发、回复、阅读、关注、@等。其中,前四个是针对短博文, 最后的关注和@则针对的是用户之间的关系,关注某个人就意味着你成为他的粉丝,而他成为你的好友;@某个人意味着你想要他看到你的微博信
wangxl
2018/03/08
9100
推荐阅读
相关推荐
王思聪庆祝iG夺冠,微博抽奖猫腻何在?
更多 >
领券
社区新版编辑器体验调研
诚挚邀请您参与本次调研,分享您的真实使用感受与建议。您的反馈至关重要,感谢您的支持与参与!
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
首页
学习
活动
专区
圈层
工具
MCP广场
首页
学习
活动
专区
圈层
工具
MCP广场