前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >深度思考:社交媒体的大数据是否可靠?

深度思考:社交媒体的大数据是否可靠?

作者头像
腾讯研究院
发布于 2018-01-31 09:26:20
发布于 2018-01-31 09:26:20
1K0
举报

  如今,科学家们正越来越多的把目光转向社交媒体,以研究线上及线下的人类行为,例如预测夏季股票市场的大波动。一些数据处理专家指出,使用该种方法处理数据时,研究者们须警惕超大量社交媒体数据背后可能存在的严重缺陷。

  错误的结果可能产生严重的影响:每年,都有上千的研究报告是基于社交媒体上收集而来的数据。麦吉尔大学计算科学学院助理教授Derek Ruths称“这些文章中有好些被用来通报和决断公众,行业及政府的投资决策”。

  卡内基梅隆大学软件科学院的合作作者Jürgen Pfeffer则说,“并不是所有打上“大数据”标签的东西就都很好”,他指出许多研究者都有或是希望有如此的前提——即只要数据足够多,他们就能修正任何可能产生的偏差。“然而,行为学研究中的一句老话说的好:了解你的数据”。不过,社交媒体作为数据源之一吸引力实在惊人。“人们想要了解世界上正发生着什么,这无疑是快速的跟进办法。”以2013年的波士顿马拉松爆炸案为例,Pfeffer在两周内收集了两千五百万的相关tweets(推特)。“你能了解百万计人的行为——还都是免费的。”

 数据过滤与SPAM

  一篇发表在《科学》杂志上的评论中,Ruths和Pfeffer强调了可能导致社交媒体数据失真的若干因素,及它们的解决办法。包括:

  不同社交媒体平台吸引不同的受众——比如,Instagram对18~29岁间的成年人吸引力最大,包括非裔美国人,拉丁人,女性和城市居民,而在Pinterest上,占主导地位的则是那些家庭年收入超过\$100,000,25—34岁的女性用户。Ruths和Pfeffer指出,研究人员很少能够知晓,更谈不上正确对待这些内含的采样偏差。

  社交媒体研究所使用的公开数据并不总能准确反映平台的总体状况——研究者们关于网站建立者如何过滤他们的数据源常常一头雾水。

  社交媒体的设计通常会影响用户的行为,从而改变所测量的数据。比如,Facebook没有“不喜欢”的按钮,这就使得负面内容相比于正面的“喜欢”更难被侦查到。

  大量SPAM(垃圾邮件发送者和机器人)通常在社交媒体上伪装成普通用户,也被错误地纳入了很多人类行为测算和预测。

  研究者们还经常只报告来自于易于分类的用户,主题和事件所得出的结论,这就使得新的方法看起来更加准备。例如,在推知Twitter用户的政治取向时,只取得了65%的准确率——即使研究(侧重于政治活跃用户)声称有90%的准确度。

  解决方法

  Ruths和Pfeffer指出,以上很多问题都有显而易见的解决方法,这些方法被广泛地用在诸如流行病学,统计学和机械学等领域。Ruths说,“这些问题的共同点就是,需要研究者们在分析社交媒体数据时,能更加敏锐地感知数据本身。”

  社会学家应对此种挑战的技术和标准已经十分纯熟了。Ruths说,“1948年,臭名昭著的“杜威击败杜鲁门”报纸标题就来自于电话调查,它最终在采样上低估了杜鲁门的支持者。这并不是在抹黑民意调查,正是那次显而易见的错误导致了今天日益复杂的技术,更高的标准,以及更加准确的民调。如今,我们站在与当年类似的技术发展拐点上。通过解决面临的问题,我们才能实现基于社交媒体的研究所展现出的巨大潜力。”

  见中关村在线:深度思考:社交媒体的大数据是否可靠?

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2015/02/06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
警惕大数据中的“陷阱”
关于转载授权 大数据文摘作品,欢迎个人转发朋友圈,自媒体、媒体、机构转载务必申请授权,后台留言“机构名称+文章标题+转载”,申请过授权的不必再次申请,只要按约定转载即可,但文末需放置大数据文摘二维码。 编辑、翻译:闫蒲、Xenia、周希雯、张钰、王昱森、陈姸君 导语:关于社会大数据的研究近年来不断扩大、繁荣,发展为集社会学、计算机学、物理学、心理学等多个学科于一身的交叉学科。与此同时,新的数据获得渠道、数据处理方法和工具也不断被研究者们引入社会研究领域。然而,正是因为该领域的快速兴起,社会大数据的研究方法
大数据文摘
2018/05/23
5270
AI框架解释你的社交媒体订阅,提高透明度和可解释性
如果你像大多数人一样,你每天会花几分钟到几个小时滚动浏览歌曲,剪辑,文章,以及根据你的兴趣和偏好做出的广告。但是,如果支持Feed的算法(及其建议)更加透明就更好了。
AiTechYun
2019/08/15
6210
大数据与社交媒体营销——天作之合
文 | Rehan Sheikh 翻译 | 沙拉丁 译文版权归翻译者和CDA数据分析师共同所有,转载请留言申请授权 目前,许多广告方开始将广告投放从其他渠道转向社交媒体广告。一项来自Invesp和AdWeek的研究表明,预计到2018年,各品牌在社交媒体上的广告投入将会达到150亿美元。 一些社交媒体网站利用大数据,为广告方提供更好的服务。因此,预计社交媒体广告的需求在将来的几年中会有较大的发展。 大数据正在改变数字营销 从2014年到2015年,Facebook的广告销售额增长了122%。为什么广告方愿意
CDA数据分析师
2018/02/24
2.5K0
区块链将彻底改变传统社交媒体
在社交媒体行业中,区块链的实施有增长的趋势。这种发展正在改变公众如何接近一个以前在安全,商业,功能和全面控制方面受到少数人的支配的生态系统。 社交媒体对日常生活的重要性日益增长。在教育,政治,电子商务甚至人际关系领域,以网络空间为基础的社会环境不断证明其作为世界各地个人和群体之间有效沟通的工具的相关性。 区块链可以彻底改变社交媒体 区块链技术的出现给这个行业带来了一场革命,在可靠性和盈利机会提高的领域已经显现出来。Richtopia的创始人Derin Cag说: “随着区块链技术的兴起,社会经济交易正在
企鹅号小编
2018/02/12
1.4K0
区块链将彻底改变传统社交媒体
社交媒体分析:洞察希拉里面对的性别歧视
大数据文摘作品 编译成员:周希雯,王昱森,闫蒲,陈妍君,Xenia 感谢Julia Lu提供的素材 【摘要】作为女性总统候选人,希拉里被支持者视作政坛女强人,然而在社交媒体上,频现针对希拉里性别的语言
大数据文摘
2018/05/22
8190
从互联网到社交媒体
周烜    中国人民大学数据工程与知识工程教育部重点实验室副教授 互联网自上世纪90年代出现,经过20多年的发展,已经逐渐成为人类生产和生活不可或缺的组成部分。它承载了通讯、商务、媒体、娱乐等多种功能,对各个传统行业产生了巨大影响,甚至引发了颠覆性变革。如今,全世界的互联网使用者已经超过30亿,大部分使用者平均每天上网2个小时以上。并且,这个数字还在迅速攀升。 互联网作为一种新媒体,其影响最具颠覆性。传统媒体的传播渠道无外乎报纸、电台、电视等。以现代的眼光看,这些渠道有两个显著的局限性:第一,信息
腾讯研究院
2018/02/02
2.1K0
打开大数据研究的潘多拉魔盒
关于转载授权 大数据文摘作品,欢迎个人转发朋友圈,自媒体、媒体、机构转载务必申请授权,后台留言“机构名称+文章标题+转载”,申请过授权的不必再次申请,只要按约定转载即可,但文末需放置大数据文摘二维码。 导语 近年来,大数据研究方法逐渐应用于社会学科领域,运用大规模用户数据,社科领域研究者得以从新的视角理解用户媒介使用习惯、语言、与情感。然而,在大数据研究不断普及的背景下,如何规范大数据研究的伦理准则,如何保证研究对象的隐私权,以及如何研究现有互联网公司的伦理问题,这些问题看似遥远,但是却直接影响大数据研究
大数据文摘
2018/05/22
5360
品牌社交媒体营销如何抓住受众注意力
社交媒体是中小型企业营销的重要阵地。目前国内使用量与使用频次较多的营销型社交媒体主要包括四大类,一类是即时通讯类如微信、QQ等,第二类是以微博为首的包含博客业务的广播式平台,第三类是社区型,代表平台如知乎,豆瓣等等。第四类便是新兴的内容创作者平台,诸如抖音、小红书等。
rw178178
2020/12/18
2K0
以“懒”识人!在社交媒体上,你和ai的区别是,你有多“懒”?
一说到机器人账号,大多数人脑海里第一反应都是水军、控评,如果在国外竞选期间,这些机器人账号还能在社交媒体上被广泛运用于舆论操作中,想来后怕。但是机器人账号也有积极的一面,不少公司将其运用到新闻聚合、在线零售等领域,也着实为人们制造了不少便利。
大数据文摘
2020/05/19
4820
以“懒”识人!在社交媒体上,你和ai的区别是,你有多“懒”?
大数据让你必须知道的十一旅游趋势
编者按: 假日办撤了,“黄金周长假”到底意味着什么?官方数据可能太宏大,不妨借用新兴社交媒体的大数据,观察和记录2014年“十一”黄金周。看看游客从哪里来,又到哪里去,哪些地方最具吸引力。可以为大家在2015的“十一”黄金周出行提供具有价值的参考。 2014年的“十一黄金周”,人们都去哪儿了?官方数据显示,2014年“十一”黄金周期间全国共接待游客4.75亿人次,实现旅游收入2453亿元,分别比2013年增长了10.9%和15.7%。而纳入国家旅游局直报的124个旅游景区(
小莹莹
2018/04/20
1.7K0
大数据让你必须知道的十一旅游趋势
AIGC-------AIGC在社交媒体内容生成中的应用
随着人工智能生成内容(AIGC)的快速发展,社交媒体平台上的内容创作方式发生了巨大变化。AIGC使得内容创作的门槛大大降低,从而让更多的人能够参与到社交媒体内容的创作中,同时也使得内容创作的质量和多样性得到了显著提升。在这篇博客中,我们将深入探讨AIGC在社交媒体内容生成中的应用,分析其技术实现方式以及在内容创作中的具体应用案例。
hope kc
2024/11/26
2860
独家 | 理解和管理社交媒体算法的4个想法
作者:Veronica Combs 翻译:赵茹萱校对:郑强本文约3700字,建议阅读10+分钟没有单一的解决方案能够让所有社交媒体算法都更加易于分析和理解。 试想一下,如果科技公司必须公布有关算法如何工作的数据,而软件工程师在高等教育时期必须学习社会科学课程,那将会发生什么? 麻省理工学院斯隆管理学院(MIT Sloan School of Management)教授埃克尔斯(DeanEckles)(左上)与斯坦福大学(Stanford University)平台监管主任达芙妮·凯勒(DaphneKell
数据派THU
2022/05/19
3230
独家 | 理解和管理社交媒体算法的4个想法
GPT-4V:当 AI 遇上图文梗,社交媒体分析的新玩法!
为了使本文的标题既准确又吸睛, 我们决定征求一下ChatGPT的意见。结果发现ChatGPT已经堪称自媒体标题党高手。最后的标题参考了ChatGPT的建议(如下所示)。
AI科技评论
2023/12/11
4100
GPT-4V:当 AI 遇上图文梗,社交媒体分析的新玩法!
5个原因为你解释:为何没人愿意参与你的社交帖子互动?(附解决方案)
引言:2018年,如果你的社交媒体策略没有与你的内容策略相结合,那你就落后了。10%的专业营销人员将社交媒体营销作为最可能在2018年获得丰厚回报的策略,赶紧follow下文~
iCDO互联网数据官
2018/10/25
1.1K0
5个原因为你解释:为何没人愿意参与你的社交帖子互动?(附解决方案)
川普的逆袭,是给大数据的一记耳光!
昨日,美国总统选举落下帷幕,共和党总统候选人唐纳德·特朗普在这场权利的游戏中获得胜利,成功当选美国第58届总统。这次美国总统竞选被德国《商报》称作“第一次数字化竞选”,而特朗普的这次逆袭,让之前支持希
钱塘数据
2018/03/02
1.1K0
川普的逆袭,是给大数据的一记耳光!
社交媒体公司热门数据抓取者列表
https://www.technewsworld.com/story/86897.html
zstt8054929
2020/12/23
6660
译见:从无处看世界:大数据的文化意识形态
“无论什么历史年代里,科学的走向取决于我们如何理解科学”—SandraHarding,《谁的科学?谁的知识?》(1991)
IT阅读排行榜
2018/08/13
2570
社交媒体战略制定十大反思
随着社交媒体发展越来越迅速,当真是士别三日当刮目相待。如果你在管理公司的社交媒体,就一起来看看以下这10份统计数据带给我们对于社交媒体战略的反思: 1. Twitter上增长最快的用户群体在55-64岁之间 a. 比2012年增长了79% b. 45-54年龄层的用户在Facebook和Google+增长率都是最高的 c. 该年龄层用户群在Facebook占比已经达到46% d. 该年龄层用户群在Google+占比54% “社交媒体是年轻人的玩意”,在这份数据面前,这个说法显然站不住脚。你或许需要调整设计媒
小莹莹
2018/04/20
1.3K0
社交媒体战略制定十大反思
生活在大数据下的我们
1在刷朋友圈时间上,“60前”平均花费时间的最小值为47分钟,“90后”为42分钟。
IT阅读排行榜
2018/08/13
4520
生活在大数据下的我们
联邦贸易委员会要求社交媒体公司提供用户数据(Internet)
美国联邦贸易委员会(Federal Trade Commission)要求包括Facebook和Twitter在内的9家科技公司提供大量数据,这可能是该行业对数据处理进行监管的前奏。
谭雪儿
2020/12/18
3460
推荐阅读
相关推荐
警惕大数据中的“陷阱”
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文