Duo Labs的研究人员发现,Twitter是至少15,000个诈骗机器人的家园,并在一份新报告中公布了他们的发现。
在2018年5月至7月期间,工作人员观察,收集和分析了已发布超过5亿条推文的近9000万个公共Twitter帐户。此外,研究人员还检查了每个帐户的元素,包括个人资料屏幕名称,关注者数量,头像和描述,以收集有史以来最大的Twitter数据累积量之一。
报告中最有趣的发现是一个复杂的“加密货币诈骗僵尸网络”,其中包含至少15,000个独立机器人。僵尸网络最终通过伪装成加密货币交易所,新闻机构,经过验证的账户甚至是名人来从个人用户那里掏钱。僵尸网络中的帐户被编程为部署恶意行为以逃避检测并看起来像真实的配置文件。
研究人员还能够绘制僵尸网络的三层结构,其中包括“枢纽”帐户,其后是许多机器人,骗局出版机器人,以及特别喜欢推文的放大机器人,以提高其受欢迎程度并显得合法。
Olabode Anise是一位数据科学家,也是该报告的合着者,他解释说,“用户可能会信任推文,具体取决于转发或喜欢转发的次数。这个特定僵尸网络背后的人知道这一点,并设计它来利用这种趋势。”
为了发现骗局机器人,研究人员利用各种机器学习算法的子集,并建立了可以训练他们定位机器人帐户的功能。在五个考虑的算法中有AdaBoost,Logistic回归,随机森林,朴素贝叶斯和决策树。发现Random Forest在初始测试阶段表现优于其他算法。从那里,该算法的三个单独模型被训练以处理社交和加密垃圾邮件机器人。
研究人员发现机器人帐户遵循某些行为,一旦确定,就会使它们更易于识别。例如,机器人帐户经常在短时间内发送推文,导致消息之间的平均时间保持较低,而实际的Twitter用户通常会在推文之间等待更长的时间。
然而,一些用于规避发现的方法更复杂。机器人经常在推文中使用unicode字符而不是传统的ASCII字符。他们还使用欺骗帐户的屏幕名称拼写错误的屏幕名称,并在单词和标点符号之间添加空格。还会编辑配置文件图片以防止图像检测。最后,许多机器人似乎遵循相同的帐户。
Twitter过去曾暂停加密货币垃圾邮件机器人,并且通常可以快速识别假账户。尽管如此,高管似乎已经错过了最新诈骗项目的几个部分。
一个Twitter的发言人宣称,“垃圾邮件和自动化的某些形式的对抗Twitter的规则。在许多情况下,垃圾内容会在自动检测的基础上隐藏在Twitter上。当垃圾内容在搜索和对话等领域隐藏在Twitter上时,可能不会通过API影响其可用性。这意味着某些类型的垃圾邮件可能会通过Twitter的API显示,即使它在Twitter本身不可见。不到5%的Twitter帐户与垃圾邮件有关。”
领取专属 10元无门槛券
私享最新 技术干货