新零售网 > 品牌 >

麻省理工学院称第三方Twitter机器人检测工具“不准确”:数据集过于简

来源:IT之家 发布时间:2023-06-27 10:39   阅读量:15230   

,美国麻省理工学院的研究团队近日发表论文指出,现有的第三方推特(Twitter)机器人账户自动检测工具并不准确,因为其数据集过于简单,缺乏泛用性。

此前有消息称,机器人账户过多是阻止马斯克收购推特的原因之一。推特当时声称其日活跃用户中有 5% 是机器人账户,但马斯克表示这个数字要比 5% 高得多。

推特有自己的机器人账户识别系统,但并未公开。因此,对于普通公众而言,第三方工具是较为可行的检测方法。这些第三方工具使用从推特收集的数据集和机器学习模型来检测机器人的可疑迹象,许多工具和模型已被用于研究社交媒体上的机器人活动,相关论文甚至已达数千篇。

用于推特机器人检测的公开基准数据集

这些论文中的大多数基准数据集都是在不同推文中收集的数据集合,其中许多都是在特定推文中收集的,每条都由人类手动标记为机器人或人类。然而这种经过专门训练的机器人检测模型在该专业领域表现出色,却并没有涵盖全部领域,并且严重依赖于特定数据,而不是机器人和人类之间的根本差异。

当这些模型在其他领域的数据集上进行测试时,它们的准确性很差,几乎与随机预测水平相当。同时,在许多数据集上,即使是相对简单的模型也与最先进的机器学习模型准确率相当。

简单模型与 SOTA 模型在基础数据集上的性能比较

换言之,在一个数据集上训练的模型不能推广到其他数据集,现有的机器人检测数据集由于数据收集简单而通用性较低。

最后,研究人员警告说,当使用现有的机器人检测数据集时,用户应该仔细考虑可能存在哪些类型的偏差。研究人员认为,一个根本的解决方案是推特等社交媒体本身就应该为研究人员提供丰富、可靠的数据以及高质量的真实标签。

IT之家附上论文地址:点此前往

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

消息称OpenAI计划将ChatGPT打造成“超级智能个人工作助 2023-06-27 09:58

7月上海百货会即将起航,新锐产品突围,新势力渠道探寻百货业新商机 2023-06-27 09:09

全球财经连线|国际油价、金价周线均下挫,后市怎么走? 2023-06-27 08:33

保持流动性合理充裕央行加码“补水” 2023-06-27 08:16

中基协:5月份企业资产证券化产品新增备案规模同比增长77.76% 2023-06-27 08:13

微信小程序手机号快速验证组件升级,8月26日起收费 2023-06-26 15:34

行业首款24GB内存手机,消息称一加Ace2Pro将提供24GB 2023-06-26 15:28

上海试点新建住宅交房即交证 2023-06-26 15:22

南京银行北京分行积极开展数字人民币推广宣传活动 2023-06-26 15:01

国家邮政局:今年全国快递业务量已达600亿件 2023-06-26 14:48

AOHi推出永恒之城磁吸无线充:科幻外观分体设计、需用户自行拼装 2023-06-26 14:47

对标索尼ZV-E10,消息称佳能年底推出PowerShotV10 2023-06-26 14:35

日本电商平台ANDPLANTS推出AR新服务:用iPhone即可 2023-06-26 14:10

摩米士推出新款USB-C扩展坞:8合1、一键息屏,229.9元 2023-06-26 14:08

《仙剑奇侠传》开发商大宇资讯首款印度FPS手游预约人数已突破26 2023-06-26 14:03

任天堂Switch新作上架,包含《皮克敏12》《牧场物语》 2023-06-26 13:12

消息称YouTube正在测试游戏服务Playables,同时支持 2023-06-26 13:02

丰田推出GR86TRUENOEdition跑车:纪念AE86问世 2023-06-26 12:30

Vespa推出迪士尼联名款定制电动摩托车Primavera:四种 2023-06-26 12:22

Flyme迎11周年重磅更新,即日起对魅族20、魅族20Pro手 2023-06-26 11:27