2022-10-27 14:58

人工智能审核员跟不上疫苗虚假信息的最新语言:表情符号

Scientist's gloved hands using syringe to fill vaccine shot

编码语言并不是什么新鲜事,但它在社交媒体上的应用规模却是前所未有的。观察人士经常将在线内容审核比作打地鼠游戏,在这种游戏中,平台几乎无法阻止有针对性的错误信息、阴谋论、宣传图像和仇恨言论的涌入。

上周的一份报告详细说明,反疫苗接种者尤其越来越依赖编码语言,经常使用表情符号在Facebook等社交媒体平台上传递被禁止的错误信息和宣传。此外,Facebook一位负责公共政策的前高管表示,目前的人工智能审核项目显然无法应对挑战,而且有理由相信它们可能永远也无法应对挑战。

科技政策战略集团Anchor Change的首席执行官凯蒂·哈巴思(Katie Harbath)说:“坦白地说,这些平台继续建立的所有这些系统,在能够做一些他们希望它们能够做的事情方面,仍处于初级阶段。”凯蒂·哈巴思是大西洋理事会数字取证研究实验室的非常驻高级研究员,此前曾担任Facebook的公共政策主管10年。

反疫苗接种者在“突然死亡”等模糊名称的群组和页面内会面和交谈,指出他们继续兜售明显虚假的COVID-19错误信息,使用“吃了蛋糕”等短语来指代接种疫苗。报告补充说:“有时,用户声称他们的爱人吃了四五片辉瑞或Moderna疫苗,用表情符号在披萨、纸杯蛋糕和各种水果上表达他们的观点。”

背景是标记和删除禁止内容的关键,而表情符号代码语言的引入使得AI监控程序更加复杂。人工智能内容审核利用机器学习算法来识别、标记并在必要时删除被其识别为有问题的内容——典型的是性露骨或暴力的图像和文字,但编码语言和表情符号通常仍然是它们的阿喀琉斯之踵。“机器仍然会漏掉一些重要的细微差别,比如错误信息、偏见或仇恨言论。因此,在互联网上实现百分之百清晰、安全、用户友好的内容几乎是不可能的,”数据标注服务“标签你的数据”的一份概要解释道。

哈巴斯表示,处理表情符号和编码语言的挑战是双重的,对人工智能系统和人类监督者来说都是如此。她说:“首先,你必须重新培训版主,让他们能够尝试理解上下文,并弄清楚他们是否在试图使用这个表情符号。”“这可能是个挑战,取决于内容审查员能或不能得到多少(背景和材料)。”哈巴斯说,这些版主通常一次只看到一篇帖子或一条消息,剥夺了他们对执行决定可能至关重要的背景信息。

试图超越这些群体本身也存在挑战。哈巴斯解释说,更新或扩大审查系统的分类器和命名法也会导致更高的假阳性,造成新的头痛和并发症,同时弊大于利。“大多数人使用表情符号的方式相对温和,”她说,“这是所有平台都必须应对的一场持续的斗争。”

当被联系到Facebook的母公司meta就该问题发表评论时,meta选择了引用自己在这一领域的成功。Facebook的政策沟通经理亚伦·辛普森(Aaron Simpson)在电子邮件中写道:“试图逃避检测或执行是一个迹象,表明我们正在有效执行针对COVID错误信息的政策。”辛普森还指出,自大流行开始以来,脸书已经删除了“超过2700万份内容”,这些内容违反了脸书和Instagram上关于COVID-19错误信息的政策。截至今年,仅Facebook就有约2.41亿美国用户。

尽管存在这些问题,但仍有一线希望。人工智能程序在不断提高它们的效能,鉴于它的本质,编码语言通常只被已经“知情”的人使用,因此对招聘工作或传播宣传不一定至关重要。这可能是一个小小的安慰,但哈瓦特这样的人对其他选择持谨慎态度,敦促更多的数字扫盲项目,而不是直接禁止使用表情符号等策略。

哈瓦斯说:“你可以全面禁止这些东西,但他们只会回到编码词。”“你差不多到了‘把互联网关掉’的地步了。”