这里是科学美国人——60秒科学系列,我是克里斯托弗·因塔格里塔
脸谱网等社交媒体平台会结合使用人工智能和人工版主来侦查和删除仇恨言论 。但现在,研究人员开发出一种新型人工智能工具,它不仅能清除仇恨言论,还能对该言论做出回复,比如:“这种语言使用非常无礼 。所有种族和社会群体都应该得到宽容 。”
“这种介入回复有望阻断我们在这类论坛中经常看到的仇恨循环 。”
英特尔公司的数据科学家安娜·贝斯克说到 。她表示,这一想法旨在用更多言论来对抗仇恨言论,这是美国公民自由联盟(简称ACLU)和联合国人权事务高级专员所倡导的方法 。
因此,贝斯克和她在加州大学圣巴巴分校的同事从Reddit网站上获取了5000多条对话,并从Gab网站上获得了近1.2万条对话,Gab网站是许多被推特屏蔽的用户喜欢用的网站 。
研究人员让真人对Reddit和Gab对话中的仇恨言论编写样本回复 。然后,他们让自然语言处理算法学习真人回复,并创作自已的回复,比如:“我认为使用本质上带有性别歧视的词语无助于形成有效对话 。”
这听起来相当不错 。但机器也会作出令人有些费解的回复,比如:“凭肤色待人是不允许的,也是不合时宜的 。”
当科学家要求真人审查员在人工回复和机器回复中进行盲选时……嗯,大多数时候都是真人获胜 。研究团队将研究结果发表在Arxiv网站上,该结果还将于下月在香港举行的“自然语言处理经验方法会议”上发表 。
贝斯克表示,这个想法的最终目的是激发更多对话 。
“不仅是人与机器之间的对话,还要开始引出可能受伤害者和可能伤人者的群体间对话 。”
换句话说,目的是唤回良好的公民对话?
“哦!我不知道是否能走那么远 。但这听起来就像是我的打算,哈?”
谢谢大家收听科学美国人——60秒科学 。我是克里斯托弗·因塔利亚塔 。
译文为可可英语翻译,未经授权请勿转载!