会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 TOXCL:用于检测和解释隐性有毒言论的统一AI框架!

TOXCL:用于检测和解释隐性有毒言论的统一AI框架

时间:2024-07-02 04:12:10 来源:带水拖泥网 作者:自媒体 阅读:323次

TOXCL:用于检测和解释隐性有毒言论的统一AI框架

划重点:

🔍 社交媒体上的用于检隐性有毒言论毒性言论可能会像野火般蔓延,针对个人和边缘化群体。测和

🔍 研究人员提出了名为TOXCL的解释新框架,旨在检测和解释隐含毒性言论。框架

🔍 TOXCL采用多模块方法,用于检隐性有毒言论将问题分解为不同步骤,测和取得了较好的解释效果。

CSS站长资源(ChinaZ.com)3月28日 消息:社交媒体上的框架毒性言论可能会像野火般蔓延,特别是用于检隐性有毒言论针对个人和边缘化群体。明显的测和仇恨言论相对容易被发现,但隐含毒性——依赖于刻板印象和编码语言而不是解释明显的侮辱——提出了更为棘手的挑战。如何训练人工智能系统不仅能够检测到这种隐晦的框架毒性,还能解释为何它是用于检隐性有毒言论有害的呢?

新加坡南洋理工大学、新加坡国立大学和信息通信研究所的测和研究人员直面这一挑战,提出了一种名为TOXCL的解释新框架。与以往将检测和解释合并为一个文本生成任务的系统不同,TOXCL采用了多模块方法,将问题分解为不同步骤。

首先是目标群体生成器——一个文本生成模型,用于识别在给定帖子中可能被针对的少数群体。接下来是编码器-解码器模型,首先使用其编码器将帖子分类为有毒或无毒。如果标记为有毒,解码器将在目标群体信息的帮助下生成为何这种言论有害的解释。

但这里的聪明之处在于,为了增强编码器的检测技能,研究人员还加入了一个强大的教师分类器。利用知识蒸馏技术,这个教师模型在训练过程中将其专业知识传递给编码器,提高其分类能力。

研究人员还添加了条件解码约束——一种巧妙的技巧,确保解码器只为被分类为有毒的帖子生成解释,消除了矛盾的输出。

那么,TOXCL的表现如何呢?在两个主要的隐含毒性基准测试中,TOXCL的表现超过了最先进的基准线,甚至超过了专注于检测或解释的模型。与其他领先系统相比,人类评估员评价其输出在正确性、流畅性和减少有害性方面更高。

当然,仍然有改进的空间。该模型有时可能会因为编码的符号或需要外部知识的缩写而出现问题。而隐含毒性的主观性意味着“正确”的解释往往是多方面的。但总体而言,TOXCL标志着朝着能够识别隐含仇恨并阐明其有害影响的人工智能系统迈出了令人印象深刻的一步。随着这项技术的进一步发展,我们还必须应对潜在的风险,比如强化偏见或产生有毒语言。但通过谨慎使用,它为赋予边缘化声音权力和遏制网络上的压制性言论提供了一条道路。

论文地址:https://arxiv.org/abs/2403.16685v1

项目:https://github.com/nhathoang2002/toxcl

(责任编辑:短视频)

相关内容
  • 女子买4只螃蟹花289元 皮筋占76元!市监局回应:规定要称净重
  • 元宇宙里过大年:春晚、庙会、灯会亮相虚拟空间
  • 豆瓣8.7高分!电视剧《三体》宣布大年初一美国开播
  • 餐饮老板冲刺年夜饭:有人躺赚,有人求生
  • 字节跳动推“Coze 扣子”AI Bot 开发平台 用户可搭建自己的聊天机器人
  • 坚决打击外挂!腾讯《英雄联盟》2023年封号超187万个
  • Vidda联合广美再推“炸裂”作品 古今碰撞贺龙年
  • 央视新闻启动鸿蒙原生应用开发 余承东亲临现场
推荐内容
  • 比利时设陷阱诱捕300万只大闸蟹 避免过度繁殖问题
  • 00后川剧变脸变出二哈表情包 网友:传统与新时代完美结合
  • remove bg平替?新背景分割开源模型RMBG v1.4来了
  • 吉利与极氪订立整车采购协议:极氪品牌即将进入墨西哥市场
  • Kore.ai获10亿元融资,提供定制化类ChatGPT助手
  • 好天气上线:南方大部春节迎气温大反弹