若何对抗收集暴力?人工智能就能搞定_措辞_在线
图片来自网络
加州伯克利分校D-Lab的科学家们正在与反诋毁同盟互助开拓'可扩展检测'系统,根据加州校友协会的宣布,该系统通过在线仇恨指数(OHI)来识别仇恨辞吐。除人工智能之外,该操持还将利用其他不同的技能在线检测攻击性辞吐,包括“学习型机器、自然措辞处理和更为传统的人脑”。研究职员的目标是,有一天能够这项技能被“紧张社交媒体平台”采纳,这样就能从中创造“仇恨辞吐”并彻底肃清这些辞吐,以及这些传播用户。
目前的技能紧张涉及“关键词搜索”的利用,一位研究职员表示:“这一方法过于坦直,不足准确。”一个不同的拼写办法就能轻松骗过这一算法。D-Lab最初招募了来自全国各地的十名不同背景的学生来“编写”这些帖子,标记那些明显或奥妙地传达仇恨信息的人。从原始学生群体得到的数据被输入到学习型机器模型中,终极产生的算法可以识别拥有仇恨信息的笔墨,其准确率为85%,仅有15%的几率,无法识别出或缺点标记攻击性词语和短语。
虽然最初的十位编码员只能自行评估,但他们会接管调查问题,以帮助他们将仇恨辞吐与仅仅是令人反感的措辞区分开来。一样平常来说,“仇恨评论”与特定群体干系,而“非仇恨”措辞与特定个体干系,而不涉及宗教、种族、性别等。
本文系作者个人观点,不代表本站立场,转载请注明出处!