商业
您现在的位置:首页 > 商业 > 在谷歌的仇恨语音检测算法中观察到种族偏见
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

在谷歌的仇恨语音检测算法中观察到种族偏见

发布时间:2019/08/15 商业 浏览次数:868

 
了解是什么让某些东西具有攻击性或伤害性是很困难的,很多人都无法弄明白,更不用说人工智能系统了。有色人种经常被排除在AI训练集之外。因此,字母/谷歌公司Jigsaw设法同时绊倒这两个问题,并将黑人美国人使用的俚语标记为有毒,这就不足为奇了。
需要明确的是,该研究并未专门评估该公司以前遇到过问题的仇恨语音检测算法。相反,它被引用为当代计算解剖语言和分配“毒性得分”的尝试 – 并且它似乎以指示偏见黑人美国语言模式的方式失败。
华盛顿大学的研究人员对目前可用的仇恨言论数据库可能存在种族偏见的想法感兴趣 – 就像许多其他数据集一样,这些数据集在形成期间缺乏包容性实践。
他们查看了一些这样的数据库,其中数千条推文被人们注释为“仇恨”,“冒犯”,“辱骂”等等。还对这些数据库进行了分析,以找到与非裔美国人英语或白人英语密切相关的语言。
结合这两组基本上让他们看看白人或黑人白话是否有更高或更低的机会被标记为冒犯。瞧,黑人英语更容易被贴上冒犯的标签。
对于这两个数据集,我们发现推断的AAE方言和各种仇恨言论类别之间的强关联,特别是来自DWMW 17(r = 0.42)的“冒犯性”标签和来自FDCL 18(r = 0.35)的“滥用”标签,提供证据表明基于方言的偏见存在于这些语料库中。
实验继续,研究人员为推文采购他们自己的注释,并发现出现了类似的偏见。但是,通过“启动”注释者知道该人发推文可能是黑色或使用黑色对齐的英语,他们标记推文攻势的可能性大大降低。
这并不一定说明注释者都是种族主义者或类似的东西。但是,在社会和语言上确定什么是攻击性和非攻击性的工作是一个复杂的工作,并且在某些情况下显然对说话者身份的认识很重要,特别是在曾经讽刺地使用术语来表示该身份被收回的情况下。
什么都与Alphabet,Jigsaw或Google有关?好吧,Jigsaw是一家用Alphabet建立的公司 – 我们所有人都认为谷歌是另一个名字 – 旨在通过自动检测(除其他事项外)令人反感的言论来帮助缓和在线讨论。它的Perspective API允许人们输入一段文字并获得“毒性评分”。
作为实验的一部分,研究人员向Perspective提供了一系列相关推文。他们看到的是“我们的数据集中的方言/组与Perspective毒性评分之间的相关性。所有相关性都很重要,这表明所有数据集都存在潜在的种族偏见。“
所以基本上,他们发现Perspective更可能将黑色语音标记为有毒,而白色语音则更为可能。请记住,这不是几千条推文背后的模型 – 它是商业审核产品的尝试。
由于这种比较不是研究的主要目标,而是副产品,因此不应将其视为Jigsaw工作的某种大规模删除。另一方面,显示的差异非常显着,与团队的其他结果完全一致。与评估的其他数据集一样,至少它是一个信号,表明需要重新评估其创建过程中涉及的过程。

姓 名:
邮箱
留 言: