要闻
您现在的位置:首页 > 要闻 > 情绪识别存在隐私问题-解决方法如下
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

情绪识别存在隐私问题-解决方法如下

发布时间:2020/02/24 要闻 浏览次数:635

 
随着设备随处聆听,隐私问题是技术进步所特有的。尤其敏感的是由智能手机和扬声器的音频驱动的不同技术,使消费者可以在隐私和实用程序之间进行持续的成本效益分析。
例如,可以学习适应用户情绪并实时识别情绪的移动应用程序或虚拟助手。这种适应可以创建更自然流畅的对话,以及语音助手提供的更有用的,类似于人的理解。但是,如果为这些见解提供支持的音频存储了有关其性别和人口统计信息的标识符,那么用户将在哪里划清界限?
CSE博士的新论文。学生Mimansa Jaiswal和Emily Mower Provost教授提出了一种消除这种障碍并启用基于机器学习(ML)的更安全技术的方法。通过使用对抗性ML,他们展示了在存储音频之前从音频中“取消学习”这些敏感标识符的能力,而是使用演讲者的简化表示来训练情感识别模型。
情感识别,情感分析和其他用于自动识别语音的不同复杂特征的技术均由在大量标记数据存储上训练的ML模型提供支持。为了可靠地挑选出用户语音中的模式,该模型必须具有类似语音的丰富训练经验,以帮助其识别某些共同特征。
然后,这些处理典型智能手机用户日常生活的系统将必须在各种普通的人类语音(本质上是对话记录)上进行培训。
Jaiswal说:“本文的希望是表明这些机器学习算法最终可以编码有关一个人的性别或人口统计信息的大量信息。”此人口统计信息存储在为特定移动应用程序或语音助手提供动力的公司服务器上,从而使用户不被公司(或更糟的是,任何恶意窃听者)识别。
作者写道:“敏感信息泄漏的影响是深远的。” “研究表明,在雇用,警务和信用等级方面,年龄,种族和性别变量会产生歧视。”
以原始格式存储的此标识音频数据甚至可以覆盖用户在应用程序其他位置选择的退出选项。为了解决此问题,服务转移到存储在云上进行预处理后获得的表示形式,以避免信息泄漏。
以前在编码音频数据时考虑到隐私性的工作尝试将随机噪声添加到数据集。如果侦听者不知道使用了哪种类型的噪声,该技术便会奏效,但攻击者能够立即访问网络并产生匿名性,此方法便告瓦解。
相反,Jaiswal和Mower Provost使用对抗性ML技术来减少原始音频在存储之前的人口统计和私人特征的编码。剩下的就是原始记录的抽象数据表示。作者使用这些表示来部分混淆对话的实际内容,从而消除了批发数据存储所带来的隐私风险。
因此,挑战在于确保这种新格式的受隐私保护的数据仍可用于有效地训练ML模型完成其主要任务。研究人员发现,随着对抗性力量的增强,隐私度量主要增加,而主要任务的性能保持不变或受到较小影响。
作者写道:“我们发现性能得以维持,或者某些设置的性能略有下降。”在许多情况下,他们甚至发现性能显着提高,这意味着通过不学习性别与情感标签之间的关联,使模型对性别不了解可以提高其健壮性。
Jaiswal希望利用这些发现为现实世界中的用户提供更安全,更安全的机器学习研究。
她说:“ ​​ML模型主要是黑匣子模型,这意味着您通常不知道它们确切地编码了什么,它们具有什么信息,或者该信息是否可以被良好或恶意地使用。下一步是了解两种模型之间编码信息的区别,唯一的区别是已经训练了一种保护隐私的模型。”
“我们希望改善人们对这些模型的感知和交互方式。”
这项研究发表在论文“用于情感识别的隐私增强多模态神经表示”上,该论文发表在2020年人工智能促进协会(AAAI)会议上。