商业
您现在的位置:首页 > 商业 > 亚马逊科学家们正在探索成千上万的语音共性
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

亚马逊科学家们正在探索成千上万的语音共性

发布时间:2019/08/09 商业 浏览次数:881

Alexa更了解您的要求
亚马逊Alexa拥有成千上万的语音应用程序 – 亚马逊的本土技能 – 由第三方开发商提供。通常,构建所述技能需要提供客户请求的示例(例如,“我的通常订购”)以及这些请求应该映射的动作,这些动作用于训练处理生产中的实际请求的AI系统。毋庸置疑,这是劳动密集型的,这就是为什么亚马逊的科学家们正在探索在训练时汇集来自不同技能的类似请求的样本请求的技术。
在上周在佛罗伦萨举行的计算语言学协会会议上发表的一篇论文中,共同作者写道,附加数据通过在示例请求列表中“堵塞漏洞”来提高性能。根据两个不同的公共语料库和内部语料库进行评估,他们报告说,同时对多种技能的人工智能系统进行培训产生的效果要好于为每项技能单独培训。
正如研究人员指出的那样,多任务训练存在导致模型失去对任务特定结构的关注的风险。为了避免这种情况,他们强迫他们的模型学习所有传入数据的三种不同表示。第一个是一般表示,它编码所有任务的共享信息,而第二个是组级表示,它捕获给定技能类别中的话语之间的共性。同时,第三个也是最后一个表示是特定于任务的。
团队使用的AI系统具有编码器 – 解码器种类,这意味着他们学习了输入数据的固定大小表示(或编码),并将其用作预测(解码)的基础。所有这些都包含用于单个任务和任务组的单独编码器模块,以及控制哪些编码器处理话语的“开关”。
总共有四种不同的架构,第一种是并行系统。它在组合结果表示并将它们传递给任务专用解码器之前,同时通过通用编码器,组级编码器和任务专用编码器传递输入话语。另外三个是串行的 – 换句话说,一组编码器的输出在转移到解码器之前传递到第二个库。
在训练阶段,特定于组的编码器学习如何最好地编码其组特征的话语,并且学习特定于技能的编码器来编码其技能特征的话语。结果,解码器 – 总是进行任务特定的预测 – 能够利用输入的三种不同表示,范围从一般到特定。
测试体系结构的所有任务都是联合意图分类(即,确定AI系统应该采取的行动)和插槽填充任务。在此上下文中,槽是意图作用的数据项。在训练期间,系统在准确分类时段和意图时会得到奖励,但是当他们的群体和宇宙级编码使得易于预测话语属于哪种技能时会受到惩罚。如果特定于任务的编码器和共享编码器被捕获不同的信息,则会进一步奖励它们。
在涉及三种不同数据集的实验中,两个连续模型在平均意图准确度和基线系统上的槽F1(其误差和假阳性率两者中)方面产生了显着更好的性能。在任何给定的测试中,多任务系统中的一个或另一个始终表现最佳,比基线提高了9%。

姓 名:
邮箱
留 言: