要闻
您现在的位置:首页 > 要闻 > 谷歌推出了实时扩展语音翻译
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

谷歌推出了实时扩展语音翻译

发布时间:2020/03/20 要闻 浏览次数:647

 
谷歌宣布为其免费的Android手机翻译应用提供新的实时转录功能。该公司表示,IOS版本计划在将来使用。
该功能将使用户能够将正在进行的演讲,讲座或独白的即时文本翻译成八种语言,包括英语。
当前,翻译仅允许转换相对简短的语音片段。
唯一的要求是,在一个安静的房间里一次只能说话一个发言人(其他声音或噪音会降低准确性)和互联网连接,这是与Google基于云的Tensor处理单元进行交互所必需的。
这项活动将从今天(3月18日)开始,并应在本周末在Google Play商店中向所有用户开放。
在对话模式下,该应用程序允许用户与说不同语言的人进行来回对话。
除英语外,还提供法语,德语,印地语,葡萄牙语,俄语,西班牙语和泰语的翻译。
该应用程序还可以播放预录制的音频。但谷歌表示,尚无法从上传的音频文件进行直接数字翻译。
本周的公告提醒人们,自最早的数字语音识别以来我们已经走了多远。贝尔实验室(Bell Laboratories)于1952年首次推出了具有未来意义的“奥黛丽(Audrey)”系统,该系统可以识别语音数字0-9。十年后,IBM在1962年世界博览会上展示了“ Shoebox”,迈出了巨大的一步-它可以识别多达16个单词。
在1970年代的五年中,语音识别得到了美国军方的极大推动。国防部在语音识别方面进行了大量研究,其中包括卡内基-梅隆的“ Harpy”语音理解研究(SUR)计划,该计划建立了超过1,011个单词的识别词汇。该程序首次特别引入了发音模式和概率的概念,从而大大增强了识别不同语音模式的能力。
1980年代,在单词检测方面取得了前所未有的进步,研究人员将概率论应用于未知声音。科技巨头IBM的计划将识别范围扩大到5,000个单词。但是,这个十年可能是因为引入了世界上第一个会说话的能说话的玩偶“朱莉”而被牢记的。广告活动中说:“最后,懂您的洋娃娃。”
Dragon在1990年代将语音识别技术带入了大众,它的第一款虽然准确无误,但仍然有问题的消费类产品的价格仅为9,000美元。到本世纪末,经过大幅度改进的Dragon NaturallySpeaking计划向消费者提供了大约700美元的服务,该程序首次不需要在每个口语单词之间停顿。
今天,我们有了Siri和Alexa以及其他免费和低成本的移动应用程序,可让我们请求行车路线,订购食物,购买生活用品并在电子邮件和文字处理文档中键入语音文字,所有这些都将语音识别扩展到了难以想象的点不太多年前。
随着数百万手持设备用户的最新进展,Harpy,Audrey和Julie可能会变得无语。