商业
您现在的位置:首页 > 商业 > 酷似AI推出语音合成平台和Deepfake检测工具
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

酷似AI推出语音合成平台和Deepfake检测工具

发布时间:2019/12/19 商业 浏览次数:742

 
人工智能和机器学习是语音合成的强大工具。正如无数研究表明的那样,仅需几分钟(对于最先进的模型而言,则是几秒钟)即可精确地模仿对象的韵律和语调。例如,百度最新的Deep Voice服务可以仅用3.7秒的音频样本来克隆语音,而最近发布的一项7月份研究论文中的实现大约需要5秒钟。
该领域的快速发展激发了前Magic Leap首席软件工程师Zohaib Ahmed的工作经验,他刚在BlackBerry和Hipmunk工作过,他与Saqib Muhammad共同创立了位于安大略省的Resemble AI。他们俩试图将领先的机器学习模型用于语音合成,以实现规模化,其目标是建立一种服务,该服务能够从相对较小的数据集中克隆语音。
但是,除了推出语音合成产品外,艾哈迈德和穆罕默德还推出了一种检测深造的工具。两种技术有着千丝万缕的联系。
虚假威胁
艾哈迈德(Ahmed)和穆罕默德(Muhammad)有远见,他们意识到,就像任何能够创建令人信服的合成音频的工具一样,Resemble的平台也可能被恶意参与者滥用。总部位于阿姆斯特丹的网络安全创业公司Deeptrace表示,Deepfakes(一种将现有唱片中的一个人替换为其他人的肖像的媒体)正在成倍增长。它在6月和7月的最新统计中,在互联网上确定了14698个Deepfake视频,高于去年12月的7964个,仅在七个月内增长了84%。
令人不安的不仅是因为伪造品可能被用来在选举中影响公众舆论,或将某人牵涉到他们没有犯下的罪行,而且还因为他们已经被用来骗取至少数百家公司数百万美元。
因此,Resemble小组在几个月前发布了一个名为Resemblyzer的开源工具,该工具使用AI和机器学习来通过获取语音样本的高级表示并预测它们是真实的还是生成的来检测深层虚假。给定语音音频文件,它会创建一个256个值的摘要矢量(一个嵌入),该矢量汇总了所讲语音的特征,使开发人员能够比较两种语音的相似性,或确定在任何给定时刻谁在讲话。
艾哈迈德说:“作为研究人员和企业家,我们对自己创造的成果给社会带来的好处和/或风险深思熟虑。” “当您在我们的平台上创建声音时,我们会采取极端措施来确保声音的所有权。”
克隆媒体声音
在今年早些时候进行软启动之后,Resemble宣布推出Resemble Clone。据首席执行官艾哈迈德(Ahmed)所说,它旨在针对娱乐业,其工具旨在优化虚拟现实体验,动画电影和电视以及有声读物的声音。
艾哈迈德说:“我们着手开发一种产品,以帮助创意人克服制作音频内容的障碍。” “随着年复一年地产生越来越多的音频内容-智能扬声器,Airpods,播客,有声读物和虚拟现实和增强现实中的数字角色-对快速准确的语音克隆的需求在不断增长。类似于AI的独特重点是赋予创造力,使他们能够在不牺牲质量的情况下控制和制作内容。”
从最终用户的角度来看,Resemble体验类似于Lyrebird,后者于9月由Group创始人Andrew Mason的Descript获得。像Resemble一样,Lyrebird的用户可以记录来自实时动态生成的提示的语句,这些提示被输入到云托管的算法模型中,这些模型用于塑造可共享的定制数字语音配置文件。
类似于AI
不过,类似的客户无需创建新的录音-现有的音频也可以通过基于Web的上传器或API进行合并。 (Resemble需要三分钟的音频才能生成高质量的样本。)该平台可以创建虚拟的声音,并带有类似于人的情感和语调,可以将其提供给Google的Dialogflow或任何类似的自然语言理解引擎。
艾哈迈德(Ahmed)设想,游戏开发人员会在预生产过程中从演员那里创建声音以进行抓取和迭代,或者根据化身或角色的个性定制完全新颖的声音。另一个潜在的用例是为智能助手和语音应用创建音像,例如分别在Google助手和亚马逊的Alexa上播放John Legend和Samuel L. Jackson的声音。
类似作品并非完全新颖。文字转语音技术初创公司iSpeech提供了类似的语音克隆工具,Modulate,Respeecher和印度班加罗尔的DeepSync也提供了类似的工具。但是像Firstminute投资者Clara Lindh Bergendorff这样的投资者相信,他们与Craft Ventures,AET Fund和Betaworks一起参加了Resemble AI的200万美元的种子融资。