商业
您现在的位置:首页 > 商业 > AI对以前从未听过的流派进行分类
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

AI对以前从未听过的流派进行分类

发布时间:2019/07/09 商业 浏览次数:840

 
即使是休闲音乐爱好者也可以毫不费力地按类别区分歌曲,但对于电脑而言并非如此。大多数基于音频的音乐分类和标记系统使用分类监督学习 – 换句话说,学习一种基于示例对将歌曲映射到流派的功能 – 使用固定的标签集,其本质上不能处理看不见的标签,例如新的添加了流派。
这就是为什么总部设在韩国的互联网内容服务公司Naver Corp的一个科学家小组在预印本服务器Arxiv.org上发表的一篇论文(“基于音频的音乐分类和标记的零镜头学习”)中进行调查的原因为零 – 替代。他们的AI分类系统学习如何在没有任何标记的训练数据的情况下识别歌曲,即通过考虑关于乐器的辅助信息,关于歌曲的描述中的单词等。
研究人员在研究开始时确定了两种类型的辅助信息:人类标记的属性信息和一般单词语义信息。他们指出,前者可以用作二进制输出来训练分类器并根据学习的层次结构或其他关系推断看不见的类。另一方面,语义空间有大量的单词来预测看不见的标签。
团队的AI模型摄取了音频mel谱图(声音的短期功率谱的表示)并将它们传递给卷积神经网络,该网络直接通过来自地面实况注释的语义嵌入来学习。本质上,该模型使用由人类标记的属性数据或一般词语义空间组成的语义查找表从一个模块获取音频并从音频注释中随机选择单词。
在几个实验的第一个中,研究人员开发了两个数据集 – 免费音乐档案和OpenMIC-2018 – 包含音频文件和流派注释,他们过滤了音频文件以同时具有流派和乐器注释(例如,“贝司”,“声音,“”声音“)并随机将标签分成看不见的和看不见的标签。然后,他们在OpenMIC-2019数据集中的20个不同乐器上进行注释,以根据类型标签创建歌曲的乐器矢量(数学表示)。
在第二次测试中,团队使用了一个公开的预训练机器学习模型,其中有百万歌数据集和Last.fm标签注释(例如,“朋克”和“金属”用于涅ana的气味像青少年精神),后者随机随机分为看见和看不见的标签。
研究人员声称,在这两个测试中,该模型设法使用辅助信息将音乐音频与看不见的标签相关联。他们进一步说这允许它使用“丰富的词汇词汇”来描述音乐,并且他们留下未来的作品使用歌词作为辅助信息和训练AI模型以包含更多的音乐背景(如播放列表或音乐文章的文本描述)。

姓 名:
邮箱
留 言: