要闻
您现在的位置:首页 > 要闻 > 研究使用统计数据加快内核选择的方法
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

研究使用统计数据加快内核选择的方法

发布时间:2020/03/12 要闻 浏览次数:641

 
通过使用近似而不是显式的“内核”函数来提取非常大的数据集中的关系,KAUST研究人员已经能够极大地加快机器学习的速度。该方法有望在大数据时代大大提高人工智能(AI)的速度。
当AI暴露于大量未知数据集时,它需要分析数据并开发描述该集合中的关系的模型或函数。此函数或内核的计算是一项计算量很大的任务,随着数据集的大小,其复杂性呈立方增加(至3的幂)。在大数据时代和对AI的分析越来越依赖的时代,这提出了一个真正的问题,即内核选择会变得不切实际地耗时。
在高新的监督下,丁立中及其同事一直在研究使用统计数据加快内核选择的方法。
丁说:“准确选择内核的计算复杂度通常与样本数量成三次方。” “这种三次缩放对大数据是禁止的。相反,我们提出了一种近似的内核选择方法,该方法可以在不牺牲预测性能的情况下显着提高内核选择的效率。”
真实或准确的内核提供了数据集中关系的逐字描述。研究人员发现,可以使用统计数据来得出近似内核,该内核几乎与精确版本一样好,但是可以根据数据集的大小以线性而不是三次缩放的速度更快地计算很多倍。
为了开发该方法,团队必须构建专门设计的内核矩阵或数学数组,这些矩阵可以快速计算。他们还必须建立选择近似内核的规则和理论界限,以保证学习性能。
丁说:“主要的挑战是我们需要设计同时满足这两点的新算法。”
通过将误差估计和数学逼近相结合,研究人员能够证明其近似核与精确核保持一致,然后在实际示例中证明了其性能。
丁说:“我们已经证明,诸如我们的计算框架之类的近似方法可以为解决基于内核的学习方法提供足够的准确性,而不会给精确方法带来不切实际的计算负担。” “这为需要可伸缩性的数据挖掘和生物信息学问题提供了一种有效的解决方案。”