-
撒钱十个亿,只做真公益!振东制药诠释现代公益新范式
发布时间:2025/06/11
如果说慈善事业是企业责任感的一个缩影。那么振东制药的慈善“侧写”便是大爱无疆。山西振东健康产业集团自太行山深处诞生,稳扎稳打、守正创新,跻身中国药企中流砥柱行列。引导旗下公益扶贫办凝聚共识、加强合作...
-
创客匠人联合主办第二届中国心理学应用发展大会,深耕“AI+心理学”应用
发布时间:2025/05/30
导语: 2025年5月24日,第二届中国心理学应用发展大会在杭州水博园盛大开幕。作为联合主办方,创客匠人通过“AI+心理学应用”圆桌论坛和“心理人的破局发展”工作坊两大核心活动,为3000余名参会者带来前沿的数字化解决方...
-
纳斯达克‖飞兔商联启航全产业链聚合生态重构行业格局
发布时间:2025/05/27
在互联网行业爆发式增长的浪潮中,贵州飞兔商联云信息技术有限公司(以下简称“飞兔商联”)以“科技+线上+线下”三位一体的合伙人创新模式,成为资本市场瞩目的焦点。作为中国互联网全产业链聚合生态的构建者,公司...
-
LAIFE「巢汐Tide」 新品发布会盛大召开,“美似潮汐,更迭永续”引领抗衰新潮流
发布时间:2025/01/14
近日,LAIFE乐梵举办了一场盛大的红宝瓶2.0新品发布会,吸引了众多业内人士及媒体的关注。 *LAIFE「巢汐Tide」美似潮汐、更迭永续新品发布会现场 LAIFE乐梵作为全球领先的长寿科技企业,一直致力于利用前沿科技为...
-
浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了
发布时间:2020/04/08
本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...
-
华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间
发布时间:2020/04/08
本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...
-
不满足于流媒体业务,亚马逊也要开始做游戏了
发布时间:2020/04/08
本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...
-
刘强东“熔断”,徐雷成为京东的新“保险丝”
发布时间:2020/04/08
本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...
Google开源框架可将AI培训成本降低多达80%
发布时间:2020/03/24 要闻 浏览次数:781
Google研究人员最近发表了一篇描述框架SEED RL的论文,该框架将AI模型训练扩展到数千台机器。他们说,这可以促进在一台机器上以每秒数百万帧的速度进行训练,同时将成本降低多达80%,这可能为以前无法与大型AI实验室竞争的初创公司提供公平的竞争环境。
在云中训练复杂的机器学习模型仍然非常昂贵。根据最近的Synced报告,华盛顿大学的Grover专为生成和检测假新闻而设计,在两周的培训中花费了25,000美元。 OpenAI每小时花费256美元来训练其GPT-2语言模型,而Google估计花费了6,912美元来训练BERT,这是一种双向转换器模型,可以为11种自然语言处理任务重新定义最先进的技术。
SEED RL基于Google的TensorFlow 2.0框架,其特点是通过集中模型推断来利用图形卡和张量处理单元(TPU)的架构。为了避免数据传输瓶颈,它使用学习器组件集中执行AI推理,该学习器组件使用来自分布式推理的输入来训练模型。目标模型的变量和状态信息保持本地状态,而观察结果则在每个环境步骤都发送给学习者,并且由于使用了基于开源通用RPC框架的网络库,因此将延迟保持在最低水平。
SEED RL的学习者组件可以扩展到数千个核心(例如,在Cloud TPU上多达2,048个),并且参与者数量(可以在环境中采取的步骤与对模型进行推断以预测下一步行动之间进行迭代)可以扩展多达数千台机器。一种算法-V-trace-预测可从中采样动作的动作分布,而另一种算法-R2D2-根据该动作的预测未来值选择一个动作。
为了评估SEED RL,研究团队在常用的Arcade学习环境,几种DeepMind Lab环境以及Google Research Football环境中进行了基准测试。他们说,他们设法解决了以前尚未解决的Google Research Football任务,并且使用64个Cloud TPU内核实现了每秒240万帧的帧数,这比以前的最新分布式代理提高了80倍。
该论文的共同作者说:“这大大缩短了挂钟时间,并且由于加速器每次操作比CPU便宜几个数量级,因此实验的成本大大降低了,”。 “我们相信SEED RL及其呈现的结果表明,在利用加速器方面,强化学习再次赶上了其他深度学习领域。”