商业
您现在的位置:首页 > 商业 > 苹果研究人员训练AI驾驶员在模拟环境中合并车道
  • 营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    营销与经营深度一体,巨量引擎助力品牌撬动全渠道增长

    发布时间:2024/01/30

    过去十年,中国企业在数字营销上的投入快速增长。根据eMarketer的数据,2023年国内数字广告的投入将达到1361亿美元,增长14.8%。数字营销已经成为品牌方最大的经营成本之一。面对如此巨大的投入,品牌方的管理层...

  • 门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    门窗行业复刻定制家居高光时刻,森鹰窗业上市成起点?

    发布时间:2022/09/25

    据悉,9月26日,森鹰窗业股份有限公司(以下简称森鹰窗业)将举办上市敲钟仪式,正式登陆深交所。 森鹰窗业是目前沪深两市第一家细分行业为“C2032木门窗制造”的上市公司。 这让笔者不禁想起2011年定制家居行业首...

  • 2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    2022年最热高端盘天坛府·九阙成首个“国脉典藏豪宅样本”

    发布时间:2022/07/25

    2022年7月15日“九阙央座,盛赋天坛”《国脉典藏豪宅样本》发布会现场,北京房协秘书长/高品质住宅综合测评中心创始人陈志先生、中国建筑北京设计研究院原副院长/总建筑师董少宇先生、攸克地产/豪宅一号出品人殷苏峰...

  • 杰尼亚集团将成为纽约证券交易所上市公司

    杰尼亚集团将成为纽约证券交易所上市公司

    发布时间:2021/07/20

      2021年7月19日,意大利米兰——享誉全球的意大利奢侈品企业杰尼亚集团(下简称“杰尼亚”“该集团”或者“该公司”)与意威基金Investindustrial七期基金旗下的特殊目的收购公司InvestindustrialAcquisitionCorp.(...

  • 浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    浑水协助Wolfpack做空爱奇艺(IQ.US) 看空报告全文来了

    发布时间:2020/04/08

    本文来源“腾讯网”。 划重点:1.两家中国广告公司向我们提供了爱奇艺(IQ.US)后端系统的数据,这些数据显示,从2019年9月开始,爱奇艺的实际移动DAU比该公司在2019年10月宣称的1.75亿平均移动DAU低了60.3%。2.大约3...

  • 华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    华尔街大佬巴鲁克:特斯拉(TSLA.US)目标股价达600美元,仍有18%上行空间

    发布时间:2020/04/08

    本文来自“腾讯证券”。 在券商杰富瑞(Jefferies)将特斯拉评级从“持有”上调到“买入”后,特斯拉(TSLA.US)在周一收盘上涨逾7.5%。上周五,特斯拉也因公司第一季度业绩强劲而迎来上涨。数据显示,该公司第一季度共...

  • 不满足于流媒体业务,亚马逊也要开始做游戏了

    不满足于流媒体业务,亚马逊也要开始做游戏了

    发布时间:2020/04/08

    本文来源“36氪”。为了在统治数字娱乐的战役中开辟新战线,Amazon(AMZN.US)正在投入数亿美元以成为视频游戏的领先制作商和发行商。由于卫生事件的影响数度推迟之后,这家互联网巨头表示,打算在5月发布其首款原创...

  • 刘强东“熔断”,徐雷成为京东的新“保险丝”

    刘强东“熔断”,徐雷成为京东的新“保险丝”

    发布时间:2020/04/08

    本文来自“盒饭财经”。公共卫生事件笼罩世界,全球经济遭遇重创,金融市场难以幸免,“熔断”一词频繁走入人们视野中。 作为在美股上市的企业,京东(JD.US)最近的日子也不太好过。瑞幸造假事件曝出后,京东“二号人...

苹果研究人员训练AI驾驶员在模拟环境中合并车道

发布时间:2020/01/31 商业 浏览次数:635

 
苹果尚未公开讨论其自动驾驶汽车研究,但它是一个秘密保存的行业秘密。据说大约有5,000名员工,其中包括一部分被苹果去年收购的无人驾驶汽车初创公司Drive.ai雇用的一部分,据称与代号Project Titan有关,后者与大众汽车共同开发无人驾驶汽车和穿梭货车。本周在Arxiv.org上发布的预印本似乎进一步拉开了帷幕:在其中,苹果研究科学家Yichuan Charlie Tang及其团队详细介绍了一种AI方法,该方法为涉及合并车辆的驾驶场景创建了越来越多样化的环境。
Tang和合著者写道:“我们在具有挑战性的多代理合并交通仿真中演示了[我们的技术],在该模拟中,代理必须与其他人进行交互和协商才能成功地在路上或路上进行合并。” “虽然环境从简单开始,但随着培训的进行,我们会通过向代理’zoo’反复添加越来越多的代理,从而增加其复杂性。定性地,我们发现通过自我扮演,我们的政策会自动学习有趣的行为,例如防御性驾驶,超车,屈服以及使用信号灯与其他特工交流意图。”
正如研究人员所解释的那样,在自动驾驶领域,合并行为被认为是复杂的,因为它们需要准确地预测意图并做出相应的反应。传统的解决方案会做出假设并依赖于手动编码的行为,但是这些导致受限且脆弱的策略,这些策略无法很好地处理边缘情况,例如车辆试图同时合并到同一车道。与基于规则的系统相比,强化学习(一种AI培训技术,利用奖励将软件策略推向目标),通过与环境的反复交互来直接学习策略。
苹果自动驾驶AI
在相关研究中,Tang及其团队在通过模拟卫星图像标注实际道路几何形状的交通的二维模拟中实施了一项自演训练方案。他们在虚拟世界中充斥着能够跟踪车道和变道的特工,这些特工随着时间的推移学会了何时减速,何时加速,何时发现差距并入,其他特工的潜在目标和信念,以及如何通过转向信号或可观察到的行为传达他们的意图。
每次模拟均以一个AI控制的代理程序为基础,该代理程序由基于规则的代理程序围绕,这些代理程序使用自适应巡航控制从车道执行车道保持(即相对于前方车辆减速并相应加速)。逐渐地,人工智能特工取代了基于规则的特工,后者因越界,偏离车道中心或与其他特工发生冲突而受到惩罚。 (他们因成功完成合并并以每秒15米或每小时约33.6英里的速度行驶而获得奖励。)对于每个模拟情节,其中32个在Nvidia Titan X图形卡上并行运行,大约10个代理商是用他们自己的随机目的地发起的;情节在1,000个时间步之后,发生碰撞后或到达目的地之后结束。
这是一个三个阶段的过程:
在第一阶段,仅在基于规则的代理程序的情况下对AI策略进行了培训。
在第2阶段中,在30%IDM代理人,30%是第1阶段的RL代理人的情况下训练了自我玩耍,而其他40%则受当前学习策略的控制。
将阶段3添加到阶段2的代理中。
研究人员特别关注拉链合并(也称为双重合并),这被认为很困难,因为左车道驾驶员通常打算向右合并,而右车道驾驶员则需要向左合并。信号和微妙的线索被用来协商谁先走,哪个空白被填补,并且计划必须在短时间内,短距离内完成。
研究人员观察到,在相当于278个小时的实时体验的1000万个环境步骤中,AI代理倾向于利用基于规则的代理的行为来谋取自己的个人利益。例如,具有制动倾向的基于规则的代理突然发现自己受制于从未屈服的“超进取” AI代理。就是说,基于规则的代理通常会归咎于涉及他们和AI代理的冲突。
为了评估他们的方法,研究人员进行了250多次随机试验,而没有增加探索噪音。 他们报告说,与基于规则的代理(成功率达到63%)相比,训练有素的AI代理对基于规则的代理和其他AI代理取得了98%的成功。 现有的算法并不完美-AI代理程序在尝试制动时有时会导致碰撞,并在紧急制动时向右侧转向-但是Tang和同事说,这为将来的工作打开了大门,这可能会将碰撞率降低到零 。