国漫手机壁纸

华为发布业内最大2D自动驾驶数据集,10倍于Waymo,主打半/自监督学习

韦丽雪发自副驾寺智能车参考报道公众号AI4Auto人类司机开车,陌生的路开多了自然就会熟练。自动驾驶开车,需要大量的学习和训练。这就离不开提供“训练场地”和素材的庞大数据集。此前,Waymo拥有最大的2D自动驾驶数据集。不过现在,华为诺亚方舟实验室联合中山大学发布了新一代2D自动驾

NetSmell 出品

  韦丽雪发自副驾寺

  智能车参考报道公众号 AI4Auto

  人类司机开车,陌生的路开多了自然就会熟练。自动驾驶开车,需要大量的学习和训练。这就离不开提供“训练场地”和素材的庞大数据集。此前,Waymo 拥有最大的 2D 自动驾驶数据集。

  不过现在,华为诺亚方舟实验室联合中山大学发布了新一代 2D 自动驾驶数据集 SODA10M。

  比 Waymo 现有的大 10 倍。

  包括了 1000 万张无标注图片以及 2 万张带标注图片。

  除了大,这个数据集还有什么不同?

  数据集从哪里来?

  SODA10M 数据集收集了不同城市在不同天气条件、时间段以及位置的场景。

  晴天雨天、白天夜晚、城市高速园区……

  更重要的是,覆盖面很广。

  1000 万张无标注图片来自 32 个城市,囊括了国内大部分地区。

  2 万张带标注的图片,直接标出了 6 种主要的人车场景类别,分别是:

  Pedestrian、Cyclist、Car、Truck、Tram、Tricycle。

  具体是怎么操作的?

  华为通过众包方式把采集任务分发给上万名出租车司机。

  由出租车司机使用手机或驾驶记录仪(1080P+)采集图片。

  你以为随手拍个照片就完事?

  还要以每 10 秒一帧的速度,在不同的天气条件下采集图像。

  地平线需要保持在图像的中心,遮挡汽车内部不能超过 15%。

  对收到的图像还会随机选择其中的5%,进行手工验证。

  合格率低于 95% 将退回。

  针对涉及隐私的信息,例如人脸和车牌等都会进行模糊处理。

  最大数据集有啥用?

  华为用已标注的训练集(2 万张带标注的图片),搞了一场自动驾驶的主流模型的大 pk。

  对象是全监督、半监督和自监督学习。

  分为训练、验证和测试三个环节。

  为了增加难度,最终测试选择的图片是上海白天晴天,而且是城市场景。

  在验证这一环节,则包含了多种不同场景下的图片。

  最终结果表明,仅仅通过全监督训训练出来的模型取得的效果并不好,全监督训练的结果夜晚与白天的精度差距大。

  此外,华为还把 Waymo 自动驾驶数据集、现有的经典自监督算法数据集 ImageNet 拉来,和 SODA10M 的表现进行比较。

  从这三项入手:

  1、目标检测;

  2、BDD100K (伯克利发布的大型开放驾驶视频数据集);

  3、Cityscapes 上的语义分割。

  效果如何?

  在 Moco 系列(城市景观语义分割),以及基于像素和中间层特征的自监督方法 DetCo, DenseCL 上,SODA10M 自监督训练的效果与 ImageNet 相仿。

  两者都明显优于 Waymo。

  这也意味着自监督算法上游的数据集大小,对于下游的学习和测试有极大影响

  据华为介绍,建立这个数据集主要是为了通过自监督学习,构建下一代工业级自动驾驶系统的方法。

  此前,自动驾驶主要依靠训练过的视觉感知模型进行学习。

  这类模型使用大量的数据标注,自动驾驶的安全性得到确保,但弊端也很明显。

  自动驾驶系统会对此产生依赖,而且学得很慢。

  半监督和自监督学习通过大型数据集,挖掘大量的无标记数据和少量的无标记数据,能够提升学习的鲁棒性。

  所以建立一个足够大的数据集,成为了关键。

  据悉,华为诺亚方舟实验室将基于这个训练集,开放 2D 自动驾驶挑战赛。

  并且会从中评选出 Best Paper Award。

  奖金丰厚,感兴趣的朋友或许可以一战。

显示余下内容
相关文章:
  1. 信用卡 PIN 码很容易猜测
  2. 神经元簇发能模拟 AI 学习策略
  3. 蜘蛛丝可能根本不具有抗菌性质
  4. 佳能因禁止无墨水打印机扫描被起诉
  5. DeepMind盈利后开始「买买买」!收购机器人模拟平台MuJoCo,全面开源
  6. 分析师:新MacBook Pro搭载自家芯片,苹果利润率更高了
  7. 格芯提交上市申请IPO,筹资约26亿美元
  8. 美股周二:中概股普涨 阿里涨超6% 高途涨逾12%
  9. 搭配自研处理器与安卓12,谷歌新机Pixel 6起价599美元
  10. 摩根士丹利:马斯克有望凭SpaceX成首位万亿美元富豪
  11. 《鱿鱼游戏》助奈飞三季度新增用户翻倍,股价近新高
  12. DOTA 2又上热搜了 为什么这次大家到处刷“猛犸”?
  13. 多位游戏巨头联合希望美国政府监管盗版和作弊网站
  14. Google Play Data Safety开始接受开发者申请:2022年将强制执行
  15. 价格欺诈投诉引发公益诉讼 京东“划线价”格式条款须整改
 

发表回复

您的电子邮箱地址不会被公开。