字节跳动开源最新GAN压缩算法 算力消耗可减少至1/46

8月27日消息,字节跳动近期开源了一项代号为OMGD的压缩技术。这是字节自研的GAN(生成对抗网络)压缩算法,在保证生成效果不变的前提下,算力消耗最低可以减少到原来的1/46,相比之前业界的最佳压缩效果提升一倍多。据悉,这项技术的论文已入选国际计算机视觉会议ICCV2021。据悉,

NetSmell 出品

  8 月 27 日消息,字节跳动近期开源了一项代号为 OMGD 的压缩技术。这是字节自研的 GAN(生成对抗网络)压缩算法,在保证生成效果不变的前提下,算力消耗最低可以减少到原来的1/46,相比之前业界的最佳压缩效果提升一倍多。据悉,这项技术的论文已入选国际计算机视觉会议 ICCV 2021。

  据悉,GAN 是人工智能领域重要的深度学习模型,在图像生成、音乐生成和视频生成等方面应用广泛,还可以提高图像质量,实现图像风格化、图像着色等任务。漫画特效等人们常用的短视频道具,就是通过 GAN 实现的。

  由于 GAN 对计算资源和存储空间的需求巨大,模型难以直接部署到手机、Pad 等移动设备上,业界一直在努力改进 GAN 的压缩方法。2020 年,麻省理工学院、Adobe 和上海交通大学的研究者们提出一种 GAN 压缩算法,将算力消耗成功减少到1/21。此次字节跳动提出的 OMGD 方法则进一步提升了压缩能力。

  OMGD(Online Multi-Granularity Distillation)意为“在线多粒度蒸馏”。据字节跳动技术团队的论文显示,该算法能灵活地在训练过程中优化并压缩 GAN 模型,从而实现更好的图像效果和更少的计算成本。

  测试数据表明,OMGD 压缩算法对 Pix2Pix 和 CycleGAN 这两种常用的 GAN 解决方案效果显著。Pix2Pix 和 CycleGAN 主要应用于图像到图像的“翻译”,比如将照片转换为绘画,对黑白图片着色等。OMGD 压缩算法可使其算力消耗分别减少到原来的1/40 和1/46。

  目前,OMGD 压缩算法已在抖音等产品中落地,为用户提供更丰富的视频创作能力。相关技术代码也已发布在开源社区,以帮助从业者提升 GAN 的创新和应用效率。迄今,字节跳动已开源了机器学习平台 Klever、联邦学习平台 Fedlearner、高性能分布式训练框架 BytePS 、LightSeq 推理和训练引擎等重磅项目。

  节能环保是字节跳动一个重要的技术研究方向。在不久前的自然语言处理领域国际顶会 ACL 2021 上,字节跳动的词表学习方案获得年度唯一的“最佳论文”大奖,该论文同样极具节能价值,相比主流词表可以节约 92% 的算力。

显示余下内容
相关文章:
  1. 两家开发商向苹果索赔2000亿美元,指控其限制免费应用推广
  2. 22岁何同学自制硬核AirDesk!苹果都做不来的超大充电桌,稚晖君点赞
  3. 佳能因禁止无墨水打印机扫描被起诉
  4. 宜家被罚,疯狂的“净醛营销”该降温了
  5. 研究揭示月球、微生物和更长白昼是如何给我们提供更多氧气的
  6. B站内测鬼畜编辑器 为UP主提供精细化创作服务
  7. Reddit用户逆向工程苹果CSAM工具:发现算法早已存在
  8. 网易云音乐下线所有明星艺人榜单 对数字专辑及单曲限购
  9. 8年12轮融资 商汤科技“流血”IPO是资本没耐心了?
  10. 用人工智能解决社会刚需,科大讯飞上半年营收增长超45%
 

发表评论

您的电子邮箱地址不会被公开。