国漫手机壁纸

阿里达摩院发布业界首款语音合成算法专用AI FPGA芯片设计Ouroboros

与阿里近来发布的其它芯片产品一样,这个产品的命名也很有特色。Ouroboros 中文是衔尾蛇,是一个古代流传下来的符号,形象为一条蛇(或龙)吞食自己的尾巴,结果形成一个圆环(有时亦会展示成扭纹形,即“∞”),其名字涵义为“自我吞食者”。这个符号一直都有很多不同的象征意义,而当中最为人接受的是“无限大”、“循环”等。

NetSmell 出品

图0:阿里达摩院发布业界首款语音合成算法专用AI FPGA芯片设计Ouroboros

这是业界首款专用于语音合成算法的 AI FPGA 芯片结构设计,能将语音生成算法的计算效率提高百倍以上。

文:包永刚

Hot chips 31(2019)正在美国旧金山举行,峰会第二天阿里巴巴带来了《Ouroboros: A WaveNet Inference Engine for TTS Applications on Embedded Devices》的演讲,并发布了新一代 AI 语音 FPGA 芯片技术 Ouroboros。

阿里巴巴称,这是业界首款专用于语音合成算法的 AI FPGA 芯片结构设计,能将语音生成算法的计算效率提高百倍以上。

根据阿里达摩院扫地僧的说法,用 AI 语音合成算法 WaveNet 生成 1 秒语音,CPU 和 GPU 需要 50 秒的计算时间,但 Ouroboros 在 FPGA 环境下只要 0.3 秒。Ouroboros 的一大突破,是用端上定制硬件加速技术替代云端服务器,避免了对网络连接和云端服务的强依赖性。

针对 ASIC 实现的性能仿真预估表明,Ouroboros 的设计可以实时运行 WaveNet 等业界先进的文字转语音(TTS,Text-to-Speech)算法 ,实现实时语音合成。

另据了解,Ouroboros 技术同样适用于达摩院于今年 7 月发布的新一代的语音合成算法 KAN-TTS。该算法将商用系统里的合成语音与原始语音的相似度提高到 97% 以上。

还有消息指出,Ouroboros 技术,同样适用于达摩院于今年 7 月发布的新一代的语音合成算法 KAN-TTS。该算法将商用系统里的合成语音与原始语音的相似度提高到 97% 以上。Ouroboros 芯片技术除了语音合成之外,还将支持 AI 语音识别。基于 Ouroboros 研发完整的语音 AI 芯片,有望率先在天猫精灵上落地。

与阿里近来发布的其它芯片产品一样,这个产品的命名也很有特色。Ouroboros 中文是衔尾蛇,是一个古代流传下来的符号,形象为一条蛇(或龙)吞食自己的尾巴,结果形成一个圆环(有时亦会展示成扭纹形,即“∞”),其名字涵义为“自我吞食者”。这个符号一直都有很多不同的象征意义,而当中最为人接受的是“无限大”、“循环”等。

显示余下内容
相关文章:
  1. 比尔·盖茨:我认为美国永远无法成功阻止中国拥有强大的芯片
  2. 美国“断供EDA软件”,对中国影响几何?
  3. 苹果自研5G基带失败:到底难在哪儿?
  4. 中国有望在2025年成为全球最大芯片制造国,美国怎么办?
  5. IBM的2nm芯片制程,是噱头还是来真的?
  6. IBM造出首颗2nm芯片,台积电、GAA工艺将受何种影响?
  7. 全球「缺芯」,中国芯片产业能弯道超车吗?
  8. 5nm芯片集体“翻车”,先进制程的尴尬
  9. 又一颗“中国芯”登陆A股!龙芯中科开启上市辅导,“CPU性能达到AMD水平”
  10. 芯片龙头中芯国际被曝“内讧”,CEO梁孟松请辞:感到不再被尊重与信任!发生了什么?
  11. 关于芯片,这是迄今为止真正说清楚了的文章
  12. 复盘一下,华为海思可能真的走投无路了
  13. 中国芯片人才在哪里?
  14. 外媒:“中国芯”崛起初现曙光!
  15. 华为有哪些“备胎”?这里有份中国芯片企业权威榜单
 

发表回复

您的电子邮箱地址不会被公开。