国漫手机壁纸

AI比人类更懂中文 阿里拿下FewCLUE双料冠军

AI人工智能是现在的热门,很多服务都上了AI客服,如何让AI用最少的样本来理解自然语言是个难题,国内还有中文语言理解的需要。在日前的中文语言理解权威评测基准CLUE评测中,阿里的AI模型就拿到了双料冠军。日前,中文语言理解权威评测基准CLUE公布了小样本学习评测榜单Few

NetSmell 出品

  AI 人工智能是现在的热门,很多服务都上了 AI 客服,如何让 AI 用最少的样本来理解自然语言是个难题,国内还有中文语言理解的需要。在日前的中文语言理解权威评测基准 CLUE 评测中,阿里的 AI 模型就拿到了双料冠军。

  日前, 中文语言理解权威评测基准 CLUE 公布了小样本学习评测榜单 FewCLUE 的最新结果,阿里巴巴在大模型和无参数限制模型两项赛事中双双刷新榜单最好纪录,仅次于“人类”,并在极少(一个类别仅十余个)样本条件下,超过了新闻文本分类上的人类识别精确度。

  这证明了 AI 小样本学习在 NLP 任务上具备超越人类的能力。

  FewCLUE 是 CLUE 最新推出的一项中文小样本学习评测榜单,包括大模型和无参数限制模型双赛道,用来评估预训练模型是否能够通过小样本学习来掌握特定的自然语言处理任务。基于这项评估,科研人员可以更精准的衡量预训练模型的泛化性和准确率。

  众所周知,预训练模型在特定自然语言处理任务上要取得高精度的成本非常高,科研人员进而转向攻关小样本学习技术,希望用较低的成本实现可观的识别精确度。

  据悉,阿里云机器学习平台 PAI 和和达摩院共同提出了一种大模型+小样本的联合方案,在大规模通用预训练基础之上,将亿级知识图谱融入预训练模型,打造了强大的底座 KGBert,结合 Fuzzy-PET 少样本学习,在多个任务上比预训练微调技术提升近 25% 了准确率,甚至在一个小样本学习任务上的精准度超过了人类。

  例如,在智能客服场景下的用户需求识别,仅需人工标注几十条样本,就能让需求识别的准确率达到 90%。

  值得一提的是,这项小样本学习技术已在阿里巴巴的实际场景落地且有很好的业务表现,目前阿里云智能客服云小蜜仅用 20 条样本就可以做到快速冷启动,实现精准问答,准确率超过 80%,并在政务、金融、通用线多个业务场景落地。开发者可基于 PAI 直接调用行业解决方案,也可以二次开发打造自己的模型。

  阿里云 PAI 是国际领先的机器学习平台,过去几年陆续打破多项国内外 AI 记录:2019 年 10 月,英文多轮阅读榜单 QuAC 取得第一;2020 年 3 月,中文 CLUE 分类榜单取得第一;2020 年 8 月,英文 SuperGLUE 取得国内第一,世界第二。

  “我们希望通过算法与工程的协同设计构建端到端的大规模 AI 工程能力,用云上 AI 平台 PAI 服务各行各业。”阿里巴巴副总裁、阿里云计算平台负责人贾扬清表示:“目前,PAI 支持从数据标注、模型设计、分布式训练、模型管理和模型服务等 AI 资产管理的各方面需求,全面提升 AI 落地企业应用的效率。”

显示余下内容
相关文章:
  1. 信用卡 PIN 码很容易猜测
  2. 神经元簇发能模拟 AI 学习策略
  3. 蜘蛛丝可能根本不具有抗菌性质
  4. 佳能因禁止无墨水打印机扫描被起诉
  5. DeepMind盈利后开始「买买买」!收购机器人模拟平台MuJoCo,全面开源
  6. 分析师:新MacBook Pro搭载自家芯片,苹果利润率更高了
  7. 格芯提交上市申请IPO,筹资约26亿美元
  8. 美股周二:中概股普涨 阿里涨超6% 高途涨逾12%
  9. 搭配自研处理器与安卓12,谷歌新机Pixel 6起价599美元
  10. 摩根士丹利:马斯克有望凭SpaceX成首位万亿美元富豪
  11. 《鱿鱼游戏》助奈飞三季度新增用户翻倍,股价近新高
  12. DOTA 2又上热搜了 为什么这次大家到处刷“猛犸”?
  13. 多位游戏巨头联合希望美国政府监管盗版和作弊网站
  14. Google Play Data Safety开始接受开发者申请:2022年将强制执行
  15. 价格欺诈投诉引发公益诉讼 京东“划线价”格式条款须整改
 

发表回复

您的电子邮箱地址不会被公开。