在人工智能前沿领域,中国AI实现了突破。
11月8日,阿里巴巴达摩院公布了多模态模型M6的最新进展,其参数从万亿跃升至10万亿,远超此前谷歌、微软发布的万亿级模型,成为全球最大的AI预训练模型。
同时,M6实现了业内最高的低碳高效,用512个GPU在10天内训练出一个可用的10万亿模型。
与去年发布的大型车型GPT-3相比,M6达到了同样的参数规模,能耗仅为1%。
M6达摩院是一个通用的人工智能模型,具有多模态、多任务能力,其认知和创造能力超越传统AI。特别擅长设计、写作、问答,在电子商务、制造、文艺、科研等领域有着广阔的应用前景。
与传统AI相比,大模型拥有数百倍的ldquoNeuron rdquo量,并且提前学到了很多知识,表现出像人类一样的ldquo以此类推。学习能力。
因此,大模式一般被认为是未来的ldquo基本模型rdquo将成为下一代AI基础设施。但是它的计算成本相当高,训练1750亿参数语言的大型模型GPT-3所需的能耗相当于汽车每月往返的路程。
今年5月,达摩院M6团队通过专家并行策略和优化技术,将万亿级模型的能耗降低了80%以上,效率提升了近11倍。
10月,M6再次突破行业极限,通过更细粒度的CPU卸载、共享-取消算法等创新技术,收敛效率进一步提升7倍,使得模型规模扩大了10倍,但能耗并没有明显增加。
这一系列突破,大大降低了大模型的研究门槛,让一台机器训练出千亿模型成为可能。
同时达摩院和阿里巴巴云推出M6服务平台,为大模型的培训和应用提供了完整的工具,使大模型首次实现ldquo。开箱即用rdquo,算法人员和普通用户都可以轻松使用该平台。
达摩院还推出了最大的中文多模态评价数据集MUGE,涵盖了图形描述、图像文本生成和跨模态检索等任务,填补了缺乏权威中文多模态评价基准的空白。
作为国内首个商业化的大型多模态模型,M6已经应用于40多个场景,日通话量上亿。
今年,Big Model首次支持双11。犀牛知止为该品牌设计的M6服装已在淘宝上线;凭借流畅的写作技巧,M6正在为天猫虚拟主播创作剧本;依托多模态理解能力,M6正在提升淘宝、支付宝等平台的搜索和内容认知准确率。
大源智能计算实验室负责人周说:接下来,我们将深入研究大脑的认知机制,努力将M6的认知能力提升到接近人类的水平。例如,通过模拟人类的跨模态知识提取和理解,我们将构建一个人工智能算法的通用框架。另一方面,不断提升M6在不同场景下的创意,产生优秀的应用价值。rdquo
据了解,达摩院语言模型PLUG最近升级到2万亿参数,成为全球最大的中文语言模型,其AliceMind语言模型系统也推出了服务平台。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
热评文章
食用大蒜的主要功效有哪些?
蒸米饭的三大误区与四大技巧
简谈两种合理健康饮食烹调方法
你需要了解的四大番茄中蕴含的营养价值
云南昭通市永善县茂林镇永安村高寒冷凉地区
简谈西柚的七大主要成效作用
对外卖说再见,年轻人爱上“懒人调料”了?
干净卫生?印度美食短视频究竟有何魔力
芋头有哪些品种?
“双十一”走向品质消费 优质国货与农产品