主页 > 要闻 > >正文

破10万亿！达摩院实现全球最大AI预训练模型：远超谷歌、微软

2021-11-08 13:40:00 许一诺中国食品消费网阅读量：18938

在人工智能前沿领域，中国AI实现了突破。

11月8日，阿里巴巴达摩院公布了多模态模型M6的最新进展，其参数从万亿跃升至10万亿，远超此前谷歌、微软发布的万亿级模型，成为全球最大的AI预训练模型。

同时，M6实现了业内最高的低碳高效，用512个GPU在10天内训练出一个可用的10万亿模型。

与去年发布的大型车型GPT-3相比，M6达到了同样的参数规模，能耗仅为1%。

M6达摩院是一个通用的人工智能模型，具有多模态、多任务能力，其认知和创造能力超越传统AI。特别擅长设计、写作、问答，在电子商务、制造、文艺、科研等领域有着广阔的应用前景。

与传统AI相比，大模型拥有数百倍的ldquoNeuron rdquo量，并且提前学到了很多知识，表现出像人类一样的ldquo以此类推。学习能力。

因此，大模式一般被认为是未来的ldquo基本模型rdquo将成为下一代AI基础设施。但是它的计算成本相当高，训练1750亿参数语言的大型模型GPT-3所需的能耗相当于汽车每月往返的路程。

今年5月，达摩院M6团队通过专家并行策略和优化技术，将万亿级模型的能耗降低了80%以上，效率提升了近11倍。

10月，M6再次突破行业极限，通过更细粒度的CPU卸载、共享-取消算法等创新技术，收敛效率进一步提升7倍，使得模型规模扩大了10倍，但能耗并没有明显增加。

这一系列突破，大大降低了大模型的研究门槛，让一台机器训练出千亿模型成为可能。

同时达摩院和阿里巴巴云推出M6服务平台，为大模型的培训和应用提供了完整的工具，使大模型首次实现ldquo。开箱即用rdquo，算法人员和普通用户都可以轻松使用该平台。

达摩院还推出了最大的中文多模态评价数据集MUGE，涵盖了图形描述、图像文本生成和跨模态检索等任务，填补了缺乏权威中文多模态评价基准的空白。

作为国内首个商业化的大型多模态模型，M6已经应用于40多个场景，日通话量上亿。

今年，Big Model首次支持双11。犀牛知止为该品牌设计的M6服装已在淘宝上线；凭借流畅的写作技巧，M6正在为天猫虚拟主播创作剧本；依托多模态理解能力，M6正在提升淘宝、支付宝等平台的搜索和内容认知准确率。

大源智能计算实验室负责人周说：接下来，我们将深入研究大脑的认知机制，努力将M6的认知能力提升到接近人类的水平。例如，通过模拟人类的跨模态知识提取和理解，我们将构建一个人工智能算法的通用框架。另一方面，不断提升M6在不同场景下的创意，产生优秀的应用价值。rdquo

据了解，达摩院语言模型PLUG最近升级到2万亿参数，成为全球最大的中文语言模型，其AliceMind语言模型系统也推出了服务平台。

声明：本网转发此文章，旨在为读者提供更多信息资讯，所涉内容不构成投资、消费建议。文章事实如有疑问，请与有关方核实，文章观点非本网观点，仅供读者参考。