(资料图)
北京日报客户端 | 记者 袁璐
AI预训练大模型如火如荼,通用性成为业内关注的话题。7月6日,在昇腾人工智能产业高峰论坛上,科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平对外透露,讯飞和华为已达成合作,联合讯飞星火与昇腾AI,打造通用智能新底座。
“大模型与大脑原理层类似,都通过超千亿神经元组合在一起,接受输入的刺激,再产生智慧的输出,有着相似的智能激发和运行机制。”胡国平表示,大模型潜力无限,但更多的数据、更强的需求、更复杂的任务,促使大模型对大算力产生强烈渴求。
“国产大模型只有基于中国自主创新的算力底座才有大未来。”胡国平认为,大模型加速迭代赶超的同时,随之带来的算力挑战不容忽视。目前大模型研发高度依赖高端AI芯片、集群及生态。高计算性能、高通信带宽和大显存成为大模型训练必不可少的算力底座。“单AI芯片进步速度还未跟上大模型对大算力的需求,算力集群化成为不可逆转的发展趋势。”
华为轮值董事长胡厚崑则表示,伴随大模型带来的生成AI突破,人工智能正进入一个新时代。在该论坛上,华为宣布昇腾集群全面升级,集群规模从最初的4000卡集群扩展至1.6万卡。目前,昇腾AI集群已支撑全国25个城市的人工智能计算中心建设,其中7个城市公共算力平台入选首批国家“新一代人工智能公共算力开放创新平台”。
在胡国平看来,讯飞星火与昇腾AI牵手合作,能促进国产大模型架构在自主创新的软硬件基础之上。一方面,讯飞星火认知大模型基于训练推理一体化设计,实现大模型稀疏化、低精度量化的技术突破,能高效适配昇腾AI,加速大模型的行业落地应用和迭代;另一方面,以昇腾AI为核心,软硬件协同优化,可构建算力集中、性能优越、供给稳定、数据安全的大模型训练集群。
记者注意到,目前在大模型的发展上,业内正展开两条路线的讨论。一条是以科大讯飞、百度、商汤科技等为代表的通用模型之路,另一条路则是以腾讯、亚马逊云为代表的行业大模型之路。这两条路的论战正如火如荼。
胡国平在昇腾人工智能产业高峰论坛上透露,10月24日科大讯飞将发布通用大模型,全面对标ChatGPT,并在中文能力上全面超越。
腾讯高级执行副总裁汤道生则在6日的2023世界人工智能大会上表示,通用大模型一般基于公开信息来训练,在许多专业知识和行业数据方面积累不足。“在策略上,通用大模型有点像‘把大海煮沸’,不够聚焦,可以解决80%的问题,但未必能够满足企业某个场景的具体需求。”