国产人工智能大模型技术水平获官方认证,四巨头领跑市场


【CNMO 新闻】日前,中国电子技术标准化研究院宣布完成国内首个官方人工智能“大模型标准符合性评测”。这次评测的重点对象为四款国产大模型,分别隶属于国内科技巨头阿里云、百度、360和腾讯。这四款产品分别是:通义千问、文心一言、360智脑以及混元大模型。在经过一系列严格的测试后,它们均顺利通过评审,这表明它们在各项评测指标上,包括通用性、智能性等维度,均符合或超越了国家的相关标准要求。

据悉,此次评测旨在为国内人工智能大模型的研发和应用建立一套权威的标准,并创建大模型标准符合性的名录。中国电子技术标准化研究院希望通过此举引领并促进人工智能产业的健康有序发展。参与此次评测标准制定的不仅有学术界的专家,还包括国内外数十家在人工智能领域有显著影响力的企业。

具体来说,此次评测围绕语言模型的通用性及智能性,设定了38项详尽的评测维度。此举是为了确保大模型不仅在技术实力上达标,而且在实际应用中能够解决多样化的问题,以满足不同场景和用户的需求。

在本次受测的大模型中,由阿里云开发的通义千问显得尤为特殊,因为它是唯一一个开源的大模型。通义千问72B自去年12月开源以来,迅速在国际人工智能领域获得了认可,连续登顶HuggingFace排行榜和上海人工智能实验室的Open Compass榜单。

腾讯方面亦对外宣称,其混元大模型符合《人工智能大规模与训练模型第2部分:测评指标与方法》的技术要求,并拥有超千亿的参数规模,其预训练语料也超过了2万亿tokens,这一数据量令人印象深刻。

通过评测的还有百度的文心一言和360的360智脑。尽管相关企业并未公开过多的技术细节,但它们的成功通过评测已足以证明它们的大模型在国内尤其是在全球范围内具有竞争力。

随着国产大模型技术的逐步成熟和官方认证的背书,中国人工智能产业的发展前景愈加广阔。业内专家认为,这四款通过评测的大模型不仅为国内外用户提供了多样化的选择,更同样标志着中国在核心技术自主可控的道路上迈出了重要一步。随着未来评测体系的完善和技术标准的推广,相信还将有更多的国产人工智能产品脱颖而出,为促进行业发展贡献中国力量。

发表回复