本篇文章3029字,读完约8分钟

中国首个云人工智能芯片发布

理论峰值速度达到每秒128万亿次定点运算,达到世界先进水平

云智能芯片是人工智能领域大规模数据中心和服务器的核心芯片。5月3日,中国科学院发布了中国首个云人工智能芯片。理论峰值速度达到每秒128万亿次定点运算,达到世界先进水平。它将广泛应用于智能手机、智能扬声器、智能相机、智能驾驶等。不同的领域-

国内首款云端人工智能芯片发布

智能芯片是前沿科技和社会的热点,也是人工智能技术发展中不可逾越的关键环节。可以说,无论算法有多先进,如果要最终应用,都必须通过芯片来实现。

国内首款云端人工智能芯片发布

5月3日,新一代人工智能芯片全球会议在上海召开。中国科学院寒武系技术公司发布了中国自主研发的cambricon mlu100云智能芯片和板产品,以及寒武系1m终端智能处理器ip产品。中国首个云人工智能芯片的理论峰值速度为每秒128万亿次定点运算,达到世界先进水平。

国内首款云端人工智能芯片发布

智能芯片实现新突破

作为此次会议的焦点,首次正式亮相的cambricon mlu100云智能芯片是中国第一款云人工智能芯片。

中国科学院计算技术研究所研究员、寒武纪公司创始人兼首席执行官陈表示,云智能芯片是人工智能领域大规模数据中心和服务器的核心芯片。云中的智能芯片规模更大,结构更复杂。智能芯片和终端芯片的最大区别在于其强大的计算能力。

国内首款云端人工智能芯片发布

mlu100云智能芯片采用了寒武纪最新的mluv01架构和TSMC 16纳米的先进技术,可以在平衡模式(1ghz频率)和高性能模式(1.3ghz频率)下工作。平衡模式下的等效理论峰值速度达到每秒128万亿次定点运算,高性能模式下的等效理论峰值速度达到每秒166.4万亿次定点运算,但典型的板级功耗仅为80瓦,峰值功耗不超过1110瓦

国内首款云端人工智能芯片发布

“在过去的三年中,我们一直在开发两种测试芯片,直到云智能芯片最终出现。我们随时准备‘从最后进入云端’。”陈说,mlu100是基于软硬件的合作,提高内存带宽的利用率。在性能比和功耗比方面,寒武纪将在智能芯片领域树立新的标杆。

国内首款云端人工智能芯片发布

与寒武纪系列终端处理器一样,mlu100云芯片延续了寒武纪产品的优秀通用性,可支持数千万用户的大规模商业检测,并配备了各种深度学习和经典机器学习算法,完全满足了视觉、语音、自然语言处理和经典数据挖掘等领域复杂场景(如大数据量、多任务、多模式、低延迟和高吞吐量)的云智能处理需求。

国内首款云端人工智能芯片发布

此外,新发布的寒武纪1m处理器是该公司的第三代ip产品,延续了前两代产品(寒武纪1h/1a)的出色完整性,单个处理器内核可以支持多样化。深度学习模式,进一步支持经典机器学习算法和局部训练,为视觉、语音、自然语言处理和各种经典机器学习任务提供灵活高效的计算平台,将广泛应用于智能手机、智能扬声器、智能相机、智能驾驶等领域。

国内首款云端人工智能芯片发布

“从末到云”协调发展

寒武系技术公司诞生于中国科学院计算技术研究所,并于2016年发布了世界上第一款商用深度学习专用处理器——寒武系1a处理器。其水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平/水平

国内首款云端人工智能芯片发布

近年来,人工智能产业的快速发展推动了芯片市场的快速增长和人工智能计算从终端到云的延伸。陈说,寒武纪在技术上实现了“端云协作”的概念。此次发布的mlu100云芯片不仅能够独立完成各种复杂的云智能任务,而且能够很好地适应寒武纪1a/1h/1m系列终端处理器,使终端和云能够在统一的智能生态基础上协同完成复杂的智能处理任务。

国内首款云端人工智能芯片发布

陈指出,终端智能处理可以最快速地响应用户需求,以极低的功耗、成本和延迟帮助用户理解图像、视频、语音和文本。同时,云端的智能处理可以从多个终端收集信息。由于终端数据有限,机器学习模型只能根据单个用户的数据进行微调。因此,端云协作的智能处理模式将在数据方面发挥巨大优势,并利用海量数据(603138,诊断单元)训练出强大的人工智能模型。

国内首款云端人工智能芯片发布

“过去,大多数芯片制造商专注于终端,如芯片巨头arm,或者专注于云,如英特尔。然而,两者都很少考虑,因为终端云任务的生态差异非常不同。但是这种情况将在智能时代被彻底打破。因为终端和云的任务是集成的,所以编程和使用的生态也是一致的。作为一个通用的机器学习芯片制造商,寒武纪就是要结合云,共同推动智能芯片生态的发展。”陈对说道。

国内首款云端人工智能芯片发布

中国科学院上海分院副院长、中国科学院院士张旭表示,从过去用于手机等终端的智能芯片,到今天更高层次的云人工智能芯片,它可以使人们在手机等终端的应用上升到未来更广泛的云等领域的应用,这是一个开创性的突破。

国内首款云端人工智能芯片发布

目前,许多科技公司都加大了人工智能芯片的研发力度,包括智能手机、无人驾驶、云计算等各个领域的巨头。据相关机构预测,到2021年,人工智能芯片的市场规模将超过110亿美元,而2016年的数字仅为36亿美元。

国内首款云端人工智能芯片发布

"寒武纪的初衷是让智能处理器在世界各地都可以使用."陈告诉记者,寒武纪将秉承学术界开放协作的精神,以处理器ip授权的形式与全球同行分享寒武纪最新科技成果,让全球客户快速设计生产具有人工智能处理能力的芯片产品。

国内首款云端人工智能芯片发布

构建人工智能生态链

在新闻发布会上,一些寒武纪工业伙伴公开展示了基于寒武纪芯片的应用方案。联想集团高级副总裁佟福耀在新闻发布会上发布了基于寒武纪mlu100智能处理卡的thinksystem sr650,打破了37次服务器基准测试的世界纪录。

国内首款云端人工智能芯片发布

“在新产品中,我们配备了寒武纪芯片,这将有助于研究和开发人工智能、虚拟现实、高性能计算和其他各行各业的工业解决方案。”童福耀说道。

不仅如此,该芯片的成果还将应用于智能语音领域。“一个小时的语音数据智能地应用在传统的处理器上,需要10,000个小时才能完成。科达讯飞(002230,诊断学)一直在跟踪人工智能专用芯片的前沿进展。”上海讯飞总裁苏城介绍说,寒武纪智能处理器在语音智能处理方面提供了出色的答案,其能耗效率比竞争对手的云计算gpu解决方案高出5倍以上。其强大的处理能力使手机的本地端能够处理更复杂的机器学习算法,与传统处理器相比,本地语音识别的准确率提高了9.8%,极大地改善了用户体验。

国内首款云端人工智能芯片发布

中科曙光(603019,诊断单元)高级副总裁任在新闻发布会上介绍了基于cambricon mlu100智能处理卡的服务器产品系列“phaneron”,该产品性能更强,可支持2-10个寒武纪mlu处理卡,灵活应对不同的智能应用负载。以升级后的phaneron-10为例,单台服务器可以集成10个寒武纪人工智能处理单元,为人工智能训练应用提供832t半精密浮点运算能力,为推理应用提供1.66p整数运算能力,典型场景下的能效可提高30倍以上。

国内首款云端人工智能芯片发布

“下一步,曙光与寒武纪的合作将不再局限于整个机器领域,而是从高端科研延伸到低端应用,共同打造下游应用产业,打造人工智能生态链。”任透露,中科曙光还将发布人工智能管理平台sothisai,实现与寒武纪芯片和开发环境的无缝连接和深度集成。(记者郭景元)

国内首款云端人工智能芯片发布

[我想纠正错误]负责编辑:雷丽娜

标题:国内首款云端人工智能芯片发布

地址:http://www.hellosat.cn/hxzx/12937.html