寒武纪国内首款云端芯片有多厉害?这篇文章带你详细了解它

5月3日下午,寒武纪科技在上海正式对外发布了两款全新产品:全国首款云端智能芯片Cambricon MLU100和寒武纪1M终端智能处理器IP产品。这标志着寒武纪已成为中国第一家,也是世界上少数几家同时拥有终端和云端智能处理器产品的商业公司。

hwj2018050801

等效理论峰值速度可达每秒166.4万亿次定点运算

首次正式亮相的Cambricon MLU100云端智能芯片成了发布会的焦点。所谓云端,虽然普通消费者并不直接接触,但我们平时刷微博看微信,都是从云端推送的。该芯片可在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下工作,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。解放日报·上观新闻记者从一些公开的报道看到,一家专业做显卡的公司,其芯片运算速度达每秒120万亿次定点运算时,对应的功耗需要250瓦到300瓦。此次寒武纪发布的云端智能芯片不仅速度快,而且功耗低。

MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下的云端智能处理需求。寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。MLU100的板卡(即搭载芯片的集成电路板)外形设计灵感来自于寒武纪地质时代的远古海洋生物三叶虫,以黑色、蓝色为主色调,简洁而富有科技感。

寒武纪公司创始人兼CEO陈天石博士介绍,寒武纪在2016年推出了全球第一款商用终端智能处理器IP产品,已经应用于千万级用户的智能终端中(包括华为Mate10、P20和荣耀10等手机),可以用于人脸、语音识别和自然语言识别,但并不局限于此。在这之前,要想在终端上实现人脸和语音识别功能,只能借助CPU(通用处理器),这样计算力就不强。说到终端,其实我们并不陌生,手机、电脑和摄像头等消费者可以直接接触到的产品,都可视为终端。就拿手机来说吧,一般里面有一个大的芯片,这个芯片又由许多模块组成。当我们打电话时,使用的是DSP模块,上网用的是MODEM模块,看图片用的是GPU模块。

这次最新发布的寒武纪1M终端智能处理器是公司的第三代IP产品,在计算力上达到了一个新高度,其效能比达到每瓦5万亿次运算。此外,该处理器可以提供三种规模的处理器核(2Tops/4Tops/8Tops),以满足不同应用场景下不同量级的智能处理需求,并可通过多核互联进一步提高性能。寒武纪1M处理器延续了前两代IP产品卓越的完备性,单个处理器核即可支持多样化的深度学习模型,并更进一步支持经典机器学习算法。由于人工智能计算量十分庞大,以前只有在云端才可以进行训练,这也是业界第一款支持本地训练的处理器,为视觉、语音、自然语言处理以及各类经典的机器学习任务提供了灵活高效的计算平台,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域当中。
要让全世界用上智能处理器,而不是停留在论文上

寒武纪的创始团队来自学术界,陈天石博士是中科院计算所的教授和博士生导师。据介绍,在过去十年的基础学术研究中,寒武纪与国际同行紧密合作,为国际学术界和工业界同仁们奉献了一系列人工智能与处理器架构交叉研究的新思想。2013年前后,陈天石博士作为主要参与者,与中科院计算所和法国国家信息与自动化研究所的同事们一道见证了DianNao系列深度学习处理器架构在国际学术界引起的轰动性效应,该系列学术论文得到哈佛、斯坦福、麻省理工、普林斯顿、英特尔、谷歌等顶尖国际机构的高频次学术引用,成为诸多国际顶尖大学处理器架构教学的重要资料,成为全世界每一家智能芯片设计公司无法忽略的参照。

“如何让普通民众也能受益于这样的创新思想?” 陈天石博士说,他走出实验室创立寒武纪,就是要让全世界都能用上智能处理器,而不是让思想停留在论文上。一花独放不是春,万紫千红春满园。寒武纪在成立之初就延续了学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享公司最新的技术成果,帮助全球客户能够快速设计和生产具备人工智能处理能力的芯片产品。

在发布会上,寒武纪的部分产业伙伴公开展示了基于寒武纪芯片的应用方案。联想集团推出了国内首款搭载寒武纪MLU100智能处理卡的服务器平台ThinkSystem SR650,打破了37项服务器基准测试的世界记录。中科曙光同步推出了基于MLU100智能处理卡的服务器产品系列“PHANERON”,可以支持2-10块寒武纪MLU处理卡,灵活应对不同的智能应用负载,典型场景下的能效提升30倍以上。科大讯飞公司披露了与寒武纪芯片的深度合作研发项目。据介绍,一小时的语音数据在一个传统处理器上进行智能应用处理,需要一万小时才能完成,而科大讯飞于发布会上披露的测试结果表明,寒武纪的智能处理器在语音智能处理上交出了优异的答卷,能耗效率领先竞争对手的云端GPU方案达5倍以上。寒武纪智能处理器的强大处理能力使得手机本地端可以处理更加复杂的机器学习算法,使得语音本地识别准确率相对于传统处理器领先了9.8%,显著提高了用户体验。
云端智能芯片,上海智慧的结晶

在寒武纪公司的官网上,有这样一句话——智能的“寒武纪”时代,引领人工智能大爆发。这正是年仅33岁的陈天石博士的创业理想。寒武纪一词来自地质年代的名称,距今5.41至4.88亿年前,寒武纪生命大爆发是一次里程碑事件,深刻影响了地球生命史的发展,开启了通向现代生物多样性的征程。

寒武纪于2016年4月在上海临港落地,目前芯片研发人员已达百人规模,在临港和张江分别设有办公室,并依托上海脑智工程设立了院士工作站开展前瞻学术研究。寒武纪科技是全球第一个成功流片并拥有成熟产品的智能芯片公司,拥有终端和服务器两条产品线。早在2016年,寒武纪推出了世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越CPU和GPU,与特斯拉增强型自动辅助驾驶、IBM Watson等国内外新兴信息技术的杰出代表同时入选第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。

2017年,寒武纪科技完成A轮融资(投资者包括国投创业、阿里巴巴、联想创投、国科投资、中科图灵、元禾原点、涌铧投资),成为全球智能芯片领域首个独角兽初创公司。

浦东新区区委常委、临港管委会党组书记、常务副主任陈杰在发布会上说,寒武纪选择临港,可以说是天作之合,与临港的产业定位高度吻合。当前,临港面向2035年的发展定位已经明确。围绕上海科创中心的主体承载区和国际智造城的目标,临港正在着力打造“2+3+4”产业体系,而人工智能首当其冲。“MLU100云端智能芯片是寒武纪历时近2年研发的成果,是上海智慧的结晶。未来寒武纪将继续依托上海集成电路和人工智能行业的人才集聚、产业集聚的优势,力争为世界智能产业打造先进的基础芯片技术和产品。”陈天石说。