摘要:此前业内一直盛传华为正在秘密研发AI芯片,现在真的来了。10月10日,以“+智能,见未来”为主题的2018华为全联接大会(HUAWEI CONNECT)在上海世博展览馆正式开幕。在会上,华为轮值CEO徐直军公布了华为全栈全场景AI解决方案,并正式推出了两款AI芯片:昇腾910、昇腾310。

吊打谷歌、英伟达?华为发布两颗“全球最强”AI芯片:昇腾910和昇腾310-芯智讯

此前业内一直盛传华为正在秘密研发AI芯片,现在真的来了。10月10日,以“ 智能,见未来”为主题的2018华为全联接大会(HUAWEI CONNECT)在上海世博展览馆正式开幕。在会上,华为轮值CEO徐直军公布了华为全栈全场景AI解决方案,并正式推出了两款AI芯片:昇腾910、昇腾310。

人工智能是新的通用目的技术

华为轮值董事长徐直军在大会上发表“构建万物互联的智能世界”的主题演讲。1956年,达特矛斯第一次正式提出了“人工智能”的定义。“从那以后的60年里,人工智能经历了两次发展的低谷,即所谓的‘冬天’,但其发展的脚步并未就此停止。”他说。

吊打谷歌、英伟达?华为发布两颗“全球最强”AI芯片:昇腾910和昇腾310-芯智讯

徐直军认为,人工智能是一种新的通用目的技术。任何技术只有准确的定位,才会充分发挥其价值。给人工智能技术进行合理的定位,是我们理解和应用此技术的基础。

他说,“华为在实践中发现,人工智能不但可以替代人,还能够自动降低生产成本。这是人工智能与信息化最大的不同,也是其最有价值的特点。” 人工智能触发的产业变革,将涉及所有行业,从交通、教育、医疗到翻译、运维和自动驾驶等等。

两款AI芯片发布

昇腾910:计算密度最大的单芯片

昇腾910是目前单芯片计算密度最大的芯片,其算力可以达到 256TFOPS,采用7nm工艺制程,最大功耗为350W。

吊打谷歌、英伟达?华为发布两颗“全球最强”AI芯片:昇腾910和昇腾310-芯智讯

根据华为官方公布的性能数据显示,昇腾910半精度为(FP 16):256 Tera FLOPS,整数精度(INT 8):512 Tera FLOPS,128通道 全高清 视频解码器- H.264/265。

华为还将昇腾910的性能与谷歌TPU v2、谷歌TPU v3、英伟达V100进行了对比。可以看到,昇腾910的算力比Nvidia 的 V100 还要高出一倍,计算力远超谷歌及英伟达。

此外,值得一提的是,华为基于昇腾910还构建了一个昇腾 plus,它是迄今为止全球最大的分布式训练系统。

徐直军介绍,通过把 1024个昇腾910连接起来,构建一个 AI 计算机群,可提供高大 256 个 P 超高 AI 计算能力,实现人们过去从未想过的速度训练你的模型,不管多复杂的模型。

昇腾310:高效计算低功耗AI SoC

华为昇腾310属于昇腾910的迷你系列,主打终端低功耗AI场景,采用台积电12nm工艺制造,拥有8 TFLOPs半精度计算力,整数精度的算力达到16TFLOPS,同时昇腾310还集成了 16 个通道的高全高清视频解码器,是目前面向边缘计算产品最强算力的 AI 芯片,也可以用于数据中心的训练和推理。最大功耗仅为8W。

吊打谷歌、英伟达?华为发布两颗“全球最强”AI芯片:昇腾910和昇腾310-芯智讯

两款AI芯片均采用华为自研的达芬奇AI架构。其中昇腾310目前已经量产,昇腾910将在明年第二季度量产。2019年,华为还将推出3款AI芯片,均属昇腾系列,同时华为将会基于昇腾系列AI芯片提供AI云服务。

十大改变 开创未来

在会上,徐植军表示,要解决人工智能“火热”与“冷静”之间的巨大落差,开创未来,要从技术、人才、产业这三个方面进行主动的变革。徐植军和大家分享了十个有关人工智能技术、人才和产业的重要变革方向。

改变之一:缩短训练模型的时间

按照目前的技术水平,训练某些复杂模型时往往需要数天甚至数月,而成功的创新发现往往需要多次迭代,这种训练速度严重制约了应用创新。我们认为,未来模型的训练要能在几分钟、甚至几秒钟内完成。

改变之二:充裕经济的算力

算力是AI的基础,但目前的算力非常昂贵,是一种稀缺资源。如果说算力的进步是当下AI大发展的主要驱动因素,那么,算力的稀缺和昂贵正在成为制约AI全面发展的核心因素。

我们认为,算力应该是充裕且经济的,并且这种需求应该尽快实现。

改变之三:人工智能要适应任何部署场景

混合云已经成为企业采用云服务的主要模式,当前的AI主要在云,少量在边缘,与企业的业务环境的结合有待进一步深入。

我们认为,未来AI将无处不在,要能够部署在任何场景,并确保用户隐私得到尊准和保护。

改变之四:更高效更安全的算法

算法是推动AI发展的另一个主要动力,但目前运用的主要算法多诞生于1980年代。随着AI的广泛普及,这些算法的不足愈发明显。

我们认为,未来的算法,要能够基于更少的数据需求,即数据高效。也要能够基于更低的算力和能耗,即能耗高效。同时要解决自身的安全问题,并实现可解释…等等,这都是AI全面发展的重要技术基础。

改变之五:更高的自动化水平

今天的人工智能,自身还需要大量的人工,特别是在数据标注环节,今天甚至还诞生了一个新的职业叫“数据标注师”。有人调侃说,今天的人工智能,是没有“人工”就没有“智能”。

我们认为,应该大大提升AI自身的自动化水平,比如在数据标注、数据获取,特征提取,模型设计和训练等环节,要实现自动化或半自动化。

改变之六:模型要面向实际应用

2018年6月,伯克利大学的助理教授 Benjamin 等发表了一篇题目奇怪的论文--《CIFAR-10分类器能否泛化到CIFAR-10?》

该论文指出,在CIFAR-10分类器上测试准确度出色的模型算法,却在作者创建的与CIFAR-10非常接近的另一测试集上出现了偏差,分类识别准确率下降了5-15个百分点不等。这也就意味着,这个模型算法的可用度大幅度下降。

由此,可见当前很多优秀的模型算法,更多的是“考试”优秀,还未达到“工作”优秀。

我们认为,未来的模型必须实现工业级的优秀,即满足工业生产的需要,而不仅仅满足于测试集上“考试”优秀。

改变之七:模型更新

模型的准确率并非是一成不变的,而是会随着数据分布、应用环境和硬件环境的变化而变化,始终保持准确率在期望的范围内对于企业应用是必须的。但目前的模型更新是非实时的,依赖人工周期性的更新,因此是一个半开环的系统。

我们认为,未来的模型要能及时适应各种变化,实时更新,实现闭环系统,保证企业AI应用始终处于最佳状态。

改变之八:人工智能要多技术协同

每一个通用目的技术,只有与其它技术充分协同配合,才能发挥到极致,创造巨大的经济价值。AI也不例外,但在目前我们探讨AI时,更多的是仅仅聚焦AI本身。

我们认为,AI需要与云、物联网、边缘计算、区块链、大数据、数据库…等技术充分协同,如此才能发挥更大价值。

改变之九:人工智能要成为由一站式平台支持的基本技能

今天,AI还是一项只有具备高级技能的专家才能完成的工作,成熟、稳定、完善的自动化工具还比较缺乏,获得一个AI模型还是一个非常复杂,耗时耗力的事情。

我们认为,应该有一站式平台,提供必需的自动化工具,让AI应用开发更容易,更快捷。从而,使AI成为所有应用开发者甚至所有ICT技术从业人员的一项基本技能。

改变之十:以AI的思维解决AI的人才短缺

AI人才的短缺,特别是数据科学家的缺乏,一直是业界顾虑较多的一个制约因素。而且我们认为,数据科学家将永远是稀缺的。

解决之道应该是,以AI的思维解决AI的人才短缺。通过着力发展智能化、自动化、简单易用的AI平台和工具服务,以及提供培训教育,培养大量的数据科学工程师,使他们能完成大量基本的数据科学相关工作。

通过这些大量的数据科学工程师与数据科学家和各领域专家相互配合的梯形结构,来解决AI人才稀缺问题。

这十个改变,一定不是AI技术、人才、产业发展的全部,但都是未来发展的重要基础。

华为的AI发展战略:

徐直军提出了10个人工智能的重要改变方向既是华为对AI产业发展的期望,也是华为制定AI发展战略的源动力。基于这十大改变,华为的AI发展战略包括五个方面:

吊打谷歌、英伟达?华为发布两颗“全球最强”AI芯片:昇腾910和昇腾310-芯智讯

1. 投资基础研究:在计算视觉、自然语言处理、决策推理等领域构筑数据高效(更少的数据需求) 、能耗高效(更低的算力和能耗) ,安全可信、自动自治的机器学习基础能力。

2. 打造全栈方案:打造面向云、边缘和端等全场景的、独立的以及协同的、全栈解决方案,提供充裕的、经济的算力资源,简单易用、高效率、全流程的AI平台。

3. 投资开放生态和人才培养:面向全球,持续与学术界、产业界和行业伙伴广泛合作,打造人工智能开放生态,培养人工智能人才。

4. 解决方案增强:把AI思维和技术引入现有产品和服务,实现更大价值、更强竞争力。

5. 内部效率提升:应用AI优化内部管理,对准海量作业场景,大幅度提升内部运营效率和质量。

华为的AI全栈解决方案

在大会中,徐直军用一张图完整展示了华为的全栈全场景解决方案。

“我们提出的全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。我们说的全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。”他说。

华为的全栈方案具体包括:

Ascend: 基于统一、可扩展架构的系列化AI IP 和 芯片,包括Max,Mini,Lite,Tiny和Nano等五个系列。包括我们今天发布的华为昇腾910(Ascend 910),是目前全球已发布的单芯片计算密度最大的AI芯片,还有Ascend 310,是目前面向计算场景最强算力的AI SoC。2.CANN: 芯片算子库和高度自动化算子开发工具

MindSpore:支持端、边、云独立的和协同的统一训练和推理框架应用使能:提供全流程服务(ModelArts),分层API和预集成方案从华为云EI、人工智能引擎HiAI到全栈解决方案,华为构建出自己的一套完整AI方案。

徐直军表示,“今天,我们发布的全栈全场景解决方案是对华为云EI和HiAI的强有力支撑。基于这个解决方案,华为云EI能为企业、政府提供全栈人工智能解决方案;HiAI能为智能终端提供全栈解决方案,且HiAI service是基于华为云EI部署的。”

从某种方面说,人工智能很“火”,但又很“冷静”,这种差异被徐直军称为“令人兴奋的落差”,是凝聚产业发展的巨大动力。

新的战场,新的对手

在两年前,华为另一名轮值董事长郭平就表示,公司每年至少拿出10亿美元的研发预算,用于与数据中心相关的投入。

2017年9月,华为发布了面向企业、政府的人工智能服务平台华为云EI。今年4月,华为又发布了面向智能终端的人工智能引擎HiAI。

但在投入的过程中,发现了一个普遍存在的问题,就是云服务平台不卖终端芯片,卖终端芯片的平台不提供云计算服务。因此,这种割裂的环节让开发者浪费了大量的时间和精力以及财力在训练和部署之间。

此前,谷歌云推出了用于边缘计算的Edge TPU,作为Cloud TPU的补充,用户可以在云上构建和训练ML模型,然后通过Edge TPU硬件加速器在Cloud IoT Edge设备上运行这些模型,这在某种程度上降低了开发者的成本。

但如果能出现一套框架,让手机、公有云、私有云、边缘计算等不同平台的AI应用应用一次调校就能部署,将会比Edge TPU更有效率。

“今天,我们发布的全栈全场景解决方案是对华为云EI和HiAI的强有力支撑。基于这个解决方案,华为云EI能为企业、政府提供全栈人工智能解决方案;HiAI能为智能终端提供全栈解决方案,且HiAI service是基于华为云EI部署的。”徐直军说。

一位华为人士在社交平台发表感叹时表示,“(华为)又多了一些强大的全球顶级竞争对手。”

编辑:芯智讯-林子

注:部分图片及内容源自网络