揭秘芯动“风华1号”GPU背后故事:回片后两晚调通信号,不做“To VC”的芯片

2021年11月26日,国产半导体IP厂商芯动科技正式进军GPU市场,发布了首款国产高性能4K级显卡GPU “风华1号”,引发了业内的极大关注。近日,芯智讯在“2021年第十六届‘中国芯’集成电路产业促进大会、ICCAD 2021期间,分别对芯动科技公司联合创始人敖钢、芯动科技工程副总裁毛鸣明、芯动科技技术总监高专进行了专访,揭开了芯动科技由做半导体IP切入到做GPU背后的秘密。

以下为经过芯智讯整理后的采访实录:

问:可否简单介绍一下芯动科技的发展历程?为什么一开始会选择做IP?

敖钢:我回国以前主要是在美国硅谷及加拿大相关科研公司从事研发工作,从系统到芯片底层都有涉及,所以我回国后约了几个朋友和同学一起开始创业,一开始就是准备做芯片产品,但是我们的启动资金很少,只有几百万,当时资本对于半导体初创企业也并不感冒,我们找到中芯国际,希望能够在流片方面给予支持。在与中芯国际进行深入沟通之后,对方觉得我们做产品的话资金规模不够,但是认为我们的技术团队很不错,于是就建议我们来帮中芯国际来做半导体IP。比如,当时他们要买Synopsys一个过时两代的IP,据说都要上百万美金,中芯国际以及它的很多客户是难以接受这样的一个成本的。所以,我们就来帮助中芯国际来做IP,然后中芯国际给我们提供订单以及一些流片上支持。

△芯动科技公司副总经理敖钢

当时,中芯国际最先进的还是90nm工艺,我们那时就开始配合做IP。从最初的几个人、几个IP,经过15年发展到现在,我们已经有了五六百人的团队,数百个IP,进入了全球六大晶圆代工厂的各种工艺制程,而且我们的 IP 都在上面实现了量产,这是非常扎实的成绩,也是非常不容易实现的。

虽然做 IP 的产值其实是并不高的,但是 IP产业对于芯片市场有着100倍的撬动作用,对于终端电子产品市场更是有着600倍的撬动作用(芯智讯注:目前全球IP市场规模才50亿美元左右,但是它撬动了5000亿美元的芯片市场,30000亿美元的终端市场)。过去15年来芯动在IP领域的持续研发,是一个啃“硬骨头”的过程,在这个过程中,我们不但提升了团队的技术能力,而且跟全球六大代工厂有了非常好的合作关系。目前我们也是国内唯一能够同时拥有台积电和三星 5nm的设计量产资质的公司。

我们在IP领域通过15年的持续积累,与众多的晶圆厂及客户建立了深度互信的机制,同时我们也以自己的实际能力和成果证明了我们值得信赖。半导体行业是一个高门槛、高投入、高风险、长投资回报周期的行业,能够在这个行业一步步走出来是非常难的,这并不是“烧钱”就能够做到的。现在半导体投资非常热,各路资本蜂拥而至,炒起了很大的泡沫,我认为资本只能起到一个助推的作用,更多还是需要我们从业者长期扎扎实实的下功夫,真正把东西做好,这才是我们产业能够坚实往前发展的正常规律。

问:为什么会想到从做IP转向做GPU产品,为什么一进入这个市场就能很快推出了首款国产高性能4K级显卡GPU芯片?

敖钢:长期以来GPU都是国内的一个薄弱环节,国内也没有厂商在高性能GPU上实现突破。相对于CPU来说,GPU中的指令集要简单,但是计算核的数量多很多倍,所以GPU执行可并行度高的计算时会大幅度提高计算效率。一般来讲,GPU芯片中的逻辑门数量会比CPU多十倍以上,这是GPU系统复杂的原因之一。正因为GPU的系统设计更复杂,系统庞大,涉及面广,因此需要一个技术积累过程,如果从零开始设计架构不仅时间周期太长,而且涉及的专利非常多,基本上是行不通的。

为什么我们能够在短时间内就实现突破,成功推出“风华1号”?因为我们十多年来通过在IP领域的持续研发投入,早就把很多关键的IP给吃透了。比如我们的GPU产品当中就有我们GDDR6/6X、HBM2e/3、INNOLINK Chiplet等全自主国产高端技术支撑,还有大量海内外GPU专业人才回国加盟,再加上芯动科技做GPU设计选择了“站在巨人的肩膀上”,我们再把各个关键的IP整合在一起,形成一个新的产品,推出高性能4K图形 GPU独立显卡芯片——“风华1号”GPU,对于我们来说其实是水到渠成的事情。

很多芯片设计公司,芯片流片一回来,都要花很长时间才能够把它调通。而我们的“风华1号”流片回来两个晚上,我们就全部把它所有的信号都调通了,因为我们有很扎实的 IP 接口的技术,我们能够在里面做很多的设计,使之有很好的容错能力。IP是芯片设计领域的“明珠”,有着很多的技术难点,需要有非常扎实的基本功。一颗芯片的里面通常都有数十亿门的电路,里面哪个地方出错了,有时候根本就摸不清楚,没有长期的迭代和研发实力,是难以发现的。所以说芯片行业里面成败的关键还是要靠技术实力。

至于为什么从做IP转向了做GPU?正如前面提到的,IP产业的产值是比较低的,我们花很多的时间和精力做出一款好的IP,只能是拿一点授权费和设计服务费,是难以做大做强的。(芯智讯:毕竟像Arm这样的半导体IP市场的王者,如果以营收规模来看,Arm在2017年-2019年的营收分别为18.31亿美元、18.36亿美元和18.98亿美元,在整个半导体市场也只是一个中型规模的公司。比如Arm大客户联发科,2021年营收有望达到170亿美元。)特别是在现在半导体泡沫这么严重,行业内都在争夺人才,我们光靠做 IP是难以维持一个强大的技术团队的。所以,我们选择了从做IP切入到做产品。

首先,我们有很多的IP积累,我们也有做芯片设计的扎实技术,所以来做产品是有着一定优势的;其次,是选择做什么产品的问题。我们要找行业内的一些薄弱环节和痛点,以及这类产品是不是未来市场有着巨大需求潜力的。其实在推出风华一号之前,我们就为客户定制过类似GPU的产品,获得了非常好的效果。

我们既看到国内在GPU领域非常的薄弱,也看到GPU在未来市场的巨大需求,比如在高端服务器当中对于图形计算的需求,这个主要来自于5G云游戏等应用,还有像现在很火的“元宇宙”,这些需求背后也是需要大量的图形计算和渲染的能力支持。而我们的GPU产品开发出来,也正是为了响应这样的一个市场的需求。由于芯动科技现有这个架构支持openGL API,所以风华1号GPU在安卓云游戏上也会更具备优势,而且风华1号GPU跟ARM、X86服务器平台都能适配,对各种Linux、安卓和国产各种操作系统都能支持。

此外,在桌面GPU上,也有着较大的国产化的需求,所以我们希望能够推出一款国产化的桌面GPU,让国内用户享受到与英伟达显卡一样流畅的图形渲染体验。

问:对于芯动科技来说,做GPU产品的难点主要在哪?

毛鸣明:相对于CPU来说,GPU的系统设计更复杂,系统庞大,涉及面广,因此需要一个技术积累过程。由于做GPU设计的复杂度确实很大,架构从零开始设计的时间周期太长,涉及的专利太多,所以芯动科技做GPU设计选择了“站在巨人的肩膀上”,基于Imagination 的架构授权,推出高性能4K图形 PCI-E Gen4 GPU独立显卡芯片——“风华1号”GPU。得益于Imagination BXT架构的多核可扩展性,芯动能够为我们的客户打造量身定制、融合图形和智能计算的显卡芯片解决方案,以满足高端桌面和数据中心的需求。另外,由于现有这个架构是基于安卓开发的原生架构,风华GPU在安卓云游戏上也会更具备优势,而且跟ARM、X86服务器平台都能适配,对各种Linux、安卓和国产各种操作系统都能支持。

△芯动科技工程副总裁毛鸣明

当然,站在巨人的肩膀上能成功也必须自身够硬。凭借芯动在GDDR6/6X高速存储、缓存一致的多晶粒封装芯片(Chiplet)创新、以及高性能多媒体处理器优化等方面的坚实积累,进而去开发独立的的GPU显卡芯片是水到渠成的事情。

除了技术上的难点,GPU开发的另外几个难点是国内GPU人才稀缺,需要大量时间投入(2-3年或更长时间)和资金支持(几亿到十亿以上),这就需要企业脚踏实地、长期耕耘。当然,是行业的难点,也是我们的优势,一方面,我们是一个脚踏实地的公司,靠自己的自有资金在做国产GPU这件事业,主攻的产品方向也是贴近市场贴近客户的。另一方面,我们过往搞先进技术的过程中积累了相关方面的精英人才,而且近几年吸引招徕了不少海外GPU专家加入,所以在做GPU上,我们有很好的基础和不断创新迭代的能力。

问:未来芯动科技的GPU产品规划如何?

敖钢:老实说,我们的首款GPU产品“风华1号”只是一个开始,推出之后效果很好。我们下一步将会继续深耕两条产品线:一条产品线是消费类市场,一条是服务器市场。

消费类市场,我们准备一年出两颗芯片,每一代我们的性能都要翻倍。除了性能继续提升之外,我们还将会推出低成本、高性价比的产品。特别是在消费类市场,性价比很关键,这是我们非常擅长的。

在服务器市场,我们也会持续推出技术更先进、性能更强的产品,比如我们会采用Chiplet技术,这样可以突破工艺制程瓶颈的限制,更好地提升性能。

问:未来芯动科技的IP业务和GPU业务将如何平衡,是否会有侧重?

敖钢: IP 是一个赋能性的产业,对整个产业行业的生态的支持是非常大的。IP业务始终最是芯动科技的根,我们的根是不会断的。在 IP 行业里面,需要随着一代接一代的先进工艺进行提升,跨工艺跨晶圆制造厂,各方面的需求其实是非常多的,虽然不赚钱,但是我们也要去做,因为这个是对生态是有好处的;第二个方面,在做IP的过程中,我们的团队也得到了锻炼;第三个方面,如果我们把半导体产业看成是一座山的话,那么几个大代工厂,就是其中的战略制高点。我们在做IP支撑他们,那我们也同样会获得支持,这样我们就等于是可以在一个更高的平台上来做我们想做的事情;第四个方面,我们公司也要寻求发展,而且特别是现在这种半导体资本很热的情况下,我们如果想要有比较好的发展,那就需要去做有价值的产品,真正解决问题的问题。同时我们也是在用我们的产品告诉大家,我们敢用的自己的IP,我们的客户自然也更有信心。

问:现在国内其实不少的GPU创业公司,更多的选择是做GPGPU,主要做高性能AI计算,而我们芯动科技则选择的是做图形渲染类的GPU。如何看待目前国内国产 GPU 在这两个方向的发展?

毛鸣明:从GPU赛道来说,我最近看了一下,有十几家公司都在做GPU,如果细分一下,GPU赛道还可以分几个类别,我一般把它归为三类,AI、FP和渲染。AI大家比较熟悉,FP就是支持双精度的浮运算,这样可以做科学计算,渲染就是比较传统的做游戏、做桌面,做各种图形化应用。

目前很多GPU公司是从AI开始做,然后往双精度和渲染扩展,而我们芯动科技选择的赛道是从渲染开始做,然后再向双精度和AI扩展。这条路开始的时候比较艰难一点,渲染的复杂程度比较大,里面不光包括了类似于通信计算、GPGPU里面需要的计算核,它还包括了很多图形管线,包括从前端的几何(Geometry),纹理(texture)还有后面光栅化像素(Pixel)的处理,所以前面的挑战比较大, 后面的路就容易走了。

不过,从生态方面来看,从图形渲染方面入手,有很多业界成熟的标准的API,比如有OpenGL、OpenGL ES、DirectX、Vulkan等,不像在AI、FP领域,这一块完全是被英伟达一手打造的CUDA生态所垄断。虽然说图形渲染在技术层面来说相对复杂一点,但是好处就是接口API是标准化的,所以更多的是把API的接口支持做好,然后做很多性能的调优等,就可以切入到GPU图形渲染的市场,可以避免一上来就跟非常强大的CUDA生态PK的挑战。如果做GPU选择从AI、FP领域入手,会有比较大的生态方面的挑战。英伟达现在已经把自己定义成软件公司并建立了一个非常庞大的围绕CUDA的生态,目前GPU的AI市场也是他们硬生生开辟出来的道路。

从市场角度来说,目前GPU市场主要有三大公司,英伟达、AMD、英特尔(英特尔集显上面占有超过50%的市场份额,同时目前也在大力发展独显)。那么,如何在这个市场上面切入?我认为有两个方面:

一方面,就是顺势而为。因为现在在云上面的渲染需求呈现爆发式的增长,特别是最近火热的“元宇宙”概念,云端图形渲染还是比较新的赛道上,这一部分是比较适合芯动科技GPU的架构的。云端图形渲染还可以分为Windows赛道和安卓赛道,我们可能会选择一些比较适合我们架构特色的赛道,比如说安卓赛道。在云上面的应用,比如说虚拟化这些跟传统的市场有一定的竞争关系,云上面的运用越广越多,虚拟化越来越普及的话,就会蚕食现有的市场。如果大家都用虚拟化了,英伟达显卡可能需求就少了。所以,在这个上面我们可以抓住一些在架构上有优势和生态上有优势的点进行突破。

另一方面就是在比较传统的消费类市场方面,针对桌面PC、笔记本这些终端,入门级别的显卡市场,我们可以做一些国产化的市场,因为现在国产化的呼声也比较高,而且竞争非常激烈,而把性价比做好,打价格战规模战都是我们的优势。

基于我们的技术实力和顽强作风,芯动科技在芯片的快速迭代方面也是比较擅长的,我们用两到三年的时间就可以迅速切入这个市场,建立桥头堡。

敖钢:现在国产GPU概念确实比较热,很多公司宣布进入,但是我们的产品是最快推出来的,这其中不光是我们做得快,我们的布局也更早,只不过我们一直很低调,我们一直用结果说话,这是我们公司的一贯作风。

说到GPU的发展路径,其实图形渲染的难度更高,这相当于直接对标的是英伟达这样的公司,那是一块硬骨头。我们也认为现在市场的真正需求更多还是在图形渲染上。虽然它是个难点,但也是一个真正应用里面用的更多的。而 AI 技术市场,其实是个比较碎片化的市场。你可以看到,现在所有的 AI 的公司,没有几个能够真正做到盈利的。所以,我们芯动科技一惯是走市场化的道路,靠我们的产品和市场来生存,而不是玩那些虚的东西。因此我们做出来的产品一定是要能够真正满足市场需求的,而不是满足资本需求的。市场愿意付的钱才是可靠的,而投资人付的钱其实都是债。

Linkedin创始人雷德·霍夫曼曾有一个形象的比喻:创业就像是从悬崖上跳下,并在降落的过程中组装飞机。投资人的钱只能让这个坑越来越深,延缓飞机坠落的时间,到如果没能在着陆前把飞机组装好,那么掉下去后就会摔的更重。

问:能否具体介绍下,我们在做GPU之前,是否有相关的图形技术积累?

敖钢:其实我们早在2014年的时候就有在做图形方面的东西,当时我们做了一款ISP芯片,芯片做的非常成功,后来亚马逊把我们的部分技术收购。当时,我们是跟美国MIT出来的一个专门研究算法的团队合作,他们也是一个初创公司,对图形的算法的研究非常深入,准备做自己的芯片。当时就找到我们,他们有算法,我们有IP,也能够帮他们做后端服务,最终做出来的东西的效果很好,可是他们的市场能力不行,一直想做到谷歌Chromebook里面去,但是谷歌选择一个产品,通常准入周期很长,几年下来他们就熬不住了。

那个时候,我们看到他们的技术很好,就投资了他们,让他们去做系统产品,他们把图形算法相关技术转让给了芯动科技,由芯动科技来做芯片。后来,他们做出来一个视频监控产品,用两节5号电池,能够在低照度的情况下运行一年,这款产品成为了当年kickstar上最热的一款产品。后来,亚马逊注意到这款产品,认为它在仓储管理方面非常有用,最后,亚马逊收购了他们,我们又是他们的主要投资人,所以我们也成为了受益者。在这个过程中, 我们就积累了图形处理方面的技术。

 

问:除了GPU,我们还有做其他的产品吗?

敖钢:我们其实还有做PCIe switch和CXL等芯片,可以跟我们的GPU一起应用在数据中心市场。

(芯智讯注:PCIe Switch芯片在业界有广泛的使用,当CPU提供的PCIe通道数量不足时,可以通过PCIe Switch芯片来扩展系统中的PCIe通道数量。虽然PCIe Gen5已经将信号速率提升到32GT/s,但GPU卡、AI加速卡、新一代的网卡仍然需要较大的数据传输带宽。通过PCIe Switch芯片的扩展,可以让服务器整机上容纳更多的功能扩展插卡。)

问:芯动科技现在又做IP又做芯片产品,是否会和我们的原有客户构成竞争?

高专:首先我们我们开发出来的技术都是可以授权的,而不是用来独占的,我们并不需要把持一个独门暗器去抑制任何竞争对手。即使我们做产品,对IP客户的承诺是始终如一的,不会有任何变化。比如整个市场GPU就那么几家,我们没有和我们现有的任何一个客户有竞争关系,我们的赛道和方向,不管是IP还是定制芯片,还是GPU,都是基于客户有这方面的需求,我们愿意去投入,而不是为了拉投资,为了圈钱,我们做GPU也没有拿什么投资。我们认为,只要这个方向好,确实有应用场景,确实是有市场潜力的方向,就会去做。而且我们做任何一个方向,任何一个范围都是来自客户的需求,不管是在IP、定制芯片还是GPU等所有的业务方向,我们希望能够赋能整个芯片行业,希望帮助到中国国产芯片事业。

△芯动科技技术总监高专

毛鸣明:其实芯动科技做IP做了15年了,IP不是一个好做的活,门槛高,体量也有一定的上限,投入比较大,技术门槛高,产出也比较慢,但是它也很关键,因为它是一个赋能型的工作。我们提供一些好的IP,芯片设计厂商才可以做“轻设计”,真正将精力放到这个芯片核心的研发上面,而不要因为一大堆接口类的IP,被一些传统模拟IP浪费太多的精力。

另外,在半导体行业内,又做产品又做IP也是比较常见的。比如说博通做了那么多产品,但是也一直有卖高速接口IP,虽然不是专注的在做IP,但是一直有延续这个业务。还有业内知名的Rambus ,也是从IP授权开始,过去几年也有在做产品,在套片上做的也挺好。此外,像AMD也有做IP授权,比如之前把CPU IP授权给海光,还有将GPU IP授权给三星,集成到他们的Exynos处理器当中。做IP这个事情本身跟做产品没有根本上的矛盾,芯动未来会坚持做IP和GPU,我们这两条路都会走下去。

问:目前半导体领域资本非常的热,如何看待资本对于产业所带来的作用?

敖钢:我觉得这是一个很好的机遇,那大家应该形成合力,真正的去考虑怎么样去把产业做好,而不是我拿到钱,然后去挖你的墙角,但是我最后又做不出东西来,或者是变成一个非常浮躁的现象。前一段时间我跟澳大的学生座谈,我就跟他们说,我说那你们是处在一个最好的时代,也处在一个最坏的时代。最好的时代是你们现在一出去,你的工资很高;最坏的时代是,很有可能你做不了两年,你加入的公司就垮了。为什么呢?因为,如果员工创造不了应有的价值,那样的公司它存活不了多久。

对于投资者来说,玩击鼓传花的游戏也很危险,如果将投资半导体项目当做是一个金融产品,那就错了。因为半导体跟互联网是不一样的,如果用互联网的思维去做半导体,那么一定会亏得很惨的。因为互联网是软件,弹性比较大,它可以今天 1 万个用户,明天是 10 万个用户,后天是 100 万个用户,他能够很容易地去快速复制。但是每一颗芯片,你都是要掏钱,花真金白银做出来的。如果你的性能不好,就没有人会去买你的芯片,就会全砸在手上了。它不是一个不要钱就能够复制的东西,而且很容易形成赢家通吃的局面。所以对于行业来说,我们想说大家钱都不是捡来的,不要去乱搞,这对于行业来说也不是好事。

高专:现在半导体行业泡沫太大了,很多搞投资的和搞企业的都变得非常的不理智了。我们认为应该是稳步地发展,尽管做慢,但是我们愿意真的在芯片技术上耕耘,一步一步把这个事情做大,我们不希望“To VC”去做芯片。现在国内有2800多家芯片设计企业,我们这么多企业大浪淘沙,最后能活下来的不会这么多,最终谁能活下来,靠的就是你能不能脚踏实地,你今后的东西能不能落地。我们不希望芯片行业像得搞互联网一样,希望能够在这个行业做的深耕,持续的健康发展的企业,最后都能脱颖而出,为我们国产芯片做出贡献。

问:如何看待现在产能紧缺问题?

敖钢:为什么会产能不足?我认为一方面是疫情之下数字化转型加速,再加上5G、AI、智能驾驶等很多新的需求出来,对于晶圆的需求很多;另一方面,高性能计算需求越来越大,芯片的尺寸越来越大,这就会带来良率的问题,因为单价高、利润高,有的厂商30%的良率他都愿意做,这也造成了产能的浪费;此外,一些意外因素(比如地震、火灾、暴风雪等)以及新冠疫情影响,也导致了一些晶圆厂的产出减少;还有就是中美贸易摩擦,导致大家为了防止断链,纷纷提高库存水平,导致需求大涨。但是晶圆厂要提升产能却并不容易,这通常需要两三年时间。以上这些因素综合起来,导致了产能的紧缺。

另外,虽然现在很多的需求在那儿,但是需求很有可能会在一定周期的时候缩减,所以晶圆厂也不能够盲目扩张,芯片设计厂商也不能盲目扩大投片规模,拉高库存。在这种情况下,那如果认识不足的话,很多公司会跌进去的。

问:前面提到芯动科技与几大晶圆厂都有很好的合作关注,那么在产能紧缺背景之下,芯动科技是否可以帮助客户来解决产能问题?

敖钢:如果你发现了市场的机会,但是你缺乏芯片的设计能力,那我们 IP 公司可以来帮助你。如果你有芯片的设计能力,但是你发现产能有限制,拿不到产能,我们也可以帮助你。我们为什么能做到,因为我们跟这些代工厂就是一个长期的合作关系,我们既是他的技术提供方,又是他的客户。而且我们在各大晶圆厂都有大量的流片。比如说我们在2018年的时候,就是三星在中国最大订单客户。

问:芯动科技既然有着很好的产业链资源,是否有做一些生态上的布局?

敖钢:我们的 IP业务是一个服务性的平台,并且早在2015年在武汉就建立了一个光谷集成电路 IP 交易推广中心,希望能够将其作为先进制程的 IP 和芯片的定制服务平台。未来 IP 的发展趋势,首先是集成的复杂程度越来越高,工艺的难度越来越高。其次,我们已经处在后摩尔时代,需要去解决后摩尔时代的性能的瓶颈,比如在Chiplet上面,芯动有很多高速接口IP。我们希望搭建一个平台出来,以现在已经有的这种产业优势和生态优势,让更多的企业能够实现四个加速。

第一个是设计加速。芯片设计厂商有了可靠的 IP,它能够迅速整合;第二个量产加速。我们能够拿到产能,帮大家实现量产;第三,系统加速。芯动不仅在IP上有积累,也有系统的经验,甚至有产业经验,我们能把这样的经验用到帮助客户的芯片设计中去,大大加快它的产品推出;第四,投资回报加速。真正好的产品,我们甚至会愿意投钱来帮助企业一起来做,成功把产品推出来。

编辑:芯智讯-浪客剑

0

付费内容

查看我的付费内容