片上纸互连技术
云AI让英伟达大获成功。如果Edge AI是一个全新的机会,那么哪些公司有机会成为赢家?
通用和专用的计算路线在业内讨论了很久,但话题其实伴随着多样和碎片化的应用场景。场景碎片化,产品碎片化。芯片呢?只能碎片化,专用化,不能通用化吗?通用计算的老大哥CPU和GPU的地位会不会被边缘化?未来通用计算和专用计算的关系会如何发展?
石清科技总裁俞欣告诉我们,为不同的应用程序设计架构是非常必要的。特定领域架构(DSA)处理器和芯片本质上是为了解决通用性和专用性之间的平衡和权衡问题。
“这里有两个主要前提。一个是端侧应用碎片化,一个是往往对功耗和成本要求很高。在这两个前提下,如何相对于某个场景保证足够的竞争力,满足成本和功耗的要求,同时兼顾足够的市场空间——这是每个公司都要面对的挑战,也是对产品定义能力的考验,”他强调。
虽然通用计算芯片可以覆盖边缘计算程序所需的所有运算,但在芯片架构可扩展性和性能方面,确实无法适应边缘需求的快速增长。通用计算和专用计算芯片已经呈现出融合发展的趋势。而且计算特性决定了边缘芯片和云芯片的区别,架构设计需要优化和定制。
灵犀科技副总经理华表示,两者应该是互补的,最好是融合的。专用计算芯片将包括通用计算的核心,如Arm或RISC-V等ip核,新型计算架构芯片,如类脑计算芯片,除了神经拟态核和神经网络核外,还包括通用Arm核。同时,通用计算芯片,比如最新的Arm芯片,也会内置一些IP核,用于传统的神经网络加速。异构融合芯片架构是发展的必然。
按照这种趋势,这意味着负责加速的特殊计算单元需要移入通用编程模型,创建通用处理器的压力始终存在。Imagination computing业务产品管理总监Rob Fisher表示,这主要是从通用处理器编程的易用性角度考虑的。当任务的规模或所需的性能远远超出一般解决方案的范围时,这种模式将受到限制。
他指出,GPU就是一个很好的例子。在实际应用中,将图形处理工作量卸载给GPU的优势是显而易见的,促进了高效图形处理器的自主开发。向量处理器越来越紧密地与CPU架构集成,允许计算任务的指令级加速。
雪狐科技副总裁赵小武表示,根据不同场景对功能和性能的不同需求,边缘的需求更加复杂,用一个通用的架构或平台很难满足大部分需求,因此会针对不同的应用场景进行专门的架构设计。通用计算芯片,如CPU,可用于性能要求低、算法变化快的部分;特殊计算芯片,如ASIC,可用于性能要求高、算法相对扎实的零件;FPGA可编程芯片可用于要求一定性能和算法灵活性的部分。
以智能交通领域的边缘计算为例,他表示,由于基本上是室外场景,环境复杂恶劣,既要满足AI大计算能力和低延迟的需求,又要满足可靠性和稳定运行。所以目前大部分边缘电脑都无法满足需求。只有使用室外基站同级别的芯片,为这个场景定制专用的大功率电脑,才能满足这些特殊场景的需求。
随着高性能计算和机器学习的兴起,异构处理器要处理的工作量急剧增加,因此在整个半导体行业建立一个开放的生态合作非常重要。
不久前,英特尔、AMD、Arm、高通、台积电等。已经联合成立了小芯片标准联盟,并推出了小芯片通用高速互连标准UCIe。在UCIe的框架下,互联接口标准已经统一,各种不同工艺、不同功能的小芯片芯片有望通过2D、2.5D、3D等多种封装方式集成在一起,各种处理引擎将形成超大规模的复杂芯片系统。
NVIDIA一方面在上个月的GTC22上宣布支持UCIe规范,另一方面宣布开放其面向半定制芯片的NVLink-C2C互连技术,这是一种支持内存一致性的芯片到芯片和芯片到芯片的互连技术。这条路线已经很清楚地展示了英伟达的异类决心。按照这个计划,理论上甚至有可能把英伟达的芯片和竞争对手的芯片放在同一个封装里。
黄仁勋告诉我,他首先喜欢PCIe,其次是UCIe,并预测UCIe的好处将在五年内逐渐显现。至于英伟达自己的NVlink互联技术,他强调其优势在于直连能力。UCIe不能直接访问芯片,还是外设接口;NVlink的优点是可以直接连接,几乎就像直接连接大脑一样。这在一定程度上可能导致其组装复杂,合作伙伴和客户必须非常了解NVlink。但是,一旦他们能够很好地做到这一点,他们就可以充分利用芯片内部的所有资源,就好像他们都在同一个芯片上一样。
这一回答不仅表明了英伟达并不打算将自己排除在UCIe联盟之外,也表明了其对自己的NVLink互联技术的绝对信心,并且推测该技术也将成为英伟达构建异构生态的关键。
边缘计算市场的巨大潜力自然吸引了云芯片巨头的竞争。他们正在通过异构计算、先进制造工艺和先进封装进行全面布局。再加上生态壁垒高,国内AI芯片厂商还有机会竞争吗?
“能建摩天大楼的,不一定擅长雕梁画柱。当然,相对于目前云的高度垄断和中心化的格局,边缘端没有确定的格局,每个人都有机会,而技术能力和落地能力更强的厂商会有更大的机会在竞争中脱颖而出。”石清科技的于欣表示,“云边缘在某些场景下进行整合和合作是有意义的,但从芯片设计的角度来看,这仍然会有很大的不同。”
灵犀科技的华认为,异构计算、先进制造工艺、先进封装都是手段,不能从根本上解决能效比高、小样本学习、在线学习的问题。在产业导向和市场需求的驱动下,冯诺依曼架构和非冯诺依曼架构的异构融合将成为驱动边缘计算技术创新和未来产业高质量发展的核心引擎。
一方面,基于冯诺依曼的芯片仍在“暴力计算”的审美方向,会考虑采用最先进的工艺和封装来提高计算能力;另一方面,非冯诺依曼架构优先考虑通过架构创新大规模使用生物神经网络、类脑方向和新型混合神经网络。以类脑计算为代表的新型计算架构将与传统计算架构深度融合,引领新一轮技术变革。
雪狐科技的赵小武表示,行业头部厂商已经开始用小芯片拼凑大芯片来完成产品布局,以满足不同场景的计算需求。比如苹果和英伟达已经开始采用这种“积木”的方式,这是一个非常明显的趋势。
这两年国内市场非常火热,发展很快,但是有规模和竞争力的厂商并不多。“芯片还是一个需要积累的行业,产业链比较长”,赵小武说。“目前国内形式小而多,不利于与上下游争夺话语权。预计未来1-2年将会有一波AI芯片厂商被淘汰。”
艾欣袁志创始人、董事长兼首席执行官邱也表达了类似的观点。她表示,这对国内芯片行业来说是千载难逢的机遇。由于市场需求和国家支持,出现了很多创业型公司。从宏观环境来看,我国芯片产业还处于起步阶段,呈现百花齐放的态势,但随着行业的不断发展壮大,后续的行业整合也将是一个必然的过程。
她强调,这符合过去几十年芯片行业的发展规律。这样的整合之后,行业内肯定会出现头部企业,这对国家整体的产业发展非常重要。只有这样,中国企业才有机会和国际厂商同台竞技。
灵犀科技华表示,边缘AI芯片市场还是开放的,没有绝对的霸主。新兴且多样化的应用场景为国产AI芯片带来了巨大的市场机会,尤其是在自动驾驶、智能安防、智能物联网、可穿戴设备等日益碎片化的市场。国内AI芯片厂商和国际巨头芯片厂商在同一起跑线上,甚至在某些领域有优势。
正如计算架构领域的一位著名科学家所说,现在是芯片架构的黄金时代,这是前所未有的。虽然CPU和GPU会不断创新,在一些计算任务中不可或缺,但AI加速计算和数据爆炸的趋势催生的新市场一定是巨大而多样的,这给AI芯片公司带来了新的机遇。
从CPU的角度来看,x86架构已经有松动PC和服务器霸主地位的迹象,Arm也从手机和IoT逐渐上移到PC和服务器领域。RISC-V也是从物联网设备入手,布局更多设备。冯诺依曼架构和非冯诺依曼架构的异构集成正在走向规模化...
每一次技术浪潮都会产生新的领先公司。边缘会不会AI?