芯来科技UX1030H发布:打造国产RISC-V高性能新标杆

芯来科技UX1030H发布:打造国产RISC-V高性能新标杆

2025年7月18日,在2025年RISC-V中国峰会次日的“高性能计算分论坛”上,国产RISC-V技术厂商芯来科技市场战略助理副总裁马越详细介绍了该公司最新推出的支持RVA23 Profile规范的高性能RISC-V 处理器IP UX1030H。马越称,该IP将助力打造国产RISC-V高性能新标杆。

RVA23 Profile规范,助力RISC-V高性能计算发展

作为全球唯一开放、可扩展的主流指令集架构,近年来RISC-V产业的发展迅速,成为了推动芯片自主化和架构创新的重要力量。

虽然,过去RISC-V架构主要是被应用在中低功耗的智能终端、物联网(IoT)处理器市场,并在对标Arm Cortex-A53/A55级别的通用计算场景中,实现从产品化到规模化部署。现在,随着RISC-V在高性能上的持续突破,也已经开始逐步从嵌入式的计算拓展到PC、汽车、存储、HPC/AI计算等更多高性能计算领域。根据SHD Group的研究数据显示,预计2031年,RISC-V的出货量将会超过200亿颗,市场占比达到25%以上。

在此基础上,市场正加速迈向对标Arm Cortex-A72甚至更高级别的中高端RISC-V处理器IP需求阶段,典型应用主要包括:边缘AI计算与语义识别引擎;智能汽车域控制器与车载虚拟化平台;高性能边缘服务器与工业智能设备;多核异构SoC中的主控核心或虚拟化运行环境等。

然而,由于高性能计算对稳定、标准、可扩展的CPU IP提出更高要求,这也给RISC-V在这些领域的突破带来了更多的挑战。

2024年10月份,RISC-V国际基金会批准了RVA23 Profile规范,通过统一 ISA 扩展,解决了RISC-V生态中存在的碎片化问题,为开发者提供了跨硬件平台的开发一致性,并增强了向量计算、浮点运算等高性能计算能力。 为RISC-V进一步开拓高性能计算/AI计算市场奠定了基础。

具体来看,RVA23规范的核心内容包括:

一是向量扩展 Vector Extension: 向量扩展加速了对计算密集型工作负载的处理,包括人工智能/机器学习(AI/ML)、密码学以及数据压缩/解压缩。它能够在移动设备和通用计算应用中带来更优的性能表现,并已成为 Android 平台上 RISC-V ABI 的基础要求之一。借助RISC-V Vector扩展标准,RISC-V在AI推理与并行计算场景中展现出更高的灵活性与性能潜力。

二是虚拟化扩展 Hypervisor Extension:虚拟化扩展为企业级工作负载提供了虚拟化能力,适用于本地服务器和云计算环境。这将加速基于 RISC-V 的企业级硬件、操作系统和软件工作负载的发展。此外,虚拟化扩展还可通过将安全组件与非安全组件分离,为移动应用提供更强的安全保障。

芯来科技市场战略助理副总裁马越指出,RISC-V作为开放指令集,其软件生态也正在快速完善,从工具链、编译器到操作系统、虚拟化和中间件,已逐步形成面向高性能应用的完整基础设施。而随着RVA23的推出,也为面向 Linux / Android 等复杂操作系统的 RISC-V 应用处理器,提供了统一的指令集特性规范,解决跨厂商RISC-V芯片生态的碎片化问题,支持软件的可移植性和标准化。包括Google、Red Hat、Canonical等关键厂商正在围绕RVA23构建下一阶段的系统软件支持。这也使得RISC-V产业携手共建标准化、生态兼容与稳定安全的高性能计算生态成为了可能。

芯来科技高性能RISC-V处理器IP UX1030H

作为中国本土RISC-V领军企业,芯来科技在2018年成立以来,从0到1自主研发了全系列的RISC-V CPU IP和子系统及SoC解决方案,已经完整构建了覆盖32位到64位、通用与专用并行发展的产品体系。目前芯来科技已拥有超过300家正式授权客户,累计出货量已经达到了数亿颗。

芯来科技在此次“高性能计算分论坛”上最新发布的高性能RISC-V处理器IP——UX1030H支持最新的RVA23 Profile规范,全面支持虚拟化及向量计算扩展,并在此基础上进一步提供对IOMMU和AIA(Advanced Interrupt Architecture)的支持,面向新一代高安全、高扩展性的应用场景,标志着国产RISC-V高性能处理器IP在生态融合与系统适配能力上迈出关键一步。

具体来说,UX1030H基于其自研的UX1000系列微架构平台,在原有成熟设计的基础上,进一步增强计算性能、并行能力和可扩展性,面向高性能RISC-V处理器的实际部署场景。该处理器采用3译码宽度乱序执行架构,12级乱序执行流水线,每周期最大支持6条标量指令与2条矢量指令并行发射。

UX1030H还支持RISC-V Vector 1.0标准,可配置最高256位(VLEN=DLEN=256)的向量处理能力,适用于AI推理、图像处理、信号分析等计算密集型场景。

内存方面,UX1030H支持L1 I/D Cache、ILM/DLM片上内存配置、Cluster Cache。

UX1030H在支持最新的RVA23 Profile规范的基础上,还额外提供了对IOMMU和AIA的支持。其中,IOMMU支持可实现外设访问隔离与内存管理能力,增强系统安全性与资源隔离能力。AIA支持则为RISC-V系统提供高性能、可扩展且支持虚拟化的中断处理框架,显著优化多核与虚拟化场景下的中断效率和灵活性。

这使得UX1030H不仅满足RVA23软件栈的基本运行要求,也具备支撑复杂虚拟化系统、高可靠设备接入和高并发中断调度的硬件能力,为Android在RISC-V架构上的广泛部署打下坚实基础。

此外,UX1030H支持多核扩展架构,单个Cluster最多可配置16个核心,支持可配置的I/O一致性接口,支持可配置的Cluster Cache,支持将集群缓存配置为Cluster Local Memory(CLM),并提供CLM接口,供集群内多个核心或其他计算模块共享访问,适用于面向高并发、高吞吐量系统的集群化部署需求。该设计为处理器在数据中心加速卡、智能汽车控制器及高性能边缘平台中的集成使用提供了可靠基础。

UX1030H还支持Linux通用操作系统运行模式与实时处理模式双模式运行配置,可在不同应用场景下灵活切换处理器特性,满足控制类任务的低延迟响应需求,同时也适配完整的操作系统和应用软件栈,适用于智能边缘、工业控制、车载计算等多样化场景。

UX1030H还提供了可配置IO一致性接口(IOCP),用于支持系统中多个外部主设备与处理器之间的数据一致性共享:支持外部 Master(如 NPU、加速器、PCIe 控制器、DMA 等)访问处理器Core和Cluster Cache;在不需软件干预的情况下保持缓存数据一致性;降低I/O访问延迟,提高异构系统的整体带宽与响应性能。

在具体性能表现方面,据芯来科技市场战略助理副总裁马越介绍,UX1030H在遵循Dhrystone Ground Rule,不启用内联优化(编译选项 -fno-inline)的前提下,Dhrystone跑分达到5.35 DMIPS/MHz;CoreMark跑分达到8.5 CoreMark /MHz。

马越表示,该成绩在同类RISC-V高性能内核中处于领先水平,充分体现出UX1030H在指令调度、执行通道、Cache体系与流水线深度设计上的综合优化能力。相较于部分依赖自定义指令集扩展以提升理论跑分的RISC-V处理器方案,UX1030H在标准RISC-V规范之内实现高性能输出,更利于后续操作系统、编译器、库文件等软件生态的直接兼容和长期维护。

同时,UX1030H内建的VPU(矢量处理单元)在图像计算、张量运算、加密等负载下提供了显著的性能加速能力。根据芯来科技公布的数据显示,UX1030H在Vcctor向量运算性能表现和Crypto加解密性能上都有着很大的提升。

UX1030H在运行虚拟机性能上的表现也非常不错。马越在现场也展示了UX1030H虚拟机运行Simulation的情况,可以同时运行3个虚拟机。

据马越介绍,目前UX1030H已进入客户导入阶段,多个合作项目正在进行SoC集成验证与平台适配。在T22工艺下可达1.6GHz。下图为UX1030H典型配置下的Floorplan示意图,展示其在面积优化与功能集成方面的布局特性。

马越指出,UX1030H的发布,进一步夯实了芯来和技在RISCVCPUIP产品线上的高端布局,强化国产自主IP供给,助力软件生态向通用计算平台快速迁移。未来,芯来科技将继续围绕通用处理、智能计算、安全隔离与虚拟化等方向推进产品演进,构建更完整、更具深度的RISC-V处理器生态,推动本土算力平台向高性能持续跃升。

编辑:芯智讯-浪客剑

0

付费内容

查看我的付费内容