(来源:华为计算)
不改业务代码,性能大幅提升?在鲲鹏920新型号处理器上,鲲鹏BoostKit虚拟化套件通过全栈调优,实现了计算、存储、网络的系统级进化:计算侧通过拓扑亲和与绑核优化,使虚机性能逼近裸机;存储侧深度优化I/O中断发送流程,延迟大幅降低,吞吐能力全面提升;网络通过多队列负载均衡,带来超低损耗。无需业务代码改造,让虚拟化平台性能全面跃升,即刻释放极致算力。
在企业上云与资源池化的浪潮中,虚拟化是底座,也是瓶颈。然而,尽管虚拟化技术已经相当成熟,其在计算、存储、网络三大核心环节中依然存在损耗难题:
计算性能衰减:虚拟化层次切换与指令陷入频繁,导致OS调度能力下降,处理器有效算力无法充分释放。
存储 I/O 开销高:多层虚拟化路径叠加与中断处理引入额外开销, I/O 性能损失明显。
网络队列不均衡:虚拟网卡多队列调度难以均衡利用 CPU 资源,部分队列热点过载,造成网络延迟升高与带宽利用不足。
这意味着,企业投入了同样的硬件成本,却无法获得预期的性能回报。如何打破这一僵局?
鲲鹏BoostKit虚拟化套件(BoostVirt)基于鲲鹏920新型号处理器,创新性提出三大硬核优化手段,把“损耗”变成“算力”,让虚拟机性能直逼物理机!
硬核拆解:三大绝招击破性能瓶颈
计算优化:给调度装上“导航”,Unixbench提升20%+
问题:在传统的虚拟化场景中,虚拟机(VM)就像一个“路痴”。由于缺乏底层的拓扑信息(SLIT表),VM视角里访问所有NUMA节点的距离是一样的。这导致操作系统将线程随机调度到任意NUMA节点上,频繁出现“跨远端内存访问”,时延骤增,性能大幅下滑。
鲲鹏解法:拓扑亲和与精确绑核
鲲鹏BoostKit通过向虚拟机注入真实的物理拓扑信息(包含NUMA distance和Cluster拓扑),让VM拥有了“导航”。
精准调度:VM操作系统能根据实际访存距离,就近调度线程,大幅减少跨NUMA访问。
1:1绑核: 配合1G大页内存与1:1绑核模式,彻底释放CPU潜能。
虚拟机物理机优化效果:实测显示,优化后Unixbench跑分提升20%以上,计算虚拟化损耗大幅降低。
存储优化:拒绝“中断风暴”,损耗降至5%以下
问题:存储性能测试(如FIO)显示,普通虚拟化损耗高达20%左右。症结在于virtio-blk机制:每完成一个后端请求就向VM发送中断。高并发下,海量中断导致VM频繁退出以响应中断,大量算力被浪费在“处理通知”上,而非“处理数据”上。
鲲鹏解法:中断直通 + 聚合降噪
硬协同: 基于鲲鹏处理器开启GICv4.1,将虚拟中断直通虚拟机,避免繁琐的陷入陷出
软优化: 智能感知I/O请求,对中断进行“聚合打包”处理。减少中断次数,把CPU算力还给业务。
优化效果:
中断次数从16万骤降至2万。
Virtio单次I/O读取耗时占比从40%降至2.5%。
Guest可用算力从93.3%提升至99.2%。
整体存储虚拟化损耗降至5%以下。
网络优化:智能负载均衡,消除单核瓶颈
问题:使用iperf测试时发现,网络带宽和包率损耗均超过15%。经排查,这是OVS-DPDK模型中的“偏科”现象导致的:两条数据流可能挤在同一个PMD轮询核上,该核算力被吃满(99%),成为瓶颈;而其他核却在围观。
鲲鹏解法:PMD Auto Rebalance
鲲鹏BoostKit引入了智能负载均衡机制。OVS侧能自动统计每个PMD轮询核的压力,并动态重新分配任务。配合虚拟设备中断直通技术,就像给网络流量配备了“智能交警”,确保每条车道都畅通无阻。
优化效果:有效降低轮询核单核压力,成功将网络虚拟化损耗降低到5%以下。
实践场景:算力更强、数据更快!
大规格虚拟机场景:降低调度开销,释放算力
在企业云基础设施建设过程中,随着业务系统规模不断扩大,单实例往往需要更多计算资源来支撑复杂负载。当虚拟机vCPU数量不断增加时,调度开销会呈指数级上升,鲲鹏BoostKit提出的拓扑感知与亲和调度优化机制可以有效降低大规格虚拟机的调度开销与跨节点访问延迟,使可用算力资源占比达到95%以上。
云数据库平台场景 :高并发数据读写方案
在公有云数据库(如MySQL、PostgreSQL、GaussDB)的主从同步或集群复制中,数据写入与网络复制链路往往同时成为瓶颈。结合鲲鹏BoostKit存储中断聚合调优,实现用户态高性能块设备访问,配合DPDK网络均衡调优,大幅减少内核态切换和中断延迟,实现写入延迟降低20%、复制带宽提升15%。
快速上手:体验鲲鹏虚拟化加速套件,轻松释放多核潜能
获取方式:访问 鲲鹏社区 -> 鲲鹏BoostKit虚拟化,获取相应鲲鹏优化补丁。
安装部署后,即刻释放多核极致潜能!