公司
解决方案
开发者
支持
Search
CN
CN
Ampere Computing Logo
解决方案
解决方案主页
平台系统
解决方案
性能总览
White Papers Coming Soon!
工作负载简介概览
Tuning Guides Overview
如何购买
Ampere 系统
Ampere Altra
Azure
Equinix
甲骨文
腾讯云
谷歌云
Ampere AI 下载工作原理常见问题
开发者
开发者中心部署云应用使能开源社区把数据用起来构建云应用设计云应用
Search
Cloud Computing Solutions

x265 工作负载简介

一种用于编码视频流的开源软件库和应用程序。

Print
Download
Ampere—赋能未来
在 AMPERE ALTRA MAX 处理器上部署 X265
在AMPERE ALTRA MAX 处理器上运行 X265 的收益
Ampere Altra Max 处理器
基准测试配置信息
视频编码性能
视频编码性能 – 插槽级别的扩展性
视频编码能效
视频编码的每瓦性能
基准测试结论
参考信息
Ampere—赋能未来

Ampere® Altra® 和 Ampere® Altra® Max 处理器是为云原生应用构建的完整片上系统 (SOC) 解决方案。 Ampere Altra Max 最多支持 128 个内核。 除了提供大量高性能内核外,其创新架构还提供可预测的高性能、线性扩展和电源效率。

在线视频市场持续快速增长,推动了视频转码压缩的应用,这样可以大大减少存储空间和网络带宽。Ampere Altra Max提供行业领先的性能和能效,非常适合用于 x265 的视频转码。

在 AMPERE ALTRA MAX 处理器上部署 X265

Ampere Altra Max 旨在为视频编码等应用提供卓越的性能和能效。我们使用 x265,它实现了 H.265/MPEG-H Part2 标准,这是当今仅次于 H.2641,2 的第二广泛使用的视频编解码器。此前,我们曾报道过在 Ampere Altra Max 3,4 上运行 x264 的行业领先性能和能效。与 x264 相比,更高级的视频编解码器(如 x265)提供更大的视频压缩,同时也需要更大的计算资源和功耗。

Ampere Altra Max 采用创新的架构设计,以一致的频率与单线程内核运行,使应用程序更能抵抗“相邻干扰”问题,保证工作负载以可预测的方式或最小的差异下运行,同时有非常出众的能效表现。最近针对 aarch64 架构的 x265 性能优化有了显著提升。在出色的硬件平台上运行优化的x265软件赋予了 Ampere Altra Max 领先的性能和能效,高性能与低功耗兼得。

在AMPERE ALTRA MAX 处理器上运行 X265 的收益

云原生:Ampere Altra Max 专为云原生应用用户而设计,Ampere Altra Max 处理器非常适合使用 x265 等应用在云中进行视频编码。

可扩展性:凭借创新的横向扩展架构,Ampere Altra Max 处理器具有高内核数和令人称叹的单线程性能,以及所有内核的一致频率,可在插槽级别提供更高的性能。

能效:行业领先的能效使 Ampere Altra Max 处理器的原始性能达到具有竞争力的水平,同时消耗比竞争对手低得多的功率。

Ampere Altra Max 处理器
  • 128个 64-bit内核,最大主频3.0 GHZ
  • 单核 64 KiB i-Cache, 64 KiB d-Cache
  • 单核 1MiB L2 Cache
  • 16MB SLC (System Level Cache)
  • 一致性网格互联架构

内存

  • 8x72 bit DDR4-3200 channels
  • 支持ECC & RAS
  • 最大可配 16x DIMMS (2 DPC) 和 4TB 内存容量

外部连接

  • 单颗CPU提供128路 PCIe Gen4
  • 支持双路一致性互联
  • 4x16路 CCIX协议通道

系统

  • Armv8.2 指令集,SBSA Level 4认证
  • 高级电源管理模块

性能

  • SPECrate®2017Integer Estimated: 350
基准测试配置信息

我们评估了 Ampere Altra Max M128-30 处理器与 Intel® Xeon® Platinum 8380(Ice Lake)和 AMD EPYC™ 7763(Milan)的 x265 性能。我们使用带有 4.18 内核的 CentOS 8.4,使用多个 x265 预设条件(中等、较慢、非常慢和安慰剂)和具有不同分辨率(480、720 和 1080)的视频输入来运行测试。为了最大限度地提高平台吞吐量,运行多个 x265 实例,数量等于插槽上可用的 CPU 内核数,每个实例使用一个线程。为了最大限度地减少操作系统开销,x265 二进制文件、输入和输出文件存储在 RAM 磁盘上。我们在所有平台上使用 gcc 11.2 构建了最新可用版本的 x265,[此处] https://bitbucket.org/multicoreware/x265_git)下载。有关其他详细信息,请参阅下面的其他基准测试详细信息描述。

视频编码性能

与 Intel® Xeon® Platinum 8380 (Ice Lake) 和 AMD EPYC™ 7763 (Milan) 相比,Ampere Altra Max 运行 x265 的性能最高。 图 1 显示,取 3 个不同输入视频中的性能平均值,对测试的所有 x265用例,Ampere Altra Max 始终比 x86 平台更快。 我们可以看到与 Intel® Xeon® Platinum 8380(Ice Lake)相比,Ampere Altra Max 的平均编码速度提高了 2.0 至 2.5 倍,与 AMD EPYC™ 7763(Milan)相比,Ampere Altra Max 的平均编码速度提高了 1.1 至 1.3 倍。

x265 Performance: Ampere Altra Max vs legacy x86 platforms
视频编码性能 – 插槽级别的扩展性

在图 2 中,我们绘制了聚合 FPS 与同时运行的 x265 实例的数量。Ampere Altra Max 展示了出色的平台扩展能力,从 1 到 128 个内核呈线性扩展,突出了 Ampere Altra Max 创新的横向扩展架构。Intel® Xeon® Platinum 8380 处理器(Ice Lake),40 个物理核心,AMD EPYC™ 7763(Milan),64 个物理核心,整体性能较低,使用超线程运行时,扩展性差,此特征非常明显。

x265 Aggregate FPS vs. # of Jobs - 1080 input
x265 Aggregate FPS vs. # of Jobs - 720 input
视频编码能效

除了最佳的视频编码性能外,Ampere Altra Max 还是最节能的处理器,可减少视频编码的碳足迹。 图 3 显示了 Ampere Altra Max 在插槽级别的平均功耗,其功耗是Intel® Xeon® Platinum 8380 处理器(Ice Lake)的 0.79%-0.81%,是 AMD EPYC™ 7763(Milan)的 0.79%-0.80%。

x265 Average Power Consumption
视频编码的每瓦性能

凭借行业领先的性能和能效,Ampere Altra Max 可提供出色的每瓦性能。 图 4 显示了 FPS/Watt(相当于帧/焦耳),与 Intel® Xeon® Platinum 8380 处理器(Ice Lake)相比,Ampere Altra Max 的 FPS/Watt 提高了 2.5 – 3.1 倍,相比AMD EPYC(霄龙)7763(Milan)FPS/Watt 提高了 1.4 – 1.7 倍。

x265 Average FPS/W Improvement
基准测试结论

Ampere Altra Max 处理器是一个完整的片上系统 (SOC) 解决方案,专为云原生工作负载而构建,旨在为使用 x265 的视频编码等应用程序提供卓越的性能、更大可扩展性和更高能效。 h.265 压缩标准是当今使用第二广泛的视频格式,仅次于 h.264,x265 是 h.265 的主要实现。我们之前展示了 Ampere Altra Max 在运行 x2643,4 时提供了行业领先的性能和能效。 在这里,我们展示了 Ampere Altra Max 在运行 x265 时提供了行业领先的性能和能效。更高级的视频编解码器(例如 x265)需要更大的计算资源和功耗提供更大的视频压缩,非常适合在高性能低功耗的Ampere Altra Max 处理器上运行。

与Intel® Xeon® Platinum 8380 处理器(Ice Lake)相比,Ampere Altra Max 的编码性能提高了 2.5 倍,能源效率提高了 1.2–1.3 倍,FPS/Watt(相当于焦耳/帧)提高了 3.1 倍。与 AMD EPYC™ 7763(Milan)相比,Ampere Altra Max 的速度提高了 1.35 倍,能源效率提高了 1.2-1.3 倍,FPS/Watt 提高了 1.7 倍(相当于焦耳/帧)。除了提供最快的视频编码之外,Ampere Altra Max 还提供可预测的高性能,可从 1 到 128 个内核线性扩展,其高能效的设计能显著减少视频编码计算所产生的碳足迹,以最高性能水平完成 x265 进行编码,同时不影响能源效率。

参考信息
  1. Rethink Technology Forecast
  2. BITMOVIN Video Developer Report 2021
  3. Overwhelming Cloud Native Processor Leadership with Ampere Altra Max
  4. Ampere Altra Max Delivers Industry Leading x264 Video Transcoding Performance and Power Efficiency
  5. Ampere Altra Max Delivers Sustainable High-Resolution H.265 Encoding

Ampere Computing

4655 Great America Parkway

Suite 601 Santa Clara, CA 95054

Tel: +1-669-770-3700

info[at]amperecomputing.com

关于我们
image
image
© 2022 Ampere Computing LLC. All rights reserved. Ampere, Altra and the A and Ampere logos are registered trademarks or trademarks of Ampere Computing.