英特尔发布全新高级性能指令集APX,开启AVX10时代
【本站】7月25日消息,英特尔今日发布了全新的高级性能扩展指令集(APX),并推出了即将为 P 核和 E 核提供统一 AVX-512 支持的新型 AVX10 指令集,为未来的消费者和服务器处理器带来了新的矢量 ISA 选择。
AVX10是AVX-512的超集,包含了256bit和512bit寄存器大小的所有AVX-512指令集功能。这一新的指令集将使得搭载P核和E核的英特尔芯片都能支持AVX-512,尽管512bit版本的指令只能在P核上运行,而256bit的AVX-256模拟指令集则可以同时在P核和E核上运行。 据本站了解,AVX10将包括带有AVX512VL功能标志的AVX-512矢量指令、最大矢量寄存器长度为256bit以及八个32bit掩码寄存器,以及支持嵌入式舍入的新256bit指令。这个版本可以在P核和E核上运行,不过E核限制为最大256bit长度,而P核则可以使用完整的512bit矢量。
英特尔表示,现有应用程序在AVX10上的性能与AVX-512相同,至少在相同的矢量长度上。此外,经过重新编译为AVX10后,英特尔AVX2编译的应用程序无需额外软件调整即可实现性能提升。新增的16个矢量寄存器和新指令使得对矢量寄存器压力敏感的英特尔AVX2应用程序可以获得大幅性能提升。高度线程化的可矢量化应用程序在使用基于Intel Xeon E内核的处理器或具有混合架构的Intel产品时,可能实现更高的总吞吐量。
据悉,英特尔将从第六代Xeon“Granite Rapids”芯片开始支持AVX10首个版本(AVX10.1),但该版本只支持512bit矢量指令,而不是新的256bit矢量指令。未来所有的Xeon处理器将继续支持完整的AVX-512指令,以确保传统应用正常运行。随后的AVX10.2将支持256bit矢量长度和其他新功能,如新的AI数据类型和转换、数据移动优化和标准支持。 为了解决开发者的担忧,英特尔还计划为AVX10实现与AVX-512相比大大简化的枚举方式,并确保每次转向新修订版时都有足够的新指令和功能值得升级变,从而减少版本和枚举膨胀。这一举措将有助于提升新指令集的应用和推广,进一步推动英特尔处理器在未来的性能和功能上取得新的突破。 |