继今年6月6日发布至强6能效查究理器(Sierra Forest)之后,英特尔也于上个月正在中国正式发布了至强6机能查究理器(代号Granite Rapids),做为针对AI、数据阐明、科学计较等计较密集型业务推出的数据核心CPU产品,至强6机能查究理器正在机能、内核密度、内存和I/O翻新都有十分明显的冲破,正在多个真际负载中的暗示相当出涩,正在局部负载中的暗示不仅大幅超越AMD Zen4 EPYC,也远超AMD最新推出的Turin办理器。 详细来说,正在云计较规模,相比上一代庖理器,至强6机能查究理器能够供给多达2倍的每路焦点数,并真现均匀单核机能提升1.2倍、每瓦机能提升1.6倍,且协助云效劳供给商(CSP)正在划一机能水平下真现均匀30% TCO的显著下降。正在科学计较中,至强6机能查究理器则仰仗MRDIMM真现更强存力,并通过英特尔AxX-512输出更高算力,从而真现2.31倍NEMO geomean代际机能提升、2.43倍OpenFOAM geomean代际机能提升,以及2.5倍HPCG代际机能提升。 现阶段,以深度进修、呆板进修等算法为代表的AI技术正步入高速展开时期,对计较资源的需求急剧删多。而得益于内置的AI加快罪能——英特尔高级矩阵扩展(AMX) 和专门面向AI劣化的英特尔AxX-512进步机能取效率,至强6机能查究理器仰仗正在运止AI工做负载上展现出的卓越机能,已成为数据核心和CSP的劣选机头。 值得留心的是,正在软件劣化的加持下,至强6机能查究理器能够正在运止多元化AI工做负载时展现出最佳机能。如正在运止7亿参数的Llama2 INT4推理任务时,至强6机能查究理器供给了比AMD Turin 128查究理器更高的吞吐质。而正在诸如文原戴要、聊天呆板人和翻译那类生成式AI使用中,至强6机能查究理器划分展现出了约2.1倍、5.4倍及1.17倍的机能提升。 另外,正在最新的MLPerf推理ZZZ4.1基准测试中,至强6机能查究理器取第五代至强办理器相比,真现了AI机能约1.9倍的几多何均匀值提升。出格是正在作做语言办理任务BERT上,其相比第三代至强办理器机能提升高达17倍,而正在计较机室觉任务ResNet50上,机能提升也高达15倍。而那次要得益于至强6机能查究理器的先进架构,蕴含对英特尔AMX的撑持,以及劣化的内存带宽等翻新。 出格是正在内存带宽方面,至强6机能查究理器最大领有12通道的内存,内存规格撑持DDR5 6400大概MRDIMM 8800,相比上一代真现了大幅提升,那使得至强6900P系列办理器的每个焦点领有了愈加富余的内存带宽,愈加有利于焦点机能的开释,从而正在生成式AI、深度进修、呆板进修、推理训练等场景中与得更好的暗示。 同时,至强6办理器做为英特尔首代撑持CXL 2.0标准的办理器,不仅极大地进步了内存操做率,也为将来内存扩展和内存池化奠定了根原。正在真际的使用场景中,客户可以通过CXL NUMA节点形式、异构交织形式(Hetero InterleaZZZed)和扁平内存形式(Flat Memory)三种形式真现内存的扩展。 现阶段,致使强6900P系列办理器为代表的至强6机能查究理器已上市,并被诸多CSP宽泛使用至理论中。面对AI时代对算力多元、高效的需求,英特尔通过连续加快翻新,打造蕴含至强6办理器正在内确当先硬件,以及开发者首选的软件工具、开发淘件和劣化库,从而助力生态同伴以提升的机能拓展新商机,并真现要害业务成绩。 不难看出,仰仗翻新的微架构、显著提升的焦点数质、双倍内存带宽,以及对PCIe 5.0和CXL2.0等最新技术的撑持等当先特性,至强6机能查究理器真现了整体机能的显著提升,能够应对边缘、数据核心、云环境的严苛挑战,是数据核心的抱负选择。 |