英特尔在MLPERF客户端v0.6测试中宣布对NPU的全面支

日期：2025-05-09 浏览：

。这种成功标志着该行业首次在NPU的客户端设备上表现出大型语言模型（LLM）的性能。根据MLPERFCLCCLIENT V0.6的Intel测试结果，配备了Intelcore Ultra Series 2处理器的设备可以以不仅仅是人类阅读速度来生成与GPU和NPU的内容。 MLPERF客户端V0.6基于Llama2 7B模型，并测试了四个应用程序，以生成内容和摘要。英特尔展示了导致NPU和Intelated Intelarc GPU行业的业绩。在测试中，英特尔达到了最快的NPU响应时间 - 单词的第一代仅需1.09秒（即“第一个令牌延迟”），这意味着系统在收到提示后几乎立即开始。同时，NPU还达到了Intel Ang最高吞吐量，达到每秒18.55令牌，代表系统生成后续文本的速度并提供保证实时和顺利的交互式AI体验。关于MLPERF的NPU测试：MLPERFCLIENTV0.6是由MLCommons Alliance的成员共同生产的，参与者包括Intel，AMD，Microsoft，Nvidia和Qualcomm。此版本不仅在以前的GPU重点测试中持续存在，而且还首次为NPU添加了特殊的基准测试。在英特尔NPU硬件团队与OpenVino软件团队之间的密切合作伙伴关系中，Intelcore Ultra系列处理器已成为当前在最终试验中符合NPU测试标准的平台。

英特尔在MLPERF客户端v0.6测试中宣布对NPU的全面支

推荐阅读