英特尔在MLPERF客户端v0.6测试中宣布对NPU的全面支

日期:2025-05-09 浏览:

。这种成功标志着该行业首次在NPU的客户端设备上表现出大型语言模型(LLM)的性能。根据MLPERFCLCCLIENT V0.6的Intel测试结果,配备了Intelcore Ultra Series 2处理器的设备可以以不仅仅是人类阅读速度来生成与GPU和NPU的内容。 MLPERF客户端V0.6基于Llama2 7B模型,并测试了四个应用程序,以生成内容和摘要。英特尔展示了导致NPU和Intelated Intelarc GPU行业的业绩。在测试中,英特尔达到了最快的NPU响应时间 - 单词的第一代仅需1.09秒(即“第一个令牌延迟”),这意味着系统在收到提示后几乎立即开始。同时,NPU还达到了Intel Ang最高吞吐量,达到每秒18.55令牌,代表系统生成后续文本的速度并提供保证实时和顺利的交互式AI体验。关于MLPERF的NPU测试:MLPERFCLIENTV0.6是由MLCommons Alliance的成员共同生产的,参与者包括Intel,AMD,Microsoft,Nvidia和Qualcomm。此版本不仅在以前的GPU重点测试中持续存在,而且还首次为NPU添加了特殊的基准测试。在英特尔NPU硬件团队与OpenVino软件团队之间的密切合作伙伴关系中,Intelcore Ultra系列处理器已成为当前在最终试验中符合NPU测试标准的平台。

0
首页
电话
短信
联系