盖世汽车讯 由于担心全球人工智能GPU短缺,边缘人工智能初创公司耐能(Kneron)认为其神经处理单元(NPU)技术有机会成为有竞争力的替代方案。据外媒报道,该公司宣布发布最新KL730 NPU,其能效比之前的型号高出四倍。 新芯片旨在加速GPT、基于Transformer的AI模型。
图片来源:耐能
耐能的芯片主要针对边缘应用,例如自动驾驶汽车以及医疗和工业应用。受益于高通和富士康的支持,耐能将Quanta部署在边缘服务器中。
耐能创始人兼首席执行官Albert Liu表示:“与GPU相比,NPU拥有更多的内核。其核心效率更高,并且更专注于细致入微的连接。”
Kneron NPU内部技术
耐能的芯片使用可重新配置的AI架构来加速AI,与GPU中使用的架构不同。KL730的架构还针对GPT基于Transformer的AI模型进行了专门优化。
Kneron在NPU市场上享有盛誉
KL730并不是耐能第一款针对变压器进行优化的芯片。两年前,耐能就发布了具有这种功能的KL530芯片。耐能芯片中变压器模型的最初用例是帮助自动驾驶汽车制造商。Liu表示,Transformer模型对于实时时间相关性检测用例非常有帮助。
KL730的级联能力
凭借新的KL730,耐能对其NPU芯片的性能进行了一些显着的改进,包括集群。因此,如果单个芯片不足以满足特定用例,则多个KL703可以集群部署。
虽然耐能的芯片目前主要用于推理用例,但Liu希望将多个KL730组合在一起,使该技术更广泛地用于机器学习(ML)训练。
【以上内容转自“盖世汽车”,不代表本网站观点。 如需转载请取得盖世汽车网许可,如有侵权请联系删除。】
延伸阅读: