如何在资源有限的边缘端实现高效AI? Cadence发布DNA 100和HiFi 5两款全新DSP IP-PCB抄板

联系方式

地　址：深圳市龙岗区南湾街道平吉大道1号建昇大厦B栋1605号（李朗软件园对面）
联系人：周工
电　话：0755-88820678
传　真：
信　箱：498187676@qq.com

欢迎新老朋友来电洽谈业务！

如何在资源有限的边缘端实现高效AI? Cadence发布DNA 100和HiFi 5两款全新DSP IP

[导读]强化端侧AI体验，DSP需要有更高效的结构。Cadence的DNA 100和HiFi 5分别面向视频和语音识别的NN算法加速，通过稀疏计算引擎来实现高效高性能。想要实现更有效率的人工智能体验，很多工作都需要在设备端直接完成。在视觉识别和语音助手这两大热门应用中，常常都会见到DSP的身影;而Cadece的Tensilica系列DSP产品，一直受到华为等诸多厂商的喜爱。近日，Cadence在北京召开了发布会，发布了全新的DNA100和HiFi5的产品。作为Vision系列和HiFi系列的最新产品，有何高明之处?Cadence公司IP事业部Tensilica资深产品总监Lazaar Louis先生和IP事业部Tensilica技术营销总监Yipeng Liu进行了详细的讲解。

DNA100: 通过稀疏计算引擎实现高效人工智能结构

Cadence最新发布的DNA 100是其首款神经网络加速器IP，作为端侧的运算单元，功耗仍然是客户非常敏感的指标;从0.5到数百TMAC均可实现高性能和高能效。换言之，不论是电池驱动的小型IoT设备，还是譬如手机等多核处理器中，DNA 100均可发挥巨大作用。

相较其它采用相似阵列尺寸大小的乘法累加运输商解决方案，DNA 100的性能提升高达4.7倍，每瓦性能提高2.3倍。据悉，这种性能提升和功耗的降低得益于其采用了稀疏计算引擎。“神经网络的特征在于权重和激活函数的固有稀疏度，加载和乘以零会早晨其它处理器不必要的MAC消耗。DNA 100移除了这两项任务，利用稀疏度提高能效并降低计算量。神经网络再训练有助于提高网络的稀疏度，并通过DNA 100处理器的稀疏计算引擎实现最高性能。DNA 100处理器能够利用更小的阵列实现最大吞吐量。作为例证，4K MAC配置环境下，ResNet 50推理性能预计能实现每秒高达2550帧(fps)和3.4TMAC / W(在16 nm工艺)。”

上一篇：什么是单片机？51单片机学前预备知识

下一篇：明年就能双剑合璧！AMD展示7nm GPU+CPU数据中心