联系方式
地 址:深圳市龙岗区南湾街道平吉大道1号建昇大厦B栋1605号(李朗软件园对面)
联系人:周工
电 话:0755-88820678
传 真:
信 箱:498187676@qq.com


欢迎新老朋友来电洽谈业务!

PCB抄板 >> 行业新闻 >> 当前位置
如何在资源有限的边缘端实现高效AI? Cadence发布DNA 100和HiFi 5两款全新DSP IP
[导读]强化端侧AI体验,DSP需要有更高效的结构。Cadence的DNA 100和HiFi 5分别面向视频和语音识别的NN算法加速,通过稀疏计算引擎来实现高效高性能。 想要实现更有效率的人工智能体验,很多工作都需要在设备端直接完成。在视觉识别和语音助手这两大热门应用中,常常都会见到DSP的身影;而Cadece的Tensilica系列DSP产品,一直受到华为等诸多厂商的喜爱。近日,Cadence在北京召开了发布会,发布了全新的DNA100和HiFi5的产品。作为Vision系列和HiFi系列的最新产品,有何高明之处?Cadence公司IP事业部Tensilica资深产品总监Lazaar Louis先生和IP事业部Tensilica技术营销总监Yipeng Liu进行了详细的讲解。

DNA100: 通过稀疏计算引擎实现高效人工智能结构

Cadence最新发布的DNA 100是其首款神经网络加速器IP,作为端侧的运算单元,功耗仍然是客户非常敏感的指标;从0.5到数百TMAC均可实现高性能和高能效。换言之,不论是电池驱动的小型IoT设备,还是譬如手机等多核处理器中,DNA 100均可发挥巨大作用。

相较其它采用相似阵列尺寸大小的乘法累加运输商解决方案,DNA 100的性能提升高达4.7倍,每瓦性能提高2.3倍。据悉,这种性能提升和功耗的降低得益于其采用了稀疏计算引擎。“神经网络的特征在于权重和激活函数的固有稀疏度,加载和乘以零会早晨其它处理器不必要的MAC消耗。DNA 100移除了这两项任务,利用稀疏度提高能效并降低计算量。神经网络再训练有助于提高网络的稀疏度,并通过DNA 100处理器的稀疏计算引擎实现最高性能。DNA 100处理器能够利用更小的阵列实现最大吞吐量。作为例证,4K MAC配置环境下,ResNet 50推理性能预计能实现每秒高达2550帧(fps)和3.4TMAC / W(在16 nm工艺)。”

返回顶部