Banner
Flex Logix 发表InferX™ X1 8TOPS高性能,低功耗,低本钱AI边沿推理芯片-火狐体育
- 2020-02-13-
今年4月10日, Flex Logix Technologies, Inc.  公布,其在拥有数个专利的业界领先的eFPGA互连技术性上,融合专为AI推理运算而优化的nnMAXtm乘加器(MAC), 研发了 InferXtm X1边沿推理芯片。今天在美国硅谷举办的Linley Processor Conference,Flex Logix详细介绍了 InferX X1芯片及其性能。作为一款对于于边沿AI推理使用的芯片,InferX X1领有极高的 MAC 运用率以及出众的能效比 — 只须要一颗x32的DRAM, 就能够超过8TOPS的算力。这在边沿推理这种只需 low batch size 的使用场景中显得极为要害。与现有的摆脱计划对比,InferX X1能以更低的功耗,更低的本钱,出示更高的算力。zG9EETC-火狐体育技术性专辑zG9EETC-火狐体育技术性专辑InferX X1能够适用语音,图像,视频等任何基于TensorFlow-Lite或ONNX的实体模型和算法,特别支持于大型的实体模型算法和实时识别。例如YOLOv3实时物体识别算法,InferX X1在batch=1的状况下,能够对1Megapixel图像 超过25.4帧每秒(fps)的吞吐量。对2Megapixel高清图像超过12.7帧每秒(fps)。而超过那样的高吞吐量只须要用到一个x32的DRAM。zG9EETC-火狐体育技术性专辑InferX 适用INT8,INT16,BF16并能够在不一样的算法层混合应用,顺手客户依据自身的需求来优化吞吐量和算法精度。InferX还内置有Winograd转换来加速INT8测算卷积,芯片会全自动对支持的矩阵乘法来实时变换weights到Winograd模式,得到将近2.25倍的性能提高。因为InferX的Winograd是用12bits来测算的,所以精度不会有损失。zG9EETC-火狐体育技术性专辑Flex Logix出示客户详细的软件开发自然环境。客户能够立即将基于TensorFlow-Lite或ONNX的算法立即用Flex Logix的nnMAX Compiler软件来编译。zG9EETC-火狐体育技术性专辑Flex Logix将出示InferX X1芯片。芯片能够通过扩展口来连接数个芯片以增多算力。Flex Logix同时还会出示搭载InferX X1的半高半长PCIe卡给Edge Server和gateway客户。zG9EETC-火狐体育技术性专辑“设计方案边沿神经互联网推理芯片的一个难题是怎样减少大批的数据互换及减少功耗,而我们的可编程互连技术性是贴近完美的摆脱计划。”Flex Logix CEO Geoff Tate说。”在运算一层互联网的时候,我们运用可编程互连将InferX的MAC依据这一层互联网的dataflow来连接,等于是专为这一层运算配备了一个ASIC。同时对下层网开展络pre-load,以实现在这一层运算完后能够最迅速地配备下层。相同的可编程互连也与片上的SRAM连接,将这一层的输出,迅速配备成下层的输入,从而防范了大批的数据互换。所以InferX只须要一颗x32 DRAM就够了。这让我们能够将芯片设计方案得更小,大大减少了功耗和本钱。”zG9EETC-火狐体育技术性专辑Geoff Tate还说, “我们还在芯片里加上了Winograd来加速INT8的运算,这让客户在选取INT8时能得到更高的吞吐量。而同时我们也适用BF16,让对精度更在意的客户在须要时也能利用。客户能够选取依据自身的需求在不一样的互联网层混合利用来抵达高精度,高吞吐量。”zG9EETC-火狐体育技术性专辑一个自主创新的可编程互连技术性,两个高速成才的商品线Flex Logix在其拥有十余个专利的自主创新可编程互连技术性上研发了EFLX eFPGA IP. Flex Logix已经成为eFPGA IP市场的领先者,已有包含大唐辰芯,美国波音,SiFive RISC-V等十余个客户正在使用Flex Logix的eFPGA IP。zG9EETC-火狐体育技术性专辑最新研发的nnMAX AI IP,即InferX芯片中应用的新推理架构,运用了相同的可编程互连技术性,并融合了专为AI推理而设计方案的乘加器(MAC)和贮存模块。这些乘加器能适用INT8, INT16, BF16等AI算法里常见的精度数字。每一颗nnMAX IP模块拥有1024个乘加器以及相对的SRAM,在16nm制程上能够出示2 TOPS的算力。nnmAX IP模块能够依据需求拼接成NxN的阵列,最大能够出示达到100 TOPS的算力。zG9EETC-火狐体育技术性专辑Flex Logix在InferX X1芯片里集成了4个nnMAX IP模块,出示8 TOPS的算力。zG9EETC-火狐体育技术性专辑工夫表InferX X1推理芯片方案于Q3 2019流片,样片和PCIe板可于年末出示。基于台积电16nm的nnMAX IP将于Q3 2019出示受权给客户用于集成到客户自身的ASIC或SoC. 感兴趣的客户能够浏览 www.flex-logix.com 来赢得我们在 Linley Processor Conference发表的胶片,或联络Flex Logix亚太区销售jim@flex-logix以分离更多消息。zG9EETC-火狐体育技术性专辑