官方现在通过《科学》杂志发表了一组NorthPole的基准测试结果,堪称是一个新的里程碑。根据对ResNet-50模型的测试,基于TrueNorth架构的12纳米芯片比常用的12纳米GPU和14纳米CPU能效比高25倍。据IBM称,NorthPole在延迟和计算所需的空间方面也表现更好,超过了所有主流架构,包括基于4纳米工艺的GPU。那么,它是如何实现这一成果的呢?因为它256个核心本身就集成了一块内存芯片而无需单独连接,NorthPole用于220亿个晶体管,其每个核心都可以执行2048个运算。该公司称,其架构消除了冯?诺依曼瓶颈,该瓶颈围绕着大多数系统中CPU和RAM之间数据传输引起的延迟。因此,它可以比市场上最好的GPU(包括Nvidia最强AI显卡)运行得更快。IBM研究部门的DharmendraModha表示:“从架构上看,NorthPole模糊了计算和内存之间的界限。在单个核心层面上,NorthPole表现为接近内存的计算;而在芯片外部的输入输出层面上,它表现为主动内存。”指股网注意到,AMD也探索了类似的技术,并成功将内存和计算结构集成到单个组件中。上个月,Xilinx便展示了其VirtexXCVU7P卡,其中包括八个内存加速器模块。据介绍,IBM在其NorthPole芯片中为每个计算核心的添加了内存芯片,他们认为这个组件非常适合新兴的AI用例,包括与计算机视觉相关的用途。此外,它还经过了自然语言处理和语音识别方面的测试。NorthPole还适用于边缘应用,这些应用可实时处理大量数据。广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,指股网所有文章均包含本声明。
IBM NorthPole 芯片测试:比常用的 12nm GPU 和 14nm CPU 能效高 25 倍