论文部分内容阅读
Habana Labs近日宣布,该公司正式退出隐身模式,将面向精选客户推出首个人工智能处理器样品。基于其Goya HL-1000处理器的PCIe卡可基于Res Net-50推理基准实现每秒15 000张图片的吞吐量,延迟时间为1.3 ms,功耗仅为100 w。与如今数据中心部署的一般解决方案相比,Habana Labs人工智能处理器的性能要高出1~3个数量级。