近几年,生成式AI一浪高过一浪,对于各种AI大模型的训练、推理也提出了越来越苛刻的要求。一般而言,推理工作不需要庞大的GPU加速器集群,更适合交给CPU处理器,尤其专门面向服务器和数据中心的CPU产品。所谓推理(Inference),就是将...