标签:AI推理网络

ZCube – 智谱AI联合清华研发的大模型推理网络架构

ZCube是智谱AI联合清华研发的大模型推理网络架构,面向PD分离推理、万卡GPU集群与长上下文AI服务优化。该架构通过扁平化拓扑与确定性路由降低TTFT延迟、提升...