标签:高速推理

GLM-5.1-highspeed – 智谱AI推出的GLM-5.1高速推理模型(400 tokens/s)

GLM-5.1-highspeed是智谱GLM-5.1旗舰模型的高速推理版本,支持最高400 tokens/s输出速度与200K上下文窗口,面向企业级API与智能体场景优化,适用于AI编程、实...