智谱：新一代开源模型推理速度达 200Tokens/秒

admin 2025年04月15日 08:50 3 0

快讯摘要

智谱发布新一代开源模型，推理速度最高达 200Tokens/秒，价格优势明显。

快讯正文

【智谱发布新一代开源模型，速度惊人！】今日，智谱推出新一代开源模型 GLM-4-32B-0414 系列，涵盖基座、推理、沉思模型权重，并遵循 MIT License。当前，该系列所有模型均可通过“z.ai”进行访问体验。据介绍，推理模型 GLM-Z1-Air/AirX-0414 的推理速度能够达到最高 200 Tokens/秒，这是目前国内迄今最快的商业模型，并且 GLM-Z1-Air-0414 的价格仅为 DeepSeek-R1 的 1/30。

智谱：新一代开源模型推理速度达 200Tokens/秒