快讯摘要
智谱发布新一代开源模型,推理速度最高达 200Tokens/秒,价格优势明显。
快讯正文
【智谱发布新一代开源模型,速度惊人!】今日,智谱推出新一代开源模型 GLM-4-32B-0414 系列,涵盖基座、推理、沉思模型权重,并遵循 MIT License。当前,该系列所有模型均可通过“z.ai”进行访问体验。据介绍,推理模型 GLM-Z1-Air/AirX-0414 的推理速度能够达到最高 200 Tokens/秒,这是目前国内迄今最快的商业模型,并且 GLM-Z1-Air-0414 的价格仅为 DeepSeek-R1 的 1/30。
评论列表