#1
OpenAI 前沿通用工作模型,面向复杂真实任务、智能体编码、研究、数据分析和跨工具执行。
Agentic codingReal-world workResearch workflows
代码99
- 上下文
- 1M+
- 发布
- 2026-04
大语言模型排行
按代码、写作、推理、数学和多模态能力对主流大语言模型进行结构化对比。
快照更新时间:2026-05-20。分数为 AI Explorer 根据公开榜单信号整理的 0-100 标准化评分。
模型数据根据公开榜单、厂商信息和整理后的能力信号生成。
分数会标准化代码、写作、推理、数学和多模态等公开能力信号。
适合在选择模型厂商或模型系列前,先比较不同模型的能力侧重点。
OpenAI 前沿通用工作模型,面向复杂真实任务、智能体编码、研究、数据分析和跨工具执行。
高端通用模型,适合复杂推理、代码、工具调用和专业写作。
高端模型,写作、代码审查和智能体工作流表现突出。
DeepSeek 新一代 V4 系列模型,面向长上下文、代码、数学推理和高性价比生产 API。
Z.AI 最新旗舰模型,面向长周期智能体任务、真实工程交付、代码和复杂推理。
长上下文、多模态和推理能力突出的通用模型。
DeepSeek V4 的低延迟版本,适合高吞吐、成本敏感和实时产品场景。
多语言、代码和成本敏感应用表现均衡。
推理型模型,适合复杂问答和需要新信息的工作流。
适合企业 API、代码和多语言任务的欧洲模型。
Z.AI GLM-4.6,在真实代码、长上下文、推理、搜索、写作和智能体应用上增强。
中文、写作和通用知识任务表现稳定。
开放权重 MoE 模型,适合自托管和成本敏感推理。
长上下文和中文任务表现突出的通用模型。