Google 最新 Pro 系列通用模型,重点覆盖复杂推理、长上下文、多模态和高质量生成任务。
- 上下文
- 1M+
- 发布
- 2026-05
大语言模型排行
按代码、写作、推理、数学和多模态能力对主流大语言模型进行结构化对比。
快照更新时间:2026-07-04。分数为 AI Explorer 根据公开榜单信号整理的 0-100 标准化评分。
模型数据根据公开榜单、厂商信息和整理后的能力信号生成。
分数会标准化代码、写作、推理、数学和多模态等公开能力信号。
适合在选择模型厂商或模型系列前,先比较不同模型的能力侧重点。
Google 最新 Pro 系列通用模型,重点覆盖复杂推理、长上下文、多模态和高质量生成任务。
长上下文、多模态和推理能力突出的通用模型。
Google 最新 Flash 系列模型,面向低延迟、多模态、长上下文和高吞吐应用。
OpenAI 前沿通用工作模型,面向复杂真实任务、智能体编码、研究、数据分析和跨工具执行。
高端通用模型,适合复杂推理、代码、工具调用和专业写作。
Anthropic 最新 Opus 系列高端模型,写作、代码审查、复杂推理和智能体工作流表现突出。
推理型模型,适合复杂问答和需要新信息的工作流。
多语言、代码和成本敏感应用表现均衡。
DeepSeek 新一代 V4 系列模型,面向长上下文、代码、数学推理和高性价比生产 API。
Z.AI 最新旗舰模型,面向长周期智能体任务、真实工程交付、代码和复杂推理。
适合企业 API、代码和多语言任务的欧洲模型。
长上下文和中文任务表现突出的通用模型。
DeepSeek V4 的低延迟版本,适合高吞吐、成本敏感和实时产品场景。
Z.AI GLM-4.6,在真实代码、长上下文、推理、搜索、写作和智能体应用上增强。
中文、写作和通用知识任务表现稳定。
开放权重 MoE 模型,适合自托管和成本敏感推理。