Skip to content
毫河风报
菜单
  • 首页
  • 关于我们
  • 联系我们
  • 播记
 

阿里云开源 Qwen2.5 系列模型,支持 128K 上下文和 29 种语言

2024-09-20

2024 年 9 月 19 日,阿里云宣布开源 Qwen2.5 系列模型,包括 Qwen2.5 语言模型、Qwen2.5-Coder 编程模型和 Qwen2.5-Math 数学模型。Qwen2.5 系列模型在最新的大规模数据集上进行了预训练,包含多达 18 万亿 tokens,提升了知识、编程能力和数学能力。Qwen2.5 语言模型支持高达 128K tokens,并能生成最多 8K tokens 的内容,支持 29 种以上语言。Qwen2.5-Coder 在 5.5 万亿 tokens 编程数据上训练。Qwen2.5-Math 支持中文和英文,整合多种推理方法。除 3B 和 72B 版本外,所有开源模型均采用 Apache 2.0 许可证。

  • **Qwen2.5 语言模型 **:在最新的大规模数据集上进行了预训练,包含多达 18 万亿 tokens,提升了知识和语言处理能力。该模型支持高达 128K tokens 的上下文长度,并能生成最多 8K tokens 的内容,支持 29 种以上语言。
  • **Qwen2.5-Coder 编程模型 **:在 5.5 万亿 tokens 编程数据上进行了训练。该模型支持 128K 上下文长度,覆盖 92 种编程语言,能够处理复杂的编程任务。
  • **Qwen2.5-Math 数学模型 **:支持中文和英文,整合多种推理方法,能够解决复杂的数学问题。该模型在多个数学基准测试中表现优异。
    Qwen2.5 系列模型的多语言支持和上下文长度支持是其一大亮点。Qwen2.5 语言模型支持 29 种以上语言,能够处理多语言任务。Qwen2.5-Coder 编程模型支持 92 种编程语言,能够处理复杂的编程任务。Qwen2.5-Math 数学模型支持中文和英文,能够解决复杂的数学问题。Qwen2.5 系列模型支持高达 128K tokens 的上下文长度,能够处理长文本任务。

AI 日报

查看全部日报

  • AI 技术在医疗领域的突破性应用:从诊断到治疗的全新变革
  • AI 代理战场新核武!OpenAI 发布 o3 模型:比肩人类决策,媲美专业审核
  • 软银 5000 亿美元 AI「星门」陷融资困境,孙正义:短期波动不足为惧
  • 贝索斯加持 AI 搜索新星估值 140 亿!3 年超谷歌 7 年成绩
  • 苹果重磅爆料:秘密研发两大“杀手锏”芯片,剑指智能眼镜与 AI 服务器!

©2025 毫河风报 沪ICP备18012441号-5