腾讯最新万亿参数异构MoE上线,技术细节首次曝光!权威评测国内第一,直逼GPT-4o
文章概要:
1. 腾讯混元推出新一代旗舰大模型混元Turbo,采用全新分层异构的MoE架构,总参数达万亿级别,性能仅次于GPT-4,位列国内> 2. 混元Turbo采用全新的异构MoE结构,通过较多的专家数和较小激活量设计,在整体参依然保持万亿级规模前提下,通过整体算法和训练推理框架加速的端对端优化,模型效果相比上代混元Pro有较大提升
3. 混元Turbo在Posttrain阶段,腾讯混元Turbo自研了混元CriticModel和RewardModel,构建自提升pipeline,并在RLHF全面采用了离线数据和采样结合的强化学习策略
4. 针对当前业界大模型普遍存在的文科能力「重而不强」,理科能力普遍偏弱的现状,本次混元Turbo大模型也专项强化了高质量文本创作、数学、逻辑推理等典型大模型文理科
5. 混元Turbo除支持各类大模型能力外,也支持AI搜索联网插件。通过整合腾讯优质的内容生态和全网搜索能力,同时基于Planner+Action Agent架构,混元Turbo搜索基于混元通用大模型底座,使用丰富的搜索数据进行多任务精,得到更懂搜索、具备精准阅读理解能力的SearchGPT,用于深度问答
6混元大模型全面建立在腾讯全面自研Angel机器学习平台和强大的基础设施之上
7. 目前,腾讯混元Turbo模型除已经作为新一代旗舰大模型在腾讯云官网API正式上架。此外,还在腾讯APP中面向所有C端用户开放速度更快、体验更好,同时AI搜索、AI阅读、AI写作和AI作画等核心功能
阅读原文
3. 混元Turbo在Posttrain阶段,腾讯混元Turbo自研了混元CriticModel和RewardModel,构建自提升pipeline,并在RLHF全面采用了离线数据和采样结合的强化学习策略
4. 针对当前业界大模型普遍存在的文科能力「重而不强」,理科能力普遍偏弱的现状,本次混元Turbo大模型也专项强化了高质量文本创作、数学、逻辑推理等典型大模型文理科
5. 混元Turbo除支持各类大模型能力外,也支持AI搜索联网插件。通过整合腾讯优质的内容生态和全网搜索能力,同时基于Planner+Action Agent架构,混元Turbo搜索基于混元通用大模型底座,使用丰富的搜索数据进行多任务精,得到更懂搜索、具备精准阅读理解能力的SearchGPT,用于深度问答
6混元大模型全面建立在腾讯全面自研Angel机器学习平台和强大的基础设施之上
7. 目前,腾讯混元Turbo模型除已经作为新一代旗舰大模型在腾讯云官网API正式上架。此外,还在腾讯APP中面向所有C端用户开放速度更快、体验更好,同时AI搜索、AI阅读、AI写作和AI作画等核心功能