混元大模型-2024年9月28日最新技术资讯

大模型专题

文章概要：

1. 国外核心大模型ChatGPT在8月份的访问数据同比增长了7.5%，去年9月份至今，该模型经历了多次模型更新，如更新到GP4和GP4OCBTOE版本，均导致了其月度访问数据的显著上升。<. 谷歌的模型在国内大模型市场中表现较为突出，虽然谷歌的模型在模型更新频率和能力上可能不及Open I/O系列模型，但由于其即将接入苹果IOS18系统，因此对端侧模型的关注度很高。
3. 国内大模型中，苹果和百度文心一言的访问量表现较为突出。其中百度文心一言自去年11月模型升级后，访问量稳步提升至接近2000万的月度体量
4. 文心是国内大模型测访问量最大的一个，而kimi（另一大模型）最近几周访问量也保持了健康稳定的增长状态。
5. open I的OE模型在模型侧引入了思维链，强化了模型训练，使其具备思考和反思能力，从而超越了传统模型。
6. OE的模型定价相较于GT4O或其他版本有3到4倍的提升，主要原因是OE在推理过程中的算力占用时间更长，且其思考逻辑更加深入，生成多个答案并进行选择，这需要更多算力支持。
7. OE在测评体验中展现出了高效的问题解答能力。例如，对于社会云方向上智慧路口建设费用规模的问题，OE在6秒内给出了清晰的框架逻辑、计算过程和结论。
8. OE通过引入scaling技术打破了传统大模型依赖数据量提升模型能力的条件，即使在训练资源相对固定的情况下，也能实现模型能力的有效提升。
9. OE在黑客攻防、代码开发、APP游戏开发、艺术创作、生物医药（基因和药物分析）、密码解码等多个领域展现有可能超过人类能力。
10. 国产模型在综合能力上与GPSO的差距非常小，甚至在某些场景中超过了GPSO的能力。
11. 混元大模型得分接近80分，仅次于GBSO-likest，超过了其他一些模型在某些场景的表现。
12. 快手发布了基于丰富自由数据的大模型，效果优秀；阿里旗下的豆包发布了两款基于DIT结构的视频大模型，并已处于小范围测试阶段，计划很快提供给C端用户使用。
13. DIT框架在今年年中进行了flag DIT的升级，提升了图像处理和生成图像的效率，并提高了图像文本理解能力，从而增强了整体应用场景的融合。
14. 六月份的DBAAR，double division 3实现了对于六代模型的超越，具备排版微调能力和性能提升，包括真实感上的明显增强，并已正式发布。
15. 腾讯的多模态模型与GT46相比，整体水平靠前，具备对于动态图片的理解能力和深度认知能力，未来有望与特斯拉、奥特曼斯等机器人相关领域融合，具有广阔的应用前景。
16. 国产模型在半年内有望基于思维链进行问答、互动及内容生成，预计会有落地成果。
17. 应用侧主要关注办公、教育和智能驾驶三个方向。

阅读原文