【一文介绍16款国内主流LLM】一个简单问题就干懵近90%的国产大模型,你经常用的哪款大模型呢?
文章概要:
1. 文章介绍了16款国内主流LLM产品,包括通义千、心一言、混元豆包、智M4、deepseek、面壁智能、零万物书生浦语、kimi海螺AI、讯飞星火、百川、天工AI、商汤日日新、秘塔AI,并通过两个问题对这些模型的效果进行了测试。
2. 第一个问题是地上有2张钱,一张100元,一张1万元,该捡哪张;第二个问题是已知现在苹果6元一斤,梨3一斤,苹果和4斤梨,但是发现苹果价格比去年涨了20%,梨比去年降了40%,那小明需要给多少钱。
3. 文章对每个模型的回答效果进行了详细的分析和评价,包括回答、过程的冗余性等。
4 文章最后总结两个问题的评测结果,第一个问题只有豆包和天工3.0回答正确,其余的大模型都回答错误,几乎干懵90%大模型。
阅读原文
2. 第一个问题是地上有2张钱,一张100元,一张1万元,该捡哪张;第二个问题是已知现在苹果6元一斤,梨3一斤,苹果和4斤梨,但是发现苹果价格比去年涨了20%,梨比去年降了40%,那小明需要给多少钱。
3. 文章对每个模型的回答效果进行了详细的分析和评价,包括回答、过程的冗余性等。
4 文章最后总结两个问题的评测结果,第一个问题只有豆包和天工3.0回答正确,其余的大模型都回答错误,几乎干懵90%大模型。
腾讯元宝,后来居上
文章概要:
1. 5月30日,腾讯宣布基于混元大模型的App“腾讯元宝正式上线,已在苹果和安卓应用商店开放下载
2. 腾讯元宝背靠微信公众号丰富的语料数据,具有得天独厚的先天优势
3. 腾讯拥有庞大的用户和内容生态在AI上略显低调,内部面临不小的压力
4.元宝相较于之前的混元小程序版本有了显著升级,了更多面向工作效率场景和日常生活场景的功能
5. 在工作效率方面,腾讯元宝提供了AI搜索、总结、AI写作核心能力,PDF、Word、txt等的文档,并支持超长的窗口
6.元宝会分走微信的流量,为顶级流量入口,这是的
7. 模型厂商追求模型能力的比拼,用户感知最明显的还是应用
8. 没想到,腾讯元宝使用起来,还是让人耳目一新,使用起来非常
阅读原文
2. 腾讯元宝背靠微信公众号丰富的语料数据,具有得天独厚的先天优势
3. 腾讯拥有庞大的用户和内容生态在AI上略显低调,内部面临不小的压力
4.元宝相较于之前的混元小程序版本有了显著升级,了更多面向工作效率场景和日常生活场景的功能
5. 在工作效率方面,腾讯元宝提供了AI搜索、总结、AI写作核心能力,PDF、Word、txt等的文档,并支持超长的窗口
6.元宝会分走微信的流量,为顶级流量入口,这是的
7. 模型厂商追求模型能力的比拼,用户感知最明显的还是应用
8. 没想到,腾讯元宝使用起来,还是让人耳目一新,使用起来非常
17人入选博士生科研激励计划
文章概要:
1. 中国电子学会联合腾讯发起“中国电子学会-腾讯博士生科研激励计划(混元大模型专项)”,旨在培养AI拔尖人才,推动产学研深度融合新质生产力。
2. 该计划为入选的优秀博士生提供为期一年的0/人的科研资助,以及科研平台等其他支持。
3. 本年度共收到123份申请,经形式审查、网络评审及会评答辩,共有17名博士生入选。
阅读原文
2. 该计划为入选的优秀博士生提供为期一年的0/人的科研资助,以及科研平台等其他支持。
3. 本年度共收到123份申请,经形式审查、网络评审及会评答辩,共有17名博士生入选。
重磅!腾讯宣布推出开源大型MoE模型:Tencent Hunyuan-Large
文章概要:
1. 腾讯宣布推出开源encentyuan-Large
2. 该模型是业界参数规模最大效果最好的Transformer架构的开源MoE>3. 模型总参约389B,激活参数量约52B长度达256>4. 具有高质量文本创作、数学、知识问答等专项能力
. 采用随机补偿路由策略和KV Cache压缩技术
6. 在与业界开源的DeepSeek-V2、lama3.-70B、lama3.1-05B以及Mixtral-8x22B对比,在CMMLU、MMLU、CEval等多学科综合评测集、中英文NLP任务、代码和数学等9大维度全面领先
7. 提供了试用链接、详细能力链接、链接、链接、论文链接、huggingface链接
阅读原文
2. 该模型是业界参数规模最大效果最好的Transformer架构的开源MoE>3. 模型总参约389B,激活参数量约52B长度达256>4. 具有高质量文本创作、数学、知识问答等专项能力
. 采用随机补偿路由策略和KV Cache压缩技术
6. 在与业界开源的DeepSeek-V2、lama3.-70B、lama3.1-05B以及Mixtral-8x22B对比,在CMMLU、MMLU、CEval等多学科综合评测集、中英文NLP任务、代码和数学等9大维度全面领先
7. 提供了试用链接、详细能力链接、链接、链接、论文链接、huggingface链接
字节跳动、智谱AI视频生成再升级;腾讯开源混元大模型;天工AI高级搜索功能 | AI 周报
文章概要:
1. 字节即梦AI的Seaweed模型仅需60秒就能生成时长5秒的高质量AI视频,大幅领先国内业界水平,为视频内容创作带来革命性变化
2. 昆仑万维发布天工AI高级搜索功能,在数据和信源的时效性、权威性、质量等方面进行了全方位升级,优化了文档AI阅读分析功能,并具备超强的上下文理解能力。
3. 腾讯推出的Hunyuan-Large大模型,拥有3890亿总参数和520亿激活参数,成为业界开源的基于Transformer的最大MoE模型。< 4. 腾讯混元开源的Hunyuan3D-1.0大模型,两阶段生成方法,保证质量和可控性基础上,能在短短10秒内生成3D资产,这一技术突破极大地提高了3D建模的效率。
5. 智谱推出的AI生成视频「新清影」支持生成10秒、4K、60帧的超高清视频,并自带音效,标志着AI视频技术从“默片”时代进入“有声电影”时代。
阅读原文
2. 昆仑万维发布天工AI高级搜索功能,在数据和信源的时效性、权威性、质量等方面进行了全方位升级,优化了文档AI阅读分析功能,并具备超强的上下文理解能力。
3. 腾讯推出的Hunyuan-Large大模型,拥有3890亿总参数和520亿激活参数,成为业界开源的基于Transformer的最大MoE模型。< 4. 腾讯混元开源的Hunyuan3D-1.0大模型,两阶段生成方法,保证质量和可控性基础上,能在短短10秒内生成3D资产,这一技术突破极大地提高了3D建模的效率。
5. 智谱推出的AI生成视频「新清影」支持生成10秒、4K、60帧的超高清视频,并自带音效,标志着AI视频技术从“默片”时代进入“有声电影”时代。
腾讯混元康战辉:将开源大模型训练代码,但数据开源意义不大
文章概要:
1. 11月5日,混元宣布最新的MoE模型“混元Large“以及混元3D生成大“ Hunyuan3D-10”正式开源,支持企业及开发者精调、部署等场景的使用需求,且免费可商用。
2. 腾讯混元Large是目前开源领域参数规模最大效果最好的MoE模型,而腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。
3. 腾讯混元Large在各类测试集上得分领先现有主流开源模型模型结构和训练策略方面,腾讯混元Large全面探索了MoE ScalingLaw,进行了MoE共享专家路由、回收路由等策略上的创新,并引入了专家特化的学习率适配训练策略,有效提升不同专家利用率和稳定性,带来模型效果的。
4. 腾讯混元Large模型分门别类提升数学、推理、代码等能力,另外在一阶段离线DPO的基础上引入了二阶段强化策略。
5. 腾讯混元Large构建了覆盖数十个类目,高质量、高多样性、大量级的中英文合成数据。
6. 腾讯混元选择了先开源大规模参数的模型、后开源小参数模型。
7. 腾讯混元3D生成大模型Hunyuan31.0,解决现有的3D生成模型在生成速度和泛化能力上存在不足的问题。
8. Hunyuan3D-1.开源模型包含轻量版和标准版,量版0s即可生成高质量3D资产,已在社区公开发布,包含模型权重、推理代码、模型算法等完整模型,开发者、研究者等可以免费使用。
阅读原文
2. 腾讯混元Large是目前开源领域参数规模最大效果最好的MoE模型,而腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。
3. 腾讯混元Large在各类测试集上得分领先现有主流开源模型模型结构和训练策略方面,腾讯混元Large全面探索了MoE ScalingLaw,进行了MoE共享专家路由、回收路由等策略上的创新,并引入了专家特化的学习率适配训练策略,有效提升不同专家利用率和稳定性,带来模型效果的。
4. 腾讯混元Large模型分门别类提升数学、推理、代码等能力,另外在一阶段离线DPO的基础上引入了二阶段强化策略。
5. 腾讯混元Large构建了覆盖数十个类目,高质量、高多样性、大量级的中英文合成数据。
6. 腾讯混元选择了先开源大规模参数的模型、后开源小参数模型。
7. 腾讯混元3D生成大模型Hunyuan31.0,解决现有的3D生成模型在生成速度和泛化能力上存在不足的问题。
8. Hunyuan3D-1.开源模型包含轻量版和标准版,量版0s即可生成高质量3D资产,已在社区公开发布,包含模型权重、推理代码、模型算法等完整模型,开发者、研究者等可以免费使用。
10万元/人!首届博士生激励计划名单,公布
文章概要:
1. 中国电子学会11月日公布了首届2024“中国学会-腾讯科研激励计划混元大模型)”名单>2. 本项激励计划对大模型研究有兴趣和明确目标的优秀博士生科研支持,学生每人将获得一年10的科研资助,以及相关科研平台支持
3. 本年度共收到3份,经形式审查、网络评审及会评,共有17名博士生入选
4. 清华大学和北京大学各有4名博士生入选,数量最多,上海交通大学有2人入选。其他高校各有1博士生入选名单
阅读原文
3. 本年度共收到3份,经形式审查、网络评审及会评,共有17名博士生入选
4. 清华大学和北京大学各有4名博士生入选,数量最多,上海交通大学有2人入选。其他高校各有1博士生入选名单
Hunyuan3D-1.0来了!腾讯混元首个文生图生双能3D大模型亮相
文章概要:
1. 腾讯混元正式开源了Hunyuan3D1.0模型,这是首个同时支持文本生成和图像生成的3D开源大模型
2. Hunyuan3D1.0多视图生成和多视图重建两阶段生成方法,用户仅需约10秒即可高质量的3D资产
3. Hunyuan3D-1.0具有强大的化和可控性,能够重建各类不同尺度的物体
多视图生成采用了自适应CFG,为不同视角和time steps设置不同的CFG尺度值
5. Hunyuan3D-1.0采用了Signed distance function的隐式表示,通过Marching cube算法在三维空间进行采样查询得到signed distance来输出3D mesh
6.yuan3D1.0的模型权重、推理代码、模型算法等已全部开源,用户可以在HuggingFace、Github等技术社区直接,免费可商用
7. 随着AI生成内容的普及,版权问题、数据安全和滥用的风险等逐渐,行业规范和用户自律来共同应对
8. 未来,Hunyuan3D-1.0有望在领域得到推广,如虚拟现实(VR)、增强现实(AR)
阅读原文
2. Hunyuan3D1.0多视图生成和多视图重建两阶段生成方法,用户仅需约10秒即可高质量的3D资产
3. Hunyuan3D-1.0具有强大的化和可控性,能够重建各类不同尺度的物体
多视图生成采用了自适应CFG,为不同视角和time steps设置不同的CFG尺度值
5. Hunyuan3D-1.0采用了Signed distance function的隐式表示,通过Marching cube算法在三维空间进行采样查询得到signed distance来输出3D mesh
6.yuan3D1.0的模型权重、推理代码、模型算法等已全部开源,用户可以在HuggingFace、Github等技术社区直接,免费可商用
7. 随着AI生成内容的普及,版权问题、数据安全和滥用的风险等逐渐,行业规范和用户自律来共同应对
8. 未来,Hunyuan3D-1.0有望在领域得到推广,如虚拟现实(VR)、增强现实(AR)
AI资讯 | 每周前沿动态速递
文章概要:
1. 三川科技将人工智能+数字化运用核心技术与商业化场景深度融合,创新数字,打造数字化酒店,全面开展智慧城市建设运营。>2. 阿里巴巴发布全新AI人像生成项目EcomID,并推出ComfyUI原生实现插件,在AI人像生成领域实现显著突破。
3 NVIDIA发布全新AI Blueprint,专注于视觉AI Agent的开发,旨在帮助几乎任何行业的用户都能轻松构建出用于分析视频和图像的AI Agent,以提升工作效率和监控效能
4. 亚马逊Prime Video推出了基于生成式AI技术的X-Ray Recaps功能,该功能能够、季度或特定场景生成简洁而全面的总结,助力用户精准回顾错过的剧情。
5. 微软向部分用户推出Windows 11最新版画图应用测试版,版本号为11.2410.28.0。此次更新引入了AI技术,新增内容生成填充和除功能,用户可用自然语言编辑添加内容并保持艺术风格,同时擦除工具能移除画布物体并填补空白。
6. 腾讯混元大模型家族正式发布混合专家(MoE)模型Hunyuan-Large(Hunyuan-Mo-A52B)。混元Large模型拥有3890总参数和520亿激活参数,上下文长度达26k,多轮对话、高质量文本生成、数学逻辑、代码创作多个场景表现优异,企业及开发者精调、部署等不同场景的使用需求。
阅读原文
3 NVIDIA发布全新AI Blueprint,专注于视觉AI Agent的开发,旨在帮助几乎任何行业的用户都能轻松构建出用于分析视频和图像的AI Agent,以提升工作效率和监控效能
4. 亚马逊Prime Video推出了基于生成式AI技术的X-Ray Recaps功能,该功能能够、季度或特定场景生成简洁而全面的总结,助力用户精准回顾错过的剧情。
5. 微软向部分用户推出Windows 11最新版画图应用测试版,版本号为11.2410.28.0。此次更新引入了AI技术,新增内容生成填充和除功能,用户可用自然语言编辑添加内容并保持艺术风格,同时擦除工具能移除画布物体并填补空白。
6. 腾讯混元大模型家族正式发布混合专家(MoE)模型Hunyuan-Large(Hunyuan-Mo-A52B)。混元Large模型拥有3890总参数和520亿激活参数,上下文长度达26k,多轮对话、高质量文本生成、数学逻辑、代码创作多个场景表现优异,企业及开发者精调、部署等不同场景的使用需求。