今日AI-混元大模型-2024年11月7日

发现全网最新的AI内容

AI智能体如何实现公众号/微信客服全自动引流成交?

文章概要:

1. 腾讯混元大模型-腾讯元器介绍
2. 如何创建自己的AI智能体
3. AI智能体知识库该如何搭建
4. AI智能体如何实现公众号/微信客服全自动引流成交
阅读原文

重磅!腾讯开源中文最强MoE巨模型Hunyuan-Large,参数规模超越Llama!

文章概要:

1 腾讯开源了Hun-Large,一个拥有3890亿参数的巨型MoE模型,在多项基准测试中性能显著超越Llama等同级别模型,中文傲视群雄
2. Hunyuan-Large业界首个参数规模最大且性能最优的Transformer架构开源MoE模型
3. Hunyuan-Large的强大性能得益于一系列关键技术创新,包括高质量合成数据、KV缓存压缩技术、专家学习率缩放、上下文处理能力、混合路由策略Recycle Routing、E缩放法则探索、三阶段率调度、高效Tokenizer
4. Hunyuan-Large在多项基准测试中都取得了令人瞩目的,性能比肩甚至超越了参数更大的模型
5. Hunyuanarge提供了vLLM和TRT-LLM推理后端,并支持FP8和INT8量化,可以根据实际需求灵活选择最合适的方案> 6.yuan-Large的开源,是腾讯对AI社区的贡献,更是对AI技术发展和AI的坚定承诺
阅读原文

重磅!腾讯开源中文最强MoE巨模型Hunyuan-Large,参数规模PK Llama!

文章概要:

1. 腾讯中文最强MoE巨模型unyuan-Large,拥有380亿参数,在多项基准测试显著Llama等同级别模型,在中文领域傲视群雄。br>2.yuanarge是业界首个参数规模最大且性能最优的Transformer架构开源MoE模型,在公开benchmark、多轮、高质量文本生成、逻辑、代码等多个任务上都取得了卓越的成绩。
3.yuan-Large采用了一系列关键技术创新,包括海量高质量合成数据、KV缓存压缩技术、专家特定学习率、超长上下文处理能力、混合路由策略与Recycleouting、MoE缩放法则探索、三阶段学习率调度、高效Tokenizer。5. Hunyuan-Large提供了vLLM和TRTLLM两种推理后端,并支持FP8和8量化,可以根据实际需求灵活选择最合适的方案。
. Hunyuanarge,是腾讯对AI社区的贡献,更是对AI技术发展和普惠AI的坚定承诺
阅读原文

最新开源:腾讯再开源两款最新大模型!SAM2Long来了,无需训练大幅提升SAM 2!

文章概要:

1. 腾讯开源Hunyuan3D-1.0,文本图像10秒转3D资产
2. 腾讯Hunyuan-Large,业界最大开源MoE模型
3. 港中文上海AI推出SAM2Long,无需训练即可大幅提升SAM 2
4. 中科院与字节联合发布DreamClear,安全优先的高性能图像修复技术
阅读原文

17人!入选博士生科研激励计划

文章概要:

1. 中国电子学会联合腾讯公司了“中国电子学会-腾讯博士生科研激励计划(混元大专项)”,旨在面向明确博士生提供支持,助力他们开展前沿研究及海内外交流学等学生将获得为期一年的10万元/人的科研资助,以及科研平台等其他支持共3份形式审查、网络评审及会评答辩,共有17名博士生入选。
阅读原文

腾讯一出手就是最大MoE大模型!开源大模型领域又来一位重磅玩家

文章概要:

1. 腾讯发布了市面上最大的MoE——Tencentyuan-Large
2. 该模型总参数量约3,激活参数量约52B ,上下文长度达256k,当前业界参数规模最大效果最好的Transformer架构的MoE模型
3.采用高效的超长文 Attention 训练和退火 4混元 Large 模型专项提升的长文能力已经应用腾讯 AI 助手腾讯元宝上
5E (Mixture Experts),即专家模型,MoE 模型的每一层都包含多个并行的同构,一次 token 的前向计算只会激活部分专家
6. 得益于 MoExture of Experts) 结构的优越性, Large 可以在保证模型推理的同时,显著提升模型的参数量进而提升模型性能
7. Hunyuan-Large在与业界开源的模型DeepSeek-V2、Llama31-70B以及Mixtral822B的对比,在CMMLU、MML、CEval等多学科综合集、中英文NLP任务、和数学等大维度全面领先,处于行业领先水平
8 腾讯把自研的、经过业务检验的大模型开放给技术,了个人开发者和中小科技企业的开发成本也推动了一个更加活跃的技术
阅读原文

腾讯混元3D生成大模型“ Hunyuan3D-1.0”正式开源

文章概要:

1. 腾讯公司近日宣布其最新的MoE模型“混元Large”以及混元3D生成大“Hunyuan3D-1.0”已正式开源,企业及开发者免费下载并商用。
2. 腾讯混元3D生成大模型是业界首个同时支持文字、图像生成3D开源大模型,首批开源模型包含轻量版和标准版,轻量版能在10秒内生成高质量3D资产。
3. 该模型已在技术社区公开发布包含模型权重、推理代码、模型算法等完整模型开发者、研究者等各类用户免费使用。
4. 腾讯混元3D生成大模型解决了现有3D在生成速度和泛能力上的不足,帮助3D创作者和艺术家自动化生产3D资产。br>5. 该模型具有强大的泛化能力和可控性,可重建各类尺度物体,从建筑到工具花草。在两个公开的D数据集GSO与Omni,3D生成模型的效果优于主流开源模型,整体能力属于国际领先水平。
6.,腾讯混元带来更多、更多尺寸的开源模型,将更多经过腾讯业务场景打磨和检验的模型开源,以促进大模型技术进步和行业生态繁荣。
阅读原文

产品技术

文章概要:

1. 腾讯混元大模型亮相,包括上线文生图、首批通过备案、率先通过国家大模型测试等
2. 腾讯会议助力腾讯每年节省.亿,腾讯云应用防火墙、腾讯天籁inside音频、腾讯全面支持使用腾讯电子签等
3 腾讯编码器包揽MSU关键指标第一,腾讯云向量数据库发布,一站式边缘安全加速平台EdgeOne,TDSQL首批通过安全可靠测评,为金融机构保驾护航,原生智能数据湖,3D数智人数智人工厂,O视障服务,张国荣演唱会超清修复,分布式分析型TDSQL-A,SQL打破TPC-C纪录,“腾讯云音视频”品牌,H.26/VVC,世界杯快,英雄联盟总决赛直播,音视频中国专利金奖,游戏多媒体引擎GME,开源联盟链软硬件平台,第四代大数据平台
4. 星星海云服务器SA5,星脉高性能网络,高性能应用服务HAI,腾讯云量应用服务器Lighthous,星星海自研服务器,分布式云遨驰,大模型算力集群HCC,AIGC算力,GPU服务器,高性能网络HARP,K贡献榜,100云服务器,DNSPod 4.0
5. 腾讯云CODING,云开发2.0,云开发者,公益云开发,药物互助小程序,玛特小程序,二次元小程序,剧本杀小程序,幼儿园小程序,云原生超级节点>. 三款自研芯片,芯片研发故事,自研芯片“沧海”进展,自动化运营管理,光伏发电,数据中心碳中和,科学家,机器人Ollie,机器人Ollie2.0,机器人Max.0,骨架跃迁分子生成算法,AI新癌细胞,智能手术导航系统,鹏城实验室战略合作,KVM核心突破数中国企业第一
7. 腾讯云原生安全数据湖,数字免疫力模型
阅读原文

【腾讯】高质量3D生成能力,腾讯开源Hunyuan3D-1.0大模型

文章概要:

1. 11月5日,腾讯正式开源了其首个3D生成大模型——Hunyuan3-1.0
2. Hunyuan3D-1.0采用独特的两阶段生成策略,第一阶段采用多视角扩散模型,第二阶段采用前馈重建模型> 3yuan3D-1.极强的泛化能力和可控性能够重建各种尺度的> 4. Hunyuan3D-10在游戏开发、电影制作、设计等领域都有广泛的应用前景
5 Hunyuan3-10腾讯混元大模型家族的重要成员之一,腾讯通过开源Hunyuan3D-1.0,推动3D生成技术在全球范围内的普及与应用
阅读原文

腾讯混元宣布大语言模型和3D模型正式开源

文章概要:

1. 11月5日,腾讯混元宣布其最新的MoE(混合专家)模型“混元Large”以及混元3D生成大模型“Hunyuan3D10”正式开源,支持企业及开发者精调、部署等使用需求,在HuggingFace、Github等技术社区直接下载,免费可商用。
. 腾讯混元Large是目前开源领域参数规模最大、应用效果的MoE模型之一。
3. 腾讯混元3D生成大模型是业界首个同时支持、3D的开源大模型,解决了现有的3D生成模型在生成速度和泛化能力上存在的问题,可以帮助3D创作者和艺术家自动化生产3 4. 腾讯混元3D生成大模型首批开源模型包含轻量版,轻量版仅需10秒生成高质量3D资产,目前已在技术社区公开发布,包含模型权重、推理代码、模型算法等模型,开发者、研究者等各类用户免费使用。> 5. 未来,腾讯混元继续带来更多模态、更多尺寸的开源模型更多经过业务打磨和的模型开源,促进大模型技术进步和行业生态繁荣。
阅读原文

腾讯又出两款神器

文章概要:

1. 腾讯宣布开源两款最新模型MoE架构的大语言模型“Hunyuan-Large(混元Large)”和3D生成大模型unyuan3D-1.0”。
2. 混元Large模型的总参为389B激活参数量为5B,目前开源领域参数规模最大、效果最好的MoE模型。
3. 混元Large模型采用MoE(Mixture of Experts)混合专家模型,具有强大的长文处理能力和高效的性能。
4 混元Large模型在腾讯业务“腾讯元宝上应用,最大25上下文,适用于、多文档摘要总结和长文逻辑推理等任务。br>5. 混元D生成大模型是业界首个支持、图像生成3D的开源大模型泛化能力和性,重建各类尺度物体。
6. 混元3生成模型在腾讯内部大量业务中应用,UGC 3D创作商品合成、游戏3D资产生成等场景。
7. 腾讯开源举措不仅展示了在人工智能领域的技术实力,也为开发者提供了一个强大的工具平台,有助于推动AI技术的和应用创新。
阅读原文

腾讯混元开源:引领技术变革的新潮流

文章概要:

1. 腾讯混元大语言模型和3D模型开源,推动技术广泛应用和行业共同发展
2. 混元Large是目前开源领域参数规模最大、效果最好的MoE模型,将极大地促进自然语言处理技术的进步
3. 混元D生成大模型轻量版仅需10秒即可生成高质量3D资产,将单个3D模型制作成本降低至不到1元
4. 腾讯混元的开源,对于推动技术进步和行业生态繁荣具有重要意义
5. 混元Large在多学科评测中表现极为出色,具有强大的长文能力
6. Hunyuan3D-1.0是业界首个同时支持文字、图像生成3D的开源大模型,具有独特的创新优势
7. 腾讯混元大语言模型和3D模型的开源,为人工智能领域带来了新的活力
8. 腾讯混元开发者提供了强大的工具和平台,使他们能够在已有的基础上进行创新和改进,推动技术的不断进步
9. 腾讯混元在人工智能领域的未来发展潜力巨大,将继续推出更多模态、更多尺寸的开源模型
10. 腾讯将加强与其他企业和机构的合作,共同推动人工智能技术的发展
11. 腾讯还将不断拓展混元大语言模型和3D模型的应用场景
阅读原文

第一批被大模型气死的人…

文章概要:

1. 通用大模型在企业级严肃场景、垂直场景可能会出现幻觉、水土不服的情况,因此需要进行精调;2. 大模型精调存在模型选择、数据清洗标注、算力等难点;3. 腾讯云TI平台可以解决大模型精调的各种难题,包括模型选择、数据准备、精调过程、模型评估与部署等;4. 腾讯云TI平台预置了数据清洗pipeline脚本和大模型标注工具,支持低代码、灵活自定义两种精调模式,提供三层保障机制,加速训练和推理,支持政企部署;5. 腾讯云TI平台提供了完善的模型评估体系,内置推理加速器,提供统一的大模型调用API和体验工具,支持可视化应用编排;6. 混元-Large×TI的强强联合服务已经腾讯云上开放,可以通过直接问答、构造自定义评测集、接入自有大模型应用、基于自有数据集精调等方式使用。
阅读原文

第一批被大模型气死的人…

文章概要:

1. 大模型在B端严肃场景中可能会出现问题,如数据分析、成本核算、招标助手等方面。
2. 大模型精调是解决问题的有效方法,但精调过程中存在难点,如模型选择、数据清洗和标注、算力消耗、模型部署等。
3. 腾讯云TI平台可以帮助企业快速搞定大模型精调,解决模型选择、数据清洗和标注、精调过程、模型与部署等难题。
4. 混元Large是腾讯云TI平台的一个开源模型,具有3890亿总参数量、520亿激活参数量,并支持256K上下文长度,是目前业界参数规模最大、性能领先的开源MoE模型。
5. 混元Large在推理速度和参数规模之间取得了平衡,显著提升了模型的处理能力。
6. 腾讯云TI平台提供了一套完善的模型评估体系,从精调的不同阶段了「轻量体验、客观评测、主观评测」等“考试环节”,并且支持在精调训练的任一checkpoint进行抽查。
7. 腾讯云TI平台提供了可视化应用编排,并可以纳管边缘集群,通过云端控制边缘服务发布,快速落地生产场景。
阅读原文

科技风云起:特斯拉股价飙涨近 15%,腾讯混元大模型开源

文章概要:

1. 特斯拉股价飙涨 15%,创 2023 年 7 月以来新高,市值一夜之间上涨约 120 亿美元,马斯克的身家更是单日增长 209 亿美元,总资产达到 2856 亿美元,稳居全球首富位。
2. 腾讯混元最新的 moe 模型“混元 large”以及混元 3D 生成大模型“hunyuan3d - 1.0”正式开源。
3. 特斯拉股价的大涨和腾讯混元大开源,只是科技领域不断发展和变化的一个缩影。
阅读原文

腾讯开源Hunyuan-Large,3890亿参数,全球最大开源MoE模型

文章概要:

1. 腾讯开源混元模型——Hunyuan-L,是目前开源的基于Transformer的MoE模型,拥有3890亿,20亿参数。
2. Hunyuan-Large通过使用合成数据增强训练,显著减少KV缓存的内存使用量开销推理吞吐量。
3 Hunyuan-Large在常识理解和推理以及经典LP任务中表现出色。
4. 与具有类似激活参数的LLM相比,Hunyuan-Large-Instruct在大多数类型的任务上都了持续改进。
5. 在MMLU数据集上,Hunyuan-Large-Instruct模型比LLama3.1-405B模型高出.6。
6MATH数据集上,Hunyuan-Large-Instruct模型比LLama3.1405B模型高出3.6%。
7. 腾讯还开源了一个3D生成大模型。
阅读原文

重磅发布!腾讯混元打造AI效率之王,性能超越业界标杆

文章概要:

1 苹果Siri即将迎来重大AI升级,新的"App Intent APIs"允许开发者让其应用程序的内容可被Siri和Apple访问,系统将支持直接与浏览器、文档、照片内容进行交互,无需截图操作,iOS 18.测试版已开始支持ChatGPT集成,完整的屏幕感知功能将未来更新中推出
2. 腾讯开源混元大模型,这是一个结合了规模与混合专家(MoE)架构的开源语言模型其性能可与lama-4B等竞品相媲美总参数量达389,但通过创新的路由策略和率技术,激活52B即可高效运行,在7T token包括15T合成数据)训练,在数学、编程和推理上达到了领先水平。
3 苹果通过代号为"Atlas"的内部研究,开始认真探索眼镜"Atlas研究计划正在员工对现有智能眼镜产品和场景反馈,此举或Meta在智能眼镜取得的成功启发,特别是其Ray-Ban智能眼镜和"Orion"机的示范效应。
阅读原文

腾讯AI全面拥抱开源,389B参数MoE,最强开源模型来了

文章概要:

1. 腾讯AI全面拥抱开源,将自家最好的大模型之一混元Large开源,这是目前综合能力最强的开源MoE大语言模型,具有389的MoE模型,参数52B,56上下文,7训练量,免费且商用,各项指标都非常好,代码能力非常强
2. 腾讯不仅放出了自家的超强模型,还公开了干货满满的技术报告,满足了对很多前沿技术的好奇心,对开发AI应用和研究大语言模型技术都很有帮助
3. 腾讯混元Large可以在官网、Github、Hugging Face上使用
4. 除了混元Large,腾讯还放出了一个3D模型:混元3D 1这是业界首个同时支持文字、图像生成3D的开源大模型
5. 腾讯表示,接下来会有混元-M和混元-S会陆续开源,未来还有重磅模型要陆续
阅读原文

腾讯发布业界最大开源MoE模型:Hunyuan-Large,具有3890亿参数,在长文本处理、常识推理、数学能力等方面表现出色。

文章概要:

1. 腾讯发布开源Mixture of Experts(MoE):腾讯混元大模型(unyuan-Large),具有3890亿参数,其中活跃的参数为520亿。
2. 该模型专为提升自然语言处理、计算机视觉和科学任务而设计,文本处理、常识推理、数学能力等方面表现出色。
3. 腾讯混元大模型(Hunyuan-Large)训练过程中使用了大量合成数据,使其可以学习到更丰富的表达方式。
4. 模型采用了KV缓存压缩、分组查询注意力、跨层注意力、专家特定学习率等,提高了模型的训练效率和推理效率。
5. 预训练模型支持256K的上下文窗口,Instruct模型支持128K长度的文本输入,模型处理超长文本时依旧能保持较高的性能。
6. 在多项任务中表现优越,在常识和逻辑推理、阅读理解和问答任务、数学推理能力等方面取得了显著的优势。
7. 在中国语言测试(C-Eval和CMMLU)中,Hunyuan-Large展现出一流的性能,是同类开源模型中的佼佼者。
8. 在与Dense模型和其他MoE模型的对比中,Hunyuan-Large在MMLU、BBH和WinoGrande等多个基准测试上均超过了LLama3.1Mixtral和DeepSeek等同类模型。
阅读原文