李彦宏最新内部讲话,暴露出哪些大模型行业困境?
文章概要:
1. 行业对大模型存在怀疑,认为其可能像上次一样沦为一地鸡毛,但也有人认为大模型是一场。
2. 百度是坚定的AI革命派,李彦宏在内部总监会上道出了当前大模型技术和产业落地的部分难题。4 业界对于追逐Scaling Law的积极性在减弱,这是多方因素共同导致的。 智能云的标准化与定制,大模型喧嚣一年余,玩家开始收敛,是坚定的标准化派。
阅读原文
2. 百度是坚定的AI革命派,李彦宏在内部总监会上道出了当前大模型技术和产业落地的部分难题。
大模型预训练“狼人杀”,是谁悄悄掉队了?
文章概要:
1. 国内顶尖大模型初创公司面临预训练取舍问题
2. 预训练对模型性能至关重要,但成本高昂且具有不确定性
3. 能力和资源是大模型预训练的门槛
4. 部分公司放弃预训练,选择利用开源模型做调优
5. 人才流动频繁,预训练成大模型公司灵魂考验
6. 能力与资源并举是大模型时代的硬指标,中国大模型“小虎”们道路出现分野
阅读原文
2. 预训练对模型性能至关重要,但成本高昂且具有不确定性
3. 能力和资源是大模型预训练的门槛
4. 部分公司放弃预训练,选择利用开源模型做调优
5. 人才流动频繁,预训练成大模型公司灵魂考验
6. 能力与资源并举是大模型时代的硬指标,中国大模型“小虎”们道路出现分野
ChatGPT4o、o1 谁才是最佳大模型?
文章概要:
阅读原文人工智能教育大模型:体系架构与关键技术策略
文章概要:
1. 国外已诞生了Khanmigo、Merlyn Mind、CheggMate、ChatGPT Edu等专门用于教育领域、解决各类教育场景任务的人工智能教育大模型,这些行业模型锚定教育特定场景,通过不同技术方式实现能力的跃升,。
2. 我国呈现“百花齐放”,科大讯飞、网易、腾讯等科技企业都在积极开展和部署自主研发的大模型技术,致力于研发好用、易用的人工智能教育大模型,力求差异化竞争。
3. 人工智能教育大模型的建设需把问题防范和并重推进,一方面采取措施规避上述技术路线可能出现的问题,另一方面坚持“场景优先、数据为王”策略,重视教学应用场景打造,以场景应用为驱动,以学习者为中心,实现“大模型”和“小模型”的集成学习、“大数据”和“小数据”的协同融合。
4. 人工智能教育大模型的建设可以通用大模型核心能力为基础,在教育领域专业语料库基础上精调优化以适配下游特定教育场景任务,并提供相应支持组件,以提升模型在教育场景应用中的适配性能、增强模型教育教学能力。
5. 人工智能教育大模型体系由基础支撑、模型能力、智能体平台、场景应用、模型评测五部分构成。
6. 采取何种技术,不仅是人工智能教育大模型的建设与应用从理论探索走向实践的桥梁,更是确保其在教育场景发挥最大效能、促进教育创新与变革的核心所在。
阅读原文
2. 我国呈现“百花齐放”,科大讯飞、网易、腾讯等科技企业都在积极开展和部署自主研发的大模型技术,致力于研发好用、易用的人工智能教育大模型,力求差异化竞争。
3. 人工智能教育大模型的建设需把问题防范和并重推进,一方面采取措施规避上述技术路线可能出现的问题,另一方面坚持“场景优先、数据为王”策略,重视教学应用场景打造,以场景应用为驱动,以学习者为中心,实现“大模型”和“小模型”的集成学习、“大数据”和“小数据”的协同融合。
4. 人工智能教育大模型的建设可以通用大模型核心能力为基础,在教育领域专业语料库基础上精调优化以适配下游特定教育场景任务,并提供相应支持组件,以提升模型在教育场景应用中的适配性能、增强模型教育教学能力。
5. 人工智能教育大模型体系由基础支撑、模型能力、智能体平台、场景应用、模型评测五部分构成。
6. 采取何种技术,不仅是人工智能教育大模型的建设与应用从理论探索走向实践的桥梁,更是确保其在教育场景发挥最大效能、促进教育创新与变革的核心所在。
强烈推荐:2024年度AI报告,大模型进入下一阶段,产品经理窗口期来了!
文章概要:
1. 红杉资本发布年度报告,聚焦生成式人工智能(AI),总结过去一年的重大进展并剖析其对未来商业和社会发展的深远影响。
2. 通过对海量数据的分析和对行业专家的访谈,红杉资本提炼出了几个极具洞察力的关键发现,包括新的 scaling law 已经开始、SaaS 的重新定义、细分领域的-how 将变得无比重要等>3. 最重要是一方面看到大模型进入到下一阶段的技术突破,,伴随着模型变强大的过程,经理的窗口期已经来了。
4. 生成式 AI 市场的基础层已经趋于稳定,形成了由一些重要玩家和联盟主导的平衡态,包括 Microsoft/OpenAI、AWS/Anthropic、Meta 和 Google/DeepMind。
5. 人们的注意力正逐渐转向推理层的开发和扩展,这一层以“系统 2”思维为主导。
6. 2024 年最重要的模型更新非 OpenAI 的 o1 莫属,它以前被称为 Q*,内部代号为 Strawberry。
7. AlphaGo 在预训练时不仅模仿了人类专家的决策,它还会在作答前“停下来思考”。
8. 思维 AI 研究正进入一个全新的阶段,从预训练的“本能反应”(“系统 1”)到深度推理(“系统 2”)的飞跃,成为下一个突破点。
9. 推理时代的竞赛开始 o1 论文最关键的发现是,AI 推理层面有了一条新的扩展法则。
10. 当 OpenAI、Anthropic、Google 和 Meta 继续扩展推理层,开发出越来越强大的推理机器时,未来会如何?我们会走向“一个模型统治所有”的局面吗?
11. 复杂的现实世界要求大量特定领域和应用场景的推理,而这些推理无法通过通用模型高效实现。
12. 新一代自主型应用开始涌现,这些应用层公司的形态是怎样的呢?有趣的是,它们与传统的云计算公司看起来有所不同。<13. 作为投资者,我们的重点放在哪里?资金在流向哪些方向?以下是我们的一些简要分析。
14. 在生成式 AI 的下一个阶段,我们预计推理研发的成果将快速且深入地渗透到应用。
阅读原文
2. 通过对海量数据的分析和对行业专家的访谈,红杉资本提炼出了几个极具洞察力的关键发现,包括新的 scaling law 已经开始、SaaS 的重新定义、细分领域的-how 将变得无比重要等>3. 最重要是一方面看到大模型进入到下一阶段的技术突破,,伴随着模型变强大的过程,经理的窗口期已经来了。
4. 生成式 AI 市场的基础层已经趋于稳定,形成了由一些重要玩家和联盟主导的平衡态,包括 Microsoft/OpenAI、AWS/Anthropic、Meta 和 Google/DeepMind。
5. 人们的注意力正逐渐转向推理层的开发和扩展,这一层以“系统 2”思维为主导。
6. 2024 年最重要的模型更新非 OpenAI 的 o1 莫属,它以前被称为 Q*,内部代号为 Strawberry。
7. AlphaGo 在预训练时不仅模仿了人类专家的决策,它还会在作答前“停下来思考”。
8. 思维 AI 研究正进入一个全新的阶段,从预训练的“本能反应”(“系统 1”)到深度推理(“系统 2”)的飞跃,成为下一个突破点。
9. 推理时代的竞赛开始 o1 论文最关键的发现是,AI 推理层面有了一条新的扩展法则。
10. 当 OpenAI、Anthropic、Google 和 Meta 继续扩展推理层,开发出越来越强大的推理机器时,未来会如何?我们会走向“一个模型统治所有”的局面吗?
11. 复杂的现实世界要求大量特定领域和应用场景的推理,而这些推理无法通过通用模型高效实现。
12. 新一代自主型应用开始涌现,这些应用层公司的形态是怎样的呢?有趣的是,它们与传统的云计算公司看起来有所不同。<13. 作为投资者,我们的重点放在哪里?资金在流向哪些方向?以下是我们的一些简要分析。
14. 在生成式 AI 的下一个阶段,我们预计推理研发的成果将快速且深入地渗透到应用。
AI大模型技术层行业分析(三)迭代版
文章概要:
1. 现状分析包括组成部分与市场参与者、商业模式、主流算法、AI大模型的相关算法等方面。
2. 组成与市场参与者包括底层大模型、相关算法/模型、框架AI供应商br>.算法供应商供应商商业模式>深度学习学习、监督br和趋势商业
7. 技术算法方面和开发框架方面。
8 商业化趋势包括算法基础商业化模式、相关算法/模型研究机构商业化模式、框架供应商商业化模式、AI开发平台供应商商业化模式和开源社区商业化模式。
阅读原文
2. 组成与市场参与者包括底层大模型、相关算法/模型、框架AI供应商br>.算法供应商供应商商业模式>深度学习学习、监督br和趋势商业
7. 技术算法方面和开发框架方面。
8 商业化趋势包括算法基础商业化模式、相关算法/模型研究机构商业化模式、框架供应商商业化模式、AI开发平台供应商商业化模式和开源社区商业化模式。
工业新智能:矿山产业集群大模型运营最佳实践
文章概要:
1. 介绍了华为云
2. 宣传了华为云Stack
阅读原文
2. 宣传了华为云Stack
【精选报告】大模型专题二:海外模型应用复盘,国内AI奇点已至(附PDF下载)
文章概要:
1. 模型层面,GPT-4领先,多模态演进趋势加速,当下LLM模型的规模持续增长,参数量已远远超过千亿级别,多模态崭露头角;2. 应用层面,参照海外落地路径,国内纯模型端、教育、办公、图像、视频、金融、医疗、类特别是C端应用值得关注,国内模型端相对海外大概滞后1年时间,参照海外应用发展情况,Q4或是国内应用商业化落地拐点;3. 主要大模型汇总:GPT-4领先,多模态演进趋势加速,OpenAI打开LLM新纪元,GPT-4多模态再,DALL-E3发布,颠覆AI生成图片技术,Google&DeepMind:LLM的奠基者,即将推出Gemini多模态模型,机器人模型RT-2—机器人多模态GPT时代已至Anthropic:Claude——ChatGPT-4平替,擅长安全可控,Meta:Llama开源重塑大模型市场格局,Falcon:免费商用的模型;4. 模型性能比较:GPT-4独占鳌头,我们对一些广泛使用的模型的性能进行了分析,主要依据模型大规模多任务理解上的表现进行了排序,同时参考了模型在MT-bench测试中的得分,用于评估模型行在多轮对话中的会话流程和遵循指令的能力;5. 大语言模型蓬勃发展,应用端落地进程加速,应用端产品从导入期迈向成长期,为企业带来新的收入增长点;6. 模型端:Anthropic:与亚马逊深度合作,加快企业发展速度;7. AI+语音:AssemblyAI:利用语音数据构建AI应用;8. AI+图像/视频:Midjourney:从文本到图像的AI生成器;9. 企业加速应用端开发,探索盈利新机遇;10. AI+社交:基于LLM的聊天机器人;1. AI+图像/视频:Adobe Firefly:解锁想象力;12. AI+金融:开源的金融数据大模型;13. AI+音乐:Musico:一个会创作音乐的AI。
阅读原文
从“夕发朝至”到“智算为王”:智算平台成企业“大模型”时代成功关键
文章概要:
1. 随着大模型训练对算力需求的级增长,人工智能与超级计算的界限逐渐模糊,智算平台成为大模型训练的必备基础设施。
2. 赛斯与并行科技打造了基于混合弹性云架构的高性能计算平台,整合了集团内部算力资源,并结合自研的智能化仿真平台,了云端资源的统一调度
3. 面对大模型训练带来的算力挑战,陈健提出“智能算”的概念,即面向人工智能的算。
4. 未来的智算平台需要具备更高的性能、更低的成本、更智能的调度能力,才能满足大和推理的苛刻需求。
阅读原文
2. 赛斯与并行科技打造了基于混合弹性云架构的高性能计算平台,整合了集团内部算力资源,并结合自研的智能化仿真平台,了云端资源的统一调度
3. 面对大模型训练带来的算力挑战,陈健提出“智能算”的概念,即面向人工智能的算。
4. 未来的智算平台需要具备更高的性能、更低的成本、更智能的调度能力,才能满足大和推理的苛刻需求。
【每日精读】「装备大模型化」落地破圈!AI技术的一次自证与他证
文章概要:
1. 该文章主要讲述了「装备大模型化」的落地破圈技术的自证证
2. 文章来源为智东西
阅读原文
2. 文章来源为智东西
中国移动IT运维大模型成果登上国际顶级学术期刊,助力AI模型架构设计
文章概要:
1. 中国移动信息技术中心运维“模型架构自动化设计”研究人工智能领域国际顶级学术期刊-IEEE Transactions on Neural Networks Systems》上发表<> 2. 该成果创新性地提出了“自适应通道分配算法”以解决当前业界AI架构设计面临的门槛高稳定性等难题,推动提升AI架构设计的和稳定性能力。
3. 中国移动信息技术中心IT运维大模型聚焦模型架构研发设计,创新性提出自适应通道算法”,有助于模型架构设计。br> 目前,中国移动信息技术应用该打造了“深瞳”IT运维模型,并应用于中国移动IT运维领域,通过智能化的模型设计与训练成果,有效降低大模型训练门槛,助力提升业务运维,已落地服务省公司2余家。
5,中国移动中心持续深化IT运维领域智能化探索,提升算法的灵活性与泛化推动运维效率与质量的双重提升,实现运维工作智能化、自动化与精细化管理。
阅读原文
3. 中国移动信息技术中心IT运维大模型聚焦模型架构研发设计,创新性提出自适应通道算法”,有助于模型架构设计。br> 目前,中国移动信息技术应用该打造了“深瞳”IT运维模型,并应用于中国移动IT运维领域,通过智能化的模型设计与训练成果,有效降低大模型训练门槛,助力提升业务运维,已落地服务省公司2余家。
5,中国移动中心持续深化IT运维领域智能化探索,提升算法的灵活性与泛化推动运维效率与质量的双重提升,实现运维工作智能化、自动化与精细化管理。
案例实践丨大模型助力半导体企业“事件管控”智能化
文章概要:
1. 创新奇智为国内领头的半导体晶圆生产代工企业打造智能事件管理,该项目引入大模型技术,提升效率减少运营成本,进一步优化生产工艺>2. 创新奇智在智能事件管理中嵌入的奇孔明AlnnoGC工业大模型,整合了ChatDoc、ChatBI应用和Agent智能客户MES的无缝对接,实现事件智能分析、数据查询、知识问答和任务自动化
3. ChatDoc智能事件分析可结合客户内部的数据和知识进行深层次分析理解,让生产人员可以实时询问关于设备状态故障或生产流程,并快速得到精准的答案
4BI智能数据查询分析可以快速进行数据检测,并对其深度分析,并迅速识别并解读生产过程中发生的各种异常事件>5. Agent智能任务流程管理在企业生产事件管理系统中,Agent智能任务编排能力也至关角色
. 创新奇智为客户打造的智能事件将工业大模型的智能问答能力、数据分析以及Agent智能任务管理能力有机的结合半导体企业创造了显著的价值
7. 创新奇智专注于“AI+制造”,打造“工业软件、数软件、工业物流、智能装备、工业”五大业务主题,赋能钢铁冶金、面板半导体、3C高科技、汽车装备、电力、工程建筑、食品饮料&新材料、智造实训等领域的行业客户
阅读原文
3. ChatDoc智能事件分析可结合客户内部的数据和知识进行深层次分析理解,让生产人员可以实时询问关于设备状态故障或生产流程,并快速得到精准的答案
4BI智能数据查询分析可以快速进行数据检测,并对其深度分析,并迅速识别并解读生产过程中发生的各种异常事件>5. Agent智能任务流程管理在企业生产事件管理系统中,Agent智能任务编排能力也至关角色
. 创新奇智为客户打造的智能事件将工业大模型的智能问答能力、数据分析以及Agent智能任务管理能力有机的结合半导体企业创造了显著的价值
7. 创新奇智专注于“AI+制造”,打造“工业软件、数软件、工业物流、智能装备、工业”五大业务主题,赋能钢铁冶金、面板半导体、3C高科技、汽车装备、电力、工程建筑、食品饮料&新材料、智造实训等领域的行业客户
PaddleNLP上新!浪潮信息源2.0全面接入,大模型生态加速进化!
文章概要:
1 源2.0开源大模型与百度PaddleNLP完成全面适配,用户可通过PaddleNLP快速调用源2.0预训练模型,也可使用特定领域的数据集对其进行微调。br>2. PaddleNLP是百度基于飞桨框架打造的大语言模型套件,具有高效训练和推理,可满足灵活定制的开发需求
3. 源2.0系列基础大模型首个全面开源的千亿参数模型,此次适配标志其迁移到飞桨中,了PLP的大模型。br> 相关代码已提交至PaddleN开源项目,可参考文档进行操作。
阅读原文
3. 源2.0系列基础大模型首个全面开源的千亿参数模型,此次适配标志其迁移到飞桨中,了PLP的大模型。br> 相关代码已提交至PaddleN开源项目,可参考文档进行操作。
Q3大模型中标项目超360个,业界仍在解决落地难
文章概要:
1. 大模型落地项目在大模型相关中标项目数,仅2024年第三季度已至少有369个6模型生态落地不明显等问题,项目内容反映出,业界在着手解决这一系列。
2. 20第三落地相关增多,各行各业企业都更细分的应用 硬件项目颇为的部分2成的项目,均为算力硬件云资源的采购,的采购人,不仅一些的先锋也医院> 大模型一个鲜明特点是,的项目愈加多起来,至少有14项目与人才相关,这个数量远超的情况。< 目前大落地最大的问题数据不ready。用户可能等混搭。模型落地的逐渐深入,这个正在更加6云行业核心研发;:凶猛的拿单智谱AI:Q3平均金额涨了中标个项目其中23为内部;中国移动中标亿元大模型配套算力;中国联通:中标多开源火山:中标为公有应用服务;云:一体进入更核心场景;浪潮系:软硬一体,行业优势突出;商汤科技:中标2亿元超级大单腾讯云:至少中标2个大模型相关项目。
阅读原文
2. 20第三落地相关增多,各行各业企业都更细分的应用 硬件项目颇为的部分2成的项目,均为算力硬件云资源的采购,的采购人,不仅一些的先锋也医院> 大模型一个鲜明特点是,的项目愈加多起来,至少有14项目与人才相关,这个数量远超的情况。< 目前大落地最大的问题数据不ready。用户可能等混搭。模型落地的逐渐深入,这个正在更加6云行业核心研发;:凶猛的拿单智谱AI:Q3平均金额涨了中标个项目其中23为内部;中国移动中标亿元大模型配套算力;中国联通:中标多开源火山:中标为公有应用服务;云:一体进入更核心场景;浪潮系:软硬一体,行业优势突出;商汤科技:中标2亿元超级大单腾讯云:至少中标2个大模型相关项目。
议程发布|大模型赋能新消费的场景在哪里?
文章概要:
1 1031日下午,百联集团、东方购物、汤引擎、势科技将进行案例分享和头脑风暴,共话大模型时代新领域的机遇
2. 现转发推文或报名活动,联系免费领取近100份报告
3. 欢迎来到现场生态伙伴们交流!想了解大在各行业应用,请点击
阅读原文
2. 现转发推文或报名活动,联系免费领取近100份报告
3. 欢迎来到现场生态伙伴们交流!想了解大在各行业应用,请点击
提质增效,大模型+知识管理在央国企、制造、零售等领域案例分享
文章概要:
1. 企业在发展中积累数据和知识,如何发挥其价值,利用数据赋能企业内部核心管理,推动核心业务进展,是本文探讨的重点。
2. 鸿翼提出以 AI 大模型为技术驱动,以企业自身和知识沉淀为基础,通过知识管理深入赋能业务场景,重塑业关键业务和流程,并聚焦在不同层次,从办公到经营管理到核心业务,推行大模型知识管理在企业应用侧的“一体三环”落地路径。
3. 国内某芯片半导体企业希望通过大模型知识管理系统逐渐创造智能助理,从智能实习生慢慢过渡到数字助理,甚至到咨询顾问专家,最终成为优秀的数字员工。,也能够帮助企业充分利用分散的文档、知识内容、业务系统中的数据,通过问答类应用快速获取已有知识以及通过任务类构建实现快速任务的执行。
4. 某家电制造品牌希望能够构建庞大的面向海外的客服体系知识管理系统,主要解决知识产生、翻译能力、语音转文本等问题。
5. 某能源央企希望在拟稿过程中提供相应助力,可以基于原有的优秀范文、公文范本,快速生成内容,并对专项中的政治错误、敏感词错误、常见语句错误、法律条文的引用和错误审核,做直接的内容生成和内容辅助审核,在拟稿过程中保证内容更加符合质量要求。
6. 某希望借助大模型能力,对上传科研项目资料进行内容审查。
阅读原文
2. 鸿翼提出以 AI 大模型为技术驱动,以企业自身和知识沉淀为基础,通过知识管理深入赋能业务场景,重塑业关键业务和流程,并聚焦在不同层次,从办公到经营管理到核心业务,推行大模型知识管理在企业应用侧的“一体三环”落地路径。
3. 国内某芯片半导体企业希望通过大模型知识管理系统逐渐创造智能助理,从智能实习生慢慢过渡到数字助理,甚至到咨询顾问专家,最终成为优秀的数字员工。,也能够帮助企业充分利用分散的文档、知识内容、业务系统中的数据,通过问答类应用快速获取已有知识以及通过任务类构建实现快速任务的执行。
4. 某家电制造品牌希望能够构建庞大的面向海外的客服体系知识管理系统,主要解决知识产生、翻译能力、语音转文本等问题。
5. 某能源央企希望在拟稿过程中提供相应助力,可以基于原有的优秀范文、公文范本,快速生成内容,并对专项中的政治错误、敏感词错误、常见语句错误、法律条文的引用和错误审核,做直接的内容生成和内容辅助审核,在拟稿过程中保证内容更加符合质量要求。
6. 某希望借助大模型能力,对上传科研项目资料进行内容审查。
2024国产AI大模型应用发展现状与未来趋势
文章概要:
1. AI大模型的发展历程:可追溯到上世纪50年代,经历了早期探索、技术突破和规模化应用阶段。
2. 国产AI大模型的历程:起步于OpenAI发布GPT-2大模型后,223年进入快速发展阶段,政策驱动和技术创新使其技术水平快速提升。
3. 国产AI大模型应用落地情况:应用市场涵盖多个领域,下载量和月活量快速增长,热门应用有《豆包》《文心一言》等,不同应用的用户结构、兴趣偏好和使用习惯存在差异。
4. 国产AI大模型应用未来发展趋势:多模态大模型将成为发展方向,垂直领域产品化将加速,商业化模式将不断探索。
阅读原文
2. 国产AI大模型的历程:起步于OpenAI发布GPT-2大模型后,223年进入快速发展阶段,政策驱动和技术创新使其技术水平快速提升。
3. 国产AI大模型应用落地情况:应用市场涵盖多个领域,下载量和月活量快速增长,热门应用有《豆包》《文心一言》等,不同应用的用户结构、兴趣偏好和使用习惯存在差异。
4. 国产AI大模型应用未来发展趋势:多模态大模型将成为发展方向,垂直领域产品化将加速,商业化模式将不断探索。
浅谈人工智能与大模型
文章概要:
1. 人工智能是指通过或来扩展和增强人类的智能行为其核心要素主要包括数据算法和算力。
2. 大模型通常是指那些规模庞大参数的机器学习模型,它们能够处理复杂任务,并在学习过程表现出的性能。br>. 大模型的架构大多采用了Transformer,Transformer是一种用于自然语言处理(NLP序列到序列(sequence-to-sequence)任务的深度学习模型架构。
阅读原文
2. 大模型通常是指那些规模庞大参数的机器学习模型,它们能够处理复杂任务,并在学习过程表现出的性能。br>. 大模型的架构大多采用了Transformer,Transformer是一种用于自然语言处理(NLP序列到序列(sequence-to-sequence)任务的深度学习模型架构。
浪潮云洲受邀出席2024产业投融资大会 以大模型驱动新型工业化发展
文章概要:
1 10月22日至23日,224产业投融资大会山东青岛举办,浪潮云洲受邀出席对接会,分享“知业大模型”在工业领域的创新实践
. 浪潮云洲“知业大模型”融合工业互联网平台海量工业数据,以1个基础模型为核心,构建起行业特有的图谱,搭建“N个行业模型”,为不同行业提供服务,并成功通过国家网信办“境内深度合成服务算法”和“生成式人工智能服务上线”双备案>3. 浪潮云洲以“知业大模型”为基础,立足行业,深入企业,落地场景,已打造出铝业风电、农业等5款行业模型,形成数字化转型服务、工艺优化、柔性生产种植等15款场景大模型
4. 浪潮云亨通集团打造了知业·线缆行业大,高效解决痛点难点问题
5. 浪潮云洲携手山东电工电气打造“基于企业知识库的安全监测与智能客服大模型智能体”成功入选山东省工信厅公布了“赋景”数字化转型揭榜挂帅试点项目名单,并位居名单榜首>. 未来,云知业大模型”将企业数字化转型“主战场”,继续立足行业,深入企业,锤炼“1个基础模型+N个行业模型+X种场景应用”模式,持续赋能企业数字化转型,助推工业化发展
阅读原文
. 浪潮云洲“知业大模型”融合工业互联网平台海量工业数据,以1个基础模型为核心,构建起行业特有的图谱,搭建“N个行业模型”,为不同行业提供服务,并成功通过国家网信办“境内深度合成服务算法”和“生成式人工智能服务上线”双备案>3. 浪潮云洲以“知业大模型”为基础,立足行业,深入企业,落地场景,已打造出铝业风电、农业等5款行业模型,形成数字化转型服务、工艺优化、柔性生产种植等15款场景大模型
4. 浪潮云亨通集团打造了知业·线缆行业大,高效解决痛点难点问题
5. 浪潮云洲携手山东电工电气打造“基于企业知识库的安全监测与智能客服大模型智能体”成功入选山东省工信厅公布了“赋景”数字化转型揭榜挂帅试点项目名单,并位居名单榜首>. 未来,云知业大模型”将企业数字化转型“主战场”,继续立足行业,深入企业,锤炼“1个基础模型+N个行业模型+X种场景应用”模式,持续赋能企业数字化转型,助推工业化发展
中国大模型首次超车!Yi-Lightning强势超越GPT-4!
文章概要:
1. 中国的Yi-Lightning在顶尖的LMSYS Chatbot Arena榜单上成功超越GPT-4o-24-51和ude 3 Sonnet,至第六中国第一的位置象征着中国AI模型在国际竞争首次实现了强势“超越”。br> 2. Yi-Light在中文排行榜上表现亮眼,众多国内外知名模型,中国大模型中的“中文理解之王”
3. Yi-Lightning在轮排行榜上,广为人知的Gemini和ude,荣登全球第三。br> 4 Yi-Lightning在算术和编程方面表现出色,数学和代码榜单中分别了全球和第四的佳绩。
5-Lning在难度问题和长提问榜单中稳居第四中国充分展现其多领域问题上的推理能力
6. Yi-Lightning正式上线Yi大模型开放每百万token仅售0.99元。
阅读原文
3. Yi-Lightning在轮排行榜上,广为人知的Gemini和ude,荣登全球第三。br> 4 Yi-Lightning在算术和编程方面表现出色,数学和代码榜单中分别了全球和第四的佳绩。
5-Lning在难度问题和长提问榜单中稳居第四中国充分展现其多领域问题上的推理能力
6. Yi-Lightning正式上线Yi大模型开放每百万token仅售0.99元。
小白学大模型:提示词工程与Agent
文章概要:
1. 本文提出了33个词汇术语的全面词汇表,58种纯文本提示技术的分类法,以及其他模态的40种技术
2. 大模型通常依赖用户提供的输入“提示”(prompt)来生成输出。提示可能是文本形式的——“写一首关于树的诗。” 或者采取其他形式:图像、音频、视频或它们的组合
3. 提示是输入给生成式人工智能(Generative AI)模型的指令,用于指导模型的输出。提示可以由文本、图像、声音或其他媒体组成
4. 提示链(Prompt Chain)由两个或更多的提示模板连续使用组成。第一个提示模板生成的提示的输出用于参数化第二个模板,直到所有模板都耗尽为止
5. 提示工程(Prompt Engineering)是通过修改或更改所使用的提示技术来开发提示的迭代过程
6. 提示工程技术(Prompt Engineering Technique)迭代改进提示的策略。通常是自动化技术,但在消费者设置中,用户通常手动执行提示工程
7. 思维链(Chain-of-Thought, CoT)提示利用少样本提示鼓励LLM在给出最终答案之前表达其思维过程
8. 思维树(Tree-of-Thought ToT),也称为思维树,通过从初始问题开始然后以思维(如Co)的形式生成多个可能的步骤来创建类似树的搜索问题
9. 随着LLMs的能力迅速提高,公司和研究人员探索了如何让它们利用外部系统。这主要是因为LLMs在数学计算、推理和事实性方面的不足。这推动了提示技术的显著创新;这些系统通常由提示和提示链驱动,这些提示和提示链经过精心设计,以允许类似代理的行为
10. 工具使用是GenAI代理的一个关键组成部分。符号工具(例如计算器、代码解释器)和神经工具(例如单独的LLM)通常被使用。工具有时被称为专家或模块
11. 程序辅助语言模型(Program-aided Language Model, PAL)直接将问题翻译成代码,这些代码被发送到Python解释器以生成
1 一些被为玩具交互来解决问题。基于的代理提示接收插入的观察结果
13. LLM集成Minecraft的工作产生了令人印象深刻的结果能够这个开放视频导航时获得新技能。我们不仅将这些代理视为将代理技术应用于Minecraft,而是将它们视为可以在需要终身学习的真实世界任务中探索的新型代理框架
14. RAG是一种从外部源检索信息并将其插入提示中的范式。这可以增强知识密集型的性能。当检索本身被用作外部工具时,RAG系统被视为代理
阅读原文
2. 大模型通常依赖用户提供的输入“提示”(prompt)来生成输出。提示可能是文本形式的——“写一首关于树的诗。” 或者采取其他形式:图像、音频、视频或它们的组合
3. 提示是输入给生成式人工智能(Generative AI)模型的指令,用于指导模型的输出。提示可以由文本、图像、声音或其他媒体组成
4. 提示链(Prompt Chain)由两个或更多的提示模板连续使用组成。第一个提示模板生成的提示的输出用于参数化第二个模板,直到所有模板都耗尽为止
5. 提示工程(Prompt Engineering)是通过修改或更改所使用的提示技术来开发提示的迭代过程
6. 提示工程技术(Prompt Engineering Technique)迭代改进提示的策略。通常是自动化技术,但在消费者设置中,用户通常手动执行提示工程
7. 思维链(Chain-of-Thought, CoT)提示利用少样本提示鼓励LLM在给出最终答案之前表达其思维过程
8. 思维树(Tree-of-Thought ToT),也称为思维树,通过从初始问题开始然后以思维(如Co)的形式生成多个可能的步骤来创建类似树的搜索问题
9. 随着LLMs的能力迅速提高,公司和研究人员探索了如何让它们利用外部系统。这主要是因为LLMs在数学计算、推理和事实性方面的不足。这推动了提示技术的显著创新;这些系统通常由提示和提示链驱动,这些提示和提示链经过精心设计,以允许类似代理的行为
10. 工具使用是GenAI代理的一个关键组成部分。符号工具(例如计算器、代码解释器)和神经工具(例如单独的LLM)通常被使用。工具有时被称为专家或模块
11. 程序辅助语言模型(Program-aided Language Model, PAL)直接将问题翻译成代码,这些代码被发送到Python解释器以生成
1 一些被为玩具交互来解决问题。基于的代理提示接收插入的观察结果
13. LLM集成Minecraft的工作产生了令人印象深刻的结果能够这个开放视频导航时获得新技能。我们不仅将这些代理视为将代理技术应用于Minecraft,而是将它们视为可以在需要终身学习的真实世界任务中探索的新型代理框架
14. RAG是一种从外部源检索信息并将其插入提示中的范式。这可以增强知识密集型的性能。当检索本身被用作外部工具时,RAG系统被视为代理
极智AI | 解读大模型KV Cache
文章概要:
1. KV Cache在基于的生成模型的优化中扮演重要角色,一种存储Transformer模型在自注意力机制中生成的Key和向量的缓存机制
2. 在Transformer的自注意力机制中,每个输入Token都会为查询Query、Key和值向量。
. 自注意力的计算包括计算注意力分数、化、求和
4 KV Cache的优势包括计算高、内存利用。
5. 文章介绍了KV Cache的推导过程提供了一个基于PyTorch的示例代码,展示如何在Transformer模型中实现KV Cache。
6. 在实际的大规模模型中,KV Cache的实现需要考虑并行处理、管理、跨层缓存等优化。
阅读原文
2. 在Transformer的自注意力机制中,每个输入Token都会为查询Query、Key和值向量。
. 自注意力的计算包括计算注意力分数、化、求和
4 KV Cache的优势包括计算高、内存利用。
5. 文章介绍了KV Cache的推导过程提供了一个基于PyTorch的示例代码,展示如何在Transformer模型中实现KV Cache。
6. 在实际的大规模模型中,KV Cache的实现需要考虑并行处理、管理、跨层缓存等优化。
“新华妙笔”入选“主流媒体大模型应用创新案例”!
文章概要:
1. 10月15日,“新华”入选“主流媒体大模型应用创新”,业界推广大模型+媒体创新实践应用的多方面成果
2. “新华由新华社媒体生产技术与系统国家重点实验室携手博特智能共同打造,专注于写作场景的智能化升级。
3. 20年7月,新华融媒与博特智能联合推出“新华妙笔,包括妙笔工具、妙笔学习、妙笔三大核心板块。
4. 此次入选,体现新华妙笔”在推动与智能技术方面的突出成果,了行业广泛认可。
阅读原文
2. “新华由新华社媒体生产技术与系统国家重点实验室携手博特智能共同打造,专注于写作场景的智能化升级。
3. 20年7月,新华融媒与博特智能联合推出“新华妙笔,包括妙笔工具、妙笔学习、妙笔三大核心板块。
4. 此次入选,体现新华妙笔”在推动与智能技术方面的突出成果,了行业广泛认可。
央国企加速大模型布局:30家央国企成功发布大模型
文章概要:
1. 2024年央国企招采中涉及大的逐渐国企加速大模型。
2. 中国海油发布“海能”模型,围绕8大类10多个业务场景模型,支持集团上中下游业务
3. 中国南方电网电力行业首个跨NLP/CV模态大模型大瓦特,多种能力。<> 4 国网湖南电科院研发的0亿节点配网视觉大模型,满足作业各种。
6. 国家能源集团发布“能源通道大模型”,支撑集团实现“全景、共振易”一体化的运营调度。
7. 中国中煤能源集团天津设计中煤“地知”模型,采用国内开源大模型+多元多能小模型煤炭知识图谱技术。
9 中国石油发布330亿参数大,从大模型、大模型、专业大模型、场景大模型四方面发布针对性模型。br> 10. 煤炭科学研究总院发布太阳石大,从6个层面进行建设
11 北大荒信息发布寒地作物大模型,融合集团数十年积累的地种植数据,并持续引入新的农业大数据。
阅读原文
2. 中国海油发布“海能”模型,围绕8大类10多个业务场景模型,支持集团上中下游业务
3. 中国南方电网电力行业首个跨NLP/CV模态大模型大瓦特,多种能力。<> 4 国网湖南电科院研发的0亿节点配网视觉大模型,满足作业各种。
6. 国家能源集团发布“能源通道大模型”,支撑集团实现“全景、共振易”一体化的运营调度。
7. 中国中煤能源集团天津设计中煤“地知”模型,采用国内开源大模型+多元多能小模型煤炭知识图谱技术。
9 中国石油发布330亿参数大,从大模型、大模型、专业大模型、场景大模型四方面发布针对性模型。br> 10. 煤炭科学研究总院发布太阳石大,从6个层面进行建设
11 北大荒信息发布寒地作物大模型,融合集团数十年积累的地种植数据,并持续引入新的农业大数据。
首批 | 浙江移动ChatBI通过信通院“数字原生应用-基于大模型的智能分析BI”评估
文章概要:
1. 政府工作报告多次提到“人工智能”,并提出开展“人工智能+”行动。
2.完成了数字原生应用-基于大分析评估。
3信息基础设施建设,夯实共同富裕智基座。
4.移动着力推进改革创新能力提升,积极引入大模型等新兴技术发展引擎。
5. ChatBI作为公司数据分析领域的语言大模型BI产品交互。<>6. ChatBI、单指标可视分析多指标组合上下文联想分析等能力。
阅读原文
2.完成了数字原生应用-基于大分析评估。
3信息基础设施建设,夯实共同富裕智基座。
4.移动着力推进改革创新能力提升,积极引入大模型等新兴技术发展引擎。
5. ChatBI作为公司数据分析领域的语言大模型BI产品交互。<>6. ChatBI、单指标可视分析多指标组合上下文联想分析等能力。
以AI之力应对AI引发的网络挑战——大模型还能这么用
文章概要:
1. AI的进展非常快,特别是大模型的出现,彻底改变了各行业的游戏规则。
2. 大模型在迅速改变我们身边的各个行业,它不仅在应用端场景上大显身手,如今连基础设施领域也可以感受到大模型的“魔法”。
3. 随着AI技术的普及直接导致了数据量的成倍增长,传统网络架构在面对如此庞大的数据吞吐时,其性能瓶颈日益显现。
4. 华为在数据通信领域迈出了创新的步伐,发布了通信大模型应用NetMaster,它能够实现自然语言、自动决策、智能调优等多种功能。
5. 华为发布星河AI自动驾驶网络解决方案,技术赋能网络,解决方案采用了“三层架构”的设计,包括智能网元、数字孪生和智慧大脑,加速千行万业的全面数智化转型。
阅读原文
2. 大模型在迅速改变我们身边的各个行业,它不仅在应用端场景上大显身手,如今连基础设施领域也可以感受到大模型的“魔法”。
3. 随着AI技术的普及直接导致了数据量的成倍增长,传统网络架构在面对如此庞大的数据吞吐时,其性能瓶颈日益显现。
4. 华为在数据通信领域迈出了创新的步伐,发布了通信大模型应用NetMaster,它能够实现自然语言、自动决策、智能调优等多种功能。
5. 华为发布星河AI自动驾驶网络解决方案,技术赋能网络,解决方案采用了“三层架构”的设计,包括智能网元、数字孪生和智慧大脑,加速千行万业的全面数智化转型。
数字园地 | AI大模型混战后,以知识为中心驱动的人工智能迎来风口?
文章概要:
1. 第136届中国进出口商品交易会开幕,吸引近400企业参会,AI大模型正逐渐跨越单一模态的界限。
2. 如何降低生成式人工智能应用中的幻觉问题,仍是业内的重要关注点。
3 人工智能技术赋能场景应用,不断提升效果的主要架构有两种分别是以模型为Model-Centric和以数据为中心-Centric。
. 在人工智能时代,的重要资产之一是数据以及可能由此衍生而出的“精准知识库”。
5. 随着ChatGPT、Sora等工具的快速迭代跨境电商行业亦迎来诸多变革。
枫清科技将立足广州,进一步拓展华南区业务辐射粤港澳大湾区,助力本地区企业智能化转型升级
阅读原文
2. 如何降低生成式人工智能应用中的幻觉问题,仍是业内的重要关注点。
3 人工智能技术赋能场景应用,不断提升效果的主要架构有两种分别是以模型为Model-Centric和以数据为中心-Centric。
. 在人工智能时代,的重要资产之一是数据以及可能由此衍生而出的“精准知识库”。
5. 随着ChatGPT、Sora等工具的快速迭代跨境电商行业亦迎来诸多变革。
枫清科技将立足广州,进一步拓展华南区业务辐射粤港澳大湾区,助力本地区企业智能化转型升级
一图看94家工业企业大模型应用现状
文章概要:
1 中国的工业企业大多从2023年下半年开始单点探索大模型应用经过一年多的探索,头部工业企业基本上都了自己的大模型已形成应用落地
2. 从细分行业看,电力、煤炭、汽车制造、制造等行业头部企业探索较快,电力行业的国家电网、南方电网,煤炭行业的山东能源集团,汽车制造的、集团、集团电子制造的海尔、联想等
3.内容来自沙丘智库发布202年中国应用跟踪报告》
阅读原文
2. 从细分行业看,电力、煤炭、汽车制造、制造等行业头部企业探索较快,电力行业的国家电网、南方电网,煤炭行业的山东能源集团,汽车制造的、集团、集团电子制造的海尔、联想等
3.内容来自沙丘智库发布202年中国应用跟踪报告》
掌握大语言模型在软件研发提效的秘诀
文章概要:
1. 该文章主要介绍了微信公众平台的相关内容。
阅读原文
图书馆大模型创新应用需求与场景研究
文章概要:
1. 大模型对图书馆行业的影响:包括行业价值、影响方式和影响领域。
2. 图书馆中的大模型应用:包括应用进展与特征、应用路径和落地应用策略。
3. 智慧图书馆中的大模型应用需求:包括智慧服务、智慧业务、智慧管理和智慧空间。
4. 图书馆典型领域大模型应用场景构建:包括智慧咨询服务、智慧资源发现、智慧阅读推广、智慧知识服务、智能采编、数字资源智能加工、数字人文智慧研究与服务和智慧馆员助手。
5. 结语展望:图书馆需要积累高质量的数字化资源,实施精细化的数据管理和全面的数据治理为未来AI技术的有效应用打下坚实的基础。
阅读原文
2. 图书馆中的大模型应用:包括应用进展与特征、应用路径和落地应用策略。
3. 智慧图书馆中的大模型应用需求:包括智慧服务、智慧业务、智慧管理和智慧空间。
4. 图书馆典型领域大模型应用场景构建:包括智慧咨询服务、智慧资源发现、智慧阅读推广、智慧知识服务、智能采编、数字资源智能加工、数字人文智慧研究与服务和智慧馆员助手。
5. 结语展望:图书馆需要积累高质量的数字化资源,实施精细化的数据管理和全面的数据治理为未来AI技术的有效应用打下坚实的基础。
旷视太乙大模型成功通过国家网信办备案审核
文章概要:
1. 10月21日,旷视太乙大模型成功备案审核。
2. 旷视太乙大模型多模态能力,能处理金融领域非结构化数据,具有高安全性和私有化部署的特点
3. 旷视太乙大模型核心优势包括多模态能力、金融领域非结构化数据处理能力和高安全性私有化部署。
4. 旷视太乙大模型在现有业务和探索方面都有应用,如赋能FaceID服务、视觉风控服务、体工厂智慧文档。
5 旷视太乙大模型的应用正在不断扩展,未来将在更多领域发挥核心作用。
阅读原文
2. 旷视太乙大模型多模态能力,能处理金融领域非结构化数据,具有高安全性和私有化部署的特点
3. 旷视太乙大模型核心优势包括多模态能力、金融领域非结构化数据处理能力和高安全性私有化部署。
4. 旷视太乙大模型在现有业务和探索方面都有应用,如赋能FaceID服务、视觉风控服务、体工厂智慧文档。
5 旷视太乙大模型的应用正在不断扩展,未来将在更多领域发挥核心作用。
什么,生物安全领域也有大模型了?
文章概要:
1. 人工智能浪潮中,生物安全领域革命性突破,“磐涌”大模型诞生
2. “磐涌”大模型由动汐科技专为生物安全垂直领域打造,拥有>1参数,使用数百本书籍、、论文等专业料训练,具备深厚专业知识储备和强大信息处理能力,为高等级生物安全实验室和生物安全教学带来智能支持
3. “磐涌”大模型的核心理是“坚如磐石,智如泉涌,它不仅是一个技术产品,更是对未来生物安全领域的承诺
4. 在高等级生物安全实验室中,“磐涌”大模型为研究者提供稳定可靠的智能平台,也为生物安全教学带来新鲜知识和创意
5. 期待“磐涌”大模型在生物安全更多惊喜和人类生物安全事业贡献力量
阅读原文
2. “磐涌”大模型由动汐科技专为生物安全垂直领域打造,拥有>1参数,使用数百本书籍、、论文等专业料训练,具备深厚专业知识储备和强大信息处理能力,为高等级生物安全实验室和生物安全教学带来智能支持
3. “磐涌”大模型的核心理是“坚如磐石,智如泉涌,它不仅是一个技术产品,更是对未来生物安全领域的承诺
4. 在高等级生物安全实验室中,“磐涌”大模型为研究者提供稳定可靠的智能平台,也为生物安全教学带来新鲜知识和创意
5. 期待“磐涌”大模型在生物安全更多惊喜和人类生物安全事业贡献力量
杂志 | 大模型与推荐系统开启个性化推荐新篇章(一)
文章概要:
1. 推荐系统被广泛应用于电子商务、社交媒体和内容流媒体等领域,采用的核心方法包括协同过滤、内容的推荐和混合推荐方法。
2. 大模型推荐系统发展现状:大模型通常指参数规模极其庞大的深度学习模型,特别是基于Transformer架构的语言模型这些模型的数量通常达到数十亿甚至上千亿级别,通过处理海量数据和模式,展现出强大的抽取和模式识别能力,在文本处理、图像识别等多个领域都取得了优异
3. 大模型赋能推荐系统应用:随着大模型技术的不断进步,系统的发展将迎来更多机遇与挑战,方向大模型现有推荐算法中的直接应用、传统推荐模式的变革以及智能推荐智能体的驱动。
阅读原文
2. 大模型推荐系统发展现状:大模型通常指参数规模极其庞大的深度学习模型,特别是基于Transformer架构的语言模型这些模型的数量通常达到数十亿甚至上千亿级别,通过处理海量数据和模式,展现出强大的抽取和模式识别能力,在文本处理、图像识别等多个领域都取得了优异
3. 大模型赋能推荐系统应用:随着大模型技术的不断进步,系统的发展将迎来更多机遇与挑战,方向大模型现有推荐算法中的直接应用、传统推荐模式的变革以及智能推荐智能体的驱动。
大模型预训练“狼人杀”,是谁悄悄掉队了?
文章概要:
1. 国内顶尖大模型初创面临预训练取舍问题有两家公司已决定放弃预训练模型,预训练算法团队人数,重心转向AI应用。>2. 预训练是利用大规模数据对模型进行无特定任务的初步训练,让模型学习到通用的语言模式、知识和特征等,但需要大量算力资源和高质量数据,以及复杂的算法和技术。
资源能力算法的先进性、数据以及工程师的技术水平等因素,资源对应计算资源的投入、数据采集和处理的成本、人才等。
4. 国内大模型“小虎”有六七家公司,在大模型预训练上,各家面临的难题相同,现状不一。
5. 预训练成大模型公司灵魂考验,人才流动频繁,从尖端芯片到美元投资,中美之间在科技领域的竞争会愈演愈烈。
6. 掌握预训练能力,才能保证自己不下全球大模型竞争的牌桌,随着中美科技角力的加剧,顶尖人才资源的争夺战已然成为焦点,一场围绕人才的战略较量早已爆发。br>7. 预训练能力”无论是从基座模型的角度,还是从应用的角度,预训练能力都是大模型企业的“压舱石”。
8. 阿里巴巴、字节等大厂入局之后,大模型初创公司在资源方面的劣势一览无遗。凸显,各家技术实力追平资源差距是大模型初创公司都需要思考的问题。
9. 算法、AI Infra能力强,能够以各种方式降低训模成本和推理成本;资源整合能力强,能够支撑公司不断在模型预训练上作出新尝试。
10. 能力与资源并举,才是大模型时代能全局掌控的“硬小虎”们道路已经出现分野,从预训练开始,技术领先者已经脱颖而出。
阅读原文
资源能力算法的先进性、数据以及工程师的技术水平等因素,资源对应计算资源的投入、数据采集和处理的成本、人才等。
4. 国内大模型“小虎”有六七家公司,在大模型预训练上,各家面临的难题相同,现状不一。
5. 预训练成大模型公司灵魂考验,人才流动频繁,从尖端芯片到美元投资,中美之间在科技领域的竞争会愈演愈烈。
6. 掌握预训练能力,才能保证自己不下全球大模型竞争的牌桌,随着中美科技角力的加剧,顶尖人才资源的争夺战已然成为焦点,一场围绕人才的战略较量早已爆发。br>7. 预训练能力”无论是从基座模型的角度,还是从应用的角度,预训练能力都是大模型企业的“压舱石”。
8. 阿里巴巴、字节等大厂入局之后,大模型初创公司在资源方面的劣势一览无遗。凸显,各家技术实力追平资源差距是大模型初创公司都需要思考的问题。
9. 算法、AI Infra能力强,能够以各种方式降低训模成本和推理成本;资源整合能力强,能够支撑公司不断在模型预训练上作出新尝试。
10. 能力与资源并举,才是大模型时代能全局掌控的“硬小虎”们道路已经出现分野,从预训练开始,技术领先者已经脱颖而出。
大模型在华为推荐场景中的探索和应用
文章概要:
1. 华为诺亚方舟实验室高级算法工程师陈介绍了华为在基于LLM的推荐算法方向的探索和工业落地
2. 传统推荐模型主要依赖于用户在特定场景中的交互,大模型推荐系统能引入开放域世界的知识,具备较好的跨域通用语义知识,且复杂度相对较高
3. 大模型在推荐系统中的应用带来了两方面的额外能力,包括具备开放世界知识和逻辑推理能力
4. 利用LLM开放知识辅助推荐的通用框架KAR,包括确定推荐场景的因素、通过QA方式对大模型进行提问、设计知识编码器方法、引入多专家网络进行知识的提取
5. 提出了一种基于个性化检索加模糊校验的方法来进一步加速面向知识生成推荐的大模型
6. 大模型直接用于打分排序时,面临长理解问题,可采用基于语义相似度检索的方法和LLM个性化参数微调方法来解决
7. 提出了一种语义增强的推荐方法,将语义信息注入到传统的推荐模型中,确保较低的在线延迟
8. 大模型在推荐系统中的应用带来了额外的信息增益,包括提供丰富的领域知识和世界知识、突破传统定位,重塑推荐流程、语义协同兼顾,空间融合、缓解稀疏场景等
9. 大模型在推荐系统中存在一些挑战和展望,需要进一步解决,包括ID特征的索引和建模、推荐领域的长文本建模、训练效率、推理时延等
阅读原文
2. 传统推荐模型主要依赖于用户在特定场景中的交互,大模型推荐系统能引入开放域世界的知识,具备较好的跨域通用语义知识,且复杂度相对较高
3. 大模型在推荐系统中的应用带来了两方面的额外能力,包括具备开放世界知识和逻辑推理能力
4. 利用LLM开放知识辅助推荐的通用框架KAR,包括确定推荐场景的因素、通过QA方式对大模型进行提问、设计知识编码器方法、引入多专家网络进行知识的提取
5. 提出了一种基于个性化检索加模糊校验的方法来进一步加速面向知识生成推荐的大模型
6. 大模型直接用于打分排序时,面临长理解问题,可采用基于语义相似度检索的方法和LLM个性化参数微调方法来解决
7. 提出了一种语义增强的推荐方法,将语义信息注入到传统的推荐模型中,确保较低的在线延迟
8. 大模型在推荐系统中的应用带来了额外的信息增益,包括提供丰富的领域知识和世界知识、突破传统定位,重塑推荐流程、语义协同兼顾,空间融合、缓解稀疏场景等
9. 大模型在推荐系统中存在一些挑战和展望,需要进一步解决,包括ID特征的索引和建模、推荐领域的长文本建模、训练效率、推理时延等
从某大型互联网公司安全事件看AI大模型安全防护
文章概要:
1. 某大型互联网公司了一起严重的AI大模型安全事件,起因是实习生对资源分配不满,利用漏洞注入破坏性代码,导致模型训练成果受损,同时也暴露出公司在权限管理和代码审计方面的不足。
2. 除了来自供应链投毒、网络安全漏洞等问题外,模型的自身安全问题也令人担忧,如非法测绘事件中的问题答复,以及儿童智能设备上的“已读乱回”问题。
3 为了防范系统可能面临各类安全威胁,企业应从模型生命周期的全管理、多层次的风险评估与检测、隐私与合规性保障、道德风险与内容安全监管、自动化安全流程持续优化等关键维度,构建起一个完善的AI安全防护。
4. 安恒信息推出了AI大模型安全检测产品:恒脑智鉴,能够帮助企业完成持续的安全优化和合规建设保障其AI技术为社会创造价值,真正实现其应有的潜力。
阅读原文
2. 除了来自供应链投毒、网络安全漏洞等问题外,模型的自身安全问题也令人担忧,如非法测绘事件中的问题答复,以及儿童智能设备上的“已读乱回”问题。
3 为了防范系统可能面临各类安全威胁,企业应从模型生命周期的全管理、多层次的风险评估与检测、隐私与合规性保障、道德风险与内容安全监管、自动化安全流程持续优化等关键维度,构建起一个完善的AI安全防护。
4. 安恒信息推出了AI大模型安全检测产品:恒脑智鉴,能够帮助企业完成持续的安全优化和合规建设保障其AI技术为社会创造价值,真正实现其应有的潜力。
一文盘点最火的央企大模型 | 第四期:千穰大模型与昆仑大模型
文章概要:
1. 中国航信的千穰大模型是由中航信移动科技有限公司航旅纵横团队发布的首个民航领域垂直大模型融合了视觉大模型、语言大模型、多模态大模型和计算大模型,形成了一个图文计算多智体,为民航全行业提供完整的智能化生成式大模型解决方案。
2. 千穰大模型具备参数规模大、聚焦垂域训练、先进推理技术等特点,面向旅客和行业提供了多种解决方案。<>3. 千穰大通过中央网信办生成式人工智能服务备案,目前已被应用于航旅纵横App和多家民航主要机构,为行业主体提供全面智慧化支持,有效提升行业效率与旅客出行体验。
. 昆仑大模型是中国石油、中国移动华为和科大讯飞的行业大,具备330亿参数,并已通过国家生成式人工智能服务备案,是中国能源化工行业首个通过备案的大模型
5. 昆仑大模型的主要特点包括四层架构、统筹管理、共享,在大模型训练方面,发布了不同层次、不同类型、不同尺寸的8个大模型,以满足不同业务场景需求。7. 昆仑大模型的建设是中国石油在人工智能领域的关键一步,也是服务国家战略、推动行业技术进步的生动实践。
阅读原文
2. 千穰大模型具备参数规模大、聚焦垂域训练、先进推理技术等特点,面向旅客和行业提供了多种解决方案。<>3. 千穰大通过中央网信办生成式人工智能服务备案,目前已被应用于航旅纵横App和多家民航主要机构,为行业主体提供全面智慧化支持,有效提升行业效率与旅客出行体验。
. 昆仑大模型是中国石油、中国移动华为和科大讯飞的行业大,具备330亿参数,并已通过国家生成式人工智能服务备案,是中国能源化工行业首个通过备案的大模型
5. 昆仑大模型的主要特点包括四层架构、统筹管理、共享,在大模型训练方面,发布了不同层次、不同类型、不同尺寸的8个大模型,以满足不同业务场景需求。
大模型时代,企业级知识图谱过时了吗
文章概要:
1. 大模型时代,一些人认为级知识图谱已过时。
2. 大模型和其他AI模型是平等关系,知识图谱和大模型技术定位不同。
. 大模型技术留存率低,用户评价随机。
4. 知识图谱更利于管理和维护,符合数据治理的PDCA闭环逻辑。
5. 当前主流AI产业落地思想是大模型与知识图谱等技术柔性协同
大模型负责解析需求,特定Agent处理具体任务,模型完成自身使命。
阅读原文
2. 大模型和其他AI模型是平等关系,知识图谱和大模型技术定位不同。
. 大模型技术留存率低,用户评价随机。
4. 知识图谱更利于管理和维护,符合数据治理的PDCA闭环逻辑。
5. 当前主流AI产业落地思想是大模型与知识图谱等技术柔性协同
大模型负责解析需求,特定Agent处理具体任务,模型完成自身使命。
大模型要"断粮"了?| IBM重磅发布Granite 3.0秒杀同级别大模型|全球首个39语言多模态大模型开源,告别"英语霸权"
文章概要:
1. 大模型要"断粮"了?最新综述揭示AI数据困境与之道
2. IBM重磅发布Granite 3.0:8B参数秒杀同级别大模型,还能随便商用!
3. 全球首个39大模型开源,告别"英语霸权"
阅读原文
2. IBM重磅发布Granite 3.0:8B参数秒杀同级别大模型,还能随便商用!
3. 全球首个39大模型开源,告别"英语霸权"
LLMOps:大型语言模型的生产运营之道
文章概要:
1. LLMOps是指一系列用于在生产环境中部署、监控和维护大型语言模型的实践、流程和工具。
2. LLMOps的核心组件包括开发、部署、监控扩展和维护。
3. 监控和维护LLMs的包括实时监控、定期维护和重新训练、安全和合规。
. 实际操作案例是使用ugging Face Inference部署和监控LLM。
阅读原文
2. LLMOps的核心组件包括开发、部署、监控扩展和维护。
3. 监控和维护LLMs的包括实时监控、定期维护和重新训练、安全和合规。
. 实际操作案例是使用ugging Face Inference部署和监控LLM。
人工智能教育大模型:体系架构与关键技术策略
文章概要:
1. 人工智能教育大模型发展现状:国外大模型教育应用实践表明,直接将大模型用于教学,容易存在专业知识不足和生成内容的不确定性等问题,需依据教育场景和用户实际需求定制,以解决特定任务下可能产生的内容误差、偏见、伦理以及生成内容的版权争议等。
2. 人工智能教育大模型内涵与特征:目前人工智能教育大模型的研究处于试验加速期,产业界正积极推动适用教育领域的专用大模型设计及研发,试图通过最新技术手段提升模型性能,并探索其在教育全流程中的应用。
3. 人工智能教育大模型体系架构:人工智能教育大模型建设是以重构未来教育图景为目标、以开放算法模型架构为基础、以创新教育应用场景为核心的系统性变革
4. 人工智能教育大模型关键技术策略:采取何种技术策略,不仅是人工智能教育大模型的建设与应用从理论探索走向实践应用的桥梁,更是确保其在教育场景发挥最大效能、促进教育创新与变革的核心所在
阅读原文
2. 人工智能教育大模型内涵与特征:目前人工智能教育大模型的研究处于试验加速期,产业界正积极推动适用教育领域的专用大模型设计及研发,试图通过最新技术手段提升模型性能,并探索其在教育全流程中的应用。
3. 人工智能教育大模型体系架构:人工智能教育大模型建设是以重构未来教育图景为目标、以开放算法模型架构为基础、以创新教育应用场景为核心的系统性变革
4. 人工智能教育大模型关键技术策略:采取何种技术策略,不仅是人工智能教育大模型的建设与应用从理论探索走向实践应用的桥梁,更是确保其在教育场景发挥最大效能、促进教育创新与变革的核心所在
一夜之间,大模型像人一样操控电脑了!Claude 3.5重磅升级,抢先OpenAI
文章概要:
1. Claude 3.5 模型迎来一波大更新,推出了升级版的 Claude 3.5 Sonnet 以及一款新模型 Claude 3.5 Haiku
2. 升级版 Claude 3.5 Sonnet 能够根据用户指令移动光标、点击相应位置以及通过虚拟键盘输入信息,模仿人类与计算机的交互方式
3. 目前「使用计算机」功能已经有了公开测试版,大家可以申请试用
4. 有开发者尝试了 Claude 3.5 Sonnet 的新能力,设置时间不超过 10 分钟,堪称 game changer
5. 在 Anthropic 更新 Claude 3.5 的同时,热门 AI 编程工具 Cursor 也已经成功接入 Claude 系列模型
6. 根据研究者 Austin Starks 的实验,最新版 Claude 3.5 Sonnet 的性能表现优于 OpenAI ο1-mini
7. 操作计算机需要查看和解释图像的能力,还需要推理能力,以了解以怎样的方式在什么时间执行特定的操作
8. Anthropic 在训练 Claude 使用计算机方面,仅使用少量简单软件进行的训练就让 Claude 可以泛化这种能力
9. Claude 可以说是当之无愧的 SOTA 模型,其使用计算机的方式与人类相同
10. Anthropic 的信任与安全团队对计算机使用模型进行了广泛的分析,以识别潜在的漏洞
11. 研究者构建了一个 API,使 Claude 能够感知计算机界面并与之交互
12. 对于 Claude 来说,它观察的屏幕「翻页」方式是通过拍摄屏幕截图并将它们拼接起来的方式,而不是观察更细粒度的视频流
13. Asana、Canva、Cognition、DoorDash、Replit 和 The Browser Company 已经开始探索「计算机使用」的各种可能性
14. 升级版的 Claude 3.5 Sonnet 现在对所有用户开放
15. 新的 Claude 3.5 Haiku 将在本月晚些时候发布
16. 升级版的 Claude 3.5 Sonnet 在行业基准测试中显示出广泛的改进,特别是在智能体编码和工具使用任务上取得了的提升
17. Claude 3.5 Haiku 是 Anthropic 最快的模型的下一代,在编码任务上尤其强大
18. Claude 3.5 Haiku 将于本月晚些时候通过 Anthropic 的第一方 API、Amazon Bedrock, 和谷歌云的 Vertex AI 提供
阅读原文
2. 升级版 Claude 3.5 Sonnet 能够根据用户指令移动光标、点击相应位置以及通过虚拟键盘输入信息,模仿人类与计算机的交互方式
3. 目前「使用计算机」功能已经有了公开测试版,大家可以申请试用
4. 有开发者尝试了 Claude 3.5 Sonnet 的新能力,设置时间不超过 10 分钟,堪称 game changer
5. 在 Anthropic 更新 Claude 3.5 的同时,热门 AI 编程工具 Cursor 也已经成功接入 Claude 系列模型
6. 根据研究者 Austin Starks 的实验,最新版 Claude 3.5 Sonnet 的性能表现优于 OpenAI ο1-mini
7. 操作计算机需要查看和解释图像的能力,还需要推理能力,以了解以怎样的方式在什么时间执行特定的操作
8. Anthropic 在训练 Claude 使用计算机方面,仅使用少量简单软件进行的训练就让 Claude 可以泛化这种能力
9. Claude 可以说是当之无愧的 SOTA 模型,其使用计算机的方式与人类相同
10. Anthropic 的信任与安全团队对计算机使用模型进行了广泛的分析,以识别潜在的漏洞
11. 研究者构建了一个 API,使 Claude 能够感知计算机界面并与之交互
12. 对于 Claude 来说,它观察的屏幕「翻页」方式是通过拍摄屏幕截图并将它们拼接起来的方式,而不是观察更细粒度的视频流
13. Asana、Canva、Cognition、DoorDash、Replit 和 The Browser Company 已经开始探索「计算机使用」的各种可能性
14. 升级版的 Claude 3.5 Sonnet 现在对所有用户开放
15. 新的 Claude 3.5 Haiku 将在本月晚些时候发布
16. 升级版的 Claude 3.5 Sonnet 在行业基准测试中显示出广泛的改进,特别是在智能体编码和工具使用任务上取得了的提升
17. Claude 3.5 Haiku 是 Anthropic 最快的模型的下一代,在编码任务上尤其强大
18. Claude 3.5 Haiku 将于本月晚些时候通过 Anthropic 的第一方 API、Amazon Bedrock, 和谷歌云的 Vertex AI 提供
大模型技术关键特性与发展趋势
文章概要:
1. 人工智能经历三个主要发展,呈现从手工总结到自动学习,从离散符号到参数,从专用智能到通用智能的趋势
2. 单个预训练大模型可同时处理多种任务,若干权威评测上达到或超过人类水平远超传统任务专用小模型的
3. 获取通用知识需要大数据 ,存储通用知识需要参数,训练大参数模型需要大算力
. 过去4年间,训练数据增长500,参数规模增长5000倍,计算量增长10000倍+大算力大模型具备大规模通用知识,处理复杂任务
阅读原文
2. 单个预训练大模型可同时处理多种任务,若干权威评测上达到或超过人类水平远超传统任务专用小模型的
3. 获取通用知识需要大数据 ,存储通用知识需要参数,训练大参数模型需要大算力
. 过去4年间,训练数据增长500,参数规模增长5000倍,计算量增长10000倍+大算力大模型具备大规模通用知识,处理复杂任务
大模型如何提升智慧办公效率?8家头部企业实践案例
文章概要:
1. 大模型在智慧办公领域的应用日益广泛,为企业带来了前所未有的便捷与效率提升。
2. 大模型在办公场景的应用价值度有限,更多在于降本增效而非创造额外的业务价值。
3. 智慧办公已经成为企业在落地大模型首选的场景之一。
4. 沙丘智库通过研究8家企业的大模型+智慧办公”落地实践,旨在为其他企业提供参考。
阅读原文
2. 大模型在办公场景的应用价值度有限,更多在于降本增效而非创造额外的业务价值。
3. 智慧办公已经成为企业在落地大模型首选的场景之一。
4. 沙丘智库通过研究8家企业的大模型+智慧办公”落地实践,旨在为其他企业提供参考。
百度智能云千帆大模型(无锡)创新中心确认出席本届峰会!
文章概要:
1. 微信公众平台一个重要的社交媒体平台。
阅读原文
通义大模型:重塑智能时代的基石
文章概要:
1. 人工智能已深刻影响我们的、工作乃至整个社会的变革力量,通义其卓越的性能、广泛的应用场景和的技术理念,成为了业界瞩目的焦点。
2. 通义大模型采用了先进的深度神经网络架构,如Transformer等,架构具有强大的特征提取和表示学习能力,能够自动从数据中学习复杂的模式和规律。br> 3 通义大应用场景包括自然语言处理计算机视觉智能推荐与搜索、智能制造与智慧城市等领域。
4义大模型的未来展望包括技术创新持续深化、应用场景不断拓展、与个性化学习、健康、金融科技环境保护与可持续发展等。
5.义大模型在实际应用过程中仍面临诸多挑战,如数据隐私与安全、模型可解释性与透明度、能源消耗环保。
阅读原文
2. 通义大模型采用了先进的深度神经网络架构,如Transformer等,架构具有强大的特征提取和表示学习能力,能够自动从数据中学习复杂的模式和规律。br> 3 通义大应用场景包括自然语言处理计算机视觉智能推荐与搜索、智能制造与智慧城市等领域。
4义大模型的未来展望包括技术创新持续深化、应用场景不断拓展、与个性化学习、健康、金融科技环境保护与可持续发展等。
5.义大模型在实际应用过程中仍面临诸多挑战,如数据隐私与安全、模型可解释性与透明度、能源消耗环保。
重磅!首个计算机使用功能大模型横空出世!升级版Claude3.5 Sonnet与Claude 3.5 Haiku发布!
文章概要:
1. 北京时间2333分,Anthropic发布升级版Claude3.5 Sonnet和新型号Claude35 Haiku,推出测试版新功能Computer use计算机使用功能
2. 性能上,New Sonnet全面击败GPT-4o,比较于上一款ude3.,整体性能也得到了全面的提升和加强。br> 3. 全新的Claude. Sonnet是全球首个在公开测试版本中使用的前沿人工智能模型,具有开创性意义。br> 4. 性能指标上来看,New Son在性能上最为亮眼的在编码能力方面,在SWE-bench Verified上创下了最高水平新纪录,得分达到49%使用复杂scaffolding)。
5. 价格上,Haiku性价比直接拉满,这款“基础”模型是Sonnet的分之一。
阅读原文
2. 性能上,New Sonnet全面击败GPT-4o,比较于上一款ude3.,整体性能也得到了全面的提升和加强。br> 3. 全新的Claude. Sonnet是全球首个在公开测试版本中使用的前沿人工智能模型,具有开创性意义。br> 4. 性能指标上来看,New Son在性能上最为亮眼的在编码能力方面,在SWE-bench Verified上创下了最高水平新纪录,得分达到49%使用复杂scaffolding)。
5. 价格上,Haiku性价比直接拉满,这款“基础”模型是Sonnet的分之一。
Anthropic教会大模型以人类的方式使用电脑,RPA不存在了?
文章概要:
1. RPA(Robotic Process Automation)是一种利用软件机器人模拟人类操作,自动执行重复性高、规则明确的任务的技术。现在,通过大模型来实现更泛化的模拟人类操作电脑的流程,传统RPA可能要被颠覆了。
2. OpenAI最大的Anthropic深夜更新,宣布推出升级版Claude 3.5 Sonnet和新型号Claude 3.5 Haiku。
3. Anthropic还将推出一项突破性的新功能:计算机使用。从今天起,开发人员可以通过API控制Claude以人类的方式使用计算机——查看屏幕、移动光标、单击按钮和输入文本。
4. Claude 3.5 Sonnet是首个提供计算机使用功能的前沿人工智能模型,目前处于公开测试阶段。
5. Asana、Canva、Cognition、DoorDash、Replit和The Browser Company已经开始这些可能性,执行需要数十步甚至数百步才能完成的任务。
6. 大量现代工作都是通过计算机完成的。让人工智能能够像人类一样直接与计算机软件交互,将解锁大量当前一代人工智能助手无法实现的应用。
7. 在使用计算机方面,Anthropic正在尝试一些全新的事物。这不是制作特定工具来帮助Claude完成单个任务,而是教它通用的计算机技能——允许它使用为人类设计的各种标准工具和软件程序。
8. Anthropic表示其之前在工具使用和多模态性方面的研究为这些新的计算机使用技能奠定了基础。
9. 虽然Anthropic在取得初步突破后很快就取得了后续进展,但实现这一目标需要大量的反复试验。
10. 目前,Claude是最先进的模型,其使用计算机的方式与人类相同——即通过查看屏幕并采取行动做出响应。
11. 人工智能的每一次进步都会带来新的安全挑战。使用计算机主要是降低人工智能系统应用现有认知技能的门槛,而不是从根本上提高这些技能,因此对计算机使用的主要关注点在于当前的危害,而不是未来的危害。
12. Anthropic的信任与安全团队对新的计算机使用模型进行了广泛的分析,以识别潜在的漏洞。
13. 鉴于即将到来的美国大选,Anthropic高度警惕可能被视为破坏公众对选举过程信任的滥用企图。
14. 计算机的使用是开发AI的完全不同的方法。到目前为止,LLM开发人员已经让工具适应模型,创建自定义环境,AI可以使用专门设计的工具来完成各种任务。现在,Anthropic可以让模型适应工具——Claude可以适应每天使用的计算机环境。
阅读原文
2. OpenAI最大的Anthropic深夜更新,宣布推出升级版Claude 3.5 Sonnet和新型号Claude 3.5 Haiku。
3. Anthropic还将推出一项突破性的新功能:计算机使用。从今天起,开发人员可以通过API控制Claude以人类的方式使用计算机——查看屏幕、移动光标、单击按钮和输入文本。
4. Claude 3.5 Sonnet是首个提供计算机使用功能的前沿人工智能模型,目前处于公开测试阶段。
5. Asana、Canva、Cognition、DoorDash、Replit和The Browser Company已经开始这些可能性,执行需要数十步甚至数百步才能完成的任务。
6. 大量现代工作都是通过计算机完成的。让人工智能能够像人类一样直接与计算机软件交互,将解锁大量当前一代人工智能助手无法实现的应用。
7. 在使用计算机方面,Anthropic正在尝试一些全新的事物。这不是制作特定工具来帮助Claude完成单个任务,而是教它通用的计算机技能——允许它使用为人类设计的各种标准工具和软件程序。
8. Anthropic表示其之前在工具使用和多模态性方面的研究为这些新的计算机使用技能奠定了基础。
9. 虽然Anthropic在取得初步突破后很快就取得了后续进展,但实现这一目标需要大量的反复试验。
10. 目前,Claude是最先进的模型,其使用计算机的方式与人类相同——即通过查看屏幕并采取行动做出响应。
11. 人工智能的每一次进步都会带来新的安全挑战。使用计算机主要是降低人工智能系统应用现有认知技能的门槛,而不是从根本上提高这些技能,因此对计算机使用的主要关注点在于当前的危害,而不是未来的危害。
12. Anthropic的信任与安全团队对新的计算机使用模型进行了广泛的分析,以识别潜在的漏洞。
13. 鉴于即将到来的美国大选,Anthropic高度警惕可能被视为破坏公众对选举过程信任的滥用企图。
14. 计算机的使用是开发AI的完全不同的方法。到目前为止,LLM开发人员已经让工具适应模型,创建自定义环境,AI可以使用专门设计的工具来完成各种任务。现在,Anthropic可以让模型适应工具——Claude可以适应每天使用的计算机环境。
AI大模型与智算中心:构建未来智能社会的基石
文章概要:
1. AI大模型是通过深度学习算法和神经网络训练出的具有庞大规模参数的人工智能模型,其发展历程经历了多层感知机、循环神经网络、卷积神经网络、长短时记忆网络、深度信念网络、深度学习复兴、大规模预训练模型的兴起和模型规模的不断扩大等阶段。
2. 智算中心是一个集成了高性能计算资源与优化管理的综合计算平台,其核心功能包括数据存储、模型训练和实时推理。
3. 中国移动京津冀(天津)西青数据中心是按照中国移动最高标准建设的天津地区最大规模的数据中心,承载能力超1.4万架。
4. 中国移动智算中心(青岛)是中国移动在全国建设的11个区域节点之一,首期投资超5.5亿元,智能算力规模达825PFlops。
5. 毫末智行的MANA OASIS智算中心是目前中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。
6. AI大模型与智算中心的协同发展将会迎来多模态模型的兴起、边缘计算的应用、模型压缩与加速技术等重要趋势。
阅读原文
2. 智算中心是一个集成了高性能计算资源与优化管理的综合计算平台,其核心功能包括数据存储、模型训练和实时推理。
3. 中国移动京津冀(天津)西青数据中心是按照中国移动最高标准建设的天津地区最大规模的数据中心,承载能力超1.4万架。
4. 中国移动智算中心(青岛)是中国移动在全国建设的11个区域节点之一,首期投资超5.5亿元,智能算力规模达825PFlops。
5. 毫末智行的MANA OASIS智算中心是目前中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。
6. AI大模型与智算中心的协同发展将会迎来多模态模型的兴起、边缘计算的应用、模型压缩与加速技术等重要趋势。
聊一聊大模型六小虎生存现状
文章概要:
1. ChatGPT的出现引发了生成式AI创业热潮,国内智谱AI、百川智能、零一万物、月之暗面、Minimax、阶跃星辰六家公司成为大模型创企的“六小虎”。
2. 2024年,AI应用层的井喷被预告为今年AI领域的最强看点,大模型“六小虎”在今年都取得了亿元以上的融资进展。
3. 目前大模型能力的增长正陷入普遍的停滞,OpenAI的商业化探索也依然迷茫。
4. 大模型“六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
5. 大模型六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
6. 大模型“六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
7. 大模型“六小虎”在To B和选择上有所侧重,但并未完全放弃对另一条路的探索。
8. 大模型“六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
阅读原文
2. 2024年,AI应用层的井喷被预告为今年AI领域的最强看点,大模型“六小虎”在今年都取得了亿元以上的融资进展。
3. 目前大模型能力的增长正陷入普遍的停滞,OpenAI的商业化探索也依然迷茫。
4. 大模型“六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
5. 大模型六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
6. 大模型“六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
7. 大模型“六小虎”在To B和选择上有所侧重,但并未完全放弃对另一条路的探索。
8. 大模型“六小虎”在To B和To C的选择上有所侧重,但并未完全放弃对另一条路的探索。
大模型评测的真正难点:内在精细决策逻辑与人认知的对齐
文章概要:
1. 对大模型的评测往往着眼于大模型输出结果本身的正确性,然而在实际工业应用中,评测大模型表征可信程度的症结点在于评测大模型输出结果背后潜在决策逻辑的正确性。
2. 团队之前基于交互的解释已经证明了下面两个性质,从理论上保证了神经网络的决策逻辑可以被解释为稀疏的符号化交互概念。
3. 以法律大模型为例,我们发现尽管法律大模型判案结果的正确率很高,但哪怕在一些正确预测的法律案例中,超过一半的决策逻辑在人类认知上都是错误的。
4. 我们认为跳出端对端评测范式,在精细决策逻辑层面评测大模型,代表了大模型评测的一个根本方向,确保大模型逻辑和人类认知的真正对齐。
阅读原文
2. 团队之前基于交互的解释已经证明了下面两个性质,从理论上保证了神经网络的决策逻辑可以被解释为稀疏的符号化交互概念。
3. 以法律大模型为例,我们发现尽管法律大模型判案结果的正确率很高,但哪怕在一些正确预测的法律案例中,超过一半的决策逻辑在人类认知上都是错误的。
4. 我们认为跳出端对端评测范式,在精细决策逻辑层面评测大模型,代表了大模型评测的一个根本方向,确保大模型逻辑和人类认知的真正对齐。
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
文章概要:
1. DeepMind今年2月份的一篇论文在社交媒体上掀起了一些波澜,文中介绍说,DeepMind的研究者训练了一个参数量为2.7亿的Transformer模型,这个模型无需依赖复杂的搜索算法或启发式算法就能达到“特级大师(Grandmaster-Level)”的国际象棋水平,优于AlphaZero的策略和价值网络(不含MCTS)以及GPT-3.5-turbo-instruct模型。
2. 这一结果非常有趣,也很容易激发想象力,因为到目前为止,能达到这个级别的计算机国际象棋系统——无论是否基于机器学习——都使用了搜索组件。而DeepMind模型不依赖搜索似乎就能达到如此强大的下棋水平。
3. 很多人将其解读为:这表明Transformer不是简单的“随机鹦鹉”,而是具有一定的推理和规划能力。就连该论文的作者也在“结论”部分写道:“我们的工作为快速增长的文献增添了新的内容,这些文献表明,复杂而精密的算法可以被蒸馏为前馈transformer,这意味着一种范式的转变,即从将大型transformer视为单纯的统计模式识别器,转变为将其视为算法近似的强大技术。”
4. 不过,这种解读也引来了一些争议。比如,Meta FAIR研究科学家主任田渊栋指出,论文采用的评估方法——“blitz”可能存在一些局限。“blitz”字面意思是闪电战,在国际象棋中指超快棋。在这种棋赛中,对局每方仅有几分钟的时间思考,玩家往往依赖直觉而非深入的搜索和解决问题的能力。此外,模型与机器人对弈时的分数比与人类对弈时的分数要低。田渊栋认为这可能是因为人类在有限的时间内可能没有机器人那么擅长发现战术上的失误。所以,这种比赛可能并不足以用来测试模型是否拥有推理能力。
5. 一向喜欢唱反调的纽约大学教授Gary Marcus这次也没有缺席,他也认为论文的结论被夸大了,模型的泛化能力存在严重问题。
阅读原文
2. 这一结果非常有趣,也很容易激发想象力,因为到目前为止,能达到这个级别的计算机国际象棋系统——无论是否基于机器学习——都使用了搜索组件。而DeepMind模型不依赖搜索似乎就能达到如此强大的下棋水平。
3. 很多人将其解读为:这表明Transformer不是简单的“随机鹦鹉”,而是具有一定的推理和规划能力。就连该论文的作者也在“结论”部分写道:“我们的工作为快速增长的文献增添了新的内容,这些文献表明,复杂而精密的算法可以被蒸馏为前馈transformer,这意味着一种范式的转变,即从将大型transformer视为单纯的统计模式识别器,转变为将其视为算法近似的强大技术。”
4. 不过,这种解读也引来了一些争议。比如,Meta FAIR研究科学家主任田渊栋指出,论文采用的评估方法——“blitz”可能存在一些局限。“blitz”字面意思是闪电战,在国际象棋中指超快棋。在这种棋赛中,对局每方仅有几分钟的时间思考,玩家往往依赖直觉而非深入的搜索和解决问题的能力。此外,模型与机器人对弈时的分数比与人类对弈时的分数要低。田渊栋认为这可能是因为人类在有限的时间内可能没有机器人那么擅长发现战术上的失误。所以,这种比赛可能并不足以用来测试模型是否拥有推理能力。
5. 一向喜欢唱反调的纽约大学教授Gary Marcus这次也没有缺席,他也认为论文的结论被夸大了,模型的泛化能力存在严重问题。