今日AI-大模型-2024年11月12日

发现全网最新的AI内容

百度的大模型棋局,都藏在这些李彦宏的非共识中

文章概要:

1. 李彦宏是中国最早一批AI先行者,他认为大模型的意义在于应用,要卷AI应用,不要重复造轮子,没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值。
2. 李彦宏认为大模型对于ToB业务的改造,比互联网对于ToB的影响力要大一个数量级。
3. 李彦宏认为智能体是在李彦宏看来门槛非常低的一种AI应用,随着大模型能力不断提升,智能体的创建会非常简单,只需最简单的自然对话交互,更通俗来说用户只要几句话,就能创建自己的AI应用。
4. 李彦宏的答案是“超级有用”,围绕“超级有用”,刚刚结束百度世界2024大会上,百度发布了的检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
5铺垫,完成从1到100,再到100万乃至数百万的加速,重点在于生态
阅读原文

百度的大模型棋局,都藏在这些李彦宏的非共识中

文章概要:

1. 李彦宏是中国最早一批AI先行者,在过去一年多来分外活跃,经常提出一些“与众不同”的观点。
2. 李彦宏认为大模型的意义在于应用,要卷AI应用,不要重复造轮子。
3. 李彦宏认为大模型对于ToB业务的改造,比互联网对于ToB的影响力要大一个数量级。
4. 李彦宏认为下一个应用趋势将是智能体,而当时智能体在行业还算是新物种、非共识。
5. 李彦宏一直说大模型要卷应用,如今文心大模型发布近一年多来后,百度仍在持续致力于降低普通人开发应用的门槛。
6. 李彦宏认为技术的应用成本与创新的总和往往以跷跷板的结构出现。技术的成本越低,产生的创新就越多。
7. 李彦宏认为智能体是在李彦宏看来门槛非常低的一种AI应用,随着大模型能力不断提升,智能体的创建会非常简单,只需最简单的自然对话交互,更通俗来说用户只要几句话,就能创建自己的AI应用。
8. 李彦宏的答案是“超级有用”。
9. 李彦宏认为大模型发展要经历这么几个阶段,首先是Copilot阶段,需要人类进行辅助、把关后才能交付成果;然后是Agent智能体,智能体最大的特点是有一定的自主性,具备自主使用工具、反思、自我进化等能力;最后是Al Worker,能够像人一样独立完成各种脑力和体力劳动。
10. 李彦宏认为智能体相当于PC时代的网站和自媒体时代的账号,最明显的是门槛足够低,谁都能上手,天花板又足够高,可以做出非常复杂,非常强大的应用。
11. 李彦宏认为基于无代码产品,每个用户及企业都能通过自然语言交互,自己就可以搭建并指挥多个智能体协同完成任务,不需要基础的代码能力,也不需要项目经理、设计人员、开发人员、测试人员等专业人员,每个人都拥有程序员的能力。
12. 李彦宏认为重点在于生态。
13. 李彦宏认为以应用为核心这即是百度做大模型初心,也是百度有了如今成果的军功章。
阅读原文

调用量激增约30倍!文心大模型火了,李彦宏:AI应用将迎爆发期!

文章概要:

1. 李彦宏在百度世界2024大会现场表示,过去两年来,AI行业发生的最大的变化是大模型基本消除了幻觉,让AI从“一本正经地胡说八道”变得可用、可被信赖。基于技术的快速迭代,李彦宏判断,AI应用即将迎来爆发期。
2. 仅仅用了一年,百度文心大模型的日均调用量增长了约30倍。李彦宏在发布会上透露,11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长至7.5倍,相较一年首次披露的5000万次,更是增长约30倍。
3. 百度智能云事业群总裁沈抖,AI应用正率先在B端(企业端)爆发。在能源电力行业,国家电网正在围绕文心大模型、千帆平台,结合电力行业高质量数据,联合百度共创电力行业大模型基础底座,并在调度、设备、营销等六大专业领域深入探索。目前,已经在电力设备运检、供电服务等电力行业核心场景成功完成应用落地。
4. 李彦宏透露,目前在百度智能云的千帆大模型平台上,百度已经累计帮助用户精调了3.3万个大模型,开发出了77万个企业级应用,百度智能云已经拥有中国最大的大模型产业落地规模,六成以上的央企以及众多民营企业,都在联合百度智能云进行AI创新。
5. 百度方面表示,其日均分发量已突破00万次大关。这一数据预示着,百度的搜索生态系统能够有效助力企业及开发者推广其智能体并实现盈利,促进客户销售转化的增长与投放效率的提升。随着越来越多企业选择接入公司的智能体,百度搜索业务的未来发展空间势必将得到显著拓展。
6. 李彦宏在演讲时透露,目前,文心智能体平台上,已经吸引了15万家企业和80多万名开发者参与,覆盖的应用场景非常丰富。同时,他还在现场发布了基于大模型的100大涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。
阅读原文

调用量激增约30倍!文心大模型火了,李彦宏:AI应用将迎爆发期!

文章概要:

1. 李彦宏在百度世界2024大会现场表示,AI应用即将迎来爆发期。
2. 百度智能云已经拥有中国最大的大模型产业落地规模,累计帮助各类企业用户开发出77万个企业级应用。
3. 百度文心大模型的日均调用量增长了约30倍,反映出千行百业对AI的真实需求。
4. 百度文心大模型的实际应用案例已经遍布金融、能源、教育、招聘、公共服务等各个领域,帮助各类企业大幅降低运营、生产成本,提高产出效率。
5. 百度文库AI月活用户达到国内第一梯队,百度文库AI功能在2024年二季度实现国内所有AI应用月活用户数的三连冠。
6. 百度在AI领域的持续技术积累,让百度旗下的AI产品可用性也在不断提升,而这也帮助百度实现新的增长曲线。
7. 李彦宏在百度世界2024现场再次公布了百度AI技术的最新迭代,其中,检索增强的文生图技术iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。
8. 百度最新发布的工具“秒哒”,可以帮助人、更多企业打造出数百万“超级有用”的应用。
9. 智能体开发难度大幅降低,也意味着应用场景蕴藏的巨大潜力。
10. 百度搜索已经成为了智能体分发的最大入口,百度方面表示,其日均分发量已突破1000万次大关。
11. 文心智能体平台上,已经吸引了15万家企业和80多万名开发者参与,覆盖的应用场景非常丰富。
12. 李彦宏表示,“发布这100大产业应用,其实也代表我们的认知和态度百度不是要推出一个‘超级而是要不断地帮助更多人、更多企业打造出数百万级‘超级有用’的应用。
阅读原文

大模型路线之争MoE获胜,国内MoE谁最强?

文章概要:

1. 英伟达股价暴跌,原因是海外部分AI玩家烧不起钱,以及机构投资者对依靠资源堆积的模型发展模式感到担忧。
. 以英伟达算力芯片为核心的,变成击鼓传花游戏原因是英伟达每升级一个版本相关芯片的价格就会暴涨几倍。br>3 互联网巨头开始吃不消不断上涨的算力芯片价格,反思以资源投入和算卡堆砌推动模型的模式。
4 MoE成为解题关键,它将多个专家模型组合起来,解决一个问题,每个专家都是一个小型的神经网络,它们各自擅长任务的某一方面。br>. 国内模型研发团队也迅速跟进,推动了MoE国内发展。
. 昆仑万维国内最早投入精力研究E架构的平台公司抓技术,抓的模式,对于E模型架构在中国的普及才是最有的。
阅读原文

周枫:教育大模型16个月落地思考

文章概要:

1. 教育大模型潜力巨大,行业共识是其适合教育领域,可提升教学效率,解决教师数量不足问题。目前已有一些成功应用,如AI教学助手、家庭教师和学习伙伴等。
2. 语言类学习和全科答疑是两个已经跑通的教育大模型应用方向。语言类学习应用中,良好的视觉形象和垂直化落地到具体场景非常有帮助;全科答疑产品需要在基础答复质量、学习类功能和用好摄像头上做到位。
3. 大模型在文科领域已经“超人”,在理科方面也不会太久。目前,大模型在文字类以及记忆性、直觉性强的任务方面能力已经超越人类,在理科方面的基础能力还较为薄弱,但未来可能会快速提升。
4. 基于2C App和学习硬件推动教育大模型发展。2B2G逆流前进,2C应用更加乐观,AI硬件在教育领域有机会,如提供最大定制化体验、创新形态带来大模型产品的巨大设计空间和良好商业模式、端侧模型带来新的机会。
阅读原文

"超级有用"的AI,被百度做成了

文章概要:

1. 2024年上半年,百度智能云以32.4%的市场份额,位居中国MaaS市场第一。
2. 2024年上半年中国AI大模型解决方案市场,百度智能云营收占比达17.0%,市场第一。
3. 百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以真实的图片。
4. 百度集团执行副总裁沈抖在不久前的云智大会上曾表示,百舸4.0预置了主流的大模型训练工具,能够实现工具层面的秒级部署,并将万卡集群运行准备时间从几周缩减至1小时,极大地提升部署效率,缩短业务上线周期。
5. 百舸将不同地点、不同规模的异构算力进行统一管理,构建起多芯资源池。当业务提交工作负载时,可自动进行芯片选型,依据集群剩余的芯片资源,选择性价比最高的芯片来运行任务,从而最大化地利用集群的剩余资源。最终,可实现高达95%的万卡多芯混合训练效能。
6. 百度自身利用百舸训练文心大模型的成熟经验,也能够帮助其它大模型企业快速训练。
7. 成立于2023年3月的生数科技,仅仅一年后就发布了被称为“国产Sora”的视频生成大模型Vidu。
8. 在中国,典型的AI应用场景是智能客服,但是传统的智能客服普遍需要人工提前准备好现成的FAQ,对用户问题的理解能力也非常有限。而在大模型的加持下,智能客服对自然语言的理解能力出现了质的飞跃,无论是应用范围还是部署成本都明显改善,是大模型对于现有产品改造的绝佳案例。
9. 百胜中国是国内最大的餐饮公司,其基于文心大模型打造客服系统,已经在为旗下包括肯德基在内的多个品牌提供服务。
10. 杭州全诊医学基于千帆平台和文心大模型打造了AI医疗助理应用,则能够在导诊、预诊、诊间、入院、手术、随访等全阶段服务医生患者。以辅助医生撰写病历为例,全诊医学通过使用20万份精标病历数据对大模型进行了精调,使AI医疗助理的医学用语更准确、更规范,大幅提升病历内容质量。病历生成的准确度提升了45%,医生的接诊量提高了20%,造福更多病患。
11. 大模型的应用不仅限于自然语言理解,也能够深入改造传统企业的生产环节。在能源电力行业,国家电网正在围绕文心大模型、千帆平台,结合电力行业高质量数据,联合百度共创电力行业大模型基础底座,并在调度、设备、营销等六大专业领域深入探索。目前,已经在电力设备运检、供电服务等电力行业核心场景成功完成应用落地。
12. 得益于在全栈AI技术、产品创新和产业落地方面的持续投入,百度智能云拥有中国最广最深的大模型产业落地规模,超60%的央企正在使用百度智能云进行AI创新。百度智能云千帆大模型平台已经帮助客户精调了3.3万个模型、开发了77万个企业应用、文心大模型日均调用量超过15亿次。
阅读原文

AI技术干货|大语言模型知识大全!从入门到精通,通俗易懂!|附391页PDF文件下载

文章概要:

1. 本文提供完整版报告下载,请查看文后提示
2. 如欲获取完整版PDF文件,请扫描下方二维码加入“人工智能之地”获取
3. 需要下载和及时更新最新人工智能报告的朋友,可以加入我们的《人工智能之地》分享会,大量的中外文精品人工智能行业分析报告及各类专题资料将会优先分享到人工智能之地中,加入即可下载全部报告
4. 已上传《人工智能之地》的报告详细清单如下:已分享的人工智能研报如下(691):2024年生成式AI赋能零售电商行业解决方案白皮书|附69页PDF文件下载等
5. 加入《人工智能之地》1年内可免费下载《人工智能之地》内所有的报告,目前每天仍会新增至少2篇行业报告,欢迎加入
阅读原文

通俗易懂,大模型原理及缺陷!

文章概要:

1. ChatGPT发布以来,用户的搜索方式以及人机交互经历了显著的。在简单的应用场景体验质量得到了的提升。
2. 大模型能够生成且连贯的,主要归功于Transformer模型架构以及海量预训练微调数据集的。
3. 大模型通过在大量数据上建立共现词概率来生成文本,因此“下一个词是什么”与“在真实世界中的语义含义或真实性”无关。
4. 人类运用语言精确地向他人描绘世界然而,语言亦能用于辩论、误导促使行动以及含蓄地表达使用者的信念,这些功能同样会被纳入大型语言模型(LL)的训练数据中,从而影响模型对于正确与错误或幻觉)的判断。<> 5. 在某个主题存在广泛共识且模型受过大量相关语言训练的情况下,模型的通常能反映共识。但缺乏足够的语言示例存在争议性或没有明确共识时,模型就可能产生看似合理实则错误的回答。
6. 大模型有效地回答网络数据不足的问题。尽管某些大模型在处理有争议时更为细致,并偶尔提醒用户对争议主题发表声明,但整体上,模型回答准确性依赖于训练集中的语言数据。在处理有争议或不常见的主题时,大模型的较低容易。
阅读原文

国内首个!厦门理工学院携手多家企业发布船舶与海洋工程行业大模型

文章概要:

1. 11月0首个与海洋工程行业大模型——“文鳐”大在正式发布。
2. 该模型由学院众数(厦门)信息科技有限公司共同发起多家政产学研机构共同发布。
3 “文鳐大模型致力于打造行业领先的模型基于通用大模型,多模融合,结合专业知识,不断训练和模态自研行业大模型,模型在船舶设计、预测航运气象服务等特定领域的处理行业知识研发办公领域应用,多场景应用,助力船舶与海洋工程提高工作效率。
.会上,政府人员、企业行业专家和产业聚焦人工智能时代智慧海洋发展新路径和“船舶、海洋、气象”建设新模式开展深入的研讨
阅读原文

AI大模型革新细胞特异性基因调控:深度学习指导下的顺式调控元件合成设计

文章概要:

1. 研究团队在Nature上发表了题为"Machine-guided design of cell-type-targeting cis-regulatory elements"的研究论文,提出了一个名为CODA的计算框架,可以从头设计具有细胞特异性的合成CREs
2 CODA框架主要包含利用深度神经网络Malinois对CRE活性进行建模、通过目标函数评估序列的细胞特异性、使用序列优化算法进行迭代设计、最终通过实验验证几个关键步骤
3. Malinois是一个卷积神经网络模型,可以准确预测DNA序列在不同细胞类型中的调控活性
4. CODA实现了三种不同类型的序列优化算法:Fast SeqProp、AdaLead、Simulated Annealing
5s的性能评估显示合成序列在目标细胞中具有更高的特异性活性、94.1%的CODA设计序列成功展现了细胞特异性、合成序列通过同时增强目标细胞活性和抑制非目标细胞活性来实现特异性
6. 调控机制解析鉴定出36个核心转录因子结合模体、合成序列比天然序列更频繁地使用特定模体组合、NMF分析揭示了12个功能程序,其中5个与细胞特异性相关
7. 体内验证显示2/3的肝脏特异性序列在发育中的肝脏中表达、2/3的神经特异性序列在神经细胞中表达、神经特异性synN1在大脑皮层第6层神经元中特异性表达、RNA测序验证了其组织特异性
8. 这项研究具有重要的科学意义和应用前景:方法学创新、机制洞见、应用潜力、技术拓展
9. 代码与数据可在CODA代码:https://github.com/sjgosai/boda2、数据:https://zenodo.org/records/1069804获取
阅读原文

LoRA和全量微调有何不同?被问了不下5遍

文章概要:

1 学员通过训练营的项目和面试辅导,拿下苏州国企大模型offer,年薪3w+。
2 本文旨在了解两种微调大型语言模型方法之间的:完全微调和低秩 (LoRA)。
论文LORA VS FULL FINEUN: AN ILLUSION OF EQUIVALENCE》通过分析预训练模型矩阵的光谱特性来研究不同的微调方法如何改变模型。br>4. 研究发现,完全微调与LoRA产生的权重矩阵奇异值分解结构有显著不同经过微调后的在面对超出适应任务的时也出不同的泛化行为。
5.研究LoRA微调模型中侵入维度的原因、它们为什么不受欢迎,以及如何最小化这些效果来展开研究。
.给出了几点观察:LoRA和微调在结构上不同的参数,这种差异由维度产生的;具有侵入维度LoRA微调会忘记的预训练分布,并且表现出较差的稳健连续学习能力;在目标任务上低秩LoRA表现良好,但更高秩的参数化可能仍然是可取的。
阅读原文

周成虎院士:大模型推动地理科学迈向地理智能

文章概要:

1. 中国科学院地理科学与资源研究所联合中国科学院青藏高原研究所、中国科学院自动化研究所研发的“坤元”大模型发布,旨在拓宽普通大众的地理视野,增强地理科技工作者的智力,加速重大地理科学发现。
2. 相比通用语言大模型,“坤元”更熟悉地理学的语言模式、专业术语和领域知识,在地理学基准测试集上的准确性提升了31.3%。
3. “坤元”大模型的应用优势体现在“懂地理”“精配图”“知人心”“智生图”等方面,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能。
4. “坤元”大模型已经在文献辅助阅读、论文辅助撰写等方面发挥了作用,未来计划出一个地理科研协作大平台,每个科学家和科研团队都能够拥有专属的地理大模型,每个科研人员都可以通过平台共享数据、模型或者寻求跨学科合作。
5. “坤元”大模型的训练、使用要遵照我国关于地理信息安全的所有法律条文,确保地理信息安全。大模型本质上还是一个生成式人工智能,所以大模型采集的数据、形成的分析结果到底是对还是错,最终还需要通过人来判断,确保大模型生成及分析结果的准确性与可靠性。
阅读原文

李彦宏:大模型基本消除幻觉,AI是真需求,智能体将爆发

文章概要:

1 李彦宏认为大模型基本消除了,这是24间AI行业的变化> 2. 李彦宏AI是真需求,体将成为内容、服务和信息的新载体,AI应用的最主流形态
3 李彦宏了两大赋能应用的AI技术检索增强的(无代码br 4,在文字做得图像多和AG还现象仍然很普遍,所以多模态大模型尚未诞生成规模的应用
5 李彦宏宣布推出代码工具“秒,让一行代码都看不懂的人具备程序员的能力有让任何想法能迅速、低成本地现实的
阅读原文

李彦宏置身事内

文章概要:

1 李彦宏认为百度要帮助更多人、企业打造出数百万‘超级有用’的应用,而非推出一个‘超级应用’。
2. 李彦宏表示大模型的性能越来越高,门槛却越来越低,从业者也越来越多,新的机会也随之而来。他认为智能体就是AI应用的最主流形态,并将迎来它的爆发点。
3. 李彦宏在今日的世界大会上发布了检索增强的文生图技术(iRAG)、0代码产品以及四大智能体(公司类智能体、角色智能体、工具类智能体和行业智能体)。他认为借助这些工具以及生成式AI的颠覆性功能,让每个人都具备程序员的能力。
4. 李彦宏认为,大模型发展的过程必然要经历Copilot阶段、Agent智能体阶段、Al Worker阶段。而智能体正是他最看好的AI原生应用发展方向。李彦宏认为,智能体相当于PC时代的网站和自媒体时代的账号,它最明显的特点是门槛足够低,谁都能上手,天花板又足够高,可以做出非常复杂、非常强大的应用。他认为,将来会有数以百万量级的智能体出现,形成庞大的智能体生态。
5. 李彦宏在AI投资、布局上的躬身入局和置身事内,让百度开始尝到时代的红利。2023年9月7晚,《时代》周刊发布了首届全球百大AI人物,百度创始人李彦宏同特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、OpenAI CEO山姆·阿尔特曼等企业家一起被评为全球AI领袖。
阅读原文

中国电信“天罡”通用大模型评测榜单发布

文章概要:

1 中国电信“天罡通用大模型榜单,依托中国电信云网融合装置,天罡”模型平台于8月发布了通用大模型榜单获得的关注和积极的市场反响
. 本次发布的10榜单中,天罡”模型沿用评估框架的上,优化自动化评价可靠性,显著提升评估的准确度和效率。
3. 本次榜单了对Q2.系列、-4o-Mini、Seek-V2L3.主流大模型迭代版本,通过权威题库、动态抽样、模型和人工等机制,天罡”模型对新了全面评估br>4. 评测结果丰富了对大模型能力的理解,也为行业的和提供的参考依据和。br>5. 中国电信通用大模型评测10国内外通用大模型整体榜单解析:GPT-4o领跑,中文测试环境下,国内头部大模型达到9%以上水平;wen2系列取得显著提升环境下开源逼近闭源Deepseek-V2较上一版本整体显著提升;Llama.能力提升有限非率和安全退步。br. “天罡”评测榜单一致性验证:Chat Arena由开放LYS推出针对语言LL)测试公众匿名投票语言模型对抗,体现人类的主观感知。
.了“天罡”模型评测的,了最具代表性的14大模型Chat Arena榜单进行逊系数,显示两者的逊相关系数高达为.9(完全一致得1),充分“天罡大模型测评结果人类主观评测具有高度一致性。
阅读原文

文心大模型日调用量超15亿!百度打开增长新空间

文章概要:

1. 百度文心大模型日调用量超15亿,成为百度新增长极
2. 百度发布两大AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”
3. 文心大模型成百度新增长标杆,调用量增长陡峭
4. 文心大模型持续快速进化,得益于百度全栈布局
5 百度发布无代码工具“秒哒”,可帮助更多人、更多企业打造应用
6. 智能将成为内容、服务和信息的新载体,百度搜索已成为智能体最大分发入口
7. 百度构建起“易开发、有分发、有钱赚”的一站式智能体平台能力
阅读原文

AI大模型实现图片OCR识别

文章概要:

1. 介绍了OCR技术的背景和应用场景,以及LLM助力OCR的方式和缺点。
2. 通过实践案例,展示了如何使用LLM识别图形验证码,并提供了相关代码实现。
3. 介绍了通义千问VL模型的特点和应用场景,以及使用该模型进行图片识别。
4. 总结了LLM辅助OCR图片识别的重要意义,包括提高信息提取的准确性和效率、拓展OCR技术的应用场景、推动智能化发展和技术融合与创新。
阅读原文

【每日精读】AI大模型技术产品在智慧城市的应用,一文了解

文章概要:

1. 城市越大,运行管理越复杂,各类问题和风险就越多。习近平总书记指出要加强城市基础设施建设,打造宜居、韧性尤其是AI模型,将加速推进智慧城市建设,成为促进智慧城市升级革新的必由之路。
2. 大模型技术产品落地智慧城市应用的思考:如何构建行业大模型,以智慧城市应用场景为驱动,推进行业精细化治理;如何体现以人为本,基于大模型辅助智慧城市各类参与者。
3. 大模型赋能智慧城市发展的主要业务场景分析:大模型赋能民生诉求“优服务”;赋能法治政府“强规范”;大模型赋能城市管理“优考评”;大模型赋能基层治理“减负担”;大赋能城市停车“提效率”。
4. AI大模型助力智慧城市发展展望:大模型推进智慧城市发展的四大关键原则;大模型使能智慧城市四大场景分类;大模型应用场景务实落地的三大核心抓手。
5. 结束语:大模型在智慧城市当中的应用要能切切实实赋能智慧城市的各类参与者,而不应只是个“花架子”。
阅读原文

小米大模型升级第二代:云边端结合模型矩阵赋能「人车家全生态」

文章概要:

1. 2023年AI浪潮推动了产业格局重塑,小米提出将"轻量化、本地部署"作为突破点,在手机芯片NPU上跑通十亿参数规模大语言模型。
2. 过去一年多,国内大模型生态系统日趋完善,技术迭代周期不断压缩,产业落地进程加速。小米大模型团队专注于提升自研大模型的模型能力和「端」「云」协同的落地效果,推出小米第二代自研大模型MiLM2。
3. MiLM2实现了从一代到二代的升级迭代,在模型规模、训练数据、训练策略、、配套技术等方面进行了深入打磨。
4. 小米大模型团队在预训练、后训练、量化、推理加速等方向做了大量的技术探索和创新,并将部分成果以论文的形式发布出来,推动大模型技术的发展。
5. 二代模型MiLM2系列融合多项前沿技术,实现技术能力升级的同时模型效果全面超越前代,其中,MiLM2-6B模型与MiLM2-1.3B模型经过进一步升级打磨,实力更上一层楼。
6. MiLM2模型矩阵主要在参数规模和模型结构两个方面打造纵深,目的是为了适应多元化的业务场景并在小米生态中挖掘更多的落地场景。
7. 小米自研大模型不仅包含多样的参数量级,同时也纳入了各种不同的模型结构。
8. 端侧新增4B模型,小米大模型团队创新性地提出“TransAct大模型结构化剪枝方法”,仅用8%的训练计算量即从6B模型剪枝了4B模型,训练效率大大提升。
9. 云端新增30B模型,MiLM2-30B模型是小米二代大模型系列中参数量级最大的模型,专为云端场景设计。
10. 目前,小米第二代自研大模型取得的进步和成果,已经开始渗透到真实的业务场景与用户需求中,不仅帮助集团内部解决了多样化的业务需求、实现工作提效,也已经在澎湃OS、小爱同学、智能座舱、智能客服中开始应用落地。
阅读原文

大语言模型的超曲率微调

文章概要:

1. 文章探讨了语言LLMs)在嵌入标记时的欧几里得特性,并提出了一种新的低秩方法(LoRA)旨在在超曲率中进行模型微调,以更有效地利用br> 2 研究发现Ms频率遵循幂律分布,并且空间呈现树状特性。HypLoRA通过直接在流形上低秩了传统方法在欧几中应用时局限性,显著了模型复杂推理任务AA上的性能,可1%。
3. 文章提出了一种新的曲率低秩(Hyp)通过超曲率改进大语言模型(LLMs性能更有效地捕捉和利用复杂的层次关系在复杂任务显示出显著的提升
阅读原文

小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%

文章概要:

1. 小米大模型来了,第一代,训练数据规模更大品质训练与上也打磨。不仅长度到了的50,1大能力上相比于第一代平均提升4。
2. 第二代大语言模型端侧部署上还支持种推理加速方案大小模型、BiTA、usa,业界标准方案,损失降低7。> 小米模型了1篇论文了0项发明专利部分的如下:br> - SUBLLM:基于Transformer结构,地提出一种新的结构。
TransAct:一种大模型剪枝。> INTRoc:是一种注意力机制。
- Mixture of D Size Experts:是一种MoE结构。
4. 小米第二代模型MiLM2融合多项前沿技术模型效果全面超越了第一代。
5.将大模型的参数规模灵活扩展0.、0.7B、1.3B.、B、B、B、30B等量级,适应不同下需求。br>.端侧,第二代大模型技术也有新突破,新的4B模型将在端侧更的作用。
阅读原文

汽车软件领域双奖显实力 德赛西威大模型语音赋能座舱智能化

文章概要:

1. 2024中国汽车软件大会在上海举行,德赛西威OS8.入选创新案例并摘得“产业创新实践奖br> 2. 德赛西威卡副总经理双建平分享了《基于车载场景的模型语音实践之路》
. 德赛威模型语音解决方案可针对不同车平台需求进行端侧大模型
4 德赛威大模型语音座舱特定语料优化模型座舱适应,基于用户口语数据学习进一步理解自然表达
5. 德赛西威大模型语音突破了传统语音模式的技术难题,实现了拟人智能、用户偏好个性满足,主动式动态学习和同步
6.赛西语音基于云侧、端大模型以及语音动作引擎技术,融入智能生态插件,提供场景应用> 7 未来,赛西OS将语音为入口,应用壁垒,构建“AI+场景+生态”的智能化服务,实现0层级无感交互,为用户极致高效的车载语音体验
阅读原文

SDC2024 议题回顾 | 大模型软件生态系统的安全隐患:从传统漏洞到新型威胁

文章概要:

1. 大模型软件生态系统存在安全隐患,包括传统漏洞和新型威胁。从"Shadowray"Probllama"漏洞一系列安全揭示了其脆弱性。
2软件生态系统可分为面向智能服务开发者的大模型服务组件和面向模型开发者的大模型训练推理组件,每层都功能和风险。
3 传统安全漏洞包括提示工程中的模板注入漏洞、向量数据库中的拒绝服务漏洞、推理平台中的数据泄漏和越界写漏洞等。
5. 安全检测技术包括rag和agent在安全检测中的探索,如模型服务接口测试和Agent应用。
6. 呼吁开发者重视开发组件的安全性,安全可从内容安全、基础设施安全和具身安全等方面介入大模型安全领域。
阅读原文

[技术] 为什么现在AI大模型都是基于Python开发的?

文章概要:

1. 知乎上有个问题:国内AI大模型Python开发的,AI大模型是什么语言的?为什么python?有人认为Python只是接口,大模型底层都是C++开发。不然,现在大模型多是基于Porch、Tensoflow开发的直接引用轮子,这两个框架确实基于C++,但大模型的其他代码包括数据处理、训练、数据可视化、模型校验等等都是基于Python。
2. 有个很简单的方法可以看开源的AI工具主要用哪种,只需要Github看这个AI仓库基础信息,它会主要基于哪种语言开发的,因为Github会综合分析仓库中文件扩展名、、主要内容等来自动确定主要是哪种编程语言。
3 打开Openai在Github的账号,有将近20个项目仓库你会几乎90%的都是基于Python开发的,尽管也会有其他语言代码,但Python贡献了多数代码。
4. 不只是OpenAI,其实大多数知名AI公司产品都是Python,比如创造了阿尔法狗的mind。
5. AI产品都主要基于Python进行开发的表面原因是AI主要是基于机器学习、深度学习神经网络等技术,因此对计算、算法要求很高,需要专业的AI来支持开发,比如谷歌的Tensor、Facebook的Porch和Caffe、的PaddlePaddle等等,还有像numpy、scipy等底层计算库,是AI训练不可或缺。
6. 深层次的是python足够简单,具有胶水属性,且跨平台通用性好,为融合Ai工具提供了底层能力,也让算法工程师花最少的代码时间创造出的,这是其他语言所没法比拟的。
阅读原文

《2024智能教育发展蓝皮书》优秀案例 | “码上”:大模型赋能的智能编程教学平台

文章概要:

1. 《20教育蓝》案例 | “码”:大模型的编程教学平台北京邮电开发,一对一辅导、问答论坛、教学管理等功能,为学生提供实时、个性化启发式编程服务。
2码上”采用“序顺序”大模型并行调度算法等自研核心技术通过5轮启发式、轮式提示与建议老师等功能,学生、个性化式编程服务br 3.邮电大学基于“码上”了教学,教学实验证明,“上能够较好满足学生学习的辅导需求提升学生学习预计024年年底码上对于编程新手编程问题的答疑准确率将达到80%-90%,其他学生群体的编程辅导效果也显著提升br> 4. 随着实践的码上逐渐拓展多个学科并获得认可,推动高等教育领域的人工智能应用和国际化教育合作024年月,“码上”入选教育部首批18“人工智能+高等”场景案例。同年2日“码”版。
阅读原文

AI大模型产业发展趋势与应用沙龙

文章概要:

1. 2024年10日,“AI大模型产业发展趋势与应用沙龙”在北方工业大学广学顺利举办。
2. 沙龙邀请到北京中关村通力科技公司人大数学经济与人工智能俱乐部、北京朝阳区女企业家协会、北京外国语大学信息技术中心等多位嘉宾为MBA学员带来AI大模型发展趋势与应用的精彩分享。
3.大模型产业是一个以大规模参数的神经网络模型为核心的新兴技术领域,已成为全球科技竞争新焦点
4. 北京中关村通力科技服务有限责任公司副总经理姬鹏飞讲解了石景山区人工智能产业聚集区的建设。
5. 人大数学经济与人工智能俱乐部副秘书长杨波讲解了《人工智能与大模型应用实践—数智化转型下的AI时代机遇》<> 6 北京朝阳区女企业家协会高婷婷开展了以《数据语料运营基地与模型场景应用介绍》为主题的讲解。
8. 通过这次AI大模型的沙龙,让同学们对AI大模型有了全面和的。
阅读原文

李彦宏:大模型基本上消除了幻觉,回答问题的准确性大大提升

文章概要:

1. 李彦宏与百度大模型的崛起:李彦宏作为百度的领军人物,在大模型展现出了卓越的。过去两年,百度大模型取得了令人瞩目的成就。其中模型的日均调用量呈现出惊人的态势<>2. 大模型幻觉,准确性提升:大模型的幻觉问题曾是其广泛应用的限制。如今,在层面,RAG检索增强生成)技术已经很好,基本让大模型消除了幻觉。
3. 大模型的优势与应用:百度大模型显著优势,消除幻觉、生成超真实内容、优势、立等可取等这些优势吸引了众多企业和的参与。
4.未来: AI 应用的新时代百度大模型无疑占据着重要地位随着技术的不断进步,大模型的应用场景将更加广泛。
阅读原文

法律大模型「法观」全新“慢思考”版本正式发布 | 法观

文章概要:

1. 法律大模型法观」全新“慢思考”正式发布。
2 法观由中国司法大数据、数智枫桥研究院、同律师事务所研发,是一款面向各行业、的法律人工智能解决方案。br> 3. 法观基于国产底层技术架构,整合了法研的全司法以及海量的法律研究和实务,具备强大的法律文本理解与分析能力。
4. 法观在律师案件分析、企业合规审查、社会普法、法学教育政策研究等方面发挥着重要作用。
. 此前,法观通过中国法律职业资格,成为全球首个通过此项考试人工智能产品。
6 此次深度思考版本的更新,进一步模拟人类思维模式,强化了“法观”法律处理中的能力,生成内容的质量得以显著提升。
7. 法观作为法律垂类模型,其深度思考版本得益于人类“慢思考”的一系列设计的机制。
8. 目前,法观大深度思考模式,用户可以点击文末“阅读原文”或faguan.ai免费体验
阅读原文

大会演讲PPT|大模型技术演进及其对软件造价行业影响(北京智源人工智能研究院 知识计算引擎创新中心主任 孙会峰)

文章概要:

1. 2024年10月31日202(第九届)BSCEA中国大会204软件行业基准数据主会场在北京召开
2. 北京智源人工智能研究院知识计算创新中心主任孙会峰题为“大模型技术演进及其对软件行业影响”的主题演讲
3. 介绍了北京软件造价评估技术创新联盟,包括其成立时间、宗旨、会员单位以及在软件造价评估领域的和成果
阅读原文

2024中国AI大模型场景探索及产业应用调研报告(附下载)

文章概要:

1. AI大模型行业应用价值:提升要素效率及数据要素地位,包括数据成为新生产要素、AI大模型技术进步提升生产要素使用效率、AI大模型技术进步提升数据要素地位。
2. AI需求概述:100亿-200亿参数规模最优,包括AI大模型行业应用概述、企业对AI大模型能力需求、企业对安全性需求。
3. AI大模型行业应用的合规要求:暂行备案制,包括AI大模型行业应用合规要求、通过《生成式人工智能服务管理暂行办法》备案的大模型名单、部分通过《互联网信息服务深度合成管理规定》备案的大型算法名单。5. AI大模型行业应用痛点:技术面临“卡脖子”&数据不足,包括技术面临“卡脖子”、数据缺乏。
6. AI大模型行业应用痛点:人才缺失&法规风险,包括人才缺失、法规风险。
7. AI大模型行业应用痛点:市场认知不准&行业know-how不足,包括市场认知不准、行业know-how积累不足。
8. AI大模型行业应用前景趋势:技术趋势决定行业前景,包括技术趋势决定行业发展前景AI大技术发展趋势。
9. AI大模型行业应用前景趋势:竞争趋于分化,包括AI大模型行业应用竞争趋势、AI大模型行业应用竞争趋势。
10 AI大模型行业应用前景:场景更加多元化,包括AI大模型行业应用趋势、AI大模型行业应用趋势。
11. AI大模型:到2028年行业规模超1000亿元,包括AI大模型行业应用其他趋势、AI大模型行业前景预测。
阅读原文

AI大模型落地,为什么是央国企先行?

文章概要:

. 2024年1-7月,央国企采购大模型项目数量已超过950个,且均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向。
2. 除了政策影响,央国企纷纷落地大模型的背后还有哪些推动因素?
3. 运营商、政务、能源抢先智算中心
4. AI大模型:颠覆传统IT架构背后
5. 竞争点:预训练、安全及行业know-how
阅读原文

小米算法工程师:大模型微调、部署与高效实践策略

文章概要:

1. 小米算法工程师:大模型微调、部署与高效实践策略
2 大模型微调与部署的原理和方法
3. 课程配有2个项目
4. 课程导师王全东> 5. 课程大纲
6. 课程亮点
7.收获
8. 适合人群
9. 课程服务
阅读原文

数字创新再突破!合肥协鑫集成成功部署首个私有化大模型工艺机器人

文章概要:

1. 11月11协集成科技有限公司二厂成功开发并部署了首个基于私有化大语言模型的光伏组件工艺,实现了技术与传统的深度融合。
. AI大语言模型通过“数据-知识能力-复用,实现对业务、管理过程智能化的赋能与光伏制造领域离散数据的化整合。
3. 本次创新采用私有化部署方案,在确保数据安全的前提下,将新一代大成功应用领域,实现数据安全与智能化的。>4. 合肥协鑫集成打造了具有自主知识产权的智能工艺专家系统机器人具备持续学习能力,技术创新、提升、降低成本方面具有明显优势。 阅读原文

计算成本减少5倍!NeurIPS 2024 | DeeR-VLA:高效机器人执行的多模态大模型推理

文章概要:

1. 多模态大语言模型(MLLMs)在理解和推理复杂语言和视觉数据方面具有卓越能力,但在实际机器人平台上开发MLLMs具有挑战性。
2. DeeR-VLA框架通过利用MLLMs中的多出口架构,根据当前情境自动调整所激活MLLM的规模,从而避免冗余计算。
3. 该框架还开发了新的算法,建立了早退判据,确保DeeR在不同约束下高效运行,同时保持竞争力的性能。
4. 此外,设计了一个定制的训练方法,以在这种多出口架构之上整合时间信息,从而合理预测动作。
5. 在CALVIN机器人操作基准测试中,DeeR实现了LLM计算成本减少5.2-6.5倍,GPU内存减少2-6倍,同时保持了性能不受影响。
阅读原文

文心大模型最新数据公布!李彦宏在百度世界大会说了什么?

文章概要:

1. 11月12日,百度世界2024大会在上海世博中心举行,百度创始人重要演讲,发布多项新技术和新产品
2. 李彦宏宣布文心iRAG技术正式亮相,该技术将百度搜索的亿级图片资源与强大的基础模型能力相结合,能够生成各种超的图片
3. 李彦宏公布百度文心大模型的最新数据,截至11,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,实现了约3的增长
4. 李彦展示全新的工具类智能体——自由,这是由百度文库和百度网盘联合开发的一款创新产品,让用户可以类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成模态内容
5. 李彦宏发布基于大模型的100大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业
6 李彦宏提出智能体是AI应用的最主流形态,迎来它的爆发点,心智能体平台已经吸引了15企业和80开发者参与,覆盖众多应用场景
7. 百度世界2024大会还设置了多场分论坛和公开课,涵盖了AI前沿技术、大模型落地等主题,大会还设置了超过5000平方米的AI应用小镇,供与会者进行互动体验
8. 百度旗下智能硬件品牌小度宣布在百度世界大会上发布一款名为“AI新”新产品,记者参观展区时发现,这一新产品为眼镜
阅读原文

李彦宏驳大模型泡沫论:文心日调用量15亿 智能体全面爆发(附演讲全文)

文章概要:

1. 百度世界2024公布,截至11月初,百度文心大模型的日均调用量已经超过15亿相较一年前首次披露的5000万次,增长约30倍
2. 李彦宏谈到,过去24个月,AI行业的最大变化是大模型基本消除了幻觉,对此,百度发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”
3. 在AI应用的发展趋势上,李彦宏表示 ,智能体是AI应用的最主流形态,即将迎来爆发点
4. 演讲中,他还展示了文心智能体平台TOP100智能体和TOP100产业应用,并表明 “百度不是要推出一个‘超级应用’,是要帮助更多人、更多企业打造出数百万‘超级有用’的应用”
5. 当天发布的无代码工具“秒哒”,具备无代码编程、多智能体协作和多工具调用三大特性,用自然语言就能搭建一整套系统,将开启一个“只靠想法就能赚钱的时代”
阅读原文

李彦宏最新演讲整理:大模型幻觉已基本消除,文心大模型日均调用量超15亿

文章概要:

1. 百度文心大模型日均调用量已超15亿增速超出预期。过去24个月AI行业的最大是大模型基本消除了幻觉。对此,百度发布两大赋能应用的AI技术:检索增强的文生图技术(R)和无代码工具“秒哒”
2. 百度开发的检索文生图技术——iRAG(image based RAG)发布百度将搜索亿级资源和基础模型能力结合,可生成超真实图片,克服了文生图系统 “一眼假” 和逻辑不合理的问题。
. 无代码工具“秒哒”正式发布,产品由大模型和智能体组成,写代码就能实现任意想法,拥有包括无代码编程、多体协作和调用各种工具的。<>4. 李彦宏认为,智能体是AI应用最主流形态,将成为AI原生时代内容、信息和服务的新载体智能体具有低门槛、高的特点,可以满足从简单到复杂的各种需求。
5. 百度智能云成为构建智能产业生态的主要依托,千帆大模型平台已累计帮助用户精调.3模型,开发77万个企业级应用,拥有中国最大的大模型产业落地规模,众多央国企和联合进行AI创新。
6. 百度发布基于大模型的00产业应用,涵盖制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。
阅读原文

李彦宏:大模型幻觉基本消除,这是只靠想法就能赚钱时代

文章概要:

1. 11月12日,李彦宏在“应用来了”百度世界2024大会上发表了近一个小时左右的演讲,期间分享了百度在大模型应用上的观察和思考,同时展示了百度过去一年在大模型方面的成绩单。
2. 李彦宏表示,过去这24个月,AI行业的最大变化是大模型基本消除了幻觉,AI应用方向的两个方向分别是智能体和产业应用。
3. 李彦宏表示,智能体是AI应用的最主流形态,即将迎来爆发点,百度不是要推出一个“超级应用”,而是要打造数百万个“超级有用”的应用。
4. 李彦宏表示,我们将迎来一个前所未有的只靠想法就能赚钱的时代,李彦宏现场发布无代码工具“秒哒”,并称之为迄今为止人类历史上最复杂的多智能体协作工具。
阅读原文

人工智能在工业界的新角色:工业大模型

文章概要:

1. 工业大模型是一种特殊的人工智能模型,它能够处理复杂的工业问题。
2 构建工业大模型需要四个关键步骤:工业数据制备、工业基座模型训练、工业任务/行业模型适配、工业场景应用<> 3. 工业大模型做很多事情,如智能问答、认知、过程决策、终端控制、内容生成科学发现等。br> 4. 工业模型处于起步阶段,但它潜力巨大,未来可能会成为工业界的“大脑”。
阅读原文

重磅丨2024年中国AI大模型场景探索及产业应用调研报告:AI大模型爆发,重塑产业未来

文章概要:

1. AI大模型的崛起:定义与价值
2. 应用路径与商业模式:灵活多元
3. 行业应用现状:广泛渗透与融合
4. 面临的挑战与解决方案
5. 未来趋势与投资机遇
阅读原文

实测百度iRAG技术:大模型终于知道如何去掉“AI味儿”了

文章概要:

1. 2024年百度世界大会在上海举办,百度创始人李彦宏发表演讲,称过去24个月大模型行业最大的变化是消除了幻觉,回答问题的准确性大大提升。李彦宏介绍了百度最新的iRAG技术,该技术可以让AI大文生图功能准确性大增,不再有“幻觉”。
2. 曾经AI文生图功能出现过“图不对题”等问题,随着产品进化得到修复。百度世界2024上,百度正式发布iRAG技术,采用该技术的文生图能力不仅不再犯“搞笑错误”,更是在生成特定物品、生成特定人物与任意背景结合的图片等方面表现出色。
3. 为了iRAG技术的实际效果,作者对文心一言等三个大模型进行了对比测试,包括生成马斯克吃蛋糕、安妮海瑟薇吃炸酱面、霍金在篮球场打麻将图片。测试结果显示,文心一言对用户的指令理解能力最好出图正确率也是最高的。
4. 百度的iRAG技术能够将百度搜索的亿级图片资源和强大的基础模型能力相结合,生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了AI,而且成本很低。
5. 李彦宏称“我们即将迎来AI应用的群星闪耀时刻”,他还再次强调“超级能干”的应用比只看DAU的“超级应用”更重要,只要对产业、对应用场景能够产生大的增益,整体价值就比移动互联网要大多了。
阅读原文

李彦宏:大模型过去两年最大变化是基本消除了幻觉

文章概要:

1 李彦宏2024百度世界大会上问题:最近24个月以来全球大模型的狂热,究竟是一场新的技术革命,一轮新的?
2.宏表示,今年这届大会的主题是“应用来了”,基本可以代表百度对大生成式AI时代的判断。
3. 李彦认为,过去24个月,AI的最大变化是大模型基本消除幻觉。
4. 李彦宏现场发布了最新的研发——检索增强的文生图iRAG,其将百度搜索的亿级图片资源跟的模型能力相结合生成各种超真实的图片。
5. 李彦宏认为,iRAG技术提高了AI生成图片的可用性,具备无幻觉、超真实,没成本,且立等等商业
6 李彦宏表示,智能体是AI应用的最形态,即将迎来爆发点。
. 李彦宏现场发布了TOP10应用,涵盖制造、交通、、企业、、互联网等领域。
8. 李彦宏发布了无代码产品秒哒,其将在明年一季度正式上线
阅读原文

大模型商业化路径解析|图说

文章概要:

1. AI大模型应用井喷
2. 大模型商业化路径解析
3. 大模型应用
阅读原文

“大模型安全与对齐”论坛详情公布|中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会(CIPS-LMG2024)

文章概要:

1. 中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会(CIPS-LMG 2024)将于2024年11月28日-12月1日于浙江嘉兴召开,多个论坛覆盖了大模型基础理论、深度推理、大模型安全、多模态大模型、科学智能、具身智能、智能体、社会智能等时下最受关注的技术议题。
2. 本次大会的前沿技术论坛将于2024年11月30日召开,分论坛2“大模型安全与对齐”论坛日程公布,报告人、单位、报告题目等信息。
3. 论坛主席杨耀东是北京大学研究院研究员(博雅学者)、人工智能安全与治理中心执行主任,人社部海外高层次人才、国家级高层次青年人才项目获得者。
阅读原文

百度重磅!李彦宏:大模型基本消除了幻觉,这一赛道迎来爆发点!

文章概要:

1 李彦宏在百度世界2024大会上表示,大模型基本消除了幻觉,智能体是AI应用的最主流形态,即将迎来爆发点
2. 百度发布文心RAG和无代码“秒哒AI技术
3. 文心iRAG解决大模型在图片生成上的幻觉问题,极大提升实用性
4. 无代码技术“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”应用
. 李彦宏表示,智能体是下一个应用爆发点,百度将把智能体作为最重要战略方向
. 智能体的门槛低天花板,既能人人都,又能做出复杂强大的应用
阅读原文

智工观点|中工互联:自主可控是工业大模型发展的根本前提

文章概要:

1. 通用大模型与工业大模型二者相互促进,未来二者将协同推动新型工业化的发展。
2. 自主可控是工业大发展的根本前提工业领域需要借助人工智能浪潮实现“换道超车”。
3. 加强工业大模型应用落地研究任重道远,大模型厂商应积极工业大模型应用。
4. 工业大模型是新型工业化的核心动力和创新源泉深度参与新型工业化的全过程
阅读原文

应用突破还是炫技噱头:大模型能否真正驱动行业升级?

文章概要:

1. 商汤科技大模型技术总监张涛、百度灵医大模型底座技术负责人夏源和京东零售 AIGC 技术专家深入探讨大模型技术在垂直行业落地的见解。
2. 他们讨论了大模型在医疗领域的应用,包括病历生成智能诊断、多模态大模型等。
3. 他们还讨论了数据隐私和合规性问题,以及大模型在其他领域的潜在应用。
阅读原文

新的大模型被曝不及预期:没什么科学突破,只需要工程

文章概要:

1. 大模型侧重于工程优化,其发展过程中主要侧重于工程优化,尤其是在提升模型的性能、效率以及可扩展性方面,然而,仅仅依靠工程技术的提升,是否能够实现真正的科学创新,值得探讨
2. 多模态大模型中的多模态依然是盲人摸象,多模态大模型通过整合不同类型的数据,力求在多个模态之间建立联系,从而实现更为丰富和复杂的理解与生成能力,然而,尽管多模态大模型在某些任务中取得了显著的成果,但其在处理多模态信息时仍然面临诸多挑战
3. 大模型的发展更多体现在工程领域,当前的大模型确实在许多上表现出色,但如果要实现真正的科学突破,可能需要进一步的理论创新
阅读原文

chatGPT、claude平替!Qwen最强编程开源大模型发布

文章概要:

1. 通义千问发布开源的Qwen2.5-Coder全系列大模型,已覆盖0.5、1.3、7、14、320亿个参数的六大主流模型大小。
2.wen2.5-Coder在代码生成、代码推理和代码修复方面有显著,基于强大的Q2.5,训练代币5.5万亿,包括源代码、文本代码接地合成数据等。
3.wen2.5-Coder-32已成为当前最先进的开源codeLLM,其编码能力与-4o相匹配。
4. 代码生成方面,Qwen2.5-Coder-32B-Instruct在多个流行的代码生成基准上都取得了开源模型中的最佳表现,并且达到和-o有竞争力。
5. 代码修复方面,Qwen.5-Coder-32B-Instruct可以帮助修复代码中的,让编程更加高效。
6. 代码推理方面,Qwen2.-Coder-32B-Instruct能学习代码执行过程,准确地预测模型的输入与输出。
7. 文章还介绍了如何使用ollama安装qwen25-coder,包括根据设备条件下载相应,通过安装插件,将接入ollama的api。
阅读原文

大模型上车,能否帮助车企建立智能化“护城河”?

文章概要:

1 大模型上车,能否帮助车企建立智能化“护城河”?br>2. 近年来,随着大模型的技术突破,智能座舱的功能与交互体验了全新的发展机遇,各大车企纷纷将大模型技术到自家车型中,提升了车辆的智能交互能力。
3 大模型引领智能座舱新革命,它不仅能完成基本的任务,如语音识别、导航指令,还能够理解更复杂的语言指令,让车主体验到前所未智能服务。br>4. 尽管大模型在智能座舱中展现出了巨大潜力,应用中仍存在一定的技术挑战。
5. 随着车载系统功能的不断增加,许多车型的座舱逐渐呈现出功能堆砌的趋势。
6. 大模型引发的隐私与问题,车载模型应用中,车企必须加强数据安全措施,确保用户隐私。
7. 在质量方面,大模型技术的引入虽然带来了强大的处理能力,但其稳定性和准确性依然面临挑战。
8. 在未来的智能座舱中,“做减法”或将成为车企的主要优化路径。
阅读原文

什么是多模态大模型,生成式大模型与多模态大模型

文章概要:

1 多模态大要点是交叉性和性,目的是保证互补性的前提下,去除交叉性
2 多模态模型和生成式模型都是一种表征模型,多模态是建立在生成式模型基础之上一种更加复杂的模型范式
3 多模态的技术原理与生成式模型的技术没有本质的,其核心技术点,也是其核心难点就是多模态融合
4. 多模态融合就是指两个以上模态数据形成的多种不同种类的组合,其核心技术点包括表征、翻译、对齐、融合和联合学习
5. 多模态大模型一种更加强大的生成式模型,其技术实现难度也更大,但多模态也可能是人类实现通用人工智能的一种方式
阅读原文

【民生计算机】AI搜索:大模型商业落地“第一束光”

文章概要:

1. AI搜索——改变生产力的不二选择。AI搜索技术应运而生,其不仅能够生成内容,还注重对语义的理解和个性化推荐,能连接不同的互联网服务场景,构建起智能化的产品生态系统。3. AI搜索全球市场如火如荼,海内外共襄盛举。国内外科技巨头纷纷布局AI搜索市场,加速搜索引擎从信息获取工具到智能生产工具的重大转变。
4. AI搜索的终局:平台化与专业化交相辉映。平台型AI搜索公司具备天然的优势,用户的天然和历史积累的海量数据成为核心壁垒。AI搜索将完成从线性到一体综合化处理的跃迁,呈现与其他AI工具跨界融合的趋势。AI搜索场景垂直细分化,满足用户细分的需求,在特定领域内提供深入的信息和解决方案。
5. 重点公司梳理。腾讯:混元中文大模型AI搜索多模态测评尖子;三六零:独创CoE架构的AI搜索领军者;科大讯飞:持续追赶GPT4o,星火APP上线AI搜索;昆仑万维:做最懂金融投资、科研学术的AI搜索。
阅读原文

大模型中有哪些形式简单却很巧妙的上分方法?

文章概要:

1. 介绍了一些适用于模型上分方法包括算力碾压、超参数调整、小修小改、增量设计、测试方法和方法等。
2. 算力碾压包括改大batchsize、多训epoch、一个样本用好几回、减小下采样、堆算力、隐藏算力很大的组件、用重参数化把模型搞大、EMA/多模型融合涨点、选个超级小的集等方法。br> 3. 超参数调整包括把cosine学习率变化调成固定学习率、稍微调大一点学习率、把各种超参数隐藏里面、优化器有好多超参数、挑随机种子等方法。
4. 小修小改包括把模型的relu都换成swish或者leaky relu/prelu、偷偷到处加SE layer、把不带参数的组件都换成带可学参数的模组之间乱拉跳边、在没BN的地方加、针对训练集和测试集差异对训练集广等方法
5. 增量包括加奇奇怪怪的GAN Loss、一致性、别人在论文里一句话带过的技术详细展开、设计可学习的beta参数设计一堆组件、加一个NAS进去、从别的模型拿一些预训练参数、搞一些非常复杂的课程学习、套上强化学习框架方法。
6. 测试方法包括测十个指标、做十个数据集的实验、故意让测试方法和别人的训练场景不对齐发明新的创新评价指标、找trivial但是别人没考虑的、用大模型比别人小模型、在不同的硬件上测速、在测试prompt里加、变相在测试集过拟合、测试数据集加真实场景、私有测试集、客观比不过比主观等方法。
7. 终极方法包括抄一个别人的方法、报高性能、直接开始写论文等方法。
阅读原文

第一批被大模型气死的人…

文章概要:

1. 据说现在很多人跳槽、转岗去做大模型精调工作,大模型在B端严肃场景中会出现幻觉,无法直接使用,需要进行精调。
2. 大模型精调的难点包括模型选择、数据清洗和标注、算力消耗、模型部署等,腾讯云TI平台可以解决这些问题。
3. 腾讯云TI平台提供了一站式人工智能开发服务,包括数据标注、模型训练、模型评估、模型部署等,可以帮助企业快速搞定大模型精调。
4. 腾讯云TI平台支持多种模型选择,包括鹅厂的混元大模型和行业大模型,以及主流开源模型。
5. 腾讯云TI平台提供了数据清洗pipeline脚本和大模型标注工具,数据标注过程中不需要反复拷贝,省时省力省空间。
6. 腾讯云TI平台支持低代码、灵活自定义两种精调模式自由选择,并预置了训练镜像,快速发起训练,简单易用。
7. 腾讯云TI平台提供了三层保障机制,减少任务中断,提升精调效率。
8. 腾讯云TI平台基于鹅厂自研的“Angel”加速能力,让训练和推理的速度更快,资源消耗更少。
9. 腾讯云TI平台提供了一套模型评估体系,从精调的不同阶段定义了「轻量体验、客观评测、主观评测」等“考试环节”,并且支持在精调训练的任一checkpoint进行抽查。
10. 腾讯云TI平台提供可视化应用编排,并可以纳管边缘集群,通过云端控制边缘服务发布,快速落地生产场景。
阅读原文

一文看完多模态:从视觉表征到多模态大模型

文章概要:

1. 本文介绍了多模态和多模态大模型的发展脉络,包括视觉表征、视觉与自然语言的对齐或融合等技术。
2. 文中以CNN和VIT为基础,分别介绍了视觉表征和预训练、多模态对齐与预训练的方法。
3. 文章还讨论了多模态大模型的发展趋势,如Flamingo、BLIP-、InstructBLIP、Qwen-VL、LLaVA1.5、VILA、Gemini 1.0和Gemini 1.5等模型。
4. 最后,文章对多模态大模型的未来发展进行了展望。
阅读原文

大模型天才杨植麟,被朱啸虎“咬”了一口

文章概要:

1. 月之暗面的创始人杨植麟和CTO张宇韬被循环智能时期的部分投资人在香港提起仲裁
2. 仲裁申请方为杨植麟和张宇韬上一家创业公司循环智能及其5家投资人
3. 此次仲裁可能缘起于杨植麟和张宇韬在未拿到循环智能投资人同意豁免书之前就已启动融资并创立月之暗面
4. 月之暗面不到两年估值达33亿美元,是循环智能的16倍多
5. 循环智能投资人认为当初拿到的股权过少需要补偿,开始频繁威胁和小动作
6. 月之暗面认为此次仲裁既缺乏法律依据,也不具备事实基础
7. 投资人选择在香港申请仲裁,是因为月之暗面采取的是VIE架构,境外主体有香港公司的存在
8. 仲裁有较大和解概率,并非所有循环智能的股东都提出仲裁申请,说明各方可能存在不同立场
9. 高科技公司创始人具备稀缺的技术优势,高管二次创业甚至离职跳槽,往往对股东利益造成严重冲击
阅读原文

大模型周报(10.28-11.03)

文章概要:

1 企业动态:Meta推出手指形传感器Digit 360,具有高分辨率触觉感知能力;Altera介绍智能体文明项目技术框架PIANO;Decart和Etched推出完全由AI的开放世界游戏Oasis;ChatGPT正式推出网络实时检索功能;阿里巴巴达摩院发布“八观气象大模型。
2. 技术风向:Wisdom等推出树形搜索增强的大模型智能体系统SELA;字节跳动等研究视频生成模型物理法则的能力;GoogleDeepMind等推出开放式的RLHF框架EVA;推出TableGPTofNebraska-Lincoln等推出多智能体系统MACopilot等对人像动画生成模型allo进行;Johannes Gutenberg University Mainz等推出恶意言论数据集Multi³Hate。 阅读原文

全世界最懂大模型的两个产品经理,一起聊怎么做AI产品

文章概要:

1. Kevin Weil和Mike Krieger都曾管理过Instagram,现在分别担任OpenAI和Anthropic的CPO,他们分享了在大模型公司做产品的经验和挑战。
2. 他们认为,在大模型公司做产品,需要同时考虑ToC、ToB和ToD,并且要适应企业市场的反馈周期。
3. 他们还讨论了如何在模型准确率不高的情况下开发产品,以及如何评估和迭代AI产品。
4. 他们认为,AI时代的产品经理需要具备写评估标准的核心技能,并且要学会用模型做原型设计和深入了解技术栈。
5. 他们还分享了如何在企业中推动变革管理,以及如何教育最终用户使用反直觉的产品。
6. 他们认为,未来的AI产品应该具备主动性和异步性,并且模型会以加速的速度变得越来越智能。
阅读原文

科学智能十大前沿观察发布!四个自研科学大模型集中推出

文章概要:

1. 11月11日,“科学智能十大前沿”和复旦联合上海科学智能研究院(上院)自研的四个科学大模型在科学智能创新论坛上重磅发布,其中Planet Intelligence @Climate(PI @ Climate)大语言模型为中国首个自研气候领域大语言模型。
2. 论坛汇聚全球顶尖科学家行业翘楚,围绕AI Science双螺旋引擎的构建展开深入讨论,探寻人工智能与生命科学、材料科学、化学、物理学、地球科学、海洋科学、社会科学等众多科学领域的前沿创新、落地场景与产业实践。
3. 论坛上,上智院与复旦大学、德勤管理咨询(上海)有限公司、上海海洋大学以及国家蛋白质科学研究(上海)设施签署了三项重要合作协议,并为第二届世界科学智能大赛获奖者颁奖。
4. 复旦大学校长助理、上智院理事长、上海创智学院副院长吴力波主持论坛。
5. 裘新、王华、屈炜、张宏韬、刘力致辞。
6. 上智院院长漆远在“科学智能前沿观察”中指出,科学智能(AI X Science)是一个新兴的跨学科研究领域,它致力于融合人工智能(AI)与领域科学,其研究方向和驱动力可以形象地表述为“双螺旋引擎“。
7. 复旦四大AI模型齐上线,取得多项重要突破,包括中国首个自研气候领域大语言模型PI @ Climate、女娲基因导航基础模型、女娲生命流体基础模型、女娲生物分子结构大模型。
8. 上智院与复旦大学、德勤管理咨询(上海)有限公司、上海海洋大学以及国家蛋白质科学研究(上海)设施签署三项重要合作协议,以进一步推动深化“1+1+N”科学智能生态建设。
9. 第二届科学智能大赛决赛在徐汇西岸举行,决出最终优胜者。
阅读原文

人工智能:再不用,就真来不及了!以ChatGPT为例,浅析如何正确的使用人工智能大语言模型?

文章概要:

1 应该以何种态度对待 ChatGPT:快速拥抱快速融入,能有多快就有多快有多就有多深入,想尽一切方法,将GPT融入到你生活的方方面面。<> 2 如何正确使用:给予ChatGPT正确的将其定位为女秘书或,避免把她负担不了的任务加在的肩上。
最重要的事情:请用英文与Chat,这样可以拉开与普通ChatGPT使用者的距离。
阅读原文