大模型-2024年11月19日最新技术资讯

AI大模型的局限与挑战

文章概要：

1. AI大模型面临记忆能力的限制，在长对话和多轮互动中表现明显，开发者和用户可以尝试控制对话长度、重复关键信息、工具辅助记忆等方法来提升模型表现。
2. 大语言模型的知识基于静态数据集训练，对实时信息的更新能力，技术社区提出了使用实时检索增强生成技术、定期微调模型等方案，还有一些工具可以帮助大模型在信息时效性上的不足。
3.大模型会产生幻觉，即生成与事实不符或完全编造，原因包括知识不完整或偏差、过度自信、生成策略问题等，可以采取明确上下文和约束条件、逐步推理、引导模型“大声思考”、多版本生成与筛选、结合外部资源等策略来减少幻觉现象的影响
4. 未来的大模型可能会引入设计，通过结合特定任务的小模型来增强专用能力，记忆的局限，可能通过RAG技术或联网功能让模型能够扩展知识，以应对需要即时响应的场景。

阅读原文

中国行业大模型市场，七项领先！

文章概要：

1. 近日，国际权威分析机构利发布《中国行业大模型市场报告，202，显示华为云在大模型取得政务、、金融个市场份额第一，并位居医疗、药物、以及汽车4个领导者象限领跑中国模型市场。
2.利总监李庆表示华为云盘古大模型深厚的技术、行业精准的把握以及丰富，多个行业占据绝对优势，千行百业的智能化和提供了源源不断的动力。
3. 沙利从行业大模型在关键应用市场、实力实际应用情况以及典型应用等多个维度，评估了中国10大模型厂商，类型覆盖互联网、云服务厂商。
4. 华为云发布盘古大.0，在系列、多模态强思维三个方面进行了全面升级，提供十亿级、百亿级、千亿级和万亿级不同参数规格的模型，包含NLP、CV、多模态以及预测大模型和科学计算大，满足企业的全场景需求。<>5. 盘古大模型持续深耕行业，在行业、0场景落地政务、金融、制造、医药研发、煤矿、、铁路、、工业设计、设计、气象等领域发挥着价值千行万业。

阅读原文

在「最难LLM评测榜单」上，阶跃万亿参数模型拿下中国第一

文章概要：

1. 阶跃星辰凭借万亿参数大语言模型Step-2，在业内权威大模型基准LiveBench AI上获得第五名，成为前十名内唯一国产大模型
2. LiveBench是当前生成式AI领域最、客观的模型能力评测榜单之一，旨在消除现有LLM基准的局限性
3. 此次杀入榜单前十的step-2-16k-22411模型的「Global Average」得分位列第五，Step-2的指令跟随（IF Average）得分全榜排名第一
4. Step-2自发布以来经历快速技术迭代，3月预览版，WAIC 202期间发布正式版，采用MoE架构，万亿参数，通过部分专家共享、异构化专家设计等创新MoE架构设计，让Step-2中的每个「专家模型」都得到充分训练
5. 阶跃星辰由微软前全球副总裁姜大昕创办，于去年4月成立，今年3月露头角，在短短几个月时间站稳国内AI创业公司第一梯队，并在一年内快速发布了包括万亿MoE语言大模型Step-2、多模态理解大模型Step-1.5V、图像生成模型Step-1X在内的Step系列模型 “全家

阅读原文

多模态大模型系列 | 20：低延迟、零遗忘：语音多模态新范式-Freeze-Omni

文章概要：

1. 简介：语音交互是人机沟通的未来，但现有多模态大语言模型在保持模型原始智能的同时实现低延迟对话一直是一大挑战。Freeze-Omni通过创新的三阶段训练策略，在不微调大语言的前提下，实现了高效、智能的端到端语音对话，多模态M研究开辟了新路径。
2. 方法：Freeze-Omni是一个语音对语音对话模型，其"智能"特性源于基于"冻结"的文本模态LLM构建。这种设计使其能够保持原有LLM骨干网络的性，避免了在整合语音模态过程中微调导致的遗忘问题。<>. 实验结果在中英文评估集上表现出色，top-k增加，错误率持续下降，文本模态LLM，平均约1.2秒。
4. 总结：ze-Om主要贡献，提出了一种冻结LLM语音交互的新方法，了计算资源消耗的多模态训练策略，证明了在保持LLM原有智能的同时扩展其语音交互能力。

阅读原文

大模型落地进行时，千行百业冲刺“跃迁时刻”

文章概要：

1. AI大模型在中国扎根发芽，百度文心模型调用量达15亿，用户突破43亿，千帆大模型协助客户优化3.3万个模型，开发77企业应用
2 百度智能云专家对话知名财经博主，探讨大模型落地经验，回答AI落地疑问，分享、制造、创新等行业实践案例. 汽车行业算力和云服务，百度智能云汽车业务部总经理高果荣介绍汽车云3.0
4. 制造领域产业升级需要拥抱AI技术，百度智能云智慧工业总经理李超希望人工智能技术帮助制造行业提升生产效率
5. AI for Science范式转型在医药、化学、教育等领域产生影响，百度智能云行业总经理认为AI是辅助，能提高科研效率>. 百度智能云联合多地持续打造AI新基建

阅读原文

七款国产AI大模型：Kimi，智谱清言，通义千问，文心一言，豆包，天工AI，讯飞，各自的优缺点是什么？

文章概要：

文章介绍了七款国产AI大，智谱清言文心一言、包、讯飞，并分析了它们的优缺点
2.imi在自然语言处理方面表现出色，尤其在情感分析和文本分类任务上，但在处理br的语言生成而闻名，但在处理专业领域或需要深入知识的问题时可能会显得力不从心。
4.义千问是一个专注问答系统的模型，能够在广泛的主题上提供准确的答案在推理和解释复杂概念时表现可能不如其他模型。
5. 文心一言是一个多功能的AI模型在文本生成、摘要和翻译等多个任务上都表现出色，但在处理特定领域需要更多的领域特定数据来进行微调br>6. 豆包模型是一个面向特定领域的AI模型，能够提供深入且准确的，但通用性相对较弱，不适合处理跨领域的问题。
7. 天是一个基于强化学习的AI模型，能够在特定任务上达到超越人类的表现，但训练成本较高。<>8. 讯飞星火是一个以语音识别和语音合成为主要功能的AI模型，在语音处理方面表现出色，但在文本生成和理解方面的能力相对

阅读原文

算力上天、多元大模型亮相……硬科技集聚！！世界互联网大会启幕新十年

文章概要：

1. 2024年世界互联网大会乌镇峰会“互联网之光”博览会开幕，无数关于未来生活、产业发展、人体探索、浩瀚宇宙的畅想落地生根，世界互联网大会乌镇的拉开帷幕。
2. 杭钢展区展示了超强算力全液冷GPU服务器，可应用于大规模训练、高性能计算、大型数据中心等各种大算力场景。
3. 之江实验室展区展示了一套“黑盒子，可以用太空计算硬件在天上组建一个计算系统。
4. 迅蚁科技展出的RA3物流无人机有效载重4公斤，巡航速度达到72km/h，最大航程可达18km。
5. 思看科技研发的彩色三维扫描仪可以于文玩古建、零部件、航空航天等领域。
6. 医疗AI是阿里巴巴达摩院研究布局中的重要板块，目前已在丽水市中心医院、景宁县人民医院两家医院开展科研试点。
7. 商汤科技高级AI产品经理王尚告诉记者，本次在乌镇互联网大会首次公布的“办公小浣熊 2.0”版本，是一次产品层面的全新升级。
8. 视觉智能是人工智能领域的重要分支，也是人工智能产业应用前景最广泛的方向。“中国视谷”是互联网之光博览会上的新面孔，本次展览聚焦人工智能主题，重点呈现了视谷“三层七端多元”产业体系的创新成果。

阅读原文

【睿嘉分享】大模型狂飙两年后，“六小龙”开始做减法

文章概要：

1. 大模型六小龙发展路径出现分野做加法到做减法，在技术侧，OpenAI o1的发布提供了新技术范式，国内的大模型企业可以模仿OpenAI，找到继续scale的路径，投入更多的精力和资源在强化学习上，而非只在预训练上盲目烧钱。在商业化上，“大模型六小龙”回到了各自更擅长的领域，打法上也更聚焦了。
2. 大模型六小龙的估值门槛已接近200亿元”高估值忧还有:下一笔融资在哪?
3. 大模型六小龙如今在经历的转型和调整，更深刻的变动还在人本身。

阅读原文

一文尽览！大模型微调方法汇总

文章概要：

1. 大模型微调方法汇总，包括量微调、基于适配器的微调、基于低秩适应（LoRA）的微调提示（ Tuning）的、基于动态预测加速的微调知识蒸馏方法
2 具身智能之心是首个面向具身智能领域的社区，目前近60，欢迎
3 具身智能之心知识星球是国内首个具身智能社区6人的社区。扫码加入星球享受第一时间掌握具身相关的进展、工业落地应用等专有服务

阅读原文

2024年国内外最新AI大模型汇总（含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型）

文章概要：

1. 文章介绍了AI搜索的崛起及其在知识工作中的重要性，了一篇探讨AI搜索的文章。
文章将搜索引擎分为带搜索功能的AI和带AI功能的搜索两类，并介绍了热门的AI大模型，包括文心、豆包工AI、智谱清言、星火、通义问、ChatGPT、Claude、Gemini等。
3. 文章指出，这些AI大在自然语言处理、语音识别、图像识别等表现出色，快速准确地完成各种任务。

阅读原文

【全环境立德树人】走进人工智能大模型时代——即墨区实验学校七年级学生探索大模型的奥秘

文章概要：

1. 介绍了科技的飞速发展，引出了人工智能大模型到来。br>2. 讲述了人工智能大模型的应用场景，包括智能问答作文、拍电影创造虚拟世界预测未来、预测和识别、可控核聚变、英语口语教学等
3. 详细介绍了模型肉体——超级计算机和“灵魂”——人工智能算法。
. 介绍了中国人工智能发展现状和前景。

阅读原文

关于大模型语料的迷思

文章概要：

1. 大模型语料的复杂性及其背后的思维过程
2. 认知偏差和错误内容：不完美语料的“陷阱”
3. 主观性与营销性：选择性宣传与诱导性表述
4. 价值观文化差异：冲突性观点的共存
5. 不可解决的“正确答案”7. 触及思维的边界
8. 总结

阅读原文

国家级AI基础设施——“法信法律基座大模型”正式发布

文章概要：

1. 最高人民法院举行新闻发布会，发布“法信法律基座大模型”研发成果，并回答记者提问
2. 人民法院出版社总编辑余茂玉介绍了“法信法律基座大模型”研发建设相关情况
3 介绍了研发建设“法信法律基座大模型”的主要背景
4. 阐述了研发建设“法律基座大模型”的重要意义
5. 通报了“法信法律基座大模型”研发进展情况

阅读原文

大模型驱动的具身智能：发展与挑战

文章概要：

1 大模型在人工智能领域掀起革命，改变人们工作和生活，而具身智能是当前人工智能领域的研究方向，模型驱动的具身智能提升机器人智能水平，推动人工智能技术迈向物理世界。
2. 具身智能是人工智能、学、认知科学的交叉领域研究如何使机器人具备类似人类的感知、、和行为能力
3. 大模型驱动的具身智能算法包括大模型驱动的环境感知、任务规划基础策略、奖励函数、数据生成。
.模型驱动的具身环境感知利用智能光电设备大模型感知技术为身决策提供。
5. 大模型驱动的具身任务规划大模型的先验知识具身智能任务的规划器。
6. 大模型的基础策略将大模型参数作为身基础策略，并利用具身数据对大模型参数进行微调。
7. 大驱动的具身奖励函数利用大模型的验知识进行奖励图或函数的。
8. 大模型驱动的具身数据生成利用世界模型和仿真环境进行自动化的生成和数据采集。
9. 大模型驱动的具身智能已具备研究和技术体系雏形，但仍面临挑战，包括大模型在特定具身场景中的适应问题、模型策略和人类偏好的问题具身策略的跨域泛化问题、大模型驱动多智能体问题、具身智能在环境中所面临的和大模型具身策略的决策实时性问题等。

阅读原文

百度：让大模型应用更落地

文章概要：

1. 202发布大数量位居第一，占比44%；中国大模型数量紧随其后，占比36%，大约478个。
2. 从ChatGPT问世到Sora爆红，不少大模型厂商都跟风开启了“军备竞赛”。面对人人向往的“超级应用”，如何认清自身定位、保持定力做好自己的事，对百度的战略都是巨大考验。
3. 为了解决文生图的幻觉，百度研发了iRAG（检索增强文生图技术）。其将百度搜索的亿级图片资源跟强大的基础模型能力相结合，可以生成各种超真实的图片，去除生成图像的“机器味”。
4. 文心一言发布后，百度接连推出文心百度智能云千帆大模型平台、文心智能体平台，在工程化方面下足功夫。百度在千帆平台上做了ModelBuilder，以最简方式帮用户精调大模型，使其更专业。
5.在内部会议上也说，智能体现在确实还不是行业共识，是百度的一个洞察或者是bet，百度赌智能体会变成内容、服务、信息的新载体。为此他愿意下注。
6. 更深层次上，智能体的出现与李彦宏多年来的战略路线有着微妙的契合。如今在智能体加持的智能时代，每个人都能“一人成军”，百度开启了新征程——通过开发更多应用，让每个人都能制作信息产品并推广，人们把信息向外输出的方式，也从“写博客发朋友圈”，变成了制造属于自己的智能体。
7. 相信AI的百度，在第一个十年，投入搜索引擎和算法；在第二个十年，又全面投入深度学习。二十余年对技术和技术落地的信仰——百度做大模型落地的底气大抵来源于此。

阅读原文

监事长单位 | 重磅首发！力维智联发布Crete动环智能运维大模型，赋能运营商数智化转型

文章概要：

1 1月18日，维联在深圳举办了Crete动环智能运维大模型的发布会。
2 力维智联董事长兼总裁徐明强调了Crete大模型在推动动环智能运维领域发展中的重要意义
3. 秦天总监、肖婷部长和范丛明会长分别了致辞，对Crete大模型的表示祝贺。br> 4 力维联晓详细介绍Cre大模型核心特点，提供的智能化，瞄准业务创新与运维效，从运维秘书、运维助理专家3个推出6个AI助手，全方位助力运维工作向数字化、自动化、智能化、无人化。
5. Crete大模型是基于力维智联自主研发的Sentosa大模型训练平台的领域大模型，融合了动环运维领域的专业知识与监测数据，具备专家级的洞察力和强大的故障预测、诊断能力。
6. 未来，力维智联将携手华为、宝德等深圳市人工智能产业协会会员企业深化产业、技术生态合作完善优化Crete动环智能运维大模型。

阅读原文

迈向通用人工智能的垂域大模型技术和应用

文章概要：

1. 迈向通用人工智能的垂域大模型技术和应用> 2.师范学院计科学院
3 241119日 130
.科学与技术学院出品
5. | 周丞
. 审核 | 张宇堃
. 微信扫一扫关注该公众号> 8. 继续看下一个
9. 太原学院计
10. 向上滑动看下一个选择身份

阅读原文

雅意大模型再升级！AI搜索能力增强，开放API调用申请

文章概要：

1. 雅意大模型全面升级“AI”能力优化了AI搜索解析问题提升AI搜索减少等待时间；搜索结果增加对于人、组织、的关键信息抽取展示，核心要点一目了然；增加风格化界面设计，可跟随特殊时间节点和事件自动换。
2. 新版本优化了AI搜索的初始化过程及推流方式更新了更快的搜索引擎接口，让雅意的和思考速度变得更快，大幅缩短用户的等待时长，提升用户体验。
3. 依托雅意大模型强大的UIE抽取能力，新版本将搜索结果中的关键信息（人/事件）单独抽取并以表格形式可视化呈现，让重点信息，能够更快速清晰地掌握核心知识。br> 4. 当搜索中包含图片时，新版本将获取图片并展示在“参考”模块，帮助用户多维度信息，更直观高效搜。
5. 新版本开启焕肤模式！冬天到，我们给AI搜索限定“新衣服，特殊时间、特殊事件时都会自动更换，欢迎来探索哦~
6. 新版本支持调用雅意模型服务用于开发者场景，只需前往YAYI-个人中心-获取，提交申请，先在个人信息里填写好邮箱哦~通过审核后，API调令及使用说明将通过邮件发送及时查收。

阅读原文

提问的艺术：如何让大模型的回答更精准？

文章概要：

1. 在当今大技术迅猛发展背景下，多的人在工作与生活中开始接触并应用大模型。
2. 要提高大模型的准确性，需要理解提示词工程的概念，即研究如何构建和调整提示词让大语言模型实现各种符合用户预期的的过程。br> 3. 提示词工程包括提示词技巧、增加示例、分配角色、限定输出风格/格式、拆解复杂任务等关键步骤
4. 在实际操作中，通常会将这些技巧综合运用，以与大沟通效率，并使大模型有效地的工作和生活。

阅读原文

郑州：最高500万元，支持制造业企业开放大模型应用场景

文章概要：

1. 近日，郑州市工业和信息化局发布通知，截至112日，在郑州市制造业产业链“链主”企业中，遴选1—2家数字化基础好、有实际需求、愿意先行先龙头企业开展应用试点。
2 围绕研发设计、生产制造和质量控制、经营管理、服务、设备维护和节能减排等环节，实施1个大模型应用场景项目。
3. 支持制造业企业开放大场景，采用经国家、河南省网信部门备案的通用大模型、行业大模型产品和服务，符合的大模型应用场景按一定比例给予最高500万元资金支持。

阅读原文

大模型可能导致规模越大边际效应递增

文章概要：

1. 近期，中国社会科学院教授、国务院原副秘书长江小涓在公开场合发表题为《数智时代的创新与发展，机遇挑战》的，创造性地阐述了AI大模型可能对经济学乃至整个社会的。
2. 江小涓以经济学中的理论概念“规模报酬”为例分析了大模型对经济影响
3. 江小涓，不仅是规模越大边际效应递增，超过阈值之后大模型可能涌现出一种的。5. 江小，数字问题、智能问题、大模型问题不能交给技术专家去决策和社会科学领域的专家一定要站到这个舞台的中央，确保科技进步有利于人类的福祉和公平。

阅读原文

2024中国5G+工业互联网大会丨百度创始人李彦宏：大模型赋能科技创新和产业创新，在自动驾驶领域应用广泛

文章概要：

1. 11月19日，百度创始人宏204中国5G+工业互联网大会上，发表了主题为《大模型促进科技创新和》的演讲。
2. 截至11，百度文心大模型的日均调用量达到15亿，相较5月披露的亿增长7.5倍相较一年前披露的5000次，更是增长30倍。

阅读原文

在矿井，看见大模型的最深层应用

文章概要：

1 标题：在矿井，看见大模型的最深层应用
2. 来源：脑极体
3. 发布时间：2024年1119日8:03

阅读原文

解锁AI大模型新潜力，破解落地难题｜爱分析活动

文章概要：

1. AI大模型在消费品、能源及央国企等展现出巨大的应用，但仍面临待解决的问题和挑战。
2 爱分析邀来自消费品零售、能源及央国企等的IT，共同参加11月29举办“价值下的大模型与实践”为主题的AI大模型
3. 报名方式为扫描下方二维码报名，对象为正在尝试落地大模型智能客服央金融、制造、消费品零售等行业的IT部门总、负责人业务负责人具有的企业用户
4. 活动形式为闭门审核制（限1人），事项包括本次研讨会为闭门审核，有限，请尽早报名，参会费用为（含茶）。
5 会议包括场景研判、实战分享、专题聚焦、高端对话私密环境
6. 活动包括开场致辞、主题演讲、案例分享、互动讨论、总结发言。

阅读原文

AI大模型赋能医药零售应用场景全解析

文章概要：

1. 随着集采、DRG/DIP、医药反腐等的，械企业目光医药零售为代表的全渠道院外市场。
2. 生成式人工智能C）为医药零售行业带来了更多可能性，安永发布了相关白皮书，深入剖析了零售药店市场发展趋势，并全面分析AIGC在这一领域多重应用。面对这些变化，医药零售企业正在探索转型方向，更加重视线上线下、销售品类多样化、降本增效、提供增值性服务注重合规经营等。<>5. AIGC有机会从两个维度医药零售提供助力，包括赋能消费者/患者在药店门店内体验、赋能连锁从总部到门店各部门运营。
6. 关于如何落地AIG，医药零售企业需要遵循分析与制定、技术评估与、准备与处理、开发与、培训变革管理、与合规性维护等步骤。
7. 尽管AIGC为医药零售行业带来了前所未有的机遇，其使用也伴随着安全、算法偏差、合法等风险。药企和连锁药店需要制定全面、细致的应对策略，使AIGC技术的应用。

阅读原文

【他山之石】Big Model weekly | 每周最新大模型论文分享！！！

文章概要：

1. 介绍了如何开发高效的偏DEs）替代模型，降低数据生成的成本
2. 提出一种新的方法，放松了常规结构化剪枝方法施加的约束消除了沿嵌入维度的结构依赖性
3. 提出了一个通用框架，在后训练阶段更好地与定制的人类价值观保持一致
4. 应用特征归因研究，识别出阻碍代理规划的两个关键因素：约束和问题的递减影响
5. 引入模型桥梁，以促进异质教师和学生之间的平滑特征知识转移
6. 提出了一种新颖的渐进对齐范式，名为领域感知扩散模型（DaDiff），通过渐进生成将夜间LR物体特征与白天对齐
7. 提出了密度感知的后训练重量），它包括两个阶段：以密度为中心的对齐和可调整

阅读原文

浪潮信息开源“源Yuan-EB模型”，助力构建大模型知识库应用

文章概要：

1. 浪潮信息开源“源Yuan-EB模型”，在Crieval任务中荣获第一名，助力用户加速大模型智能应用创新
2. 始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区，正在招募新志愿者计划
3. 介绍了Embedding模型的技术核心，将高维稀疏数据转化为低维稠密向量，从而有效地捕捉数据中的语义和特征关系
4. Yuan-embedding-1.0是专为增强中文文本检索能力而设计的嵌入模型，使用2阶段微调进行对比任务学习
5. 浪潮信息大模型开发平台“元脑企智”EPAI，现已支持Yuan-Embedding-1.0模型的选择
6. MTEB是衡量文本嵌入模型（Embedding模型）的评估指标的合集，是目前业内评测文本向量模型性能的重要参考
7. C-MTEB榜单是专门用来评估中文Embedding模型的多任务混合评测榜单，具体包含了Classification、Clustering、Pair Classification、Reranking、Retrieval、STS六种任务类型，共5个公开数据集
8. 始智AI wisemodel社区自2023年9月上线以来，逐渐成为影响力日益扩大的中立开放的AI开源社区，为了加快公司发展，长期需要技术、运营等人才加盟

阅读原文

SDC2024 议题回顾 | ExpAttack:大语言模型越狱风险持续追踪框架

文章概要：

1. 介绍了大语言模型的风险，包括训练数据污染、RAG污染、模型幻觉等，并阐述了大模型越狱风险管理的现状和难点，以及现有的解决方案及不足。
2. 提出了攻击者视角下的大模型越狱风险管理框架，包括资产发现、情报、风险评估和风险修复。
3. 介绍了ExpAttack大语言模型越狱风险持续追踪框架，包括经验采集、经验评估和经验利用。
4. 对未来大模型安全问题的解决提出了设想，包括情报获取、ExpAttack、安全对齐、能力模型优化。

阅读原文

雄狮科技&木卫四汽车大模型案例入选《2024年人工智能先锋案例集》

文章概要：

1. 1112日中国发展联盟《0年人工智能先锋案例集》正式，雄狮科技有限公司与木卫北京）科技联合申报项目《“Lion”——百亿参数汽车安全垂类大模型》成功入选行业先锋案例。br>. 雄狮科技联合卫搭建智能汽车大脑和生态智能平台，大语言模型的强大能力，为汽车提供对话系统，提高车辆的水平，满足用户在汽车安全、诊断维修等方面的。br>3. Lion Butterfly大模型项目在模式创新方面了一系列新产品和新模式，产业应用带来了新的发展。
4. 随着Lion Butterfly大的落地，汽车网络发生的转变，Lion Butterfly大了更丰富知识来源及逻辑能力服务于更广泛的汽车行业业务场景。
5. 今年科技对外发布了“AI大模型L Butterfly 1.0智能体生态群Larm 0.5”，引领奇瑞集团加速AI技术在汽车领域的应用，打造真正意义上的汽车。
6 在2024全球创新上，奇瑞汽车股份有限公司执行副总经理、雄狮科技董事长高新华宣布了奇瑞智能化重磅新成员——L AI智舱大模型首发。这标志奇瑞集团智能化“到“AI定义”的新飞跃。

阅读原文

第三期课程回顾丨大模型研讨课

文章概要：

1. 2024年11月14日晚，第三期的“大模型研讨课”在中国科学院计算技术研究所四层报告厅举行。
2. 由处理器芯片全国重点举办的“大模型研讨课”系列讲座，旨在通过十期系统课程，全面介绍大模型的前沿发展和技术原理。
3 黄迪为大家带来“大模型的预训练与后训练”的精彩讲解，介绍了预训练的基础知识、尺度定律、涌现现象以及后训练中的指令微调等核心话题。
4. 现场观众主要由计算所各个实验室组成，大家认真聆听黄迪博士讲解在轻松的氛围中收获了深刻的知识与启发。
阅读原文

FlashAttention 系列技术详解：加速大模型训练的利器

文章概要：

1. 本文深入介绍FlashAttention系列技术的核心原理、算法优化及其在大模型训练中的实际应用
2. FlashAttention通过减少内存开销和优化GPU并行计算，显著提升了Transformer模型的训练效率，特别是在长序列处理上展现出强大优势
3. FlashAttention将从输入到输出的整个过程进行融合，避免矩阵的存储开销，实现延迟缩减
4. FlashAttentionTiling的方式，实现分块计算
5. FlashAttention-2的目标的切分
6. FlashAttention-3的目标是在Hopper GPU上充分利用WGMMA和TMA的异步性加速attention
7. FlashAttention-3采用三项主要技术：生产-消费异步、硬件加速的低精度GEMM、FlashAttention调用方式

阅读原文

Industry Exploring | 大模型助力消费产业转型升级

文章概要：

1. 百联科创中心自2017年启动以来，致力于新零售生态圈的，推动创新项目着陆，塑造高水准的科创生态。
2. 10月31日联科创联合启迪之星（上海）和小即是大创新伙伴、CCF（上海）中国计算机学会主办的“大模型X新”互动沙龙杨浦区成功举办。
3. 来自百、东方购物、商汤科技、引擎、智谱AI等百余位产业专家、大模型创业者、爱好者、投资机构齐聚一堂，共同探讨大模型在零售及消费场景中的机遇与挑战。
4. 百联科创中心将继续深化“大模型+零售”的探索和实践。一方面，将不断加大技术研发力度提升模型在零售场景中的应用效果和效率；另一方面将积极拓展合作生态，与更多合作伙伴共同新零售领域的技术创新和应用落地，共同探索“大模型+零售”领域的无限可能，社会经济发展活力。

阅读原文

AI赋能教育时代：讯飞星火、通义千问、天工AI、豆包AI、GPT-4O、商汤AI、文心一言8个AI大模型应用（带链接）

文章概要：

1. 文章介绍了8个AI大模型，文心一言、讯飞星火、通义千问、天工AI、百川AI、豆包AI、-4和商汤，它们在教育领域有不同的应用。
2. 文心百度推出的大规模语言模型生成教育类文章和翻译，适用于国际教育场景。
3. 讯飞星火主要用于语音识别与合成，其语音识别技术在课堂录音、语音助手和口语练习方面表现突出。
4. 通义千问是阿里巴巴达摩院推出的综合型AI大模型，能够定制个性化的教学方案和学习路径。
5 天工AI在图像识别、自然语言处理和机器学习领域表现出色，可用于教育评估和智慧校园管理。
6. 百川AI主要在智能客服、知识图谱构建和教育资源推荐方面发挥作用，能满足学生的。
7. 豆包AI专注于情感计算机交互，在教育心理健康辅导和智能辅导员方面有优势。
8. GPT-4是OpenAI的新一代大规模语言模型，在教育领域的应用广泛，包括教学材料生成、互动教学助手和智能问答系统等。
9. 商汤在计算机视觉和深度学习方面优势显著，可用于智能监控、在线和虚拟实验室等领域。

阅读原文

国产大模型独角兽，困在光环里

文章概要：

1. 11月16日，月之暗面举办了一场临时组织的媒体沟通会，发布了一款，并与其他模型进行了测试分数对比。
2. Kimi在今年年初的热度冲到一个高峰，但很快其命运陡转，口碑逐渐下滑，质疑声扑面而至。
3. 月之暗面的B面：特长被复刻、出海失利、被前资方“逼宫”。
4. 国产大模型独角兽的“四重困”：困、技术之困、产品之困、财力之困。

阅读原文

百度李彦宏：大模型在自动驾驶领域应用广泛

文章概要：

1. 百度李彦宏表示，截至11，百度文心大日均调用量达到1，相较5月披露的2亿增长7.5倍，相较一年前首次披露的5000万次，更是增长约0倍
2 李彦宏，大模型量高增速快，表明越来越多的应用在使用文心大模型
3. 李彦宏表示，过去24个月，大模型最大的变化就是基本消除‘幻觉’，增强最初是百度特色，现在变成行业共识
4. 李彦，未来多模态的检索增强也会有快速的发展从而使得多模态大模型进入更加实用的阶段
5. 李彦宏了“哒”的最新进展，‘秒哒’发布3天，就有超过5000家排队申请测试
6 李彦宏举例，大模型自动驾驶领域也有非常好的应用，现在讲的端到端、纯视觉大模型、L4级无人自动驾驶，背后都是大模型技术
7. 李彦，百度的最新一代无人，是世界一款前装量产的L4
8. 李彦宏表示，人工智能是新一次的革命我们应该蒸汽机革命，革命信息革命的发展过程，借鉴过程当中一个国家、一个公司或者一个个人怎么从中尽可能多的获益，怎么能够避免有可能产生的负面作用

阅读原文

vivo蓝心大模型通过中国信通院AI研究所多项能力认证！

文章概要：

1. vivo蓝心大模型通过中国信通AI研究所多项认证
2. 蓝心大模型通过可信AI语音大模型评估。
3.通过中国信通可信AI手机智能体评估，获当前最高。

阅读原文

深耕大模型：苏州工业园区向“新”而行！

文章概要：

1. 苏州工业园区积极引导支持大模型企业从技术突破走向行业应用，截至目前，园区共有14家企业开展大模型研发，覆盖医疗、政务、文旅、教育等领域。
2. 园区企业依托大模型技术，服务苏州、辐射全国，成为催生新质生产力“排头兵”。
3. 大模型在驱动基础科研范式变革、提升要素配置效率、优化升级智能终端产品等领域作用显现，新业态、新模式、新产品加快涌现，初步探索出一条大模型驱动新质生产力发展的有效路径。
4. 垂域大模型在驱动基础科研范式变革领域的潜力已经彰显，但行业落地整体仍处于探索前期，还不能完全解决研发痛点，未来仍需围绕错误数据、缺失数据、模型幻觉等全面发力，持续迭代升级，有望在1—2年内实现大模型科研能力。
5. 大模型通过要素组合，能够提升企业的发展质量和效益，园区头部大模型企业深入梳理产业需求，将大模型融入生产经营过程，重点利用数据等新生产要素满足市场需求端个性化需求，实现经营模式、业务流程创新，以较低的投入实现较高的经济收益。
6. 园区引导企业应用大模型，赋能高端装备、交通等优势制造业转型升级，推动各类智能产品从“能用”走向“好用”，智慧工厂加速落地。

阅读原文

深耕大模型：苏州工业园区向“新”而行！

文章概要：

1. 苏州工业园区积极引导支持大模型企业从技术突破走向行业应用，大模型在驱动基础科研范式变革、提升要素配置效率、优化升级智能终端产品等领域作用显现，新业态、新模式、新产品加快涌现，初步探索出一条大模型驱动新质生产力发展的有效路径。
2. 园区企业依托大模型技术，苏州、辐射全国，成为催生新质生产力“排头兵”。
3. 垂域大模型在驱动基础科研彰显，但行业落地整体仍处于探索前期，还不能完全解决研发痛点，未来仍需围绕错误、缺失数据、模型幻觉等全面发力，持续迭代升级，有望在1—2年内实现大模型科研能力新跃升。
4. 大模型通过要素优化组合，能够提升企业的发展质量和效益。
5. 园区引导企业应用大模型，赋能高端装备、交通等优势制造业转型升级，推动各类智能产品从“能用”走向“好用”，智慧工厂加速落地。
6. 园区大模型赋能新质生产力，正在加速演进，未来仍有哪些短板需要补上？企业身处市场一线，最有发言权。

阅读原文

CSA GCR 2024 | 深度解析大模型原生安全的系统构建

文章概要：

1. 第八安全联盟大中华区大会以"云安全·AI迎接未来"为主题，云安全进入3.0时代AI与云计算的融合下安全挑战。
2. 百度安全技术包沉浮深入剖析了大模型安全体系的构建
3. 大模型内生安全的三大支柱：基础能力、语料安全和安全对齐。
. 大模型原生安全框架包含四大核心要素：内生安全纵深防御、红蓝对抗和持续运营。br> 百度安全建立了包含文本、图像、多混合等多个维度的，安全防护全面
. 百度安全构建了多维度的风险感知和处置机制，行为的识别和处置。br>7. 百度安全格外重视智能体应用场景安全问题，开发了一系列的防御。br>8. 大模型的核心关键在于如何将安全与大模型的有机结合。

阅读原文

前七个月，央国企采购大模型数量已超950个丨AIGC应用前沿

文章概要：

1. 2024年1-7月，央国企采购大模型项目数量已超过950个，且均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向
2. 政策推动是央国企纷纷落地大模型的决定性因素
3. 运营商、政务、能源抢先建设智算中心
4. AI大模型颠覆传统IT架构，央国企在政策引导、需求迫使环境因素等多方作用下已经开始先行落地AI大模型
5. 央国企撑起了国内大模型商业化的半壁江山，大模型落地进程行至中途，仍然有很多问题亟待解决
6. 随着AI应用走向深水区，数据安全、数据共享和数据溯源等问题则开始一一搬到台面上

阅读原文

大模型已基本解决幻觉问题？

文章概要：

1. 李彦宏公开表示大模型基本消除了幻觉，这对于大语言模型来说是一个巨大的。
2. 各企业也在全力攻克语言模型问题，尤其头部的一些大模型开发厂商。
3. 周鸿祎曾指出，幻觉问题是模型与生俱来的。
4. 产生幻觉的原因可大致分为三个方面：数据源、训练过程、推理。
5. 大语言模型产生幻觉的原因包括数据质量、算法、专业领域知识丰富度、是否拟合等。
6 有人认为大模型幻觉是宝贵的特性，如何破除幻觉和的壁垒将是大模型努力的方向。
. 大语言模型发展到今天，的不止“幻觉”这一个挑战，如未来随着数据量的巨增必须要压缩与优化；多模态模型与大语言模型的，将自然语言处理与计算机视觉、语音等多模态信息相结合，扩大应用场景。

阅读原文

20241119日报：【独家精品】2024年大模型落地应用发展现状及2025年大模型应用发展趋势预测

文章概要：

1. 介绍了上周末PEC AI创新者千人大会视频，主要探讨了202大模型落地应用发展现状205年大模型应用发展趋势预测> 2. Perplexity上了AI购物助手，支持一键结账、拍照购物、智能产品推荐
3. Momen是一款无代码全栈开发工具，用户可以通过Momen完成页面、业务逻辑和数据模型的可视化设计，通过高性能后端来实现复杂的数据交互与管理，并将项目一键部署上线
5. 介绍了一个将实时新闻自动转换为个性化播客的AI应用：ai-podcast-generator
6. 阿里的最新Qwen2.5，Qwen2.5 Turbo版来了：Qwen2.5-Turbo，将128K上下文扩展到了1M
7. Mistral开源了其超大多模态模型：Pixtral Large，124B参数，在多语言OCR、、理解等方面优秀
8. 清华姚班校友马腾宇了一款多模态嵌入模型：voyage-multimodal-3
9. 清华大学等开源了用于增强LLM工作流编排能力的框架：WorkflowLLM，比GPT-4传统LLM更擅长复杂流程设计，能处理更多步骤的任务

阅读原文

盘点七大国产AI大模型：谁更胜一筹？

文章概要：

1 文章介绍了七款国产AI大，包括Kimi、智谱清言、通义千问、文心一言豆包、天工AI和讯飞探讨了它们在不同领域的应用、技术特点各自的优缺点。
2 文章认为，这些模型各有优缺点，用户可以根据自己的需求进行选择。
3. 文章还提到，BME是中国工业减污碳品牌，以“天下无霾低碳地球为使命，通过颠覆性AI创新技术、精益化减污降碳系统和智能一体工程，稳定提升用户经济和价值。

阅读原文

1967：智谱AI：揭秘AI大模型如何重塑企业竞争力与个人效率

文章概要：

1. 文章总结了AI学习圈同学们对智公司的线下访学活动>2. 文章从企业管理者、解决方案架构师和产品运营负责人三个视角，探讨了AI大模型如何提升企业竞争力个人效率
3 文章分享了AI在、企业培训医疗行业的成功应用案例
. 文章介绍了智谱清言产品运营负责人霍婕老师分享用户可以如何使用智谱清言
5. 文章介绍了智谱AI如何通过大模型技术，重塑企业的和效率

阅读原文

突发！腾讯杰出科学家、混元大模型技术负责人离职

文章概要：

1. 腾讯杰出科学家、混元大模型技术负责人之一威已从腾讯离职
2. 刘威2012美国哥伦比亚大学科学与电子工程博士学位，曾任IBM沃森研究中心研究科学家
3 他的研究领域包括计算机视觉、机器学习、数据挖掘、信息检索等，发表了10多篇论文，总引用次数超过600次
4. 201年，刘威加盟腾讯AI Lab，担任AI Lab计算机视觉总监、广告多媒体AI中心总监，负责图像视频数据相关的AI研究
5. 今年9月份，腾讯发布了新一代的大腾讯混元Turbo，基于MoE（Mixture of Experts）架构设计，相较于前一代产品混元Pro，在推理效率上实现了翻倍，达到了100%的提升，同时在推理成本上实现了显著降低降幅达到50
6. 微信目前搜索场景灰度测试AI生成答案，该能力整合使用了腾讯内部技术资源，包括混元大模型，是进一步优化用户搜索体验，提升用户搜索效率

阅读原文

独家｜腾讯杰出科学家、混元大模型技术负责人之一刘威离职

文章概要：

1. 腾讯杰出科学家、腾讯混元大模型技术负责人之一刘威离职。
. 刘威曾以混元大模型技术之一的身份出席活动并发表演讲。
3. 刘威于2012年获得美国哥伦比亚大学计算机科学与电子工程博士学位，曾任IBM沃森研究中心研究科学家。
4. 刘威从事计算机视觉、机器学习、数据挖掘、信息检索等的研究和产品开发。
. 刘威曾先后获得多个奖项，并多次担任国际权威期刊的客座编委与审稿人。
6. 201年3月，刘威加盟腾讯AI Lab，担任AI Lab计算机视觉中心总监、广告多媒体AI中心总监。
. 2022年11月，刘威入选2023 IEEE Fellow。
8. 腾讯混元大模型名称的由来，“混元”在古代汉语中意味着到有序、从混乱到规律的过程。
9. 去年9月，腾讯混元大模型上线，之后腾讯又发布了混元模型MoE，目前已经涵盖了轻量版到中版，并且轻量版在腾讯云上完全免费。
10. 今年月，腾讯混元文生图大模型发布，并宣布开源；了9月，腾讯宣布推出新一代大模型“混元Turbo”。
11. 腾讯混元积累了大量自研技术，包括创新的专家路由Routing算法、独创的MoE Scaling Law机制以及合成数据技术。
1. 目前混元大模型已接入腾讯内部700司内业务应用及，有很多是轻量模型。
13. 在推理方面，刘威认为AI的推理能力必须从被动推理变为主动推理。
14. 在刘威看来，大模型越来越大是希望它做越来越多的任务。

阅读原文

中国杀出全球首个烹饪大模型

文章概要：

1. 老板全球首个烹饪大模型“食神”，该模型具有个性化、一体化和跨设备协同的特点，能够为用户提供个性化的烹饪解决方案，还能调动所有设备，协助用户把菜做出来。
2. 老板电器高级副总裁周海昕表示，烹饪创造，来满足用户个性化需求才是他们打造大模型背后更本质的原因，自动化只是智慧烹饪中一个场景，来满足部分用户需求。
3. 老板电器深耕烹饪行业45年，积累了海量数据和知识图谱，这是他们大厂和企业无可比拟的优势。
4. 老板电器将继续为烹饪曲线注入更多的变量，让烹饪变成一件可控的事情，当烹饪门槛越来越低，你甚至只需要提供一个想法，剩下的全有大模型和厨电设备来完成。
5. 老板电器的品牌升级为“享受创造”，他们以科技+人文的发展路线，重新定义烹饪。

阅读原文

百度智能云千帆大模型平台引领企业创新增长

文章概要：

1. 百度智能云千帆大模型平台企业创新增长，本文整理自百度世界大会 2024——「智能跃迁产业加速」论坛的同名演讲。br>2. 大模型广泛渗透到，场景越来越丰富。
3. 24 年 9 月份，百度智能云千帆大模型平台 3.0 发布，包括模型开发层、模型服务层、应用开发层，提供了最专业的应用开发工具、最丰富的大模型、最全面的工具链。
4. 在企业大模型落地的过程中，要解决的问题，最常见的如何选择模型、构建 AI 原生应用、如何优化模型使用效果。<>5. 百度云千帆大模型平台提供丰富的模型选择，有不同尺寸的大模型、精专垂类模型、以及传统多模态能力等。br. 模型应用效果优化，分为 3 个手段，最常见提示词优化，包含 Prompt 和 Few-shot 两种方式。
7. 千帆 ModelBuilder 提供的就是全流程的、模型训练和模型精调的工具链，包含数据管理、训练模式、开发工具、评估优化、推理部署、大模型周边系统。
8. 基于平台越来越多的场景实践，沉淀了一系列的模型精调间，进一步降低模型调优门槛。
9. 客户在使用面临一个问题：模型刚上线符合预期，过了一段时间模型应用效果下降。
10. 大模型应用效果优化第三招：模型能力增强，即给模型增加外部能力，检索增强能力和工具能力。
. 千帆 AppBuilder 除了提供企业级 RAG 能力，还有企业级 Agent、企业级部署、企业级集成，共 4 大企业级能力。>12. 为了进一步降低应用开发门槛，带来第三个发布：大模型应用样板间。
1. 除了智能体作为应用载体之外，还有非常多的企业级传统应用，过去是通过写代码的方式开发，今天通过大模型也实现了零代码分钟级开发，它就是 AI 速搭平台。

阅读原文

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

文章概要：

1. 大模型参数量越来越大，但也越来越奇怪，研究者发现有部分特别重要的特征（超），它们对模型表现非常重要。
2. 圣母大学和苹果的研究团队改进了round-to-nearest quantization（RNQ）技术，提出了一种对算力特别友好的方法，与SmoothQuant效果相当，在处理模型的时，可以用这种技术处理更大的数据块，让模型在变小的同时，还能保持很好的效果。
3. 研究团队通过检测层间降维投影输入和输出分布中的峰值来定位超权重，这种方法只需要输入一个提示词，非常简单方便，一组验证数据或具体示例。
4. 研究团队发现超级权重有两种主要影响：引发超激活；抑制了停用词（stopword）的生成。
5. 研究团队通过将超级权重按0.0到3.0的缩放因子放大，结果表明，适度放大幅值可以提升模型准确率。
6. 研究者提出了一种简单的方法来改进INT4的大块量化，首先，识别权重；其次，为了改善离群值拟合，对离群值权重进行剪切（CLIP），在这一步超权重也会被剪切，对剪切后的权重进行量化（Q）和去量化（Q-1）；然后，为了确保保留超权重的效果，在去量化后恢复半精度超权重（RESTORE）。
7. 研究者在LLaMA 7B-30B、Mistral 7B和OLMo上进行了实验，结果表明，与更复杂的方法相比，经过大幅简化的量化方法可以获得具有竞争力的结果。

阅读原文

发力了，Mistral对标ChatGPT全面升级le Chat，还祭出超大杯多模态模型

文章概要：

1. Mistral AI发布新模型Pixtral Large，这是一个基于Mistral Large 2构建、124开放权重的多模态模型，具备顶尖的图像理解能力。
2. Mistral AI还进一步升级了免费聊天机器人le Chat，增加图像生成、网络搜索和交互式画布功能，全面对标ChatGPT。
3. Pixtral Large可根据Mistral研究许可证（MRL）用于研究和教育用途，同时根据Mistral商业许可证用于商业目的的实验、测试和生产。
4. Pixtral Large包括一个1230亿参数解码器和一个10亿参数视觉编码器，使其在文本和视觉数据处理方面均表现出色。
5. Pixtral Large在多种基准上展现出了最先进的性能，适合图表解释、文档分析和图像理解等任务。
6. le Chat现在可以处理大型、复杂的PDF文档和图像，比如一篇理论文献的所有内容——图形、表格、图表、文本、公式、方程式。
7. Chat拥有了高质量的图像生成能力。

阅读原文

人工智能大模型教育场景应用优秀案例

文章概要：

1. 山东工艺美术学院积极开展人工智能赋能设计教育教学改革，探索“人工智能+设计教育”的新模式、新技术、新方法，全面推进设计学科在教育内容和育人方式两个层面的数字化转型。
2. 学校以产教融合、学科交叉为切入点，系统谋划，率先启动教学改革，包括顶层规划、整体布局，开展“五个一”工程等。
3. 学校重构课程体系，创新教学模式，包括课程体系改革、课程内容与方法改革等。
4. 学校汇聚多方力量，提升人才培养能力，包括师资培养、教材建设、职普融通、产教融合等。
5. 学校搭建服务平台，打造实践教学新生态，包括人工智能设计服务平台建设、超写实数字资产库构建、特色模型训练、实践教学新模式探索等。

阅读原文

华宇万象法律大模型来了！助力法院创新建设“伴随式人工智能数字助手”

文章概要：

1 华宇万象法律大模型是以通用大模型基座在法律领域的行业知识积累积淀，行业应用场景进行精调训练、知识增强打磨而成的法律专用大模型。目前在数字法院、智慧检察、智慧公安、智慧司法、智慧政法、智慧政府、企业法务等行业领域均应用。<> 2. 法官数字助理聚焦知识资源检索、阅卷案情分析、文书编写辅助、审判质效监督四大核心场景需求，专项设计研发了“查”“析””、“”四类知识服务能力，并通过法官在办案件背景解析，提供嵌入式知识服务，使得人机交互了详细情境、便于准确理解语义并把握意图。
3 法官数字助理运用华宇万象法律大模型的最新能力，并将其与法官场景深度融合。为了匹配法院场景专业知识壁垒高、权威性严谨性强数据安全和自主可控的要求，采用了“司法领域大专业知识资源库”双核支撑的方案，并引入了“基于专家反馈的学习”和“敏感信息过滤”机制，以确保提供的能力和知识可以持续优化，并做到专业可信。
4 法官数字助理支持伴随的方式供法官随时，并通过智能的人机自然语言交互方式完成查、析、写、督四大能力支持下的各类具体任务。< 5. 华宇万象法律大模型已在上海市第二中级人民法院了相关应用，联合上海二中院客户共同打造的伴随式“小至数字助手”为业内率先基于法律大模型打造的场景应用，本院“一轴九库”数据一体化为支撑，依托生成式人工智能进一步创新交互，为提升法院干警工作质效助力

阅读原文

大模型狂飙两年后，“六小龙”开始做减法

文章概要：

1. OpenAI创始人Altman认为现在是创办科技公司的最理想时机，国内大模型明星公司们将目光放在了成长速度和商业化速度上。
2. 以“大模型六小龙”为代表的AI明星公司们发展路径已有了明显的分野，在技术侧，OpenAI o1的发布提供了新技术范式，国内的大模型企业可以模仿OpenAI，找到继续scale的路径，投入更多的精力和资源在强化学习上。
3. 在商业化上，“大模型六小龙”回到了各自更擅长的领域，打法上也更聚焦了。
4. 在技术上紧跟头部大厂风向、缩小差距，在商业化则更聚焦自身优势，先占领用户心智，从做加法到做减法的过程，也是大模型洗牌期的体现。
5. 现阶段头部大模型的估值门槛已接近200亿元上下，摆在“六小龙”高估值下的隐忧还有下一笔融资在哪？
6. 在C端，目前依旧尚未出现“超级应用”，与同样瞄准端的大厂相比，月之暗面和MiniMax的优势在于反应灵活与快速迭代，他们更敏锐地根据前沿市场变化，快速变化打法。
7. 对场景和商业化相对确定性的B端而言，“六小龙”的共识是尽量不陷入传统to B的定制化“老大难”困境。
8. 无论是to B，还是to C，从曾经大卷模型参数到如今赶考商业化，祛魅明星光环后，在钱景面前，“大模型六小龙”更激烈竞争也开始了。
9. “大模型六小龙”如今在经历的转型和调整，更深刻的变动还在人本身。
10. 在“六小龙”里，分野已经出现。智谱AI是典型的继续变大，一边“模型和应用”两条腿走路，一边则对外投资，扶持产业链生态。而月之暗面则是“小而美”的代表。

阅读原文

AI大模型遇“云”化龙：智能交通迈向“知行合一”新境界

文章概要：

1. 车管业务面临海量咨询问题，佳都科技研发出基于交通AI大模型的电子书智能系统，提高了业务咨询的回复效率及准确率。
2. AI大模型对智能交通重塑才刚刚开始，车管业务可在全国范围推广和复制，大模型知识库通过微调能扩展至多业务问答、执法规范监管等场景。
3. 智能交通全面跃迁的底层逻辑已发生重大变化，AI大模型有望成为驱动变革的决定性力量。
4. 佳都科技华为云深度合作，克服重重困难，共同推动智能交通迈上更高台阶。
5. 佳都科技打造出涵盖自然语言多模态、视觉、时空决策等丰富形态的知行交通大模型，在地铁智能客服与智能运维、环控、交通应急管理、执法监督规范、交通信号控制等应用场景都取得了突破性进展。
6. 智能交通正驶入高速发展的快车道，AI将向业务层面加速渗透，知识与行动、产品与场景的交融势不可挡。
7. 佳都科技与华为云共同树立起“知行合一”的新标杆，其合作模式的未来走向值得期待。

阅读原文

【NLP】一文全面说透，AI大模型！

文章概要：

1. 介绍了多巴胺穿搭的概念和特点。
2. 多巴胺穿搭的色彩搭配特点，如使用明亮、鲜艳的颜色等。
3. 多巴胺穿搭搭配特点，如选择宽松、舒适的款式等。br>. 多巴胺穿搭的搭配特点，使用夸张、有趣的配饰等。 6. 多巴胺穿搭的注意事项，如避免颜色过于花哨、注意配饰的搭配等。

阅读原文

从技术前沿到行业落地：《2024年中国大模型评测市场研究报告》出炉！

文章概要：

1. 大模型技术发展迅猛，成为推动各行业数字化转型重要引擎
2. 弗若斯特沙利文联合头豹研究院发布2024年中国大模型评测市场研究报告》，对中国大模型市场进行深入分析
3. 报告指出中国大模型市场发展势头强劲，预计2024年市场规模将达到165亿元，同比增长达57%2028年市场规模有望达到64亿元人民币
4. 大模型金融、政务、电信、教育、工业、汽车、气象、医疗、药物等行业的应用
6. 中国高度重视大模型的发展，一系列政策，大模型技术的发展，并将其转化为实际生产力，助力国家数字化战略的推进
7. 随着大模型技术的不断迭代升级，其在各行业应用将更加深入和广泛。企业应拥抱这一变革，大模型在自身业务中的应用，以提升竞争力
8. 行业应加强合作，共同推动大模型技术的规范化、安全化发展，确保其在各领域的健康应用

阅读原文

专家论道：多模态大模型如何引领AI产业未来？

文章概要：

1. 基础大模型与垂类大模型融合互补将是未来发展趋势。
2. 多模态大模型和智能体人工智能发展主流。
3. 推动通用大模型向具身智能转化是重要发展方向。
4. 大模型场景创新将开创一批智能产业新机会。
5. 人工智能发展还将迎来更强技术范式。<>6. 发挥好人工智能在新质生产力中的引领性驱动性作用。
7. 寻找更稳定的技术形态，打通数字智能与物理智能的壁垒。
8. 充分发挥国家高新区和新型创新组织在人工智能发展中的作用。

阅读原文

大模型经典著作《大语言模型基础与前沿》

文章概要：

1. 介绍了《大语言模型基础与》这本书，作者是美国明尼苏大学双城分校电子与计算机工程博士涛。
2. 本书内容涵盖大语言模型的广泛主题，从基础到前沿，方法到应用适合高年级本科生和研究生博士后研究人员、讲师以及行业从业者阅读与参考br> 3.多位QS前50大佬做了最新的大模型实战系列课，原价699元，现在0元领取。
4.了QS前50名大佬的部分现成会大模型，让大佬直接带。
5. 沃恩智慧研发的沃研Turbo大模型限时免费使用福利。

阅读原文

“多模态大模型”论坛详情公布｜早鸟倒计时2天 | CIPS-LMG2024

文章概要：

1. 中国中文信息2024学术年会暨第三届全国大模型智能生成大会将于202年1月8日-2月于浙江嘉兴召开，前沿技术论坛2024年11月0日召开
2. 大会的15个论坛覆盖了大模型理论、深度推理、大模型安全、多模态大模型、科学智能、具身、智能体、社会智能等时下最受关注的技术议题
3. 本文主要介绍了“多模态大模型”分论坛日程安排，包括会议组织、分论坛主席等信息

阅读原文

“多模态大模型”论坛详情公布｜倒计时12天 | CIPS-LMG2024

文章概要：

1. 中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会（CIPS-LMG 22）2024年128-12月日于浙江嘉兴召开。
2 前沿技术论坛2024年月30日，大会的15个论坛覆盖了大模型基础理论、深度推理、大模型安全、多模态大模型、科学智能、具身智能、智能体、社会智能等时下最受关注的技术议题。
3 文章公布了“多模态大模型论坛日程和会议信息。

阅读原文

国内12家主流大模型，谁是地表最强？亲测后发现是它！。。。

文章概要：

1. 文章介绍了12大模型百度的文心一言、阿里巴巴的义千问、腾讯混元，并介绍了它们的特点和应用场景。
2. 文章提到了评价一个大模型能力的最重要的指标包括文本生成能力、推理能力和通用和泛化能力。
3. 文章通过三轮数学测试比较了不同大模型的智力水平，智谱GLM-4表现最佳。
4. 文章提供了AI教程免费学习访问入口，并介绍了普通人了解AI应该做两件事和大忌。
5. 文章提供了一个详细的开源教程《普通人学AI指南》PDF，一共42，在公众号回复AI获取。

阅读原文

国内12家主流大模型，谁是地表最强？亲测后发现是它！。。。

文章概要：

1 文章介绍了国产大模型崛起速度之快，列举了12家国产大模型，包括百度、阿里巴巴、腾讯、华为、科大讯飞、商汤科技、智谱AI、字节跳动、360公司、昆仑万维、快手、月之暗面科技。
2. 衡量一个大模型的能力有三个最重要的指标，分别是文本生成能力、任务推理能力和通用泛化能力，而数学推理能力又是重中之重。
3. 文章通过三轮数学测试，对智谱GLM-4、文心一言、义千、KIM四个大模型进行测试，最终得出GLM-是目前国产大模型中数学推理能力最强的。
4. 文章提供了AI教程免费学习访问入口，并强调了普通人了解AI应该从AI工具使用开始，先了解AI基础名词，不应该就学AI理论，也不应该排斥AI。

阅读原文

大模型，可以这样学？

文章概要：

1. 大模型是指拥有10亿个参数的深度神经网络，能够处理海量数据、完成各种复杂任务。
2. 推荐10个原创公众号，包括机器学习实战、深度学习基础与进阶、数据STUDIO、深度学习初学者、机器学习算法与Python实战、机器学习算法那些事aggle竞赛宝典、Pythonic生物人、图学习与大模型M。

阅读原文

弗吉尼亚理工大学：大模型时代人工智能如何服务科学研究

文章概要：

1. 弗吉尼亚理工大学和加拿大Mila研究所的学者团队撰写了一份以“科学时代的大语言模型中的人工智能”为主题的报告，全面分析了大语言模型（LLMs在科学领域的应用、技术挑战和未来机遇。
2. 报告指出，LLMs的强大性能不仅局限于文本处理，还可以扩展到科学数据分析和复杂推理任务。
3. 报告详细调查了超过260种科学领域的大语言模型（LL），并从领域和模式两个维度对其进行分类，为研究人员提供了一幅全面的现状图景。
4. 报告通过医学、物理化学以及地质与环境科学的案例，充分展示了大语言模型在不同领域的广泛适用性和变革潜力。
5. 报告指出，LLMs科学研究中仍面临一系列挑战和局限性，尤其是在科学推理、多模态学习和高风险场景中的可信度与安全性等方面。
6.提出了三大未来发展方向：复杂推理与规划、多模态整合学习和信任构建。

阅读原文

全球超万亿使用量的热门数据库，首次被大模型揪出了严重漏洞

文章概要：

1. 谷歌研究人员声称利用大语言模型发现SQLite中可被利用的堆栈缓冲区下溢漏洞，该漏洞在10月已被修复，未影响用户。
2. 漏洞挖掘AI agent“Big Sleep”是谷歌Project Zero和DeepMind合作成果，在DEFCON安全会议上受启发尝试找更严重漏洞。
3. SQLite是开源数据库引擎，漏洞可能导致程序崩溃甚至执行任意代码，原因是特殊值-1被意外用作数组索引。
4. “Big Sleep”在真实世界环境中首次实验，使用带有已知漏洞小型程序评估其查找能力，最终发现漏洞。
5. 谷歌表示模糊测试在防御者找到难以通过其发现的漏洞方面做得不够，希望AI能缩小差距。
6. Protect AI公司宣布免费开源工具VulnHunter，在Claude AI模型帮助下发现Python代码库中零日漏洞。

阅读原文

独家｜腾讯杰出科学家、混元大模型技术负责人之一刘威离职

文章概要：

1. AI前线独家获悉，腾讯杰出科学家、腾讯混元大模型负责人之一刘威，目前已经从腾讯离职
2. 刘威于2012年获得美国哥伦比亚大学计算机科学与电子工程博士学位，曾任IBM沃森研究中心研究科学家
0年3月，刘威从NSF IIS，腾讯AI Lab，担任AI Lab计算机视觉中心总监、广告多媒体AI中心总监
4. 2022年11月，刘威入选2023 IEEE Fellow，入选理由是对大规模机器学习和智能多媒体的贡献
5. 刘威曾对外介绍，腾讯混元大名称的由来，表示“混元”在古代汉语中意味着从无序到有序、从混乱到规律的过程，这也正是生成模型的使命
6. 去年9月，腾讯混元大模型发布了大MoE，量版到版，轻量版在腾讯云上完全免费 8. 目前混元大模型已接入腾讯内部700多个司内业务应用及场景，有很多是轻量模型，如微信输入法、微信“搜一搜”、腾讯、腾讯会议、企业微信等
9. 在推理方面，刘威认为，如果一个AI无法推理，人类可以写一个很长的Prompt告诉它如何推理，但几年后ChatBot可能就不再有用了
1. 在刘威看来，大模型大的原因是人们希望无论是多模态、单模态、听说读写还是具身智能做多的任务。由于整个方法论范式的改变，从单任务变成了多任务、从模态，多网络变成了一个便是的革新1. 生成式AI的变革至少包含三个维度，即方法论的变革、运算的变革和算力的变革

阅读原文

【金猿人物展】车凌科技总工程师李晟博士——车域大模型：开拓行业新生态

文章概要：

1. 2024年，大数据以前所未有的向大模型行业聚焦，大模型行业展现出广阔的发展前景和的增长潜力
2. 随着科技的飞速发展，汽车产业正站在数字化转型的风口浪尖车辆的规模将持续扩大
3. 大数据融合大模型在汽车产业中的应用分为三个主要的领域：产品开发与技术、客户服务与体验、车辆和保养
4. 目前大数据技术不断演进，包括数据采集、清洗、存储、分析、等各个，然而，挑战和困难依然存在
5. 2025年，大模型进入一个新的发展阶段，未来，汽车企业必须瞄准不同时期的落地目标，制定分阶段的大模型布局规划

阅读原文

多模态大模型数据构造方法

文章概要：

1. 本文以LLaVA和MiniGPT-4为例介绍多模态大模型数据构造的方式，数据质量是决定多模态模型性能的关键因素。
2. 高质量的数据能够减少噪声干扰，提高模型的学习和预测准确性。同时多模态数据的多样性直接影响模型的泛化能力。
3. 本文以LLaVA和MiniGPT-4为例，介绍相关多模态数据的构造过程，给大家在训练或者微调自己的多模态模型提供思路。

阅读原文

"大脑"驱动具身智能发展附2024年具身大模型关键技术与应用综合报告合集含商业计划书

文章概要：

1. 具身智能热潮是大模型技术与机器人技术的结合产物。
2. 大模型赋能的起步阶段，一些工作是把人工智能领域的新成果直接用在机器人上，但不够深入。
3. 近期大模型驱动的具身也逐渐深化，从初步应用转向深度融合，机器人运动控制集成。
4 如果具智能领域的挑战都得到了有效解决，其应用是巨大的
5. 具身智能技术已在多个领域展现显著效益。<> 6.存在技术成本、环境及伦理方面的挑战，具身智能技术在实际场景中的应用效果积极的，展现广泛的前景仍需持续改进与优化以适应变化的市场需求

阅读原文

大模型，智能家居的春秋战国之交

文章概要：

1. 智能家居长期呈现技术人工智障、市场四分五裂的局面，原因是此前的智能化水平低，门槛低，各个生态平台谁也不服谁。
2. 大模型时代的到来，将终结这种情况，推动智能家居行业进入变革时期。<>3. 目前，智能家居领域呈现出战国时期群雄逐鹿的局面，有家电派、科技派、全屋派三大派系的巨头集结在大模型周围。
4. 大模型作为智能家居的变革起点，推动行业进入春秋战国之交，实力较弱的诸侯国，在激烈竞争中相互兼并或被强国拿下，最终形成少数强国并立的局面。
5. 智能家居的体验之变，必然会推动市场格局之变，大模型的到来，将智能家居的准入门槛大幅拉高，实力不足的厂商会被消费者第一时间就从决策中筛选出去。
6. 智能家居领域，谁能实现统一并垄断市场呢？目前看，还没有哪个智能家居巨头，展现压倒性优势。
7. 大模型的智能家居产品化，注定是一个更为漫长的过程，目前尚未有哪家公司占据明显的市场优势，鹿死谁手也有较大不确定性。

阅读原文

沙丘智库《2024中国银行业大模型应用场景评估报告》正式发布

文章概要：

1. 沙丘智库发布《2中国银行业大模型应用场景报告》。<> 2. 报告探讨了20个最价值、最具可行性的大模型应用场景。
3. 报告从业务价值和可行性两个维度进行了大模型应用场景的评估。

阅读原文

大模型技术介绍

文章概要：

1. 人工智能技术在全球范围内取得了显著成果，模型是其背后的。
2 大模型的定义是参数规模较大的预训练模型，特点包括参数数量庞大、训练数据量大、计算资源高、模型泛化能力强
3. 大模型的原理是基于，训练过程包括数据收集与预处理、预训练、指令微调、高效微调。
. 大模型在自然语言处理、计算机视觉、语音识别领域取得了显著成果，具有广泛的应用前景。
5. 大模型面临的挑战包括数据隐私泄露、计算资源需求高机遇包括降低成本、推动技术创新。

阅读原文

大模型褪去野蛮生长后，百度的新思考

文章概要：

1. 大模型技术的进步是否放缓了？李彦宏认为，这取决于看问题的视角。从应用角度来看，技术进步的速度不仅没有放慢，甚至有变快趋势。
2. 大模型从“走出实验室”到“放上货柜”，中间还有海量工程问题要解决。其中一个关键问题，正是“幻觉”，即大模型有时会一本正经的胡说八道。
3. 百度的技术信仰有着务实的一面。AGI并非不重要，而是百度在长期探索人工智能边界的同时，并没有死磕AGI，更强调用新技术来解决各种现实问题。
4. 百度在利用技术解决现实问题的同时，并没有执着于闭门造车，而是倾向于和外界开发者一同探索。
5. 百度在发力AI时，一直都是“两条腿走路”：既探索科学技术的边界，对其充满敬畏；同时也善于利用工程能力，并积极尝试使用新技术改变世界。

阅读原文

AI大模型的局限与挑战

文章概要：

中国行业大模型市场，七项领先！

文章概要：

在「最难LLM评测榜单」上，阶跃万亿参数模型拿下中国第一

文章概要：

多模态大模型系列 | 20：低延迟、零遗忘：语音多模态新范式-Freeze-Omni

文章概要：

大模型落地进行时，千行百业冲刺“跃迁时刻”

文章概要：

最新！LeCun发起的LLM评测榜单中，这个大模型拿下中国第一

文章概要：

七款国产AI大模型：Kimi，智谱清言，通义千问，文心一言，豆包，天工AI，讯飞，各自的优缺点是什么？

文章概要：

算力上天、多元大模型亮相……硬科技集聚！！世界互联网大会启幕新十年

文章概要：

【睿嘉分享】大模型狂飙两年后，“六小龙”开始做减法

文章概要：

一文尽览！大模型微调方法汇总

文章概要：

2024年国内外最新AI大模型汇总（含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型）

文章概要：

【全环境立德树人】走进人工智能大模型时代——即墨区实验学校七年级学生探索大模型的奥秘

文章概要：

关于大模型语料的迷思

文章概要：

国家级AI基础设施——“法信法律基座大模型”正式发布

文章概要：

大模型驱动的具身智能：发展与挑战

文章概要：

百度：让大模型应用更落地

文章概要：

监事长单位 | 重磅首发！力维智联发布Crete动环智能运维大模型，赋能运营商数智化转型

文章概要：

迈向通用人工智能的垂域大模型技术和应用

文章概要：

雅意大模型再升级！AI搜索能力增强，开放API调用申请

文章概要：

提问的艺术：如何让大模型的回答更精准？

文章概要：

郑州：最高500万元，支持制造业企业开放大模型应用场景

文章概要：

大模型可能导致规模越大边际效应递增

文章概要：

2024中国5G+工业互联网大会丨百度创始人李彦宏：大模型赋能科技创新和产业创新，在自动驾驶领域应用广泛

文章概要：

在矿井，看见大模型的最深层应用

文章概要：

解锁AI大模型新潜力，破解落地难题｜爱分析活动

文章概要：

AI大模型赋能医药零售应用场景全解析

文章概要：

【他山之石】Big Model weekly | 每周最新大模型论文分享！！！

文章概要：

浪潮信息开源“源Yuan-EB模型”，助力构建大模型知识库应用

文章概要：

SDC2024 议题回顾 | ExpAttack:大语言模型越狱风险持续追踪框架

文章概要：

雄狮科技&木卫四汽车大模型案例入选《2024年人工智能先锋案例集》

文章概要：

第三期课程回顾丨大模型研讨课

文章概要：

FlashAttention 系列技术详解：加速大模型训练的利器

文章概要：

Industry Exploring | 大模型助力消费产业转型升级

文章概要：

AI赋能教育时代：讯飞星火、通义千问、天工AI、豆包AI、GPT-4O、商汤AI、文心一言8个AI大模型应用（带链接）

文章概要：

国产大模型独角兽，困在光环里

文章概要：

百度李彦宏：大模型在自动驾驶领域应用广泛

文章概要：

vivo蓝心大模型通过中国信通院AI研究所多项能力认证！

文章概要：

深耕大模型：苏州工业园区向“新”而行！

文章概要：

深耕大模型：苏州工业园区向“新”而行！

文章概要：

CSA GCR 2024 | 深度解析大模型原生安全的系统构建

文章概要：

"大脑"驱动具身智能发展附2024年具身大模型关键技术与应用综合报告合集含商业计划书