今日AI-大模型-2024年10月9日

发现全网最新的AI内容

何江、梁正、韩希佳 | AI产业化与产业AI化:AI大模型产业生态的行动实践、变革趋势与前沿议题

文章概要:

1. 本文提出AI大模型产业生态理念,从AI产业化与产业AI化两个维度并结合多个视角深入探究AI大模型产业生态体系。
2. 文章将AI大模型产业生态结构划分为AI产业化和产业AI化两个部分,AI产业化强调将AI大模型技术转化为产品和服务,产业AI化强调将AI大模型整合嵌入各产业环节并赋能传统产业。
3. 文章梳理了AI产业化的行动实践概况,包括数据、算力、算法及生态配套等方面。
4. 文章梳理了产业AI化的行动实践概况,包括场景功能应用和垂直领域应用等方面。
5. 文章分析了AI大模型产业生态的变革趋势,包括AI产业化、产业AI化和两者协同的趋势。
6. 文章总结了AI大模型产业生态的主要研究结论,并提出了前沿议题展望。
阅读原文

视觉语言大模型综述

文章概要:

1. 引言:介绍视觉语言大模型(VLM)的概念和基本原理,以及其在人工智能领域的重要性。
2. 视觉语言大模型的应用:探讨VLM在图像描述、物体检测、视觉问答、图像检索和零样本分类等方面的应用。
3. 视觉语言大模型的发展历史:回顾VLM的发展历程,从早期的简单结合到深度融合的过程。
4. VLM架构:介绍LM的架构,包括Two-Tower VLM、Two-Leg VLM和Unified VLM等。
5. 视觉语言大模型的训练:讨论VLM的训练过程,包括预训练、微调、调优、使用LoRAs和多分辨率等技术。
6. 训练数据集:介绍VLM训练中使用的数据集,包括大规模通用数据集和领域特定数据集。
7. 评估基准:探讨评估VLM性能的基准,包括VQA、MMMU、MME、Math-Vista等。
8. 训练你自己的VLM前需要考虑的事:总结在训练VLM之前需要的因素,包括任务需求、数据集大小、损失函数、基准选择等。
9. 结语:强调VLM在多模态技术中的重要性,以及其对未来AI世界的影响。
阅读原文

中小企业数改方案超市 | 浪潮云洲“知业大模型”赋能铝业高质量发展

文章概要:

1. 国家级中小企业数字化转型促进中心为中小企业提供全流程一体化数字化转型服务,开设《中小企业数改看样学样》《中小企业技改方案超市》两大栏目,集中展示典型案例与代表方案产品。
2. 浪潮云洲开发了工业领域行业大模型——“知业大模型”数据分析、工业知识推理、工业代码生成等优势,数字赋能铝业向“新”向“绿”发展,成功助力某世界500强铝业龙头企业实现数字化生产和精细化运营。
3. 知业大模型打造了智铝数据能力中心,实现全域海量、多源、异构的数据快速资产化,数据提取由天级降为级,在收集和汇聚电解槽生产历史的基础上,通过提供高效、易用的数据服务,实现以数据驱动的精细化运营。
4. 浪潮云洲“知业大模型”有针对性地开发出多类细分场景大模型,不仅可以赋能生产各个环节,抓住生产制造核心环节的数字化转型,还建设成高水平行业数据集,切实优化了整个行业,促进行转型升级。
5. 浪潮云洲还进行铝电解工业模型开发,通过梳理铝行业机理知识、专家经验、操作规程、行业标准、政策法规等数据,知识文本集、问答集,形成了基于工业大模型的铝行业知识库。
6. 浪潮云洲乘势而上,探索采用工业数字孪生等前沿技术应用,基于“知业大模型”为行业构建出一个与实体铝产业相类比“数字产业工厂”,把数字化转型升级做实、做深、优。
7.知业大模型”在铝业的成功实践,出典型示范效果,有利于大模型在工业领域的推广应用。未来,浪潮云洲将更加深入发挥大模型功能,协助生产企业创新优质应用场景,赋能千行百业,推动工业数字化转型升级走深向实。
阅读原文

速通!腾讯发布《2024大模型十大趋势》

文章概要:

1 腾讯发布《2024大模型十大趋势报告,广泛关注
2. 大模型发展方向:拓展模型规模和打造垂直模型
3. 大模型十大趋势预测:算力底座、推理分析、创意生成、情绪智能、智能制造、游戏环境、移动革新、具身智能、开源共享、人机对齐
4. 报告内容来源:洞见研报
阅读原文

免费!6 款国产 AI 大模型,助你轻松应对职场挑战!

文章概要:

1. AI大模型正以前所未有的方式重塑职场,为职场人士提供强大的智能化赋能。
2. 介绍了6款国产明星AI大豆包大模型、文心大模型星火、通义千问、天工智能助手和智谱探讨了在职场中的各种应用和独特优势。
阅读原文

大模型落地需要解决的几个问题

文章概要:

1. 大模型技术发展迅速,落地需解决一系列问题,不同的实际场景里,软硬件的结构怎么融合模型和底下的硬件体系,实现多元化的能力是业内关注的一个重点。
2. 9月27日,由数字开物协办的“2024产学研融通创新活动——AI大模型应用场景”在北京召开,会上,中国信通院人工智能研究所基础软硬件部主任李论发表题为《大模型主题演讲,她分享了大模型的演进,深入探讨了大模型应用落地趋势与 3. 大模型已经成为新型智能化基础设施,具备规模可扩展性强多任务适应性强、能力可塑性强等关键特征。大模型技术的范式变迁,特别是以Transformer为基础的大模型的突破,为行业提供了通用赋能技术。算法演进是模型发展的关键,强化模型理解和多模态发展是演进的重点。她提到,尽管大模型技术占据主导地位,但专用小模型的并行发展和大模型的小型化重要。
4. 大模型的落地需要模型本身智能化水平提升和高效的训练推算系统支持。模型智能水平提升可以通过构建更大规模的模型系统来实现,同时,针对特定行业场景,通过微调和算法改造,提升模型与场景的契合 模型演进的关键在于强化模型理解增强和多模态发展。开源模型和商业模型将并行发展,如何协同应用是未来关注点。同时,大模型的可控性,特别是代码层级、智能层级、开发迭代的可控性、内容层面的可控性、智能水平的可控性,都需要重点关注。
6. 突破多模态瓶颈,增加视频、音频等多模态的通用模型是未来重点行业模型的高价值、大规模应用落地场景是一个新的原点。开源在驱动产业智能水平基准线提升方面发挥着关键作用。
7. 模型应用落地需要将其作为系统性问题来考虑,计算能力受大模型性能影响,两者相互制约,HPC和AI的融合,特别是万卡、千卡规模布局是难点也是机会。
8. 李论认为,构建大模型应用底座需要软硬件高效协同的新型,实现基础设施平台化。底座构建需要解决Scale up和Scale out问题,以及硬件和软件的协同适配问题。大规模扩展的网络架构,面向大语言模型的定制化、国产化、规模化的架构体系也在不断出现模型水平发展仍然遵循定律,计算在一定情况下决定了大模型规模天花板。底层是软硬高效协同的核心驱动通用的大算法,上层是以模型中心的大生态。中国信通院也在做一系列研究性工作,试图解决大模型工程化落地过程中与底座融合一体,实现工程化应用的方向。
阅读原文

AI大模型+100典型场景正式发布

文章概要:

1 2024年被视为AI模型应用的关键之年,模型技术持续突破和快速迭代应用进入重要阶段,并在通用领域成果> 2 目前处于从通用应用向专业领域拓展的关键时期,场景拓展成为大模型应用核心方向,企业全业务流程蕴含大量高价值的AI融合机会> 3. 各行各业AI技术需求强劲,工业制造、农业、能源、政务、气象、金融、法律和企业服务等领域为模型应用提供丰富场景
4. AI大模型的应用场景定制化解决方案成为当前AI产业最受关注的核心议题,目前已有超过100个AI大模型应用的典型落地场景> 5. 在2024数字开物的204全国科普日外活动区域,数字开物”发布《AI大模型100典型场景》,为生成式的发展提供实践参考借鉴,展现AI大模型在各领域的应用潜力,期待为智能化升级和数字化转型提供启示
阅读原文

百问百答︱ 什么是大模型?

文章概要:

1. 大模型是指具有庞大的参数规模和复杂程度的模型>2. 大设计和训练旨在提供更、更准确模型性能以应对更复杂、更庞大的数据集或>3. 大模型能够学习更细微的模式和规律,更强的泛化能力和表达能力
4.自然语言、图像识别和语音识别领域,大模型表现出高度准确和广泛的化能力
阅读原文

大模型在问答领域的探索和实践

文章概要:

1. 大模型应用持续火热,应用门槛越来越低,作者利用少部分精力做了一些AI探索和实践,并完成了业务所在垂直领域答疑机器人产品的上线。
2. 作者介绍了传统答疑机器人的痛点,包括不能快速准确找到用户想寻找的答案等。
3. 作者阐述了自己的目标,希望答疑机器人可以准确理解提问人员自然语言提问的语义给出标准答案,可以比较快速给出答案,不希望答非所问,提供不属于业务范围内的回答,如果提问的问题确实没有答案,希望拒绝回答并引导到人工。
4. 作者结合业内经验和自身诉求,进行了五个迭代,包括向量搜索、RAG、SFT、多种技术结合使用、工程优化等。
5. 作者认为,随着技术发展,大模型的能力一定会越来越强,相关的调用成本一定会越来越低,对模型定制的确定性也会越来越好。
阅读原文

大模型能给大数据开发领域带来什么?

文章概要:

1. 大模型在大数据平台的应用场景
大模型赋能数据开发链路,包括使用自然语言检索数据资产、辅助开发调试和测试、辅助异常诊断。
2. 大模型在大数据开发场景落地情况
大模型在大数据开发和应用场景中的实践,往往以智能助手的形式出现,以提高效率、简化操作并增强用户体验。
阅读原文

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模和强大泛化能力

文章概要:

1. ByteDance Research 的第二代机器人大模型GR-2登场,具备卓越的泛化和多任务通用性。
2 GR2训练预训练和微调两个过程,预训练过程中GR-2在互联网的海洋中遨游,在0互联网视频片段上生成式训练。
. 微调的艺术:视频生成能力拔高动作准确率,GR-2的视频生成能力,让它在动作预测方面有着天然的优势。
4. Scaling Law:机器人+大模型诀,随着模型规模增加,GR-2的呈现出显著的提升。
5. 多任务学习与泛化:未知场景的挑战者,GR-2能够完成105项不同的任务,成功率高达97%。<>6. GR-2还能够与大语言模型相结合,完成复杂的长任务,并与人类进行互动。br>7.Dance Research还想强调,GR-2能够鲁棒地处理环境中的干扰,并通过适应变化的环境成功完成任务。br>8. 工业应用中的突破:端到端的丝滑物体拣选,GR-2相比前一代的一个重大突破在于能够到端地完成两个货箱之间的物体拣选。
9. 无论是透明物体、物体、柔软物体还是其他具有挑战性的物体,GR-均能准确抓取。
阅读原文

鲸智代码大模型:细分领域软件开发全场景、端到端提质增效

文章概要:

1. 2024栖大会,浩鲸科技推出鲸智代码大模型,专注领域软件开发全场景、端到端提质增效
2. 浩鲸科技是全球领先的数字化技术和服务的提供商,帮助全球客户实现向数字经济的跨越
3. 鲸智代码大模型是基于基础模型,通过私域数据二次训练而来的一组大模型,包含了细分领域的产品业务知识和知识
鲸智代码大模型全家桶”包含CodingPlus代码助手,Dever研发智能,灵犀平台三款产品,支持业务开发的提质增效
5. 代码助手CodingPlus是浩鲸科技自研的代码助手类产品,通过公司累积的领域知识,产品文档以及产品代码的二次训练相较基模,更像是这个领域的业务专家和代码高手
6. 研发智能Dever具备新需求的开发能力,人和AI软件工程师一起结对模式,定义基于AI智能体的软件开发SOP,每一个环节仍然由环节的结果输出负责
7. 灵犀低代码平台在低代码可视化拖拽开发的基础上,增加了新的开发模式:自然式开发,输入用户需求,低代码会自动可视化的界面
8. 后续鲸智大模型还将继续专注在细分领域的软件开发提质增效尤其是研发中的V4.0版本,将更多的注意力放到增量需求和故障定位这两个大场景
阅读原文

【专家观点】大模型时代的十个思考

文章概要:

1. 整个人类发展的历史就是一个技术发展的历史,没有技术就没有GDP的增长。
2. 过去几年大家一定是一步一步被新的人工智能的体验所震撼,即使我做了一辈子的人工智能,几年前也很难想象今天这样的情况。
3. 我想讲三个例子:第一个是从文生成文,第二个是从文生成图,第三个是从文生成视频 。
4. 今天讲算力、大模型这件事情,最重要的就是(数据)扩展(Scaling Laws),算力越多,智能越增长,现在大家都还没有摸到天花板。
5. 第二个思考,关于数据的数据。算力、算法和数据,是人工智能重要的三个因素。
6. 第三个思考,大模型的下一章。过去人们首先干的是语言模型。以ChatGPT为代表,它的底层技术是自然语言处理。今天大家正在干的是多模态模型,以GPT-4o为代表,里面很多技术是计算机视觉。再向前走,就是要做具身智能。
7. 第四个思考,人工智能的范式转移。两个礼拜前,OpenAI发布了最新一个模型就是GPT-o1。<>8. 第五个思考,大模型横扫千行百业。所有的公司都要面对大模型带来的机会,但是不需要每个公司都做通用的大模型,如果你连1万张卡没有,是没有做通用大模型的机会的,要做通用大模型,至少要有万卡。
9. 第六个思考,大模型最大的超级应用是什么,最大的机会在哪里?很多人现在不断地尝试,想找到一个超级应用。实际上超级应用一开始就在那里,就是一个超级Agent。
10. 第七个闭源。过去几十年世界科技的,特别是中国科技的发展,有两件事情是非常重要的。第一是出现了互联网,有了互联网之后,你就可以在网上找到所有的论文、资料。第二是开源,开源就使得你做应用的时候,跟领先者的差距急剧缩短。
11. 第八个思考,要重视AI治理。因为AI发展太迅猛了,全世界对AI安全都非常重视。
12. 第九个思考,重新思考人机关系。我刚才介绍了文生文、文生图、文生视频——有多少是机器的智能,有多少是因为人机交互给我们带来的震撼?
13. 第十个思考,智能的本质。今天虽然大模型已经给大家带来很多的震惊,我们对大模型、深度学习的理解暂时是没有理论的。
阅读原文

【媒体聚焦】频频上新!国产视频生成大模型迎多方布局

文章概要:

1 近段时间,多个国产视频生成上线,大众。
2. 字节跳动旗下火山引擎多镜头等功能
3. 通义万相发布视频模型,针对运动生成和物理模拟等难点优化算法。
4. 快手、生数科技、智谱AI等科技企业自主研发的视频生成产品加速上线。
5. 赛智研究院副院长邓道正表示,视频生成大模型的发展将对传媒娱乐、广告营销等行业产生深远影响。
6. 生数科技联合创始人兼CEO唐家渝表示,视频生成大模型领域竞争激烈,存在可控性不足的问题。<>7. 邓道正认为,我国视频生成大模型在技术上取得了显著进步,但生成的视频与连贯性仍有待提升。
8. 不少企业加快视频大升级。
9. 火山引擎总裁谭待表示,视频生成有很多难关亟待突破,豆包会持续演进。 阅读原文

浅析AI大模型现状及其应用

文章概要:

1. AI大模型已经成为全球科技竞争的焦点,展现出巨大的发展潜力和广阔的应用前景。
2. AI大模型具有泛化性、通用性以及涌现性等特征。
3. AI大模型能够提升要素及数据要素地位。
4. 大模型收费模式可以总结为API、订阅、广告、定制化四种。
5. 全球大模型竞争中,OpenAI、Anthropic、谷歌三大厂商为第一梯队。
6. 我国始终高度重视人工智能发展机遇和设计,发布多项人工智能支持政策。
7. 从Chatbot到AI Agent ,个人助理重塑手机应用生态。
8. AI大模型有望提升AR/VR交互能力,加速其进入主流市场。
9. 具身智能(Embodied AI)属于人工智能领域的分支,典型应用为自动驾驶和机器人。
10. AI大模型是云计算业务的“锚”,云厂商以大模型为重要底座,推动云计算业务向MaaS 转型。
11. AI大模型赋能搜索等互联网传统业务。
阅读原文

AI创新|四足机器人又出新品种、文案/代码编辑器Canvas、国内首个万卡万参大模型……

文章概要:

1. OpenAI发布Canvas,一个与ChatGPT合作写作和编程的新界面。这个全新的界面,是由OpenAI的GPT-4o来构建,需要在模型选择栏中单独pick出来使用——“GPT-4o with canvas”。在Canvas模式之下,就不仅仅是简单对话的过程了,而是允许用户可以对生成的内容进行二次创作和编排,就像文案、代码编辑器一样。
2. 中国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万集群训练的万亿参数大模型(万卡万参),正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型TeleChat2-115B。
3. 潞晨Video Ocean文生视频应用正式上线,在本次产品迭代中,对人脸渲染进行了深度优化,同时扩展了镜头语言的多样性,提升了画面的纹理和质感,风格上也更加多元化,用户打造了一个更加立体和多彩的视觉体验,使得视频创作变得简单便捷
4. 斯坦福大学的研究团队最近发布了一款名为Helpful DoggyBot的四足机器人,通过整合先进的计算机视觉技术和自然语言处理,机器人能够理解人类的指令,并在的环境中寻找和抓取物体。
5. 近期一篇发表在《nature communications》的论文全面地从数据、测评、模型多个角度考虑了多语言医学大语言模型的构建,做出了三项贡献:创建了一个包含25.5Billion tokens的多语言医疗语料库MMedC;开发了一个全新的多语言医疗问答评测标准MMedBench,覆盖了6种语言,21种医学子课题;推出了一款名为MMed-Llama 3的全新基座模型,以8B的尺寸在多项基准测试中超越了现有的开源模型适合通过医学指令微调,适配到各种医学场景。
阅读原文

大模型是否具有自己风格?这个风格来自于哪里?

文章概要:

1. 文章研究大模型生成任务中,上下文信息与模型本身的知识冲突时,模型的处理方式。
2. 作者基于认知理论,将模型分类为直觉型、依赖型、理性/非理性型。
3. 本文工作的主要思想是基于以上的分类,设计了一个完整的benchmark框架,数据集,评价pipeline,评价指标。
4. 数据集的设计是在MRC和CR数据集上构造冲突答案和冲突上下文,以实现两种冲突构造。
5. 评估pipeline包括知识、事实鲁棒性评估、few-shot评估、决策风格分析、角色扮演干涉。
6. 实验分析包括知识评估、事实鲁棒性评估、few-shot评估、模型风格划分,以及角色扮演。
7. 个人评价认为文章主题想法新颖,但得出的结论没有得到想要的,还是遵循着模型越大,综合能力越好,以及上下文学习和微调是强相关的。
阅读原文

天池-蚂蚁AFAC大模型挑战赛-冠军方案分享(文末有代码)

文章概要:

1. 介绍了AFAC大模型挑战赛的冠军方案,包括赛题背景、数据案例解析、评价指标、赛题理解、算法实现等内容。
2. 详细阐述了如何利用意图识别和few-shot技术来设计高质量的Prompt,包括产品名召回-Text Match、意图识别-KNN、例子召回-RAG等。
3. 分享了训练技巧,包括模型选型、Lora微调等。
4. 介绍了推理技巧,包括温度设置、多数投票等。
阅读原文

“谛听”降世!全球首个亿级参数量地震波大模型发布

文章概要:

1. “谛听”降世,全球首个亿级参数量地震波大模型发布。
2. 文章回顾了往期精彩内容,包括NASA激光通信试验成功、AI后遗症泛滥、特种光纤问世和平替锂电池的全球首款1850钾离子电池问世。
3. 欢迎扫码关注头条号和官方网站。
阅读原文

大模型一体机,外行看热闹内行看门道

文章概要:

1. 大模型一体机是当下非常火爆的产品,浪潮信息的一体机将硬件与面向大模型开发和落地的EPAI软件平台做了深度整合,可一站式解决数据处理、模型微调、RAG搭建、模型部署、应用上线和系统运维等环节开发难题。
2. 浪潮信息的一体机主要面向三类用户:制造、金融等行业客户,传统ISV以及SI集成商。
3. 微调是在多元多模的前提下,由于客户的行业属性不同,对算力的偏好不同,在每个具体场景下,最适合的模型也不同。
4. 元脑企智EPAI一体机提出了高效微调,就是集成了一些和当前算力相匹配的微调技术,确保微调能够跑起来。
5. 一体机中预置了上亿条基础知识数据以及自动化数据处理工具,支持10种以上企业常见的数据格式,并且以超过95%的抽取准确率,把这些数据转化为知识库以及可供模型进行微调的数据。
6. 微调之后,RAG是用户提高生成内容准确性和依据性的重要技术。
7. 本次发布了基础版、标准版、高级版、创新版和集群版五个版本。
阅读原文

北京银行如何构建全栈大模型应用体系?

文章概要:

1. 北京银行近年来一直致力于探索人工智能在商业银行的应用,打造人工智能驱动的商业银行(AIB)。
2. 自2020年起,北京银行开始构建人工智能中台应用——京智大脑,重点发展以知识驱动的大模型应用体系,通过大模型与小模型的双轮驱动,提高运营效率,精准拓客营销,支持产品创新,优化客户服务,加强风险管理,积极赋能业务发展。
3. 北京银行构建了一个覆盖前中后台的大模型应用体系,这个体系以私有化、通用化、行业化、专业化和普惠化为引领。
4. 北京银行的人工智能平台从下到上分为五个主要层次:算力层、数据层、框架层、模型层和应用层。
5. 北京银行的人工智能应用平台具有七大技术特点:建设全栈国产化的算力基座和训练框架、构建可信的金融训练集、构建金融领域的混合专家模型、建设大模型服务平台、建设Agent智能体应用能力、自研搜索引擎、建设数据安全标注环境。
6. 北京银行基于大模型的具体应用有:“京信妙笔”智能报告工具、智能会议助手工具、智能校对工具。
阅读原文

主要AI大模型产品性能分析

文章概要:

1. 文章对主要AI大模型产品性能进行了分析
2内包含大量图片
阅读原文

从数据虚拟化到大模型创新:Denodo创始人25年技术探索与行业洞察解密!

文章概要:

1. 数据编织技术受到关注,它能消除数据孤岛,为企业决策提供实时、准确的数据支持,加速业务创新与响应生成式AI和RAG技术也逐渐融入数据管理领域。
2. DataFun创始人王大川采访了Denodo的三位嘉宾,探讨了数据编织的实际应用、面临的挑战、业务价值和未来趋势,以及如何结合生成式AI和RAG技术,助力企业实现数字化转型与智能化升级。
叶苏斯博士分享了Denodo的初衷与前景,以及数据编织在中国市场的发展。他认为,数据虚拟化技术具有独特价值,能打通数据孤岛提升数据转化为价值的速度,推动数据民主化。
4. 叶苏斯博士还分享了Denodo如何运用AI技术来优化产品,以及如何为AI做什么。他认为,人工智能技术大大提升了使用通用数据的效率,Denodo的能力是能够集成来自于不同数据源的数据。
5. 叶苏斯博士分享了Denodo服务客户的经验,以及中国客户的特点。他认为,中国客户的设计会非常的长期,在做一件事的时候,是为长期准备。
6. 叶苏斯结合自己的经历,给大模型时代的创业者一些经验。他认为,需要真正地解决一些问题,解决这些问题的方法,比现有的技术要好。
7. 何巍先生分享了Denodo的产品和哪些行业匹配度更高,以及企业降本增效对Denodo在国内拓展市场的影响。他认为,客户有需求,就永远是机会。
8. 郭杰老师分享了Denodo自身的特色和优势,以及自研和采买现成产品的优劣。他认为,Denodo的数据虚拟化技术,更多的应用在数据编织、数据网格,这种整体的企业级数据架构、数据管理策略中。
阅读原文

国产力量|南威白泽行业大模型,赋能各行各业数字化转型升级

文章概要:

1. 南威白泽行业大模型是城市数字化建设的强大助手,依托行业数据进行深度二次预训练,结合真实对话数据,通过lora微调与精细的有监督训练而成,应用于多个垂直细分领域
. 南威软件推出了智能应用孵化平台白泽启元以及北昇政务训推一体机等一系列大模型应用产品
3. 白泽行业大模型在企业服务、政务服务、司法服务等领域取得显著成效,如在深圳市宝安区亲清政企平台落地“白泽政策智服”,为企业提供一条龙服务;赋能福建省打造“新生儿出生一件事”和“企业开办一件事”集成化办理的建设;山东、辽宁、广西等多地市的“代表委员系统”提供全面、精准的信息>4. 南威软件将坚定不移地深耕人工智能领域,致力于持续创新与技术优化,以更多元、更先进的智能化解决方案,赋能各行各业数字化转型升级
阅读原文

AI大语言模型技术汇总

文章概要:

1. 模型:介绍了35个文本LLM模型和8个多模态LLM模型。
2. 应用:包括领域微调、LangChain应用和其他应用。
3. 数据集:预训练数据集、SFT数据集、偏好数据集。
4. LLM训练微调框架:包括DeepSpeed Chat、LLaMA Efficient Tuning、ChatGLM Efficient Tuning、bert4torch。
5. LLM推理部署框架:包括vLLM、DeepSpeed-MII、text-generation-inference、CTranslate2、OpenLLM、MLC LLM、LightLLM、AirLLM、LMDeploy。
6. LLM评测:包括FlagEval(天秤)、C-Eval、OpenCompass、SuperCLUElyb、GAOKAO-Bench、AGIEval、Xiezhi。
阅读原文

国内外大模型可信评测排行榜

文章概要:

1. 大湾区生成式人工智能安全发展首发大模型可信能力评测,阿里巴巴、百度等的大。
2 联合实验室根据《人工智能治理框架》.0版,研究制定了国内首款对标《框架》的大模型安全可信及量化评级测评体系。
3. 联合实验室了国内外22个最新大模型作为评测,按照13个维度的体系进行了全面客观评测,形成了“大模型可信能力评测排行榜。
4 评测结果显示,国内大模型在可信能力评测中展现了较强的竞争力,顶尖模型在各维度上的差距较小,但也揭示了不足,尤其是在能力可靠性的四个维度上,模型评级从1A到4A不等,仅有2.4%的模型达到了4A。<>5. 大湾区生成式人工智能安全发展联合实验室由中共广东省委网信和国家互联网应急广东分中心联合牵头发起,华为公司、腾讯公司中山大学广州市委网信办深圳市委网信办、东莞市委网信办以及深圳河套发展署共同参与建设。
阅读原文

智能金融稳步前行:构建负责任的可信大模型

文章概要:

1. 金融智能进入大模型时代:大模型在金融行业的应用正不断拓展,领域大模型分为基础大模型、行业大模型和场景模型,垂直领域模型在输出过程中,其思考模式和上下文理解会有明显的不同。
2. 大模型在金融落地场景解决思路:大模型在金融场景中的应用正逐渐普及,但其面临着算力资源不足、软件层面设施和工具链不完善、可解释性欠缺、输出的真实性和可靠性难以保证、合规要求严格等问题。
3. 可信金融大模型落地应用成果:东方财富妙想大模型基于东方财富多年积累的数据资产和数据沉淀,构建了强大的算力能力,并专门针对金融场景进行了一系列的突破和优化。
4. 问答环节:最有效的应用还是在投研和投顾这两个方向。
阅读原文

国内首个视频大模型 Vidu 定义AI视频新标准

文章概要:

1. 生数科技旗下视频大模型Vidu正式开放API,并同步接入百度智能云千帆大模型平台成为平台接入的首个视频大模型。
2. Vidu模型是国内首个纯自研的视频大模型,它在高动态性、多风格化、极致推理等方面的领先优势在AI视频生成树一帜。
3. Vidu模型的上线,特别是其全球首个“主体参照”功能,解决了模型一致性生成的难题,更为视频创作者提供了一个全新的创作平台。br> 4. Vidu API的,用户和开发者而言,是一个激动人心的机遇,它将地推动影视、广告、娱乐等行业的创新和发展。
阅读原文

智工动态|工业和信息化部主管《新型工业化》杂志:中国工业大模型取得突破,智工落地多个场景

文章概要:

1. 《新型工业化》杂志报道工业大模型取得突破工落地多个场景
2. 北京邮电大学、国家工业信息安全发展研究中心单位的专家撰写文章,探讨大的现状、核心在安全领域的应用前景
3 文章指出大模型已成为推动工业智能化转型的关键力量,国内人工智能科技企业在这一领域持续发力> 4. 智工·工业大模型.0实现了模型参数的轻量化,为边缘计算和智能终端提供了高度灵活训练
. 智工系列大模型已在、化工等领域落地应用,覆盖多个场景
6. 《新型工业化》杂志是工业和信息化部正式创办期刊,致力于成为宣传阐释新型工业化论述的重要阵地和展示实践成果的窗口
阅读原文

聚焦丨AI生成大模型,是拉高天花板?还是消灭创作者?

文章概要:

1. 今年2月Sora问世后,国内AI视频生成模型企业揭竿而起,掀起一场“没有硝烟的战斗”。
2. 5月开始国内企业相继公布自研的视频生成模型,一时间,视频生成模型领域好不热闹。
3. 如今轻体量的短剧,也成为视频生成模型企业推出作品的首选
4. 相比初代的视频生成模型技术,现在已经能够在画面中呈现出复杂的物理规律效果,各家平台也具备各自的优势。
5. 据QuestMobile发布的数据,2024年第一季度,生成式AI(AIGC)成为移动互联网行业增速最快、收益最大的行业。
6. 视频生成大模型领域似乎一夜爆火,利好消息满天飞。
7. 目前的视频生成模型最大的局限性在于可控性不足。
8. 大模型接下来商业化怎么走?
9. 尽管产品并不完美,但无论是企业还是资本市场对视频生成大模型的未来发展都抱有较高的期待。
10. 互联网大厂目前已经成为行业引领者,字节、快手高度重视视频生成项目。
11. 视频生成大模型的用户分类分为B端和C端两类,其中B端主要来自与视频内容相关的领域,比如广告、游戏、短剧和影视等。br> 12. AI商业模式也主要有。一种是SaaS(软件即服务)订阅模式,用户打开软件可以直接体验到产品功能。另一种是API(应用程序编程接口)形式,将模型能力输出形式提供给用户,即MaaS(模型即服务)。
13. 目前AI视频生成大模型在影视、广告、电商、自媒体等领域已经有了广泛的应用,甚至取代一部分特效、动画、广告短片、商品动态展示等创作场景。
阅读原文

AI大模型,但是在卫星

文章概要:

1. 国星宇航完成全球首次卫星在轨AI大模型技术验证,标志着其在推动“太空AI”发展方面迈出重要一步> 2. PyTorch推出torchao架构优化库,专注于模型量化和稀疏性优化,旨在降低成本和内存用量,同时保持
3.AI推出集成了写作与编码功能的全新工具ChatGPT Canvas,允许用户在写作和编码时获得实时反馈和建议
4. OpenAI发布Whisper large-v3-turbo语音转录模型,该模型在几乎不牺牲质量的前提下,速度比前代large-v3快8倍
. Liquid AI推出三款非Transformer架构的AI模型,包括LFM-1.3B、LFM-3.1B和LFM-43B,它们在基准测试中表现出色,超越了同规模的Transformer模型
6. Meta推出AI视频生成器Movie Gen,该工具能够根据文本输入自动生成带有声音高清视频
7 德国初创公司Black Forest Labs发布AI图像生成模型Flux 1.1 Pro,代号“blueberry”,在图像生成上是Flux 1 Pro的6倍,同时提供更高质量和更合规的图像输出
8. Mozilla推出Lumigator框架,旨在帮助开发者挑选合适的AI大语言模型
9. Google Lens服务新增视频搜索和语音输入功能,使得年轻用户(18-24岁)使用频率最高的图像识别技术更加便捷
10. 快手旗下的可灵AI新增了一项对口型”功能,允许用户上传音频后,视频中的人物口型与音频同步
11. 约会平台Grindr于2027年推出AI助手,旨在为140万用户提供寻找合适伴侣和约会地点建议等服务
阅读原文

Agent心理诊所上线!基于1.3K抑郁症问诊对话,上海交大团队搭建大模型对话Agent,可初诊抑郁症

文章概要:

1. 上海交通大学 X-LANCE 实验室吴梦玥老师等搭建了一种自动化大模型对话 Agent 模拟系统——智能体心理诊所 AMC,用于抑郁症的初步诊断。
2. 该系统可以同时模拟精神科医生和潜在抑郁症患者,并模拟抑郁症问诊对话。
3. 为了更好地适应诊断环境的需求,AMC 利用流行的大模型 Agent 构建的思路,同时还提出了三层记忆存储结构和全新的记忆检索机制,以实现更高效准确的抑郁症问诊和初筛。
4. 研究人员提出了一种三层的记忆存储结构和全新的记忆检索机制的自动化大模型对话 Agent 模拟系统,包括患者 Agent、精神科医生 Agent 和指导员插件。
5. 为评估 AMC 的有效性,研究人员在 D4 的测试集上做了 2 组实验,结果证明在测试集上模型的整体表现都有提升验证了 AMC 在利用层次化记忆架构上的有效性。
6. 吴梦玥课题组的主要研究方向便是计算精神病学与音频病理语音研究,上述研究所采用的 D4 数据集是她带领团队构建的全球第一个符合临床标准的开源抑郁症问诊对话数据集,为相关研究提供了扎实的基础。
阅读原文

麻了!大模型的不可能三角

文章概要:

1. 业界存在著名的“不可能三角”想要又便宜又快又好不可能的
2. 大模型也存在不可能三角,包括、效果和性能
3. 成本指企业大模型落地的费用,包括训练成本、推理成本以及部署运维和升级成本等
4. 效果指大模型生成内容的质量,包括内容,是否存在幻觉,或是否会生成的内容
5. 性能指大模型服务的速度,包括大模型的训练速度,推理时的速度、生成速度等
. 大模型的效果和性能不可兼得,当成本固定时,大模型的选择主要是在效果和性能进行平衡和取舍
. 《GenAI技术落地白皮书》是阿里云研究院出品的,站在企业视角,从大模型选择、适配、优化、业务整合再到基础设施搭建、开发运维、模型安全覆盖了整个生命周期,给出了很多真知灼见
阅读原文

大模型落地路线图研究报告(2024年)

文章概要:

1. 大模型落地路线图研究报告(2024年
阅读原文

全是细节|大模型SFT的100个关键点

文章概要:

1. 文章介绍了大模型的sft如何去做,包括背景、数据、训练、评估等方面。
2. 文章指出sft的核心是数据多样性和数据质量,数据数量并不重要。
3. 文章分享了sft工作者的一天,包括分析数据、清洗数据、生产数据等。
4. 文章强调了模型上线后,sft工作才真正开始,需要利用用户日志生产训练数据。
5. 文章介绍了专项数据,包括RAG、Agent、长文本、复杂指令等。
6. 文章讨论了sft的训练框架、炼丹技巧、拟合问题等。
7. 文章介绍了sft的评估方式,包括机评和人评。
8. 文章总结了sft的重要法门,包括多了解base模型的能力,多培养训练feel。
阅读原文

R-Bench | 多模态大模型是否在真实世界中鲁棒?

文章概要:

1. 本文建立了R-Bench,以评估LMMs在真实世界的鲁棒性。
2. 本文采集高质量数据作为参考图像,再通过加入损伤得到失真图像。
3. 本文对图像从拍摄到大模型接收的步骤分为七个,分别是环境干扰(EI),摄影干扰(CI),模数转换(AD),信源编码(SE),信道传输(CT),信宿解码(RD),和增强处理(EP)。
4. 本文首次定义了相对鲁棒性,即LMM能够正确处理参考图像的前提下,失真/参考输出结果的一致性。
5. 本文采用了20种主流的LMMs进行测试,它们在过去的benchmark中展示出了卓越的性能,对高质量参考图像,从而保证了R-Bench得出的鲁棒性结果是有意义的。
6. 本文对失真的7个步骤和7个组别,以LMMs的表现为基准,计算了SRoCC相关系数。
7. 本文发现GPT4o在R-Bench的评估中获得了大满贯,但仍与人类存在极大的差距。
阅读原文

百模大战与OpenAI破产危机,探索“大模型”的历史跃迁与商业应用畅想

文章概要:

1. 大模型的发展历程始于20世纪90年代,2017年OpenAI的GPT-1展示了深度学习在语言生成上的潜力,2018年的BERT利用双向Transformer架构实现了前所未有的语境理解力。大语言模型的发展可分为基础模型阶段、能力探索阶段和突破发展阶段。2. 中国大模型的发展紧跟全球步伐,阿里云通义千问、百度文心大模型、华为盘古大模型、科大讯飞星火大模型、智谱GLM-130B等在不同领域有着广泛的应用。3. 大模型的关键技术包括大规模预训练、Transformer架构、多模态融合和高效推理技术。4. 大模型商业应用的领域包括客户服务与营销自动化、内容创作与媒体、教育与培训、医疗健康、金融与保险、企业决策支持、法律与知识产权、创意产业等。5. 随着大模型技术的不断进步和应用边界的不断拓展,它们将为商业领域带来更多的创新机会,推动社会经济结构的深刻变革。
阅读原文

6个最受欢迎的本地运行大模型工具整理

文章概要:

1. 本文介绍了几种可以在本地运行测试大语言模型的工具,包括LM Studio、Jan、Llamafile、GPT4ALL、Ollama和LLaMa.cpp等,它们的特点、优势以及使用方法等。
2. 这些工具可以帮助用户保护数据隐私、降低成本、提高定制化能力,满足不同的应用需求。
阅读原文

恒脑智鉴:助力大模型监管评估,保障AI应用安全合规

文章概要:

1. 人工智能技术迅猛发展,大模型在各行业应用广泛,如何有效监管应用的安全性与合规性成为焦点。
2. 安恒信息推出大模型安全评估产品恒脑智鉴,旨在帮助政企监管机构有效监管大模型安全性和合规性。
3. 恒脑智鉴产品内置五大核心大模型检测能力,依据相关政策法规,全面覆盖大模型的质量、安全和能力。
4. 恒脑智鉴针对大模型风险评估采用精细化风险评估方法,覆盖12大内容安全风险领域,细分为40余种小类,确保无遗漏。
5. 安恒信息愿与政企监管携手,共同维护AI大模型合规安全性,推动智能时代、有序。
阅读原文

打完“价格战”,大模型还要比什么?

文章概要:

1. 阿里在2024年云栖大会上宣布旗下通义千问三款主力模型再次大幅降价,最高降幅达85%。
2. 自阿里在5月率先“开卷”之后,国内大模型行业风向标OpenAI均跟进价格战,行业降价幅度达到了90%左右。
3. 目前大模型行业的降价速度已经远超“摩尔定律”,降价幅度接近100%,业内人士认为,大模型行业甚至可能已经到了“负毛利时代”。
4. 大模型企业宁愿牺牲利润也要降价,所求的正是“预期”,即牺牲短期利益来换取长期回报。
5. 目前大模型行业的共识,就是规模比利润更重要,大模型企业不能回避“价格战”,就只能将活过价格战作为初步目标,希望能成为淘汰赛结束后的最终受益者。
6. 阿里选择降价、开源,本质就是希望降低大模型的使用门槛,通过更低的价格来验证大模型的应用价值,让更多企业和创作者参与进来。
7. 大模型淘汰赛或还会持续2-3年,虽然最终留下的大模型企业并不会多,为了活下去,企业们也不得不使出浑身解数,但问题是,当“低垂的果实”都被摘完之后,当下大模型行业的解题思路早已不是“便宜就完事”。
8. 大模型企业在打价格战的同时,也深知产品、技术、现金流的重要性,既要抗住降价压力,又要和对手拉开技术差距,持续提升模型性能和产品落地,才能形成良性的商业闭环。
9. 目前,大模型行业的商业逻辑,已经从卷模式、卷成本,迈入到卷生态、卷技术的新阶段。
阅读原文

商汤开源大模型压缩工具LLMC!单卡压缩Llama 3.1 405B

文章概要:

1. 大语言模型(LL)的最新进展以其卓越的涌现能力和推理能力推动我们走向通用人工智能,但大量的计算和要求限制广泛采用,量化是一种关键的压缩,可以通过压缩和加速LLM来缓解需求,尽管存在潜在的准确性风险;<>2. 来自、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,即插即用的压缩工具包,以公平、系统地探索量化的影响;
3. 在使用LLLlama 3.1进行量化压缩后,可以使得一张80G A100即可完成Llama 3.1 405B的校准和评估,从而实现超低成本进行量化;
4. 10月11日晚7,青稞Talk第25期,商汤科技算法实习生、香港科技大学准博士生黄雨,分享《LLMC:语言模型的量化基准》;
5. 黄雨石,本科毕业于北京航空航天大学即将进入香港科技攻读计算机博士学位,研究方向为高效的AIGC,神经网络压缩与加速等,目前已在CVPR,EMNLP, MM发表多篇论文。
阅读原文

半天玩转大模型之Prompt

文章概要:

1. 提到大语言模型LLMs,不可避免会提到Prompt,Prompt是使用者在与大模型交互过程中,在输入里添加的一段文字或指令。
典型的Prompt通常由角色、指令、、上下文、示例等主要元素组成。
3. 在用户提问的过程中,可以用到角色提示、控制输出风格和格式、提供前置信息和上下文、限定受众对象、限定输出长度等基础应用技巧。
4. 提供示例进行仿写、结构化提示词等中阶应用技巧。
5. 思维链、自洽性、提示链、生成知识法、反思、软提示等高阶应用技巧。
6. 当我们掌握了丰富的提示词技巧之后,就可以将提示词变为具有生产力的工具了,从某种意义上说,这个工具就是大模型的Agent。
7. Agent由规划、记忆、工具等模块构成。
8. 将典型提示词元素与这些技巧框架相融合,封装为工作流后,就形成了不同用途的Agent智能体。
9. 更进一步,甚至可以将手动编写Prompt的工作自动化,形成标准化和自动化的流水线Agent。
阅读原文

华泰金工 | 大模型本地部署手册

文章概要:

1. 本文是大模型本地部署的实用参考手册,详细介绍大模型及其应用的本地部署流程。对于大模型本地部署,本文从前后端是否存在的角度将不同部署框架分为三类:前后端皆存在的大模型集成运行环境、仅含前端的对话式网页应用、仅含后端的本地大模型运行库,分别以Ollama和LM Studio、ChatGPT Next Web与llama.cpp为例进行部署流程介绍。对于大模型应用本地部署,本文分别以AnythingLLM和Dify作为RAG应用框架和多智能体应用框架的代表,进行详细的部署说明及应用实例构建。
2. 大模型本地部署的实用参考手册,详细介绍大模型及其应用的本地部署流程。对于大模型本地部署,本文从前后端是否存在的角度将不同部署框架分为三类:前后端皆存在的大模型集成运行环境、仅含前端的对话式网页应用、仅含后端的本地大模型运行库,分别以Ollama和LM Studio、ChatGPT Next Web与llama.cpp为例进行部署流程介绍。对于大模型应用本地部署,本文分别以AnythingLLM和Dify作为RAG应用框架和多智能体应用框架的代表,进行详细的部署说明及应用实例构建。
3. 本文尝试提供一份清晰易用的大模型本地部署参考手册。对于大模型本地部署,本文从前后端是否存在的角度将不同部署框架分为三类:前后端皆存在的大集成运行环境、仅含前端的对话式网页应用、仅含后端的本地大模型运行库,并逐一以Ollama和LM Studio、ChatGPT Next Web与llama.cpp为例进行详细的部署流程介绍,同时选择多项维度对比不同部署方案的优劣势。
4. 对于大模型应用本地部署,本文从框架理论出发,基于RAG与多智能体架构对大模型框架进行分类,RAG应用框架包括Anything LLM和RAGFlow等开源框架,多智能体应用框架包括Dify、AutoGPT、AutoGen等。本文分别以AnythingLLM和Dify为例,进行框架部署流程的介绍和注意事项说明,同时尝试构建私人知识库与翻译助手应用实例,从效果上看,模型输出质量较高。
阅读原文

大模型论文总结-20241009期

文章概要:

1. 本文是大模型论文总结-20241009期,由论文总结AI Agent整理。
2. 文章包含了四篇论文的研究问题、提出方法、创新点和结论
3. 第一篇论文提出了一种混合信息提取管道,使用封闭源大型语言模型生成高质量标记数据,用于建立维护所需的数据库。
4. 第二篇论文采用基于变换器模型的词元级处理技术,结合注意力机制与上下文嵌入,用于自动内容审核、政治话语分析和广告监管。
5. 第三篇论文利用大型语言模型来识别分类属性的主要特性为其分配数值值,从而生成多维特征向量。
6. 第四篇论文探讨了特定提示技术对聊天模型在数据分析中的影响,特别是在具有高专业知识和复杂性的领域中。
阅读原文

人工智能大模型教育场景应用优秀案例

文章概要:

1. 山东工艺美术学院积极开展人工智能赋能设计教育教学改革,探索“人工智能+设计教育”的新模式、新技术、新方法,全面推进设计学科在教育内容和育人方式两个层面的数字化转型。
2. 学校以产教融合、学科交叉为切入点,系统谋划与整体布局,在全校范围内启动了“AI for Design:人工智能赋能专业建设”教学改革,深入对接产业需求,培养一批具有创新精神和实践能力、面向未来的应用型设计人才。
3. 学校以人工智能设计研究中心为平台,加强全校资源协调,提供人工智能设计的教学、展示、交流、创作、培训,解决技术储备、产教融合等问题,全面推进“五个一”工程。
4. 学校以“数字媒体技术”新增专业建设为契机,积极引进具有数字媒体技术、人工智能等技术背景的专家教师,同时加强现有教师队伍的培训,推动技术与艺术交叉融合,同时学校积极打通产业资源,构建虚拟育人专区,聚拢多元化师资,实现产业资源和教育资源在云端交汇,形成产业联动、资源共享、优势互补、分工协作的“新艺科”协同教学模式,为培养工、艺兼备的创新型、复合型人才奠定基础。
5. 学校启动“山东省人工智能设计服务平台”建设,构建面向全省设计艺术专业师生以及相关行业从业者的,涵盖教育、研究和产业应用的综合性人工智能服务平台。
6. 学校积极探索数字化元数据标准建立,图文语义对齐,通过人工智能、影视摄影、智能交互、虚拟仿真及3D扫描等多技术,研究建立艺术设计领域高质量数据集及AI语料库。
7. 学校基于良好的设计专业实践教学环境,持续加强实践教学数字化研究探索,利用人工智能在数据关联分析、结构重构、价值发现等方面的技术优势,推动实践教学在教学方式、个性评价、管理服务等领域的智能化。
阅读原文

大模型能给大数据开发领域带来什么?

文章概要:

1. 大模型在大数据平台开发的应用场景:以京东的大数据开发平台为例,大模型可以在数据开发链路中提供实质性的帮助,提高数据资产的可发现性,优化开发流程,并增强系统的稳定性和可靠性。
2. 大模型在大数据开发场景落地情况:在国内,大模型在大数据开发和应用场景中的落地实践,往往以智能助手的形式出现,以提高效率、简化操作并增强用户体验。在国外,也诞生了一些以大模型辅助开发的产品,如Babel、Cognition、Blinq IO。
3. 总结:目前把大模型应用到大数据开发领域落地实践一般是自身已经有数据平台,大模型作为辅助开发助手的形式出现,而在数据分析领域,大模型可以发挥更多的优势,国内外将大模型应用到软件开发行业的作为一个独立的产品的公司相比应用到法律,医疗,营销等其它行业相对要少很多。
阅读原文

一文彻底搞懂大模型 - Dify(Agent + RAG)

文章概要:

1. Dify是一个用于构建AI应用程序的开源平台,融合了后端即服务和LLMOps理念,支持多种大型语言模型,提供强大的数据集管理功能、可视化的Prompt编排以及应用运营工具,降低了AI应用开发的复杂度
2. Dify提供四种基于LLM构建的,可以针对不同的应用进行优化和定制
3. 将文档上传到ify知识库构建RAG涉及多个步骤,包括创建知识库、文本预处理与清理、索引模式选择和检索设置
4. 在Dify搭建Agent需要选择模型、编写提示、添加工具与知识库、配置推理模式及对话开启器,最后进行调试预览并发布为Webapp
阅读原文

AI大模型与多模态应用提示词:AI赋能教学、AI论文写作、AI助力基金项目申报、AI教学应用案例、AI辅助微课制作实战指南

文章概要:

1. AI大模型在多模态应用、文献检索与基金项目申报、论文写作、教学赋能等领域的应用。
2. 中国科学院人才交流开发推出第七期“人工智能深度赋能教育教学与科研创新实践”高级研修班。
3. 介绍了研修班的主题、内容、参加人员、授课专家、时间地点、参加费用和报名咨询方式。
阅读原文

盘点11款国产应急大模型实践

文章概要:

1. “十四五”规划提出强化数字技术在公共卫生、自然灾害等突发公共事件应对中的运用,提升预警和应急处置能力,智慧应急是依靠科技创新推进应急管理能力现代化的重大战略举措。
2. 我国应急管理面临数据治理、业务融合等挑战,以大模型为代表的人工智能技术成为提升应急管理能力和效率的关键措施。
3. 截至2024年3月28日,已有117项大模型通过备案,我国大模型产业呈现蓬勃发展的态势。
4. 依托云端部署的AI大模型根据其应用领域可以分为通用大模型和行业大模型,通用大模型具备较为广泛的适用性,行业大模型针对特定行业的专业需求进行专项模型训练。
5. 应急大模型助力应急领域多元化应用场景,通过结合应急行业专业知识进行有监督的微调,使得应急指挥反馈全面化,实现预测更准、预警更快、预案更实。
6. 应急大模型主要数据来源包括危险源检测数据、安全责任落实数据、应急预案库数据、应急事故案例集、城市/园区基础环境数据。
7. 应急大模型主要应用场景包括突发事件应急处理、应急管理智能助手、安全风险评估与管控。
8. 应急部正式发布应急管理领域“久安”AI大模型,以科技创新发展落实全面深化改革,全力推动新质生产力赋能形成应急管理新质战斗力。
9. 中国气象局发布了三个AI气象大模型系统,分别是:人工智能全球中短期预报系统“风清”大模型、人工智能临近预报系统“风雷”大模型和人工智能全球次季节—季节预测系统“风顺”大模型。
10. 由国家超级计算成都中心、中国地震局地球物理研究所与清华大学联合开发的“谛听”地震波大模型正式发布。
11. 上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”。
12. 国家城市安全发展科技研究院、深圳市城市公共安全技术研究院预发布自主研发的“城安”大模型。
13. 华为云发布盘古气象大模型,登顶《Nature》杂志,引发业界广泛关注认可,在气象学家关心的一些代表性指标和极端天气预报中展现出独特优势。
14. 广东南方应急管理研究院与北京广监云科技有限公司联合研发的一款专注于安全应急领域的专业认知智能模型“大羽安全应急模型V2.0”正式发布上线。
15. 中山大学智能工程学院沈颖团队发布“神机大模型”,是首款专为应急科普打造的模态大语言模型。
16. 上海科学智能研究院、复旦大学和中国国家气候中心联合研发的“伏羲”次季节大模型发布。
17. 山东能源集团、华为公司联合发布全球首个商用于能源行业的AI大模型——盘古矿山大模型。
18. 浪潮智慧矿山AI大模型正式发布。
阅读原文

全是细节|大模型SFT的100个关键点

文章概要:

1. 文章介绍了大模型的sft如何去做,包括背景篇、数据篇、训练篇、评估篇等内容。
2. 背景篇介绍了sft涉及到的基础概念,包括Special Token、耗时问题、与pretrain的区别、幻觉问题等。
3. 数据篇介绍了sft工作者的一天,包括数据多样性、数据生产、数据飞轮、专项数据等内容。
4. 训练篇介绍了sft的训练框架、炼丹技巧、拟合问题、夹逼准则等内容。
5. 评估篇介绍了sft的评估方式、评估分析等内容。
6. 总结篇介绍了sft的重要法门,包括多了解自己的base模型的能力,多培养训练feel等。
阅读原文