今日AI-大模型-2024年12月5日

发现全网最新的AI内容

目前最全,188+26个国产大模型!

文章概要:

1. 国家互联网办公室披露,目前已通过国家级备案的人工智能大有188家,地方网信部门登记在册的AI大模型有26家。
2. 文章罗列了大模型完整清单、常用大模型的特点以及国内大模型发展趋势,文末附完整清单下载链接。
3. 介绍了10个常用的大模型及其优缺点,包括百度文心一言、科大讯飞星火大模型、阿里云通义千问、字节跳动豆包、智谱华章智谱清言、腾讯混元、商汤商量SenseChat、天工AI、百川智能百川大模型、360安全大模型。
4. 除上述大模型外,还有一些有潜力的大模型值得关注,如华为云盘古大模型、小米MiLM-6B、中科院自动化研究所的紫东太初、Minimax的ABAB大模型、月之暗面的Kimi Chat。
5. 近年来,国内大模型行业发展迅猛,已成为人工智能领域的热点,在金融、医疗、智能制造等多个领域均实现了应用落地。
6. 国内大模型具有全产业链覆盖、政策支持、技术创新、场景多样化等优势,但也面临技术门槛高、数据隐私和安全、模型可解释性不足、高额成本、认知不足与预期过高等挑战。
7. 随着技术的不断进步和数据的不断积累,国内大模型行业将迎来更加广阔的发展前景。
阅读原文

AI大模型在蛋白质稳定性预测领域取得新进展:无需额外训练和数据即可显著提升性能

文章概要:

1. 来自Peptone Ltd.的研究团队在蛋白质工程和药物开发领域取得重要突破,他们提出一种创新方法,通过对现有反向折叠模型的改进,显著提升了蛋白质稳定性预测的准确率。
2. 研究团队提出了一种新颖的方法,通过引入模型自身派生的第二项来改进预测,包括最大化序列上下文利用、引入单残基预测校正和计算效率优化。
3. 研究团队在三个基准数据集上评估了改进后的模型性能,结果表明改进后的模型不仅准确率提高,计算效率也有数量级的提升。
4. 研究团队指出,这种利用模型输出差异的方法可以扩展到其他预测任务,如预测突变对蛋白质结合能力的影响。
5. 项目代码已在GitHub上开源,感兴趣的读者可以获取。
阅读原文

AIDO.Protein: AI大模型在蛋白质理解与设计领域的革命性创新

文章概要:

1. 介绍了AIDO.Protein的研究背景,即蛋白质是生命活动的核心执行者,理解蛋白质的"语言"对于推进基因研究和加速药物研发具有重要意义。
2. 阐述了AIDO.Protein的创新突破,即来自GenBio AI等机构的研究团队在预印本平台发布了最新研究成果《Mixture of Experts Enable Efficient and Effective Protein Understanding and Design》,提出了首个蛋白质领域的专家混合(MoE)模型AIDO.Protein。
3. 说明了AIDO.Protein的模型架构,这是一个基于Transformer的编码器模型,其创新之处在于使用稀疏MoE层替代了传统的密集MLP层。
4. 描述了AIDO.Protein的预训练详情,研究团队在UniRef90和ColabfoldDB数据集上对模型进行了预训练,总计处理了1.2万亿个氨基酸序列。
5. 介绍了AIDO.的实验评估,研究团队在两个重要基准测试集上对AIDO.Protein进行了全面评估。
6. 分析了AIDO.Protein的技术原理深度解析,包括MoE层设计原理、预训练策略创新、扩散模型在逆折叠中的应用。
7. 阐述了AIDO.Protein的代码与数据可用性,研究团队已将所有代码和预。
8. 总结了AIDO.Protein的成功开发标志着蛋白质语言模型进入了一个新的效率时代 。
9. 说明了AIDO.Protein的Q&A环节,深入解析了AIDO.Protein技术细节。
10. 提供了AIDO.Protein的ModelGenerator详细使用指南,包括环境配置、模型下载与使用、模型训练、高级应用、常见问题解决、代码贡献、注意事项、未来更新、联系方式、许可证。
阅读原文

蛋白质语言大模型开启进化分析新纪元:MAAPE算法破解"暮光区"之谜

文章概要:

1. 创新性的算法MAAPE(Modular Assembly Analysis of Protein Embeddings)结合了蛋白质语言模型的嵌入表示和模块化分析方法,为蛋白质进化研究开辟了新途径。
2. 算法使用Facebook的预训练ESM2_t36_3B_UR50D模型进行序列嵌入,包含36层,隐藏状态维度为2560,总参数约30亿。
3. 算法创新性地引入了滑动窗口机制,用于分析不同尺度的进化信号。
4. 算法在两个具有已知进化关系的数据集上验证了MAAPE算法的可靠性。
5. 尽管MAAPE算法展现出了强大的潜力,研究团队指出还有以下方向需要进一步探索:深入理解子向量的具体功能和信息含义;扩展算法在蛋白质结构域相关问题中的应用;进一步提升数据集时的计算效率。
阅读原文

腾讯混元视频大模型初体验:还能更强一点

文章概要:

1 224年月15日AI正式对外公布文生模型Sora引得全球网友“AI解构真实世界的时候了”然而大约1时间过去,依然只存在上,反而是亚马逊云抢先OpenAI了Nova Reel文生视频大模型,谷歌则面向企业用户开放了AI视频模型Veo。
.互联网巨头忙于开发和布局AI生成视频同时国内互联网巨头也闲着,快手旗下团队就出了生成大可灵,随后清华大学北京生科技打造视频生成大模型idu,日前腾讯公司AI团队推出了混元文生大模型,并在元宝App上线。br>. 腾讯混元大模型数量为10亿是目前参数量最大的视频生成类大,期间用户可以4次标准和2高品质视频机会,生成长度为5秒。br>4 从实际表现来看混元大可以人类自然语言根据描述的生成视频,同一段话两次生成结果较为接近只是细节方面有待提升。br>5.视频生成大模型已理解自然语言能力面对较为复杂,会存在诸多,而在相对简单的场景下idu、灵等“老牌生成的表现略好漏洞少一些混元大模型有较大空间。br>6. 从、亚马逊云科技、等企业的来看205年会是全球生成大爆发的AI生成视频长度将数提升至分钟,如亚马逊云科技的Nova Reel支持生成长达分钟的。
阅读原文

字节开源最全代码大模型测评工具,一手教程来了!

文章概要:

1. 字节豆包大模型团队与M-A-P社区联合推出了开源的代码大模型基准测试数据集FullStack Bench以及配套工具Sandbox Fusion,覆盖全栈编程领域,数据集和工具已在HuggingFace和Github开源;2. FullStack Bench是一个多语言的基准测试数据集,专注于编程开发任务设计,它包含多达3374个问题,涉及16种编程语言,以更贴近真实开发场景的方式挑战代码生成模型的极限;3. SandboxFusion是一个高效的代码沙盒执行工具,它通过统一的HTTP API提供了对不同编程任务的标准化评估,支持docker一键部署,除了FullStack Bench,它还支持10多种其他代码评估数据集;4. 近期出现的沙盒环境很多,但是这些沙箱存在重大限制,而SandboxFusion覆盖23种编程语言,支持前端开发、后端服务和机器学习等复杂场景;5. SandboxFusion主要提供两个功能:运行代码和判断题目对错;6. 数据集Datasets模块实现了各类不同Code数据集的判断逻辑,已经实现的开源数据集有:mbpp、human_eval等;7. Sandbox模块和Datasets模块相结合,就构成了模型评估的流程;8. Coder大模型比较,Qwen2.5-Coder、DeepSeek-Coder、GPT-o1、GPT-4o、CodeLlama、Claude 3.5 Son模型各具特色,Qwen2.5的Coder也是本人经常在用的,体验效果比较好;9. 今年6月,字节发布了AI编程助手豆包MarsCode,跟随Datawhale实践,在VsCode中下载插件体验了一番,效果很不错,推荐给身边朋友一起用了;10. 现阶段各家大模型的得分表现;11. 在使用FullStack Bench和Sandbox Fusion时,最大的感受是它们可以和Coder模型的训练与评测深度结合;12. FullStack Bench作为一个多语言、多场景的代码能力测试数据集,涵盖了从基础算法到全栈开发的丰富问题,贴近真实开发场景的设计具有很强的应用价值;13. SandboxFusion则提供了强大的代码运行和评估能力,基于Docker的一键部署和易用的HTTP API接口,让测试流程变得简单、高效。
阅读原文

中国大模型生存战:巨头围剿,创业难熬

文章概要:

1. 文章主要讨论了中国大模型市场的竞争格局,指出巨头围剿下,创业公司面临着巨大的挑战
2. 文章分析了字节跳动和阿里的大模型战略,以及它们对市场的影响
3. 文章指出,创业公司在大模型市场中面临着两难境地,既要避免与大公司正面竞争,又要找到自己的产品方向
4. 文章认为,大模型市场的竞争结果取决于新技术能在多大程度上颠覆原有体验,以及是否能找到新生态
5. 文章最后指出,大模型市场尚未成熟,创业者和大公司都有机会,但需要根据市场情况调整自己的策略
阅读原文

大模型创业“生死局”:融资困难、造血乏力、卖身离场

文章概要:

1. AI独角兽公司“月之暗面”被推上风口浪尖,金沙江创投主管合伙人朱啸虎连发两条朋友圈披露相关细节,引发
2. 投资方和创业者关系紧张,大创业,AI大模型开发放缓,平台巨头和创业团队一同涌向应用开发 3. 很多创业企业推出的B端AI产品达不到,回款难、续签更难,C端缺少爆款级别的应用,难
4. AI大模型创业热潮经历了从火热融资到激烈竞争,再到备受质疑的科技创业周期,20年接近尾声,AI大模型创业进入了调整期
5. 今年5月云厂商大模型掀起一场推理算力价格战,大厂们掀起的价格战,最先冲击到的是行业中的创业企业它们原本就变现困难、利润微薄,随着行业毛利下降,自我造血的节奏也被打乱,快速商业化的难题被摆到了台面上
6. 被是不少AI大模型创业者们心中的理想结局,波形智能被厂商OPPO收购,创始团队进了OPPO负责交互产品
7. 融资放缓,今年以来(1月1日~125日),国内AI领域发生439起融资案例,总融资金额超564亿元,大概是去年的80%
8. 机构缩减投资是普遍现象,投资人的耐心逐渐被消耗,与企业之间的关系产生了裂痕
9. AI大模型行业热闹两年多后,很多人发现大模型“烧钱”似乎无底洞,无论是企业还是投资人,他们都难以在有限时间内收到投资回报 11. 尽管AI应用市场规模很大,但当下在应用层创业也无法与大厂做出明确的差异化竞争,巨头们的正在延伸到每一个业务场景之中,加剧创业的难度
阅读原文

产业丨LiveBench榜单比拼,阶跃星辰成为国内大模型第一

文章概要:

1. 国际权威榜单LiveBench官网最新公布的排名显示,阶跃星辰自主研发的万亿参数语言大模型Step-2在榜单中位居国产基座大模型之首
2. 今年三月,阶跃星辰推出了Step-2语言大模型的预览版,此举标志着国内首个由创业公司推出的万亿参数模型的诞生
3. 阶跃星辰之所以能在首次参与LiveBench评测时取得如此卓越的成绩,与其自主研发的Step-2大型语言模型的两个关键特性,与其拥有万亿级别的参数量和采用Mixture of Experts(MoE)架构密切相关
4. 2024年3月,阶跃星辰推出了具有千亿参数的多模态大模型的初始版本Step-1V
5. 据信息显示,阶跃星辰成立于2023年4月,至今仅一年多的时间,是一家相对低调的初创公司
6. 结尾部分提到,根据国际数据公司(IDC)的最新研究报告显示,预计至2028年,全球人工智能产业的支出将达到6320亿美元,几乎是目前水平的两倍,其五年间的复合年增长率(CAGR)预计为29%
阅读原文

电商行业发展与大模型应用研究

文章概要:

1. 报告解读《电商大模型及搜索实践》,分析电商发展现状及未来趋势,探讨大在电商领域的及其面临的。
2 电商行业在过去十年中飞速模式从的货架电商逐步演变为电商货架电商并存的局面。br> 3 大模型的电商行业带来了的机遇,能够通过深度学习,提升用户意图理解和商品理解的准确性,优化搜索结果提高用户体验br 4.大模型的成功应用离不开一系列关键技术的支持,数据和预、通用和对齐、以及评估体系建立。<> 5 未来电商搜索将更加智能化和个性化的发展,电商平台需要不断的,搜索引擎的智能化以用户增长的个性化需求。
阅读原文

大厂小厂肉搏,中国大模型进入淘汰赛

文章概要:

1. 大模型生存不易,国内目前有12个比较知名的大模型,大企业已经带着支票下场,小企业想突围并不容易
2.,AI公司压力倍增,各种创业公司如雨后春笋一样冒出,然后便是残酷肉搏战,最终留下几个赢家,它们通吃所有蛋糕,这是必然的流程
3. 链式反应,融资交易前赴后继,国内AI领域发生融资交易317笔,出手三次及以上的投资机构共有38家
4. 字节跳动AI产品全面开花,最近一年多,字节跳动的AI技术突飞猛进,让同行相看
阅读原文

AI营销,大模型商业化率先杀出一条路

文章概要:

1. AI营销借助大模型技术,解决品牌商家的增长焦虑,让营销效果更为确定,帮助品牌商快速找到营销ROI的基准线。
2. 大模型的加入,有机会颠覆原本冗长的内容生成—测试—投放—优化这一整套流程,让商家看到了大幅降本增效的可能,帮助商家快速试错,实现更确定的生意增长。
3. 营销焦虑的社会来源有:社会经济基本面数据严峻,电商行业闪现出很多“小”机遇,流量太贵,获客成本日益走高,利润率下降。
4. 解决焦虑的方法是:京东推出言犀智能营销平台,涵盖“1个智能营销平台-5大智能体能力-10大AI营销产品”,帮助商家降本增效。
5. 京东云言犀的小伙伴表示,这次升级一方面是技术本身有创新,另一方面是京东服务消费者20多年,他们实在是太了解商品和消费者了。
6. 具体而言,如何获得增长?一句话:帮助商家确定性地放大。懂电商、有技术,可以实现大模型的大规模商业化价值。所以这事还得是京东。
阅读原文

面试题:大模型涌现能力的解释以及产生的原因?

文章概要:

1模型涌现能力在模型,但在模型的能力,能力情况下,需要的数量。
.有两种被认为涌现的,是 content learning和思维链<> 涌现能力的是非连续度量的评价指标非线性后现象不存在。br> 涌现子任务的任务。
模型规模小的时候的能力没有临界,随着数据和规模增加,了值,会产生kking现象。
阅读原文

数字化审计|大模型在内部审计工作中可以怎么用?

文章概要:

1. 引言:人工智能发展,大模型在内部审计中的应用增多
什么是大模型:大模型通常指具有大量参数和复杂结构的机器学习模型,自然语言处理和计算机视觉等领域表现出色。
3.模型的特点:规模庞大、预训练与微调、上下文理解能力自注意力机制、迁移学习能力。<>4. 大的优势:数据分析、文本分析预测能力自动化审计。<>5.应用场景:风险评估、检查、异常检测、审计报告生成。br> 存在:隐私问题、模型的解释性技术的成本>7. 展望:大模型内部审计了工具和方法能够有效审计效率和准确性。
阅读原文

会议报道|“渐近渐远”:从人脑记忆到大模型记忆的未来之路

文章概要:

1 现今大模型“长期记忆”方面不足,为探讨AI的记忆,中文信息学会02学术年会举办了一场为大记忆与人的渐近渐”的论坛。br> 2. 盛大 Tech负责人了题为《记忆,AI进化基石》的主题演讲深入探讨了长期记忆在大模型发展中的核心作用分析了当前技术和未来的突破方向同时分享了在记忆领域的研究心得和实践成果
3. 分论坛,专家们从不同角度探讨了脑科学启发下的大长期记忆思路与应用前景。
阅读原文

不要噱头要实用!真正的AI大模型“王者”什么样?

文章概要:

. 亚马逊云科技在2024 re:Invent大会上发布了6款大模型、预告2款大模型,还推出3nm第三代AI训练芯片Trainium3及迄今最强AI服务器Trn2 UltraServer。
2. 亚马逊云科技推出了Amazon Bedrock Marketplace,这类似于一个大模型的开放平台,除了亚马逊云科技自研的大模型,还有三大第三方大模型正式登陆这个。
3. 亚马逊云科技的大模型有两大杀手锏:极致的性价比+过硬的产品力,不比参数,重在易用、好用,一句话:实用至上,发力to B端。
4. 亚马逊云科技2024 re:Invent中国行城市巡展活动已经开启。
阅读原文

AI的大模型(LLM)在零售行业有哪些应用场景

文章概要:

1. 零售阵地的全面数字化、智能化:包括客流分析及选址分析、智能货架、安全管理、门店经营智能助手、智能导购、在线智能客服方面。3. 总结:AI的LLM大语言模型语言理解能力达到人类水平,可以理解复杂指令和多轮互动交流,该能力可以应用在所有的消费者界面以及员工界面,重塑和改造现有的消费者体验,让用户操作大大减少,同时也全面提升员工的工作流程及效率。
阅读原文

目前大模型发展在放缓,还是提速?

文章概要:

1. 知乎上有人认为大模型发展到期,降低,更新。但作为大模型赛道一员,作者感觉客户对大AI应用接受度和认可度有增无减
. 大模型具有一定进入门槛市场竞争激烈,新进入者较少。大模型应用赛道有更多发展可能,但也在面临洗牌。
3 虽然今年以来,很多玩家很难保持刚成立时拼命三郎”的更新频率,但整体的“”力度和提升依然可观
. 大模型发展正呈现一些代表性趋势,如AI模型技术的与、大模型模态能力的开发、大模型的能力边界,发展AI agent等。
.现阶段大模型的度高逐渐告别生长的状态从百花齐放走向开花结果
阅读原文

一键部署2000多种AI大模型!不挑环境、不吃配置,神了!

文章概要:

1. Ollama是一个轻量级、可扩展的模型框架,Windows、LinuxMacOS等主流操作系统,包括Qwen、lama00大语言模型的庞大模型
2.ama提供了一键安装脚本,可以快速在Linux系统上安装Ollama
. Ollama常见的有ollama serve、ama create等。
4. 默认情况下,ama的目录如下:macOS为`~ollama/models`,Linux`/usr/ollama/.ollama/models`Windows为`C:\Users\username>\.ollamamodels`
5 最新版Ollama支持Hging Hub上直接取各种模型社区创建的UF量化模型。
阅读原文

鹏城国家实验室:6G网络通信大模型关键问题与技术探索

文章概要:

1 文章阐述了6G网络通信模型技术和未来方向> 2. 概述了6网络通信的研究背景与现状,探讨网络通信大的问题与挑战> 3 探索了生成式的感知一体化及通信,介绍了G基础大的进展
4. 对当前IEEE通信学会生成人工智能技术委员会GenAINet ETI”的情况进行了
阅读原文

35家央国企已落地66个大模型,国家队引领AI变革

文章概要:

1. 国资委多次对中央企业发展人工智能提出要求,国资央企正快马加鞭推动大模型布局,成为大模型落地的“新势力”。
2. 据不完全统计,央国企已落地的66个AI大模型布局,服务于企业内部实现降本增效的同时为外部千行百业赋能。
3. 国资央企在大模型的相关投入上基于其自身能力承担不同的研发任务:在通用大模型(L0)的研发方面,三大通信运营商承担主力军;行业大模型(L1)和细分领域专用大模型(L2)是大部分央企的投入重点。
阅读原文

科大讯飞:大模型商业化应用元年的下一步

文章概要:

1. 科大讯飞秉持“顶天立地”策略,推动大模型在G、B、C端市场的规模化落地,为AI的商业化应用开辟新路径。
2. 科大讯飞在大模型的风口浪尖,选择了一条扎实前行的技术之路,多年来不断积累技术优势,逐步打造了全面领先的通用底座大模型。
3. 科大讯飞在推动人工智能技术的自主研发与产业化应用方面积累了深厚的技术基础,始终专注于将技术前沿的进展与产业需求相结合。
4. 科大讯飞在数字化转型的浪潮中,成为了推动G端数字化转型的重要力量,围绕G端用户的实际需求,以人工智能技术为核心,打造了一系列高效、智能的解决方案。
5. 科大讯飞在保持G、B、C端协同发展的基础上,B端市场逐渐成为公司未来增长的关键领域,借助大模型技术的创新应用,公司在B端业务中不断拓展新场景与新需求,为行业客户提供更具竞争力的智能解决方案。
6. 科大讯飞在C端市场的广阔前景促使公司将目光转向这一领域,通过发力C端,科大讯飞希望快速积累用户基础,提升品牌影响力,并构建一个多场景、多维度的智能生态系统。
阅读原文

大模型应用开发平台标准第三次研讨会顺利召开,MaaS标准体系持续升级

文章概要:

1 随着大技术的发展落地应用千行百业持续深入提升人工智能技术综合应用效能、推动模型落地,服务(M相关产品涌现其中基于大模型应用平台企业和迅速基于大模型应用打通大模型赋能的一公里
. 中国产业发展AII)高度关注aaS发展联合信息通信简称中国信通院)成立MaaS工作组。
20212日,aaS组织《aaS模型即技术与应用要求 第6应用第三次来自中国移动、中国电信、华为云移动天翼数字生活理科技、通信信息浪潮软件、软通动力中国电信、电信等余家单位代表本次会议br>.标准了模型开发运营阶段阶段,工具的和,主要组件构建、体构建、应用集成运营维度指导产品方对标完善其M应用开发能力为方提供技术选型。br>.,信通院MaaS各单位和完善MaaS系列标准,我们也诚挚邀请来自各行各业的专家参与标准编制完善共同MaaS行业的发展!
阅读原文

科普|大模型时代,算力才是稀缺品?

文章概要:

1. 《追AI的人》AI科普系列短视频将的语言解释对于人工智能的普遍疑问,推动社会就人工智能的发展和达成共识。br>. 电影《券在》男主作为大模型研发底,办法去部门“芯片”芯片是承载了或TPU资源的计算力“核心,模型的训练强大的与高效的调度。<>3. 随着模型参数规模指数级和应用场景不断扩展对算力的正在以的飙升,“算力短缺”横亘在模型发展上一大阻碍<>4.算力发展面临,不仅与中美关系,还归因于在短期内还无法完全替代高端芯片满足大模型训练规模化应用,以及市场被区域性分割、大量私有化集群利用率低,有限的资源被利用造成浪费。
5.是支撑AI和大数据发展的动力,推动全社会生产力与生产关系的式,算力瓶颈已然成为竞争的赛点谁能破解一,谁就能掌握科技的“入场券”
阅读原文

大模型技术赋能金融行业:颠覆or重塑?

文章概要:

1 大模型技术的崛起,重新定义生产力,其核心优势在于高效的学习和的泛化,如多模态数据处理、迁移学习和上下文理解。
2 自2022年ChatGPT问世以来,大模型技术了快速,AI在金融领域的市场规模预计将从2的1亿美元增长到2025年370亿美元,年均复合增长率达23.37%。
3. 金融行业是一个高度依赖数据与信息领域,智能化技术的需求迫切大模型引入能优化传统流程,能企业在市场竞争占据。
. 大模型在金融行业的关键应用场景包括智能办公与文档生成、智能营销个性化搜索与知识管理、数据分析决策支持代码生成与技术支持。br>5.规模的快速增长最新显示,20年全球生成式AI的规模达到200亿美元,到22年突破00亿美元。中国生成式AI覆盖率上全球首位超过83机构已将大模型应用于业务。
6 区域差异与特色,市场技术在与风控方面的应用北美更注重数据分析与投资策略。br>7. 多领域融合发展,模型正在逐步跨越传统金融业务,资产管理、保险精算等高复杂度领域。
阅读原文

最新开源:腾讯上线迄今最大视频生成开源大模型!全球首个去中心化训练的10B级模型已正式开源!

文章概要:

1. 腾讯混元大模型宣布混元视频大模型 HunYuanVideo 正式上线并开源,是目前开源模型中参数最多、性能最强的生视频大模型,可以生成较强物理准确性以及一致性镜头的视频首个版本主要有画质偏写实、大幅度动作仍流畅性、理解复杂文本以及进行多主体交互、原生转场,主体保持直出的同时多切换4大特色,背后有模型采用了超大规模的数据处理、模型引入了模态语言模型作为文本编码器、模型架构使用了10亿参数的全机制和双模态ScalingLaw、模型了自研的3D VAE架构4项技术。除了基础的视频外,腾讯还拓展了 HunYuan 的应用功能,推出了视频配乐功能,能够为生成的视频提供音效与背景音乐,此外,腾讯还推出了驱动2D照片数字人的技术,通过语音、姿态和表情多种驱动方式控制照片数字人的动态表现。 2. 美国初创公司 Intellect 推出了首个去中心化的10亿参数训练项目INTELLECT-1,这是以去中心化、由社区协作训练的10B参数语言模型专注于开始训练,使用1万亿个英语文本和代码token,该模型在全球的1个节点进行训练,实现高性能和的动态扩展,在模型评估中,ELLECT-1多个基准测试表现优异,其性能与集中式训练的模型相当甚至有所超越 . UCSD 的张怡e 团队近日推出名为ognify新工具一工具工作的质量显著降低成本,业界的广泛瞩目,C是专为生成式AI工作流的多功能优化工具通过自动化的生成质量并降低执行成本,支持 LangChain、DSP 及注释 Python 编写的流,C基于层次化的流优化,将生成质量提高至多48%,并执行成本降低至9倍。
阅读原文

大模型拯救数字人

文章概要:

1. AI大模型与数字人的结合是一场恰如其分的双向奔赴,数字人是大模型给出的第一个答案,也是大模型商业化的重要途径。
2. 数字人的爆火可以追溯到4年前,当时的虚拟人分为平面2D数字人和3D超写实虚拟人两种技术路线,但都存在成本高、商业化空间局促、实时互动瓶颈等问题。
3. 生成式AI横空出世后,数字人迎来了转机,AI大模型加持下的数字人更加普及成本大幅降低,应用场景更加广泛。
4. 大模型要想解决商业化困境,需要回答产品、场景、成本三个问题,而数字人恰好是这三个问题的最大公约数。
5. 数字人看上去像是一个赚钱利器,但也并不意味着它能让客户躺着赚钱,数字人本身的价值其实非常有限,即使加入了AI能力,也无法凭空创造价值。<>6. 未来,数字人将成为AI大模型的服务入口,为客户提供更好的服务。
阅读原文

昨夜,亚马逊云科技发布大模型工厂,全球上百个顶级模型API自由调用

文章概要:

1 亚马逊云云计算领域的春晚re:Invent,发布了共计8款(6款已发布,款即将发布)模型全面涵盖了、、等主流模态场景。
. 亚马逊科技Amazon Bedrock Marketplace大模型交易市场,开发者可以在统一的上地发现测试和使用这些模型。br>3. Amazon Bedrock Marketplace提供了统一的API接口,意味着开发者不需要再为对接不同模型的而。
. 亚马逊科技发布一个叫Multi-agent collaboration的feature,复杂任务,靠单一大模型处理是完不成的,亚马逊云构建、部署和编排多个agent,协同处理的多步骤任务给抽象成了rock上面的产品功能。<5 亚马逊云科技的Nova系列模型表现可以说很惊艳最关心价格上,Micro、Lite 、和Premier的比Amazonrock上各个类别中的最强模型便宜了75!
阅读原文

【技术发展】大模型拯救数字人

文章概要:

1. 文章介绍了大模型拯救数字人的技术发展情况
2.提到了端侧AI应用提速,AIo芯片群雄逐鹿情况
阅读原文

特色活动 | 南京市人工智能产业团:场景驱动 产模融合——南京经开区举行大模型产业发展推进会

文章概要:

1 11月29日南京模型产业发展推进会兴智,会上启动了大模型集聚区公共服务建设,发布了“十大AI+应用”,揭牌了30母基金并签约基金合作项目,个科技入驻9个人工智能项目签约落地,颁发了智谷杯”模型应用创新大赛奖项和中国信通大模型样板间”优秀案例证书,发布了可信AI”模型评估最新结果
2. 南京市人工智能产业科技镇长供稿。
阅读原文

大语言模型评测中的评价指标:方法、基准和最佳实践

文章概要:

1. 介绍了LLM评估指标的重要性,包括答案相关性、正确性、上下文相关性、责任指标和任务特定指标等。
2. 解释了不同的计算指标分数的方法,包括统计类评分器、基于模型的评分器、G-Eval、Prometheus、结合统计和基于模型的评分器等。
3. 讨论了选择评估指标的方法,包括RAG指标、微调指标和用例特定指标等。
阅读原文

中移上研院交通大模型赋能港口集卡车辆监管

文章概要:

1. 港口外来集卡信息港口作业安全管理重要,但当前缺乏有效手段这些信息中上院车路协同引入港口,通过路侧相机实现对港内外来卡的有效识别检测已在港口进行落地。br>2.车辆识别检测方面,AI模型表现尚可,但存在泛化能力低、难以规模化落地等问题。大模型在部署对算力,计算时延也较高。中移研提出通过大模型知识蒸馏技术对大小进行训练小模型的和泛化能力模型在端侧的。br3 交通大模型与小能力已多个港口部署验证,对多港口交通元素感知识别其中对有人的识别准确率超9%,提升了感知效果此外,交通大应用还提升了跟踪定位的能力。
. 未来,移上海产业将继续行业伙伴大模型在港口细分领域的能力创新,打造场景解读、决策应用,助力港口细分领域化。
阅读原文

首次覆盖超 11 类真实编程场景!豆包大模型团队开源代码大模型全新基准

文章概要:

1. 豆包大模型Stack Bench,一个专注于全栈编程和多语言编程的代码评估数据集,首次囊括编程全栈技术中超11类真实场景,覆盖了16种编程语言,包含3374个问题,相比此前基准,可以更有效地评估大模型在现实世界中的代码开发能力。同时,高效的代码沙盒执行工具SandboxFusion也一起开源,用于评估来自不同语言的不同编程任务。
2. 为了支持FullStack Bench对多领域多语言编程的评测需求,团队开发了一个新的沙盒执行环境——SandboxFusion,该环境支持23种常用编程语言,能够满足不同应用场景(如前端开发和机器学习训练等)的需求。
3. 目前论文成果、数据集、沙盒体验均已对外公开。
阅读原文

Ollama对比Nexa,本地高效部署大模型

文章概要:

1. 本文介绍了llamaNex AI的安装与帮助开发者能够轻松运行管理AI模型
.Oama在Linux机器上可以使用命令一键安装,MacOS和可获取相应包后可从模型中心取并在运行也启动本地Web服务器通过Python脚本或man调用API获取数据
.a AI与Ollama,枢纽拥有更丰富资源,大型和小型语言以及、音频和视频模型,可通过链接下载Nexa,用户可快速安装其他操作系统用户可对应安装文件,通过Python的pip器进行安装安装后可Nexa枢纽拉模型到本地,使用命令启动Streamlit服务器,浏览器的使用模型
4. 最后提到《LangChain模型应用实践这本书,了Chain框架及其在构建高效AI应用中的所扮演,如何利用LangChain提升应用响应速度修复输出错误输出解析等技巧面向AI开发者数据科学家、机器学习工程师以及自然语言处理和应用感兴趣的中级和高级人员
阅读原文

大模型产业发展每周速递(11.29-12.05)

文章概要:

1 “模速空间”是全国首个大模型专业孵化加速载体,立足徐汇滨江,“百千万”目标,打造数据、、评测、金融、综合等功能平台,各通用大模型垂类大、大模型应用创新初创企业汇聚上海、引领、世界
阅读原文

中国青年报|上海:聚“模”力打造青年“希望之城”,大模型创业青年抱团发展

文章概要:

1 上海模速空间大模型创新生态社区是首个大模型专业孵化加速,徐汇滨江,打造功能平台,初创企业。
. 团徐汇区委以青年发展型城区建设为牵引,上海模速空间生态,打造“青年创造、青年共享、热爱”的“希望”
3 95后青年曾书霖的科技公司“无问”将总部落户徐汇滨江西岸的模速创新生态。br>4. 模速空间能满足初创企业需求,政策、减免、算力补贴服务等。
. 模速空间团委书记车龙表示,这里常驻办公人员超过10人,8岁的员工占比近三。
. 为了让入驻获得更多资源和平台速入驻青年的需求至今已举办分享会、对接会等主题活动超260场。br>. 9后青年、“酷爱科技”创始人张生态齐全,了不少人工智能大模型行业里的和资源。
. 徐汇滨江地区的松弛感”和丰富的模速的一个。<>9.速空间团委为创业者量身定制了青年活动品牌,涉及交友、休闲、、等方面。
阅读原文

大模型产业发展每周速递(11.29-12.05)

文章概要:

1 介绍上海模空间大生态社区
2.模速空间全国首个模型孵化和载体,基于“十千万”目标,多个功能平台各通用大模型、垂类大模型应用初创企业汇聚上海、引领、扬帆世界
阅读原文

《纪念碑谷》的视觉美学启示:探索视觉大模型在财务报销应用中的新视角

文章概要:

1. 纪念碑谷的视错觉现象为探索视觉大模型在财务报销中的新视角提供了启示。
2. 视觉大模型的组件包括图像编码器、提示编码器和掩码解码器,其思考路径包括数据预处理与输入、特征提取与层次构建、特征融合与高层决策、注意力机制的引入和迁移学习与快速适应。
3. 视觉大模型与物理世界的交互机制包括环境感知与特征提取、场景理解与语义构建、任务规划与策略制定、决策评估与风险考量、机器人控制与精确操作、多领域物理交互与智能应用。
4. 视觉大模型对财务工作的启发包括智能文档识别与处理、智能审核与合规性检查、图像分析与真实性验证、自动化流程优化与效率提升。
阅读原文

iPhone国行版确认接入百度AI大模型,你期待吗?

文章概要:

1 据The Information报道,苹果百度,为国iPhone接入百度苹果向百度支付AI大模型使用费用接入的是百度先进AI大模型 40。<>. 有消息人士透露,的AI模型在处理iPhone用户提出的问题,表现出不足和回答不准确情况。
. 除了技术挑战外,和百度在保护问题也存在分歧
4. 苹果希望利用Apple Intelligence来重振在中国市场的,苹果面临国产手机品牌的竞争,国内各大品牌都纷纷AI功能iPhone 1系列AI没有落地,其进度落后于。br>. 早在WWDC02之前,就传出苹果百度的,CEO库克不止一次中国业界猜测库克之行跟AI合作有关br>6 业内人士指出,与国内大模型合作,可以确保在人工智能服务时相关法规要求,避免潜在的风险。
7 百度国内大模型的较早入局者之一,宏202年11演讲,国内有20多家模型"文心的量比这20多家量加起来
. 在苹果之前,AI已经三星、荣耀硬件展开合作,最新旗舰Galaxy S4集成文心能力,心已了荣耀OS百模计划
阅读原文

封面故事 | 杨攀飞:亟须建立兼顾灵活性与可定制性的大模型评测体系

文章概要:

1. 随着文生图、文生视频等多模态技术的快速发展,科技巨头与研究机构竞相涌入大模型研发的浪潮,各行业大模型如雨后春笋般接踵而至。然而,面对功能多样、特色鲜明的大模型,用户在遴选最适合自身应用场景的模型时常常陷入选择困境。因此,建立一套兼顾灵活性与可定制性的大模型评测体系显得尤为迫切,旨在通过全面、客观的评估,以验证模型性能、提升模型质量、增强模型可信度,为用户提供可靠的选型参考依据。
2. 工业和信息化部电子第五研究所作为中国最早从事可靠性研究的机构,提供从材料到整机设备,从硬件到软件直至复杂大系统的认证计量、检验检测、工程监理等技术服务。作为业界领航者,电子五所积极推动人工智能技术应用,引领产业升级,加速新型工业化进程。
3. 2024世界计算大会上,电子五所推出了“人工智能计算系统性能测试套件(GCBS-AI)”和“人工智能服务器性能排行榜”,此套件集成了基础算力性能基准、训练场景性能基准及推理场景性能基准等多个程序模块,能够全面且多维度地对AI芯片、AI服务器、评估,为用户提供精准的算力选型支持。此举旨在强化技术支撑,助力人工智能产业迈向高质量发展新阶段。
4. 近日,电子五所人工智能团队负责人杨攀飞接受了《科技与金融》记者的专访,分享了对大模型评测公正性、客观性的思考与建议。
阅读原文

大模型“讲烂了”,变现才是王道 | AI光年

文章概要:

1. 大模型投资两极化,投资市场逐渐冷静,资方更看重商业可用性和变现能力,明星团队更易获得投资。
2.成为大模型企业的首要任务,只有证明自己的变现能力,才能在市场中生存。
3. 大模型的发展需要算力支持,国内通信巨头、头部互联网企业及共同推动超万卡集群技术革新。<>4. 大模型的应用场景多样,包括to B和to C,to B端更具确定性,央国企是重要推动力量。
5. 国内大模型的发展路线与北美不同,政策端的支持对AI的帮助尤大。
阅读原文

2024大模型落地企业现状:骤增的AI支出,和盛行的多模型部署

文章概要:

1. 企业AI格局正在迅速重塑,海外风险投资机构Menlo Ventures最新发布的《2024年企业生成式AI现状》报告对600名企业IT决策者展开了调研深入分析了这场变革中正在浮现的赢家与失利者。
2. 2024年是生成式AI成为企业关键任务的转折点,今年AI支出激增至138亿美元,是2023年AI支出的6倍多,这清楚表明企业正在从实验转向生产阶段,将AI嵌入其业务战略的核心。
3. 企业生成式AI投资彰显企业日益增长的投入决心,如今,60%的企业生成式来自创新预算,反映了生成式AI采纳的初期阶段。
4. 应用层领域热度攀升,企业广泛采用大语言模型(LLM),发挥其在各领域的优势,推动效率提升和功能创新。
5. 企业内部最具价值用例排名,部分用例已通过提升生产力或运营效率实现了显著的投资回报。
6. 智能体与自动化,当前的实施模式显示出对增强人类工作流程的明显偏好,而非追求完全自动化。
7. 自建还是购买,企业的选择几乎呈现均衡分布:47%的解决方案由开发,53%则来自供应商。
8. 企业在生成式AI采纳中更注重价值而非短期回报,投资回报率和行业定制化功能是挑选新工具时最关键的因素。
9. 附加式创新vs颠覆式创新,现有企业更容易受到初创公司颠覆。
10. 企业部门层面的转变,生成式AI的预算已渗透到企业的各个部门,覆盖了从研发到营销的多个职能。
11 垂直AI应用的崛起,首批生成式AI应用主要集中在文本和图像生成的横向解决方案上。
12. 深入探讨基础设施与现代AI技术栈,经过一年的快速演进,现代AI技术栈在2024年趋于稳定,企业围绕构成大多数生产AI系统运行架构的核心模块进行整合。
13. LLM趋势:多模型策略盛行,OpenAI让位于Anthropic,企业并未依赖单一供应商,而是采取务实的多模型策略。
14. 设计模式趋势:RAG崛起微调罕见,而智能体崭露头角,企业级AI设计模式正在迅速演进。
15. 向量数据库、ETL与数据流水线:RAG的基础,为了驱动RAG,企业需要高效地存储和访问相关查询知识。
16. 我们的预测,智能体架构将引领下一波变革,大卫战胜歌利亚:更多现有企业将倒下,人才荒:AI人才短缺加剧。
17. 数据来源方法论,本报告总结了2020年9月24日至2024年10月8日期间对名或以上员工的企业中的600名IT决策者进行的调研数据。
阅读原文

in讯 | ​InnoClub 大模型领域前沿速递

文章概要:

1. 马斯克全力阻止OpenAI转盈利,已向法院申请禁令,指控OpenAI及相关方进行多项非法行为。
2. 马斯克的机器人Optimus最新升级的灵巧手自由度翻倍,达22个,成功接住并控制网球。
3. AI2发布新一代语言模型OLMo 2,包括7B和13B两个版本,参数分别为70亿和130亿个。
4. LeCun称人类水平的人工智能(AG)可能在未来5到10年内实现,但大语言模型(LLM)不是实现AGI的正确路径。
5. /dev/agents宣布种子轮完成5600万美元融资,计划开发一个跨手机、电脑甚至汽车运行的云操作系统。
6. Gyges Labs宣布完成数千万元Pre-A轮融资,致力于利用光学+协同式AI技术能力,打造智能可穿戴设备。
7. 阿里巴巴国际AI团队推出的Marco-o1模型,专注于解决开放型问题,通过创新的self-play和MCTS技术,构建了具备反思能力的超长CoT数据。
8. 清华团队深入分析长上下文建模中的状态崩溃,Mamba这类RNN模型在长上下文中主要面临两个问题。
阅读原文

中国信通院正式启动《基于金融业务典型场景的大模型应用能力评估模型》首批评估工作

文章概要:

1 202年125日,中国院正式启动《基于金融场景的模型应用评估模型》评估工作。
. 中国信通联合四十金融机构科技共同编写了FLMM。
FL评估从价值提升、可靠性、安全性能力域切入,21个能力子域、54个能力项,并选取7大金融场景大银行特色场景大保险特色业务场景、3大证券特色业务,最后根据评分将业务大模型成熟度分为-。
. 中国信通将继续发挥优势,与行业协会、金融科技厂商展开深度合作,不断深化和完善FLMM内容,进一步助推大模型金融的、和应用
阅读原文

智能时代的巨擘:大模型驱动下的应用场景革新

文章概要:

1. 大模型游戏规则,进入AI智能化时代模型深度研习人类语言规律,睿智回应,在工农业等领域日益关键,拓展智能应用与深度br>2. 大大规模参数和复杂结构通常由深度神经网络,通过海量数据学习复杂模式和特征,具有更的化能力,ChatGPT对模型的体现出类似人类的归纳和思考能力
3 小模型通常指参数较少、层数浅的模型,轻量级、高效率、易于部署等,适用于数据量较小、资源有限;大模型通常参数较多、较,具有更强的表达能力更高的准确度,但也更多的计算资源时间来训练推理,适用于量较大计算资源充足的。br>. 截止到2024年3,中国大数量大概在30以上10参数的模型100个以上大模型的发展,以前产品完全不同过去是卖,现在是建生态。
5 大模型在企业营销、游戏金融、医疗已走得非常深入;AI模型还在、媒体影视、方面积极拓展市场;农业、、物流方面积极探索市场。
6 应用场景案例:企业入职AI化,有个金融,从的员工到员工入职,都用AI;AI+视频广告创意,的AKQA工作室利用AI回到过去,了比赛,199年ena雷娜·威廉姆斯与赢得2017年澳网的ena进行对决。
阅读原文

从AI大模型(LLM)到AI 智能体(Agent),AI新时代已然到来

文章概要:

1. 作者认为2024年是人工智能普通百姓生活重要一年,随着AI模型M应用,其影响力扩大
. 11月1日世界02大会上“秒哒”的,标志着智能体走入了大众视野中。
3. 大语言模型(LLM)可以生物体的,AI Agent可以被看成一个有手能够执行的实体,核心的决策中枢,为AI Agent提供驱动。
4. 大语言模型AI Agent的结合可以通过一系列步骤实现智能应用的落地,包括集成与、输入处理、和生成、与、反馈和学习
5.医疗健康领域,AI Agent可以结合大语言,大量的健康数据帮助医生诊断疾病、治疗监控病人的过程br>. 在教育领域,AI Agent可以大模型,为提供的学习资源和辅导。<>7. 通信网络发展如此,诺基亚认为所有网络都具备AI的属性,网络直接智能自动化,具备感知、和的(如自动驾驶汽车)提高运营效率并推动业务增长。
阅读原文

AI大模型在汽车后市场的落地密码【深度洞察】

文章概要:

. AI大模型在汽车后市场发展:AI大模型发展汽车后装市场对数字化转型的需求,AI大模型在汽车后市场的应用潜力及重点应用场景。
2. AI大模型在汽车后市场应用案例分析:故障诊断与维修-AI修车大模型,保险金融-二手车金融助贷平台。
大模型对汽车后市场的趋势:AI大模型在应用趋势,AI大模型对汽车后市场的影响
阅读原文

2024数字科技生态大会丨首个央企全自研视频生成大模型发布

文章概要:

1 12月3日在2024科技生态大会,TeleAI开发者在广州。会上,AI视频生成大大模型产用平台、具身、传等创新技术、产品及科研,并发布开发者产业联盟计划> 2. 中国总经理梁俊出席并致辞,CTO、首席科学家、中国电信研究院(TeleAI李龙作主旨演讲
3.央企全自研视频生成模型打造了“ST(Video As Storyboard from Text)阶段视频生成技术”,文本描述精准勾勒出包含视频构图、主体目标位置及姿态等信息“故事”(board生成视频
4. 基于知识的万物布控视觉大模型现已升级至TeleSearch.0基于知识的万物布控,实现动态知识挂载和事件认知,并驱动复杂逻辑理解
5 首届TeleAI开发者大会共建AI开发新生态,李学龙以“当梦想进现实”进行分享,并发布星海AI中台、天翼AI开放平台智能体平台等开放平台开发者大幅降低门槛,构建低成本、高效率创新开发生态
6.期间,AI还宣布华为、中兴、亚信科技等19合作伙伴发布中国电信人工智能开发者联盟,聚合各方力量,推动人工智能发展,提升技术能力与应用为开发者
7 在本次数字生态的线下展台,Tele展示了一系列在具身方向的创新,可以用于生活服务的人形机器人面向商场及展会场景小辰服务机器人视障人士提供导盲机器狗,及整合了一系列大模型的AI智能眼镜
8.了软件工厂、慧记、智能体产品、中国电信家庭小管家、星辰大模型一体机等一系列智能产品,让现场观众感受已来,就在每个人的
阅读原文

大模型赋能新质生产力,思谋科技持续引领智造创新生态 | 基石小伙伴

文章概要:

1. 思谋科技多个领域获得认可,包括贾佳亚教授团队获得SIGGRAPH Asia“时间检验奖”,富士康举办交流会,刘枢博士入选胡润35创业,思谋AI-A产品获工锂电金球奖·年度奖。
2. 贾佳亚的论文在结构边缘检测矢量化、无缝克隆等多个应用场景表现出色,推动了图像处理领域。br>3 思与富士康共同举办AI大模型智能制造交流会”,大模型技术、关键应用落地挑战等议题展开深入探讨。
4. 刘枢博士入选24胡润U3创业先锋榜”,他在人工智能领域的贡献和商业价值了更广泛的认可<>5. 思科技的蓝膜-AOI外观检测设备获得2024高工锂电金球奖·产品奖,该设备以SMore ViMo视觉AI检测平台为,对电芯30无外观缺陷的高效检出。
阅读原文

大模型落地与前沿趋势研究报告

文章概要:

1 该文章的标题是《大落地与趋势报告。
阅读原文

央企引领:学习AI正当时 | 35家企业落地66个大模型!

文章概要:

1. 在政策推动下,央企迅速布局模型领域,66个模型在央企落地应用。
2 中核集团打造了国内首个领域生产力平台“龙吟·万界,同方股份推出了华知模型”2.0和农业知识大。
3 中国电科发布了万法和观大模型,电科太极了式人工智能大模型”,科推出“智弈大模型。br>. 中远海运科技发布首个航运大模型Hi-Dolphin。
学习和技能已迫切的、必备的生存与发展。
阅读原文

龙吟风云 | 酒业大模型:白酒数字化转型的机遇与挑战

文章概要:

1 白酒行业在数字化转型中面临机遇与挑战大模型出现其带来新的思路与方向。
2 市场营销和供应链管理是白酒企业重要领域,模型技术可以通过深入分析画像和市场等因素,提升营销效果优化供应链管理<> 3.让大模型技术白酒企业中落地生根,需要多管齐包括引进和培养人才、开展对外云计算和大数据等技术手段、保证数据质量以及持续优化大模型。
4 酒业模型的开发是一个持续优化的过程,企业关注用户反馈和数据,积极学习行业的,推动大模型在行业的,数字化转型
阅读原文

大模型产业创新发展大会在南京成功举办

文章概要:

1 大产业创新发展在南京举办,由中国人工智能产业发展联盟,南京经济技术管委会主办。<>.经开区蓝主任在致辞提出经开区人工智能产业目标和,数据局党组成员、省大数据中心吴中东主任致辞中了要素市场人工智能升级的支持作用。
3 本次大会中国院发布多项人工智能相关成果《人工智能发展报告(24)》、首批大模型“样板工程”案例“可信AI”的评估“可信AI成果
. 南京正式启动“南京大模型集聚区服务建设项目了“十大+应用”,了3亿元基金的及基金合作项目的仪式迎来了5科技项目入驻,了9工项目的签约公布智杯”大应用创新大赛企业获奖情况
5.同期还举办多个分论坛,“模态大模型论坛”智能分”“模型分论坛“可信智能化分论坛”。
阅读原文

大模型落地与前沿趋势研究报告 | 量子位智库

文章概要:

1. 经过一年多的发展,大模型行业现状受到关注,量子位智库将在《大模型落地与前沿趋势研究》中相关问题
2. 目前中国大市场规模约20亿元,主要由B端交付类项目、模型API以及应用开发平台构成其中B端交付类项目大部分市场且偏好云上部署
. 大模型业务模式主要包括模型、API、应用搭建三部分,其中模型最核心,是目前行业最主要的业务模式了绝大部分
4. 云上部署是目前大普遍的部署方式,成本和运维相对较低,尤其受客户欢迎,云趋势未来仍
.数量上看,教科类、通信(运营商)、、政务金融是目前公开披露落地项目最多,在今年第二季度落地项目数量出现了明显
.金额上来看,、能源、通信()教科类,金融是项目总金额最大的行业,其中政务和能源项目金额较大行业季度出现快速增长
7. 大模型在多个行业实现覆盖,广度较好,但应用深度受到模型能力限制
8. 目前Scaling Law已经不仅限于范式下的预训练,后训练和成为和预的Scaling路线,推进大模型提升
9. 过去一年,国内大在场景的模型能力缺乏辨识度,同时其他的细分方向众多,因此未来的厂商将减少在通用的投入,更多聚焦在容易落地的垂直场景
10. 国内市场来看,互联公司在模型竞争中将获得更多优势,阿里、字节、腾讯、百度,互联网公司自身有云业务全栈支撑大的预研、训练和推理,又可以大模型赋能自身业务,优势较为明显
1 海外市场来看,格局已经收敛到头部5家,预期未来几年持续巨投入AGI,剩余腰部玩家生存空间将被进一步挤压
阅读原文

大模型理解与应用研讨会在北京大学召开

文章概要:

1 202年124,大模型应用研讨会在北京大学镜春园9号甲教室。<>2. 研讨会于大规模语言模型邀请了国内语言处理与模型领域的学者进行精彩报告
. 北京理工大学燕作题为《高性能小规模语言研究及垂直领域实践的报告
. 中科院自动化所成庆作题为大语言模型与脑神经解码方法探索》<>. 复旦大学黄菁教授作题为面向科学智能大模型拓展能力增强。<>6. 哈尔滨大学秦兵作题为大模型多元价值观》报告。br>7. 中科院软件所先培研究员作《RAG从外部记忆增强知识自》。br>8 清华大学孙茂教授作《图灵到纳人工智能走向“合一”的探索的。> 研讨会的最后,东岩研究员组织了Panel Disscussion,与参会者一起讨论大模型与领域的重点问题
阅读原文

AI的神经元:初识大模型

文章概要:

1. 大模型是一种基于深度学习的人工智能模型,它能够从海量的文本数据中学习并理解人类语言的模式和规则,这些模型通常包含数十亿甚至的参数,通过复杂的神经网络结构来模拟人类的处理能力。目前,国外的知名LLM有GPT-3.5、GPT-4、PaLM、Claude和LLaMA等,国内的有文心一言、讯飞星火、通义千问、ChatGLM、百川等。
2. AI大模型的发展历程经历了预训练模型、大规模预训练模型、超大规模预训练模型三个阶段,每年参数规模至少提升10,参数量实现了从亿级到百万亿级的突破。目前千亿级参数规模的大模型成为主流。
3. AI大模型发展正从以不同模态数据为基础过渡到与知识、可解释性、学习理论等方面相结合,全面发力、多点开花的新格局。
4. 国内外巨头在领域的竞争已经白热化。OpenAI已引领大模型发展的。微软借助对OpenAI的投资与合作,将旗下Office办公产品全线整合,已在3月下旬推出Copilot Office。5月24日,微软宣布Win11接入GPT-4。
国内大模型网页流量和应用下载量节节攀升,安卓应用商店中豆包累计下载超1.6亿,讯飞星火累计下载更是突破1.2亿,大模型已经成为日常生活中的重要助手。
阅读原文

没有百度大模型的战场,还能谈终局?

文章概要:

1. 大模型技术竞争走向深水区,成为巨头围猎的赛场,也蕴含新机遇。
2. 大模型领域竞争格局转变,巨头凭借技术积淀和资源积累主导潮流。
3. 大模型技术研发需要高门槛和资金需求,让许多AI创业公司望而却步。
4. 大模型技术的研发需要深厚的积累与人才储备,科技巨头具有天然优势。
5. 2024年被业内普遍认为是大模型领域的转折之年,互联网巨头们将围绕大模型技术展开更为激烈的竞争。
6. 大模型技术的复杂性和对资源的高需求,成为了AI企业追求做大做强必须跨越的门槛。
7. 百度成为推动大模型领域发展的核心玩家,国内其他大厂也紧随其后。
8. 大模型产品的飞速普及,推动了文心大模型调用量在2024年的跨越式增长。
9. 随着大模型技术的持续渗透,AI应用场景正变得愈发细分。
10. 智能体已成为生成式人工智能应用的主流形态之一,成为连接用户与各类服务的新桥梁。
11. 多模态技术的应用拓展了生成式人工智能的边界,赋予了人工智能系统更多维度的感知能力。
12. 自动驾驶是新质生产力典型代表,也是多模态大模型的典型应用场景。
13. 大模型领域的竞争已不再是单纯的技术比拼,而是涉及产业资源、商业模式和生态构建的全面较量。
14. 大模型仍是一项“半熟的技术”,创业公司可以通过前瞻性技术判断和独特的应用场景切入,寻求差异化发展路径。
15. 未来的终端载体或生态系统的创新也将带来新的市场机会。
阅读原文

专注企业级大模型落地,「识因智能」完成数千万元首轮融资|36氪首发

文章概要:

1. 「识智能近期完成万元的首轮融资,北京市石山区现代创新产业发展基金有限公司领投。
2. 识因是于209年的公司,专注于将AI落地到企业生产环节。br>. 识因智能自研的“轻舟大模型,一个在约50亿参数基座上进行了精细化训练的语言模型,语音、、视频多模态、多任务等通用人工智能能力。
.智能当前的业务主要面向的To B市场业务落地上,倾向于大专业模型相结合的应用方式br>5. 识因智能推出包括在智慧政务、智慧警务、工业企业等场景的解决方案。<>. 识因024也信创一体机的产品,包括了、算法、模型层及多功能应用,能够做到开箱即用,并守护用户数据安全。<>7 搭载了识因智能自研的“轻舟智算运行管控系统”后,相同的模型下,系统能够节约一半的计算资源而不影响模型表现,并且将资源利用率从条件下的40%,提升至9左右。
8. 当前,识因政府、企业领域已经有多家客户并且已稳定的商业化收入。<>.春辉表示,025年会是识市场化上提速的一年。本轮,也主要公司前沿的研发,并推动在领域的拓展和应用落地。
阅读原文

大模型学习(一)-向量在大模型中的作用

文章概要:

1 引言部分指出向量是现代AI系统中的核心要素,将向量在大模型作用。
2 解释了什么向量以及向量化的和作用,便于计算机处理捕捉数据特征和关系、计算效率等。
3. 阐述了向量在中的基础作用,表示输入、和置、隐藏状态<>. 探讨了向量在高级作用,包括表示上下文信息、生成和推理、多模态中的表示
.使用向量模型中存在的缺点,如计算资源高、维向量的、过度拟合的风险等。
阅读原文

6 款大模型官宣后,生成式 AI 淘汰赛的号角正式吹响了

文章概要:

1. 亚马逊云科技Invent 上宣布推出六自研基础模型 Amazon Nova 系列,包括文本处理模型 Amazon Nova Micro、多模态模型 Amazon Nova Lite 和 Amazon Nova Pro、最强多模态模型 Amazon Premier、图像生成模型 Amazon Nova Canvas 和视频生成模型 Amazon Nova Reel。
2. 亚马逊云科技还更新了 Amazon Bedrock,增加了模型蒸馏和降低幻觉的新能力。 阅读原文

AI大模型助力低空经济开启全新商业模式

文章概要:

1.GPT将大模型推向科技前沿,大模型技术的行业应用广泛,低空经济的也越来越受关注。低空经济以低空飞行活动为,涵盖多个应用领域,具有依托三维空间等特点<>. 大可以在能力创新和创新两方面为经济赋能。在产品能力创新,模型用于飞行器设计与、空中交通管理、无人机物流配送等;商业模式大模型商业决策、客户服务、行业拓展等。<> 低空规模呈井喷式,大模型为低空的注入强大能量,其成为新的增长点,相关产业,有利于打造高端产业,促进城市产业结构升级。
阅读原文

盘点已问世的中医药大语言模型

文章概要:

1. 中医药是中国传统科学的瑰宝,传承创新发展中医药是新时代中国特色社会主义事业的重要内容。随着大语言模型技术的蓬勃发展,中医药学迎来了数字化和智能化转型的新机遇。
2. 文章介绍了多个中医药大模型,包括‘‘’’、‘‘海河·岐伯’’、‘‘数智岐黄’’、‘‘数智本草’’、TCMLLM、ShenNong-TCM-LLM、‘‘Huang-Di’’、‘‘本草智库’’、‘‘、‘‘华佗’’、‘‘岐黄问道’’、‘‘讯飞星火’’、‘‘聪宝素问’’、‘‘天河灵枢’’、中医药横琴大模型等。
3. 这些模型在中医药领域的应用包括中医临床辅助诊疗、中医药知识问答、中药方剂推荐、药材质量控制、病症辅助诊断、新药研发以及健康管理等方面。
阅读原文

王海军研究员:矿山行业大模型建设路径探索与应用展望

文章概要:

1 王海军研究员《行业模型路径应用展望》在《煤炭科学》上。<>. 文章深度剖析了大模型技术在行业应用面临的,研发投入高高质量数据搜集难度模态数据融合技术高等<>3. 论文还了矿山行业大与应用关键问题矿山行业建设应开源模型数据相结合的,大模型以赋能业务场景、构建“---”相结合生态助力行业质发展。
阅读原文

国产大模型打响生存战

文章概要:

1. 大模型创业公司与大公司间的攻守易位,发生在不到2个月之间。
2. 不到12个月里,字节跳动在大模型上后来居上。
3. 曾经每个月都消息,也有近半年不再出现。
4. 去年冬天,阿里、字节射出反方向子弹。
5. 不要正面竞争,然后呢?
6. 大模型创业公司可能的出路是:大厂看不上的、小众的产品方向,或愿意干脏活、累活。
7. 半熟的技术,半新的战场。
阅读原文

国产大模型打响生存战

文章概要:

1. 投资人讨论如何卖掉手中大模型创业公司股份
2. 悲观心态在投资人中公司可能很难打赢大厂
3. 字节跳动在大模型上后来居上,口碑迅速翻转
4. 创业公司与大公司间的攻守易位,发生在不到12个月之间
5. 阿里的激进投资,一举扭转了市场情绪
6. 字节快速包抄的种子,也萌芽于去年冬天
. 创业公司们,也只能带着从的资金和算力,投入这场艰难的战争>8. 创业的一条道理是不要与大公司正面竞争,尤其是不要在大公司的强项上竞争
9. 投资人也逐渐认清现实:模型能持续比字节好,比的也好,而且好得很明显,这很难,最终要赢在产品
1 创业公司可能的出路是:找大厂看不上的、小众的产品方向,或愿意干脏活、累
11. 另一条路是等待
12. 中国掌握极强产品能力和流量资源的不止字节。微信还没出手呢14. 尚未成熟的技术,是创业者的机会所在:如果大模型能力还能持续进化,前瞻的技术判断和跟随能力,也许有四两拨千斤的效果
15. 半新的市场,则大公司的砝码:如果大模型能力提升短期遇阻,应用开发和产品表现会更依赖现有移动互联网基础设施,这就是一个烧钱、拼资源的游戏
阅读原文

AI大模型·白皮书 | 2024年企业AI大模型应用落地白皮书-亿欧智库

文章概要:

1. 报告针对企业AI大模型需求与痛点、探索与成功路径未来趋势与策略建议进行分析洞察
2. 提供ChatGPT学习资料(视频+课件+代码)目录。4. 适合学习AI人群IT工程师/产品经理。
阅读原文

央国企入场,国家队引领AI变革!35家企业落地66个大模型!

文章概要:

1. 国资委推动国资央企布局大模型,已有66个大模型在央企落地应用。
2. 央企采取“为根、算力为本、以用促研”的发展思路,发挥自身优势,推动技术创新与产业融合。
中核集团发布“龙吟·万界”和“华知大模型”2.0,中国核电发布“知识管理平台(i-知识)”,中国航天科工发布“爱信诺·信诺GPT”财税产业大模型,中国船舶发布百舸船舶行业大模型,中国电科发布“万法”大模型和“法观”大模型,中国石油发布330亿参数昆仑大模型,中国石化建设勘探开发和炼油化工2个行业大模型,中国海油发布“海能”人工智能模型,国家电网发布配网视觉大“思极GPT”,南方电网发布“驭电”智能仿真大模型、电力大模型——“大瓦特”、电力线缆的守卫者——“极目”、“电力鸿蒙OS”、智能巡维机器狗——“吠云”、“祝融2.0”、配网AI大模型、带电作业机器人——“悟空”、新能源发电预言家——“夸父”、输电人工智能大模型(大瓦特CV),中国三峡发布大禹大模型,国家能源发布工业设备综合诊断运维AI大模型和”平台,中国电信发布星辰系列大模型,中国联通发布联通元景大模型,中国移动发布“九天”系列通用大模型,中国电子发布星智政务大模型,中国一汽发布GPT-BI大模型,中远海运发布-Dolphin大模型,中国中化发布“天枢”智研化工大模型,中国建科发布星辰-住建行业大模型国家开发投资集团发布“天擎”公共安全大模型,招商局集团发布“ShippingGPT”大模型,“三舅健康管家”智能体和数智本草大模型,中国商飞发布“东方.翼风”大模型,中煤集团发布中煤智掘管控平台和中煤“地知”大模型,中国煤科太阳石矿山大模型、煤科卫士大模型ChinamjGPT、地质垂直领域大模型GeoGPT,铁科院发布“铁科智问”大模型,中国中铁一局发布中铁万新大模型,中国航信发布“千穰”大模型,中国广核集团发布锦书大模型,中国绿发发布泰山大模型,北大荒发布寒地作物大模型,上汽集团发布汽车行业AI售后维修大模型,河南省医学科学院发布VisionFM伏羲慧眼”大模型,山东能源发布盘古矿山大模型,西安光机所发布“华山”航天私域大模型。
阅读原文

数字孪生与大模型结合,推动工业制造新未来

文章概要:

1. 新一代信息技术与加速融合工业领域数字化、转型显著,孪生技术崛起并得到广泛应用。
2. 数字孪生创建物理工厂的虚拟数字化模型为工业制造带来多维度效益,包括提升生产效率控制、资产安全、管理决策、生产创新。
3 大模型在工业制造领域意义重大,处理和分析海量的工业数据,潜在与价值为设备的智能化、生产工艺的优化等方面提供有力支持<>4. 数字孪生与大结合在工业制造展现出广阔的,将为制造更多的和变革
阅读原文

MaVEn:面向多模态大模型多图理解的连续/离散视觉混合编码策略

文章概要:

1. 本文分享了NeurIPS 2024论文MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model,北大联合阿里提出MaVEn:面向多模态大模型多图/离散视觉混合编码策略。
2. 论文指出当前的MLLMs在多图像推理任务上面临视觉信息冗余与序列长度问题、语义抽象能力不足、多模态对齐与跨图像推理的困难等挑战,基于此,作者提出了一种名为MaVEn(Multianularity Hybrid Visual Encoding Framework)的混合视觉编码框架。
3. 本文提出了一种基于多粒度视觉特征的多模态大语言模型(MLLM)架构,能够有效增强多图像理解能力。图像输入被编码为离散符号序列和连续高维向量序列两种形式此外,了多场景中连续视觉序列的冗余信息和无关表示,并缩短输入上下文长度,框架还引入了一种基于文本语义引导的动态视觉特征缩减策略。
4. 模型的训练分为训练补丁选择器、扩展LLM嵌入层以适应多模态词汇表、优化视觉微调四个阶段。
5. 为验证Maven在多图像场景中的有效性,本文评估了其在多图像视觉理解和推理方面的表现,结果表明,Maven在多个任务中表现优异,在多图像理解场景中具有显著优势。
6. 本文还探讨了Maven对单图像视觉理解和生成的提升效果,结果表明,Maven在单图像理解任务中的性能也显著提升。
7. 消融实验结果表明,多粒度混合编码在保留语义细节和高效推理方面具有优势,补丁缩减机制在保持比例为0.25时性能最佳。
8. 定性分析结果表明,离散标记可表示高层语义,于选择与离散视觉语义相关的图像块,离散视觉标记在多图像推理过程中引导语言模型关注视觉信息。
阅读原文

LLM2Vec: 解锁大语言模型的隐藏能力

文章概要:

1. LLM2Vec是一种新方法,将大型语言模型转化为更强大的文本理解和组织工具。
2动机是解决大型语言模型在深度理解任务中的表现不佳问题。
3LM2Vec启用双向注意力、掩码下预测和无监督学习方法提升模型性能。
4. L2Vec原理是重新思考大语言模型读取,让模型能够同时关注整个句子段落。
5. LLM2Vec实验使用主流LLMs测试性能,在单词级和句子级中评估模型。
6 LLM与监督学习的结合在文本嵌入任务中创下了新记录。br> 7. LLM2的优势是高效性,无需额外的文本长度。
8. LLM2Vec在提升LLMs文本理解能力方面迈出重要一步,信息检索、文本分组以及其他NLP任务带来了新可能性。
阅读原文

大模型在人形机器人的潜力与价值

文章概要:

1. 人形机器人领域的研究重点领域包括自主导航自主学习与适应、自然语言交互与处理、视觉感知与处理、工作规划与控制/人体控制、多模态融合、情感计算机互动、驱动的优化创新等,这些方面通过提升人形机器人自然语言理解、视觉感知规划多模态融合自主和情感计算等方面的能力,极大推动其开发的和应用的。
2. 端到端方法特别适合解决人类复杂问题,减少手工设计的步骤,具备潜在的性不过同时训练难度很大,需要较多计算资源、数据和时间,其可解释性也比较差。比较推荐基于模块化和端到的资格架构,用端到端处理子任务,大模型采用控制架构,通过整体的可解释来。<>3. 以家庭服务机器人为例整个处理过程。首先,在感知中,使用LO进行物体检测CLIP理解自然语言。在规划模块中*算法进行路径规划,化强化学习进行任务分解和子规划。而在决策模块POMDP进行环境建模和实时决策与用户进行语言。最后,在到端子任务处理阶段,在特定的抓取任务中,使用端到端的强化学习方法直接图像到抓取动作。
4. 从人形机器人的成本来看大模型的必要性,模型主要与硬件的传感器选型、云服务、操作系统、模拟环境等因素,直接影响到超过5的结构,技术架构时候需要重点考虑内容同时b端工业客户的后续维护性和培训(成本不高、口碑重要)也是关键点。
阅读原文

大模型的各种版本Base,Chat,Instruction之间有什么区别?如何选择适合的模型版本来满足特定的应用需求?|大模型

文章概要:

1. 大模型的各种版本、Instruction之间有什么?如何选择的模型版本满足特定的应用需求?
.近年来的语言LP),随着预训练模型(如GPT系列、ERT系列等的迅猛发展针对不同应用场景和使用需求出现了多个模型版本br>3 Base模型通常指的是经过大规模任务特定微调的基础模型,是一个普型的训练模型,能够处理各种常见的语言任务,文本生成、文本和语言等。<>. Chat模型针对对话生成任务设计模型,它Base模型进行进一步微调和。
5.模型在Base模型的基础上进一步优化的,专门针对指令理解和执行任务。
6 在实际应用,合适的模型版本于的需求。如果是与用户进行多轮对话,模型一个更好的;如果是用户指令某项特定任务如编写代码或摘要,Instruction模型可能更适合而如果只是处理一些基本的文本任务Base模型是一个可行的选择
.、ChatInstruction模型虽然都是类似预架构,但它们训练目标和应用场景有所。模型更加通用,适语言任务Chat模型于对话生成,能够处理轮的上下文而Instruction则注重指令的与任务执行能够高效处理任务。在选择合适的模型时,需要根据任务的需求来进行决策
阅读原文

深度解析金融大模型评测:多维度透视,精准把脉

文章概要:

1. 前言:大模型技术在金融行业的应用成为数字化转型的新引擎,评估其实际效果需要考察多个方面,包括金融学术和业务知识、金融安全能力、金融智能体能力、技术成熟度、需求频次、场景价值、监管合规性、用户体验和成本效益分析等。br>2. 大模型评测方法:包括选取评测模式、设计评测基准、确定评测方法和定义评估策略。评测模式包括问答模式、GPT评分模式和竞技场模式,评测基准包括通用能力评测基准、能力评测基准和安全能力评测基准,评测方法包括生成式的方法和基于困惑度的方法,评估策略包括客观类评估和主观类评估。
3. 金融业务场景评测分析:给出了智能选股基准测试评估、智能选基基准测试评估和资讯基准测试评估三个券商业务场景的具体评测需求参考。
4. 小结:构建金融大模型评测体系需要明确评测模式、评测方法、评测基准和评价策略四个关键点,一个科学合理的金融大模型体系,将有助于更准确地评估模型性能,为金融业务提供可靠支撑。
阅读原文

首次覆盖超 11 类真实编程场景!豆包大模型团队开源代码大模型全新基准

文章概要:

1. 字节跳动豆包大模型团队开源FullStack Bench,一个专注于全栈编程和语言编程的代码评估数据集,该数据集在业界首次囊括编程全栈技术中超11类真实场景,覆盖了16种编程语言,包含3374个问题,相比此前基准,可以更有效地评估大模型在现实世界中的代码开发能力。同时,高效的代码沙盒执行工具SandboxFusion也一起开源,用于评估来自不同语言的不同编程任务。
2. 为了解决当前评测基准覆盖的编程语言和应用类型较为有限,难以全面反映真实世界中代码开发场景所涉及的各种编程能力的问题,字节跳动豆包大模型团队与M-A-P开源社区联合提出FullStack Bench,一个涵盖多个真实应用领域和编程语言的评估集,旨在评估大型模型在各种真实世界代码开发场景中的能力。
3. 为模拟全栈开发的实际应用场景,研究团队分析了全球最大程序员技术问答社区Stack Overflow上的问题分布,从中提炼出常见的编程应用领域。
4. 为方便开发者对大模型代码能力进行系统性测试,豆包大模型团队还开源了一款高效的代码沙盒执行工具——SandboxFusion,用于来自不同语言的不同编程任务。
5. 发布评测基准及沙盒的同时,研究团队也基于FullStack Bench对全球二十余款代码大模型及语言大模型的编程表现进行了评测。
6. 我们提出的全新代码大模型评估基准FullStack Bench,以及沙盒执行工具SandboxFusion,旨在为AI在真实编程场景中的表现潜力提供快速评估参考,从而推动代码大模型的发展。
阅读原文

干货+资料 | 大模型赋能金融行业落地,您的全新业务伙伴已就位

文章概要:

1. 大模型从概念走向实践,推动各行业变革,在金融领域为业务创造价值
2. 11月9日智能云千帆思享会,探讨金融领域模型应用发展现状及趋势>3. 百度智能云金融业务部总经理徐旭强调业务价值和因地制宜策略,推出产品助力金融行业本增效
. 兴业银行金融科技应用长佳介绍数字化转型情况,正与百度智能云等伙伴探索AI应用落地
5. 百度智能云解决方案总监陈杰认为生成式AI可帮助区域银行减负,带来弯道超车
6. 百度智能云产品部副总经理夏莹介绍金融智能体应用‘智金’,可轻量化解决点状问题
.胜天成行业解决方案总监李清华普适CEO陈啸翔认为模型结合知识图谱提供更综合的AI解决方案
8. 大模型将渗透至金融行业核心场景,为金融机构带来本增效的收益
阅读原文

满满的干货:AI大模型对网络五大需求及技术应对方案

文章概要:

1. AI大模型对网络的需求主要体现在五个方面,即超大规模组网、超高带宽、超低时延、超高稳定性及网络自动化部署。
2. 为了应对这五个方面的需求,本文对业内一些主要的应对技术、思路和方案进行了梳理,供读者进行系统优化时做参考。
3. 具体内容包括超大规模组网需求及应对、超高带宽需求及应对、超低时延需求及应对、超高稳定性需求及应对、自动化部署需求及应对。
阅读原文

大模型推动企业数字化转型

文章概要:

1. AI的演进之路:从生成式AI到通用AI
2. 大模型的构建与应用:自建与协作开发的行业大模型
3. 对MaaS及其工具链的探索
4. 大模型推动云服务创新
5. 大模型赋能数字化转型
6. 从云网协同走向算网融合
7. AI加速数化发展
阅读原文

打破LLM数据孤岛!Anthropic革命性MCP让大模型解锁全网数据

文章概要:

1. Anthropic开源了「模型上下文协议」MCP,LLM的数据孤岛彻底打破,LLM应用和外部、工具都将无缝集成。
2. MCP是一个开放协议,目标是实现LLM应用程序与外部数据源和工具之间的无缝集成。
3. MCP的核心架构是客户端-服务器架构,其中多个服务可以连接到任何兼容的客户端。
4. MCP的强大之处在于,它通过相同的协议同时处理本地资源和远程资源。
5. MCP对于大模型来说至关重要,它是连接人工智能与现实世界应用的桥梁,确保了创新的可及性、透明和协作性。
6. 可以利用M SDK来轻松创建具有MCP能力的服务器与客户端,实现相应的功能。
7. 作者给出了一个案例:利用MCP实现Claude Desktop访问查询本地SQLite数据库,来说明整体的交互工作流程。
8. Claude研究人员在短短5分钟内,使用MCP就将Claude和搜索引擎连接起来。
阅读原文

首个央企全自研 AI 视频生成模型发布,预计2032年全球“类Sora”规模将超180亿|钛媒体AGI

文章概要:

1 中国研究院(TeleAITele 开发者大会发布基于星辰大模型的大模型
2. 该模型是国内首个央企全自研的 视频生成,目标通过语义、语音、生图多模态能力打通短剧及影视制作各个环节,覆盖文字脚本撰写、镜脚本绘制、视频拍摄及、配音及音效合成等全流程降本增效
3. 随着Sora爆火国内运营商企业也开始与快手等一起卷” 视频了。
阅读原文

技术应用 | 大模型在金融领域的应用与安全研究

文章概要:

1. 大模型在金融领域的应用与安全研究。
2. 大模型的发展与应用,包括大模型架构、在金融领域的应用、金融大模型的开发框架。
3. 金融大模型安全,包括内生安全及应用安全。
4. 总结与展望,随着深度学习技术的发展和研究逐渐深入,未来大模型的攻防将在动态抗衡中不断升级,金融大模型需要应对的新型安全威胁将不断涌现和升级。
阅读原文

会议报道|“渐近渐远”:从人脑记忆到大模型记忆的未来之路

文章概要:

1 为了AI的长期记忆难题,2024年118日121日在浙江嘉兴召开的中国中文信息学会024学术年会暨第三届全国大模型生成(CIPS-LMG 24)上,脑主办了主题为“模型与人脑记忆渐近渐的论坛。
2. 盛大AI Tech负责人姜迅发表了题为《长期记忆,AI自进化基石》的主题演讲,的演讲围绕三个关键问题:为何AI的进化需依赖长期的?可以人类大脑的长期记忆中获得启发?突破瓶颈模型的进化?
3. 伊利诺伊大学芝加哥分校刘兵教授讨论了学习及其对记忆的。他首先提出了“持续学习理论,并描述了两个依靠大语言模型LLMs)提示的持续学习,系统表现均显著优于现有使用LLM微调或的。
4 北京大学贵从记忆的理论研究,了的及其在人工智能中的应用启示。他实验了表征在、保持和提取的变化,发现记忆从视觉皮层到高级皮层的规律,认知地图,将碎片化知识转化为结构化知识。br> 5. 西安交通大学刘均教授从层面梳理了大模型的强大根基及其缺陷。他指出,大模型的依赖于算法(如反向传播、Transformer架构)、大数据和算力的,但其在灾难性遗忘、推理能力弱和高能耗等存在。
6. 中国科学院自动化研究所余山研究员类脑智能的发展目标,探讨如何借鉴人脑推动人工智能进步。基于人脑中认知控制的神经机制,提出了具有1)运动信息处理和)抽象概念生成与表征两个层级的架构,两个层级具有双向的信息交流系统具备从与环境的互动中提取概念的,并可以不同的智能体之间通过交流实现传递。
阅读原文

大模型长文本所面临的主要问题

文章概要:

1. 大长文本时面临一些特殊的挑战和技术细节,包括的输入长度限制、生成质量控制、计算资源消耗
2. 输入长度限制是指大多数大语言模型对输入的长度有一定的限制,解决方案包括截断、处理和窗口化
3. 长文本生成推理的是指在生成长文本时大模型可能会上下文的连贯性解决方案包括增量、精心设计的提示词和模型微调
4. 计算资源消耗指处理长文本需要更高的资源解决方案包括分布式计算和化技术
. 长的摘要与信息抽取是指长文本处理并不是希望生成完整的文本,对文本进行摘要、关键词分析任务,解决方案包括抽取式和式
6. 上下文的和问题是指长,尤其是跨段落、跨的,模型可能处理时丧失上下文信息,解决方案包括输入和外部记忆机制
7. 根据不同的应用,长文本的处理方式和技术细节也会不同,的场景和相关技术包括长文本问答、长文本生成长摘要
阅读原文

AI大模型的第一批果实被谁摘了?

文章概要:

1. 2023年初,GPT3.5发布,引发了各大互联网公司对模型的竞争。随着大模型的不断迭代与渗透,谁是最大受益者成为关键问题。
2. 最大受益者可能隐藏在垂直应用领域,如Meta、谷歌、微软等巨头,以及Applovin和Pinterest等中等体量的公司。
3. Applovin是一家移动广告技术公司,其AI应用主要通过Axon引擎算法实现。Axon 2.0相比1.0时代,在自动化、素材生成、准确性和广告活动效果等方面都有了显著提升。
4.同样受益于大模型技术,其广告业务也得到了增长。Pinterest的大模型应用场景更加宽泛,在C端用户体验和商业端都有应用。
5. 并非所有加入大模型赛道的公司都是受益者,一些公司尽管大模型产品进入,但并未直接转化为收入,主要模型基础设施不足,以及C端体验改善尚未转化成商业收入。
阅读原文

推动大模型自我进化,北理工推出「流星雨计划」

文章概要:

1. 本文介绍了来自北京理工大学计算机科学与技术学院的流星雨计划,该计划旨在深入研究大模型自我进化的理论与方法,推动大模型的发展。
2. SRA-MCTS是一种通过自我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程的方法。
3. 流星雨计划提出一个由弱到强的进化框架来引导大模型自我进化的整体流程,包含导师监督学习、自我评估能力习得、自我提升训练三个关键阶段。
4. 作者对比了应用Meteor进化方法后LLM前后各维度的性能变化,在准确性、完整性、相关性、连贯性和可靠性方面,LLaMA3-8B-Instruct和Qwen2-7B-Instruct取得了性能的提升。
阅读原文

AI大模型的第一批果实被谁摘了?

文章概要:

1. 最大受益者隐藏在垂直应用领域,Meta的Advantage+平台在应用生成式AI帮助营销收益,包括降低转化成本、提高广告创建数量、用户使用时间。 2. Applovin:大模型重构在线广告,两年市值翻倍,其AI应用主要是通过其引擎算法Axon实现,Axon 2.0通过AI驱动的预测建模,帮助广告商更加高效地投放广告。 3 Pinterest:大模型生态闭环代表,增长背后亦有隐忧,其广告也受益于大模型技术的驱动,大模型的应用场景相比Applovin更加宽泛,在C端用户体验可能是到大模型调用量最大的场景。 4. 如何成为大模型浪潮受益者,并非所有加入大的公司都是受益者,不少公司尽管大模型产品已经进入应用,但并未直接转化为收入,这当中一个重要原因是大模型基础设施不足,以及C端体验改善尚未转化成商业收入,但成本端却是实实在在的投入。
阅读原文

月狐分析|大模型落地K12在线教育,校外场景的产品功能持续创新升级

文章概要:

1. 双减政策下,AIGC落地应用为教育行业带来新生,国家和地方都在推动人工智能大模型落地赋能教育行业
2. K12校外在线教育应用使用数据有所增长,从Top5应用看整体市场发展
3. 大模型落地校外在线教育带来功能的升级创新,“启发”与“引导成为关键词
阅读原文

央国企入场,国家队引领AI变革!35家企业落地66个大模型!

文章概要:

1. 自2023年起,国资委出台政策要求中央企业加速发展人工智能。2024年2月,国资委明确指出,中央企业要“开展AI+专项行动”,强化需求牵引,加快重点行业赋能,建设多模态优质数据集,并打造从基础设施、算法到智能平台的大模型赋能产业生态。
2. 已有66个大模型在央企落地应用,既于企业内部降本增效,也为外部行业赋能。在大模型的研发投入上央企根据其自身优势承担不同任务。通信行业作为主力军,三大运营商已发布了各自的千亿参数基座大模型。许多央企将行业大模型和细分领域专用大模型作为重点投入领域,如南方电网的电力行业大模型“瓦特”和中国石油的能源行业大模型“昆仑大模型”。
3. 部分央企大模型介绍:中核集团的“龙吟·万界”是国内首个核领域数字生产力平台;中国航天科工的“爱信诺·信诺GPT”是百亿参数规模财税垂直领域大模型;中国石油的“330亿参数昆仑大模型”具有创新的四层架构;中国石化的勘探开发、化工2个行业大模型计划于2025年底全部建成;国家电网的“思极GPT”是首个在电力专业领域落地应用的大模型产品;南方电网的“驭电”智能仿真大模型可以支撑多种场景;中国电信的“星辰系列大模型”已广泛应用于多个领域;中国联通的“联通元景大模型”已实现10个行业应用;中国移动的“九天”人工智能基座由万卡级智算千亿多模态大模型、汇聚百大要素的生态平台共同构成。
阅读原文

大羽模型完美适配海光全新代AI服务器,成功开创安全应急大模型一体机应用新时代

文章概要:

1. 11月27日,“大羽安全应急”与海光信息技术股份有限公司DCU100_AI”成功适配标志国内首款“大羽安全应急模型一体机”诞生。
2. “大羽应急模型”是广云科技面向应急领域构建的领域大
. 海光信息技术股份有限公司高端处理器的领军企业,本次适配在构建的国产化CPU与DCU的优良环境展开,仅两周完成全方位测试。5. 未来,大羽应急模型将以更为卓绝的智能表现服务于公共安全事业,为推动公共安全智能化和现代化贡献坚实力量。
阅读原文

腾讯版Sora震撼开源:130亿参数大模型,可免费生成4K电影感级别内容!

文章概要:

1. 腾讯推出混元视频生成大模型并全面开源,是AI视频制作领域的飞跃
. 该模型10能够制作逼真视频画面,根据提示词视频内容,能自动镜头,镜子或反射场景中内外一致性。br>. 腾讯混元视频生成模型超大参数规模和技术实力,成功实现超写实画质、符合提示的视频画面生成。br>.具有超实质感、语义能力、画面流畅性、原生镜头转换功能四大核心优势。
5. 腾讯混元生成采用DiT架构,并在多个方面进行了创新升级。
6. 腾讯这个拥有130参数的视频大模型在ugging平台和Github上都进行开源,与个人可以免费,甚至可以自己的生态。 阅读原文

大模型:重塑制造业应用新场景

文章概要:

1. 大模型技术在工业制造快速发展,成为制造业数字化转型的关键动力,其应用,涵盖生产数据分析、智能需求分析、产品设计助手、智能排产、设备巡检、智能故障诊断等多个方面。
2. 生成式AI在制造业的各个环节都发挥着重要作用,大模型在多个维度助力制造业的转型升级并加速应用落地,特别适合解决具有大场景、大语料和问题边界清晰的业务场景。
3. 大模型工具平台降低了制造业从模型训练到智能体构建的实施难度和成本,覆盖大模型私有化应用全周期。
4. 大模型知识助手帮助企业客户实现可用知识源规模扩大、构建与运维成本降低等价值。
5. 大规模设备更新是新型工业化的基础,工业大模型在设备选型优化、优化、预测性、智能优化、数字化升级、人员培训辅助等关键技术环节全方位赋能大规模设备更新。
6. 工业大模型是新质生产力的核心驱动力因素,通过数据驱动的生产优化、智能化的生产决策、个性化定制生产以及协同合作与供应链优化等方面的作用,推动企业实现的质的飞跃br> 7. 工业大模型正在成为重塑全球制造业竞争格局的新将为中国经济发展注入新的动力,也会为中国企业带来千载难逢的“换道超车”良机。
阅读原文

AIGC引领金融大模型革命:未来已来

文章概要:

1. AIGC引领金融大模型:未来已来。大模型的开发和应用,深刻着金融服务的面貌,提高业务效率,优化客户体验,并重塑风险管理。<>. 金融模型的应用:风险管理、量化交易投资建议、欺诈预防、智能客户服务
3. 金融开发面临:数据隐私和性和、数据偏见和倾向性、伦理、能力的
4策略:全面加强数据隐私安全管理、加强模型的、建立监测和机制提高的可解释透明度。>. 未来,金融大将在、交易个性化投资、金融欺诈和预防以及智能服务方面更大作用,为金融行业更加智能化、便捷。
阅读原文

重磅更新!Otty大模型上线!

文章概要:

1. Otty大模型上线它是一个超级AI助手能像一样思考反应速度极快可用于写、分析、生成图像等。
2 Otty大模型能满足用户需求,为用户生成论文大纲、思维导图与流程图。
3. Otty大模型艺术分身是超级绘画大师,帮助用户在艺术创作和视觉设计异彩,可根据用户描述创作作品,能提供创意设计建议
4. ChatMindAI能聊天了两套搜索逻辑,智能体为结果的基本单元会话视图和以单对话搜索单元消息视图
5.MindAI了+NN的模式,可选择‘仅我的’或仅AI角色’,特定AI角色在对话中检索AI交流。
阅读原文

“天工开悟”农业大模型发布

文章概要:

1. 智慧农场技术与系统全国重点实验室研发的“天工开悟”大模型正式发布,该模型是集问答大模型、多模态大模型、生长大模型、具身智能大模型为一体的综合性农业服务平台。<悟”农业大模型通过中央网信办备案,成为国内正式批准上线的农业领域大模型 ,在模型评估、敏感信息过滤、伦理道德审查等方面进行了全面论证。
3. 本文主要对“天工开悟”的问答能力及多模态能力进行了详细介绍,同时对待发布的生长大模型和具身智能大模型进行了简述。
4. “天工开悟”农业大模型已在中央网信部完成备案。
5. “天工开悟”农业大模型由刘劼教授、姜京池副教授 、杨洋副教授 、关毅教授团队共同研发。
6. 本研究团队将在未来陆续发布作物生长大模型、农机具身智能大模型等最新研究成果。
阅读原文

快速了解AI大模型

文章概要:

1. 发展:大模型了期、沉淀期爆发阶段br>.架构:Transformer架构、注意力机制和预训练与微调。br> 特点:规模庞大、海量算力巨大、和泛化强,但存在局限性。<>.领域:应用医疗金融、、娱乐教育和科研等领域。br>. 代表:ChatGPT、心通义问和讯飞星火。<>.趋势多融合、低成本部署行业融合安全与伦理规范。
阅读原文

首届中国养老院院长大会嘉宾分享——张浩:养老行业千亿大模型赋能机构数字化转型

文章概要:

1. 康养产业面临一系列挑战,包括发展层次水平不高、供给体系与康养需求不匹配等,需要加强新质生产力科技赋能、创新。> 2 2024年月北京健康养老集团与卓世联合发布北京养老千亿大模型”,模型国内首个养老行业模型
3. 北康养成立于021年0,是京能集团全资子公司,发展“普惠养老、机构养老智慧健康适老服务”核心主业。02年1月,卓世科技与其签署战略合作,并成为其行业大模型技术提供方br> 4. 2年北康养承接多家养老综合体的建设运营任务数字大屏可替代现场服务人员进行考察接待服务讲解、与老年人互动及心理慰藉。br 5. 寿山福是民营养老机构的知名,202年月寿山福与卓科技签署战略合作协议已经落地监测智能床+大模型项目,为入住老年人提供安全、安心安享的健康睡眠监测服务。br 6. 通过“北京养老服务网Web、小程序增加智能客服人,天X2节假日无休地提供高质量个性化的客户交互。<> 7. 智能养老教育培训方案基于北康养教培基地改造的需要,提供可复制的线上数字人专家复刻、数字助教/读和数字的能力,线下通识教室、实操教室的改造方案。<> 8 北京养老行业千亿,具备千亿规模神经元的新一代对话式人工智能落地实践,全国首个养老千亿级别大模型。
阅读原文

54页|大模型行业可信应用框架研究报告

文章概要:

1. 《大模型可信应用报告》由蚂蚁科技股份有限公司和信息通信研究院发布,深入探讨了大模型技术在、医疗、等领域应用的挑战解决方案
. 报告提出了系统化的大应用,构建一个以大模型核心的智能体系确保应用的专业性、可控真实性和安全性
. 报告分析了大模型各领域,包括模型技术不足、保障体系构建不全等问题,并提出了具体的技术实现路径
4. 报告展示了大模型可信应用在金融、医疗、等领域的应用案例,智能投顾、智能就医、数字社工等>. 报告对模型技术和的趋势进行展望了算法演进、工程突破、应用落地、体系产业生态多个维度推动大模型可信应用
阅读原文

国内AI对话大模型有多少?让我们一起数一数

文章概要:

1. 文章介绍了目前国内面向普通用户AI对话大模型包括通义千问豆包智谱言K、元宝讯飞星火、天工AI、海螺AI、商汤商量、东太、·浦语、Deep、GPT、心一言、360智脑
2 文章指出,这些AI大的研发厂商包括阿里云、跳动智谱&清华大学、之暗Moonshot AI、腾讯、科大讯飞、万维与奇点智源、Max、汤、中国自动化研究所、上海实验室方量化(零一万物)、舟科技、、30<> 3. 文章强调,这些AI对话大模型功能包括实时记录、创作、代码模式、搜索、搜索搜索、我写作、AI多文档阅读、生成、浏览器插件、提示专家、绘画(混元文生)、智能体(全面)、内容写作、搜索、页、、视频、音乐图像识别分析、知识库、智能体、学术写作、搜索整合、文档助手、推理、、搜索。
4. 文章建议用户根据的需求和习惯选择自己的AI对话大模型。
5. 文章提醒用户,文章介绍的对话大模型为15个,且不做排名,仅代表作者的使用观点。
阅读原文

OCR多模态大模型:视觉模型与LLM的结合之路

文章概要:

1 本文提出一种名为Guidance OCR的方法,解决多模态模型视觉信息抽取时出现的字。该方法不额外训练模型,利用O算法获取图片中的文字内容,再OCR识别出的对VLM的生成过程进行约束。<> 2 Guidance OCR任务设定是将CR出、需要的和对应的图片输入,利用多模态大模型获取信息抽取。br> 3单个字段信息抽取的场景下,模态大PromptResponse的要求是将识别出内容组合一个字典,并保证大模型的输出内容为字典树上连续的边
阅读原文

腾讯混元大模型,上线AI视频,并且开源

文章概要:

1. 腾讯混元大模型发布,视频生成能力已上线且模型开源,向全球开发者共享
2 该模型视频生成功能允许用户文本描述生成高质量视频内容,中文和英文多种视频尺寸和清晰度选择。
腾讯大模型视频生成质量上达到新高度在多个关键指标上表现出色,在场景时。
4. 该模型采用先进的DiT架构,并进行多项重要升级,更高效的文本编码器全局注意力机制以及混合分编码器<> 5 腾讯选择将这一先进模型开源,通过Hugging平台和Github,与个人可免费和使用。
阅读原文

大模型落地现状:全球视角与创业机遇

文章概要:

1. 从国内外大模型落地的现状,探讨其对运营和的,并展望未来的创业机遇> 2. 国外大模型落地现状:企业采纳情况、科技巨头的布局、市值与影响力
3 国内大模型落地现状:政府与国企的推动、民营企业的响应、效率提升与合作
4. 创业机遇:70%的有独立创业的意向,创业者可以围绕大模型技术新的应用,提供定制化解决方案,或者构建大模型的服务平台
阅读原文

大模型落地现状:全球视角与创业机遇

文章概要:

1. 企业数智的过程缘起 ,归于智能化
2. 国外大模型落地现状:企业采纳情况、科技巨头的布局、与影响力> 3 国内大模型落地现状:政府与国企推动、的响应、效率提升与合作
阅读原文

再见,传统软件开发!这个新一代开发范式,彻底火了!

文章概要:

1. 今年AI在编程领域有很大进步,如Cursor、Cline等AI编程工具让编程变得容易,也让专业编程人员工作效率提高。但同时,大家担心AI会抢程序员饭碗。
2. 传统软件开发流程像一条链子,包括需求、产品设计、架构设计、开发、测试、运维。在这条链子中,产品经理和程序员都是技术含量很高的职位,他们之间很难互相替代。
3. AI大模型新的开发范式,包括简单需求不再需要软件开发、普通需求实现不再非得依赖专业程序员、复杂任务仍然离不开专业程序员,但AI将显著提高开发效率,缩短项目周期。
4. 为了帮助快速学习、理解、掌握和实践强大的AI Agent智能体技术,我们特别邀请了多位业内顶尖专家,精心打造了一套企业级项目实战的《3天AI Agent项目实战直播训练营》。
5. 3天的直播课,阿里P9级大佬带你快速掌握AI Agent体核心技术和企业级项目实践经验。
6. 限时优惠,原价199元,现在报名只需19元。
7. 大厂都在战略布局AI Agent智能体,这是大势所趋,现在处于红利期,企业需求旺盛。
8. 课程原价199元,现在仅19元就能拿下,抢完立刻恢复199元。
9. 今天报名再送4个专属福利,包括AI Agent智能体训练营配套学习资料、学习笔记、AI Agent智能体大厂面试真题100道、2024年中国AI Agent智能体行业研究报告。
阅读原文

微调大模型—大模型的“幻觉”

文章概要:

1 大模型的“”指生成文本时,模型产生与事实不符、不准确或完全虚构。这种现象通常发生在生成式AI模型中,模型输出了看似合理且具有逻辑性,但实际上偏离真实情况或训练数据中的信息。在某些专业中,由于知识点更加集中且可能存在模棱两可的情况,这种问题可能会更加。
. AI产生什么样的“幻觉”:事实不一致、逻辑不一致;事实捏造;指令不一致。4 降低大模型“幻觉”通用措施:提高训练数据;事实核查能力;使用更先进的架构和技术;实施处理;强化用户反馈循环;限制生成长度与多样性。
5.措施在垂直的:的通用在实际操作特别是在领域,可以参考以下做法。
. 实验结果:优化提示工程后的大模型回答:如两个数字的比较错误,我们纠正AI的比较规则,就能得到正确的回答了。
阅读原文

【图书】基于大模型的RGA应用开发与优化-构建企业级LLM应用

文章概要:

1 大模型在专业生产领域的应用方向是RAG和Agent,本文主要介绍RAG。
2. “”是大模型在试图生成内容或回答问题时,输出的结果不完全正确错误。
3. RAG的基本思想是将传统的生成式大模型与实时信息检索技术相结合,为大模型补充外部的相关数据与上下文,以帮助大模型生成更丰富、更准确、更可靠的内容。
4. 微调是对基础模型在少量的、已标注的数据上进行再次训练与强化学习,以使得模型更好地适应特定的场景与下游任务。
5. 在实际RAG应用中,对于不同的应用场景、客观条件、工程要求,会有更多的模块、架构与流程的优化设计。
阅读原文

京东大模型十大应用场景

文章概要:

1. 京东物流凭借在AI大数据、运筹学等领域,全面升级了基于大模型的智供应链技术全景——“京东超脑”,将数智化深度渗透仓运配营销、客服等全环节,实现了全面降
2. 京东物流脑通过融合数字孪生技术,将数据驱动的规划与模拟相结合,网络、运输网络配送网络的规划,驱动了供应链全局最优,更实现了成本的降低>3. 京东超脑运输网络强大的资源统调和最优调配能力,自研的分布式仿真技术,实现了级订单全网线路分钟级孪生模拟及百万级数据分钟级的处理
. 京东超在末端配送方面引入了与路规划技术,区域特点、订单分布及配送人员,智能规划站点选址与配送覆盖关系为配送人员优化配送路线
5. 京东超集成先进技术和软硬件协同,实现了存储拣选、打包、分拣等场景的智能化
. 京东超脑深度整合大模型技术,了场景的高效利用和降低>7. 京东超脑引入的智能拣选技术,实现拣选场景引导和精准高效
.超通过智能包装技术,实现了包装场景的高效和成本降低>9 京东物流脑智能分拣,了分拣场景智能决策和效率提升
10 京东超脑视角和智能算法,实现了供应链的全局优化降本
阅读原文

面向金融场景的大模型 RAG 检索增强解决方案

文章概要:

1. 概述:检索增强生成(RAG)模型结合信息检索与生成式人工智能优点,在特定场景下提供更精准相关答案,本方案介绍如何使用平台PAI构建面向金融场景的大模型RAG解决方案。
2. 前置准备:包括开通PAI后付费、创建OSS存储空间、开通Mil数据库、准备数据集、部署LLM和Embedding模型等。
3. 使用PAI-Designer构建知识库:包括读取OSS数据、文本解析分块、向量生成、索引存储等步骤。
4. 使用PAI-Lang进行模版构建:包括新建应用流、配置应用流等步骤。
5. 使用PAI-LangStudio构建在线应用:包括配置专有网络链接、部署RAG应用、与大语言对话等步骤。
6. 案例对比:给出金融和医疗领域使用和不使用RAG解决特定任务的案例对比。
阅读原文

腾讯混元AI视频大模型震撼发布,多镜头切换打造电影级效果 | 含内测邀请通道

文章概要:

1. 腾讯推出混元视频生成大模型,且可自我部署,提供内测邀请通道。br> 2.效果展示,包括穿过红杉林、潜水员发现沉船等场景。
3. 介绍使用方法,下载元宝APP、进入AI应用、申请使用等。<> 4. 说明目前只能生成“标准品质”视频2次,“”视频1可通过邀请好友注册使用的方式额外获取。
5. 提供代码和模型下载地址,有部署能力的用户。
6.网页版的新增功能,如氛围、类别、高质标签等。
阅读原文

[方案实操]基于AI大模型的数据治理

文章概要:

1. 大模型是指具有数千万甚至数亿参数的深度学习模型,其原理是基于深度学习,利用大量的数据和计算资源来训练具有大量参数的神经网络模型。
2. 大模型面临的挑战包括训练和使用需要大量的计算资源和存储资源,成本较高,以及训练需要大量的标注数据,但标注数据的获取和整理成本也较高。
3. 数据治理的框架和核心内容包括管控域、过程域、治理域、技术域、价值域,以及数据战略、数据治理管控体系、数据架构、主数据、元数据、指标数据、时序数据、质量、数据安全、数据集成与交换、数据开放和共享、数据资产管理能力成熟度评估以及数据价值、数据共享、数据变现等多方面。
4. AI大模型在数据治理中的应用包括数据标准管理、元数据管理、数据质量管理、数据安全管理等方面。
5. 大模型下数据治理的未来展望包括更加注重智能化技术的应用,利用人工智能和机器学习技术对数据进行自动化的分类、标签化和质量检测等操作,提高数据治理的效率和准确性。
阅读原文

6 款大模型官宣后,生成式 AI 淘汰赛的号角正式吹响了

文章概要:

1. 亚马逊云科技在 re:Invent 上发布了六款自研基础模型 Amazon Nova 系列,包括 Nova Micro、Nova Lite、Nova Pro、Nova Premier、Nova Canvas 和 Nova Reel。
2. 亚马逊云科技宣布 Trainium2 正式可用,Trainium2 采用了先进的封装技术,将计算芯片和高带宽内存(HBM)模块集成在一个紧凑的封装内。
3. 亚马逊云科技发布了 Amazon Bedrock Model Distillation 功能,使用户能够快速蒸馏出高效的小尺寸模型。
4. 亚马逊云科技发布了 Amazon Bedrock Automated Reasoning checks 功能,能利用自动化推理检查来应对模型幻觉,提升模型的精准度。
5. 亚马逊云科技宣布对 Amazon Q Developer 进行新一轮增强,相关功能包括自动执行单元测试、提供文档与代码审查智能体,旨在帮助开发人员在整个软件开发过程中加快构建速度,并帮助用户在短时间内解决运营问题。
阅读原文

超级SIM行业大模型简析

文章概要:

1. 超级SIM卡是涉及多领域的融合产品,希望结合大模型能力,将积累的卡行业数智,建设超级SIM大模型产业数智发展。
超级卡是在传统SIM卡上,扩展存储空间、新增安全算法、应用动态加载NFC刷卡等,演进而成的可承载敏感数字的安全<>3. 行业大模型基于通用大模型技术,特定行业应用场景的,能够通过深度学习和自然语言技术,为行业定制化解决方案
. 中国移动规划建设超级SIM行业大,其定位“精通SIM的全能专家”,该行业大模型全面的知识储备、领域、更强的推理
. 在超级SIM行业大模型中,中国移动从超级需求出发,SIM卡特点和行业模型应用梳理规划知识体系,优化模型架构,安全要求,拥抱国产可控能力
SIM行业大模型思路完成搭建能力验证未来中国移动会进一步超级行业模进行优化和提升。
阅读原文

“投毒”字节大模型的实习生,不是“一般人”?

文章概要:

1. 曾因恶意行为被辞退实习生田柯宇,在NeurIPS 2024荣获最佳论文奖,篇论文是他在字节跳动实习期间与团队共同发表的
2. 田攻击字节跳动训练集群,他利用Huggingface的load ckpt函数漏洞,craft了一个看似正常的ckpt文件,但其实是加了payload进去,然后就可以远程执行代码,修改参数
3. 法院判令田柯宇赔偿侵权损失800万元及合理支出2万元,同时要求其公开赔礼道歉
4. 田柯宇团队提出了一种全新范式——视觉自回归建模(Visual Autoregressive Modeling,VAR),VAR包括两个独立的训练阶段:在图像上训练多尺度VQVAE,在token上训练VAR Transformer
5. NeurIPS全称神经信息处理系统大会(The Conference on Neural Information Processing Systems),是人工智能(AI)、机器学习(ML)和数据科学领域最负盛名且最具影响力的会议之一
6. 今年,是NeurIPS第38届年会,将于下周12月9日-15日在温哥华召开,顶会一共接受了15671篇论文,录用率为25.8%
阅读原文

基于大模型与知识图谱融合的文案生成流程:智能手机行业应用分析

文章概要:

1 随着人工智能技术的发展大模型知识融合的生成成为智能营销的。将详细一流程结合智能手机行业进行剖析。br> 2. 大模型知识各有优势,模型能力强大、适应性强、语言理解强;知识图谱领域、关系推理和更新能力将两者,发挥各自优势,局限性。
3.文案生成之前构建知识图谱收集必要的行业数据这一的任务确保图谱涵盖了的知识能够文案有力。> 4 在知识图谱构建完成后大模型进行融合,生成更加精准且符合的文案这阶段的是如何大模型知识图谱优势有机结合<>. 在完成大模型图谱的后,即可开始生成。生成这一的阶段,多个的紧密配合
. 文案生成后,反馈是关键通过广告效果监测分析,可以学习并再优化
阅读原文

【应用】当破产法邂逅法律大模型

文章概要:

1. 法律大模型是基于人工智能技术构建的法律领域专业模型,通过分析和学习海量的法律文书、、法规等,具备了法律文本提供法律咨询、案件等能力。br> 文章介绍了几款实用的大模型,法信法律大模型Power Law GLM得理法搜、法宝和LawPT。<>. 以法信大模型为例,了大模型在破产中的应用,法规检索解读智能辅助、法律服务法律文书、法律文献和案例学术论文检索。
阅读原文

大模型在金融风控领域技术实现与应用场景

文章概要:

1. 大模型在风控领域技术实现与应用> 2. 贷风控与贷后
3 交叉性金融监控
4. 信用风险管理 6. 大模型> 7. 风险管理 目录
阅读原文

vivo AI Lab出品:蓝心大模型(BlueLM)实战部署与体验全攻略

文章概要:

1. 蓝心大模型(BlueLM)是 vivo精心打造的一款自研通用大型语言模型矩阵,涵盖了从十亿到千亿不同参数量级的五款模型。
3 vivo AI Lab官方选择了业界广泛认可的OpenCompass评测框架,对 BlueLM模型进行了一系列的标准化测试。
4. BlueLM的应用领域非常广泛,包括内容创作辅助、知识问答系统、逻辑推理与分析、代码生成和软件开发、信息和数据分析、自动化办公等。
5. 文章介绍了BlueLM的部署体验,包括环境准备、Base 模型示例、命令行 Demo 体验、网页Demo 体验、量化部署推理等。
阅读原文

观点 | 谨防金融大模型应用风险

文章概要:

1. 人工智能大模型各行各业领域也不例外大模型在金融领域的应用前景光明,但也带来了一些新风险。
2. 大模型进一步推广可能会加剧金融行业的“两极分化”头部金融机构在大模型的能力开始显现出明显优势,中小机构与头部机构之间将被逐渐拉大。
3 大存在的缺陷也可能给金融系统带来安全,专业能力有限、生成结果不可控、算法可解释性等问题。
. 金融机构对少数大型科技公司的基座大可能形成新的风险点,服务商运营出现问题或系统出现故障,将对金融的稳定严重。 阅读原文

【研报-3560】2024交互型多模态大模型研究进展、应用前景以及商业模式分析报告

文章概要:

1. 报告提供限时下载部分内容受篇幅限制仅列举。
2.欲获取完成版PDF文件,关注公众号后,中回复“-356。
3. 本报告已上传知识星球,高质量报告知识星球即可下载,知识星球:https://.z.com/iEqjaEu。
温馨提示:有任何问题或合作可微信号:1184388,扫描二维码添加微信好友
阅读原文