今日AI-大模型-2024年12月6日

发现全网最新的AI内容

AI大模型震撼新作:ProtGO框架实现蛋白质功能引导建模,多模态统一表示学习取得重大突破

文章概要:

1. ProtGO框架将在NeurIPS 2024发表,实现了蛋白质序列、结构和功能的统一表示学习,在多个下游任务中取得了显著突破。
2. ProtGO框架采用了教师-学生网络的创新设计,教师网络处理蛋白质序列和结构信息,整合GO注释信息,使用定制的图神经网络处理空间信息,采用GO编码器学习功能表示;学生网络简化输入,仅需要序列和信息,共享教师网络的GNN模块,无需额外的功能注释输入。
3. ProtGO框架采用了多模态融合、知识蒸馏策略、消息传递机制、分布对齐、损失函数设计、实验结果与性能评估、技术优势与应用价值、未来展望与局限性等技术。
4. ProtGO框架在蛋白质折叠分类、酶反应分类、GO术语预测、EC编号预测等任务上取得了显著优势,证明了其功能引导的有效性。
5. ProtGO框架的提出为蛋白质表示学习开辟了新的方向,为蛋白质功能预测和药物设计等领域提供了新的工具和思路。
阅读原文

阿里Marco-o1推理大模型技术报告解读!

文章概要:

1. OpenAI推出了o1模型,阿里研究团队受此启发,开源了Marco-o1推理模型,旨在增强其推理能力。
2. Marco-o1通过思维链微调、蒙特卡罗树搜索、反思机制和创新的推理策略提供支持,适用于的现实世界问题解决任务。
3. 论文主要特点包括使用CoT数据微调、通过MCTS扩展解空间、推理行动策略和在翻译任务中的应用。
4. 为了增强Marco-o1模型的复杂推理能力,首先要使用CoT数据对其进行微调,使用如表格所示的多种数据集的监督微调策略。
5. 蒙特卡洛树搜索算法通过在决策树上进行大量的随机模拟,来估计各个节点的价值,从而指导搜索过程。
6. 在Marco-o1中,作为推理状态的节点,动作作为LLM输出,回合模拟与奖励计算,指导MCTS。
7. 计算总体奖励得分,在获取rollout序列中所有token的置信度得分后,计算这些得分的平均值以获得总体奖励得分。
8. 研究者观察,以动作作为蒙特卡洛树搜索的粒度较为粗糙,这种方式往往导致模型忽视解决复杂问题所需的关键推理路径。
9. 研究者引入了一种反思机制,通过在每次推理过程末尾添加短语“等等!也许我犯了一些错误!我需要从头开始重新思考。”来促使模型进行自我反思并重新评估推理步骤。
10. 在MGSM-en数据集中,Marco-o1-CoT相较于Qwen2-7B-Instruct表现出明显优势。然而,在MGSM-zh数据集中,Marco-o1-CoT的表现相比Qwen2-7B-Instruct有所下降。
11. Marco-o1展示了自己擅长理解上下文和细微差别,提供更准确、更自然的翻译。
阅读原文

中国大模型发展现状及使用最多的模型之探究

文章概要:

1 中国大模型发展现状中国大模型发展迅速,技术和应用方面取得了显著。
2. 中国模型发展:中国模型主要朝着两个方向发展,模型做越大,二是结合垂直领域的数据进行训练。
3 使用最多的大模型:的文大模型使用上较为突出主要得益于其技术、应用生态产业落地。
4. 大模型发展面临:中国大仍面临算力芯片和数据的制约,应用存在一定局限性,还带来了伦理道德、保护内容等问题。
阅读原文

大模型商业化,营销率先突出重围

文章概要:

1. 大模型在营销场景中实现了突破,帮助品牌找到营销ROI的Benchmark。
2. 营销链路的高复杂特性,决定了传统营销手段的局限性。
3. 大模型加持的智能营销将彻底改变这一局面。
4. 京东云言犀发布全新“言犀智能体平台”,不仅可以更好地理解和服务目标用户,更助力全营销流程降本增效,帮助品牌快速找到ROI的Benchmark。
5. 数字人直播成为最快实现大规模商业化的应用场景之一。
6. 京东云言犀数字人持续进行技术创新,不断扩展和深化服务能力,把技术做“厚”,把场景做“宽”。
阅读原文

大模型量化技术原理:QoQ量化及QServe推理服务系统

文章概要:

1. 文章介绍了大模型量化技术原理中的QoQ量化及QServe推理服务系统。
2. 文章分析了目前业界主要的整数量化算法,包括剪枝、知识蒸馏和量化,并指出QoQ选择W4A8KV4精度进行量化的原因。
3. 文章详细介绍了QoQ算法的原理和实现包括渐进式分组量化、SmoothAttention和各种通用量化优化功能。
4. 文章还介绍了QServe系统的设计和实现,包括减少GEMM Kernel中主循环的开销和使融合注意力Kernel保持在内存受限的范围。
5. 文章通过实验验证了QoQ和QServe的有效性和优越性。
阅读原文

竞争力赋能!云汉无人机企业私域大模型部署方案

文章概要:

1. 无人机模型是一种深度学习模型,通过身体感知和行动能力,让无人机具备与真实世界交互。
2. 私域大模型无人机领域的应用非常广泛,可以提高操作效率和智能化水平、处理多模态、操控与、模型和有效性。
3 无人机企业部署私域大模型,可以显著提升竞争力,增强数据安全隐私保护、决策的准确性、提高工作和、实现定制和灵活性的、降低建设和使用门槛
4. 文章介绍了无人机语言模型的案例,北京大学智能无人机的身体架构、工大学团队研发的模型无人机集群、深度学习在飞行器动力学与控制中的应用、模型控制MPC)案例、作物病虫害检测与预测、生长监测与预测> 5 文章提供了联系电话:15023822。
阅读原文

应急安全科技情报 | 从ChatGPT到Agent的演变与实践—AI与大模型技术专访

文章概要:

1. 《应急安全科技》由城安科技与信息,月为周期发布,围绕焦点与访谈、动态与、科技与金融、与法规四大领域最新产学研用“四链融合”。
2. 自本期开始,城安特推出应急安全科技情报》主题专栏,带领大家走进科技创新领域,聆听行业前沿声音。
3. 第二期让我们共同关注《月报》对话城安院与信息工程师朱国博士的精彩访谈,畅聊ChatGPT到Agent的演变与实践。
阅读原文

大模型技术课程的新动向:师生共研《大模型技术与实践》课程研讨会

文章概要:

1. 计算机学院筹备开设专业课程大技术与》,让学生理解并掌握大语言模型的前沿br>2. 202411月0,课程全体12教师开展第二次研讨,邀请了大四的优秀学生卢钇杉同学与老师们共同开展了线上共研讨会。
. 卢钇杉同学分享了他在大模型学习过程心得体会,以及参与实际项目时所和,为课程内容的丰富性和实用性提供了宝贵的视角。
. 卢钇杉同学还就如何更好地将大模型技术融入教学实践,提出了的创新想法建议,了师生之间的深入交流与碰撞为大模型与实践》课程持续优化教学质量提升了新。
5. 卢钇杉同学深入浅出介绍了大语言模型基本及其应用通过词和调用的讲解,了在实践中调动大模型能力。
.钇杉同学介绍了AG(增强生成)技术,展示了检索引擎提升生成模型准确性与效果,并通过计算机网络课程的智能这具体实例阐明了语言模型在知识查询、解答和教学支持智能生成与能力br>. 会上老师们卢钇Maxkb环境与工作流设置进行了积极的讨论,通过工作流图示结合,生动展示了将大语言模型的能力应用到实际教学中学生学习体验增强的性与趣味性。
阅读原文

2024光明科学城论坛·人工智能大模型论坛成功举办

文章概要:

1. 12月5日,202科学城·人工智能模型论坛深圳光明成功举办br>2. 本次论坛聚焦利用大科学推动人工智能的演进,吸引了近30人现场参会。br>. 光明区委常委李兴亮城实验室石、业副总裁严中宇等出席并致辞br>4 会上举行了科研成果仪式,包括鹏城实验室的国产云脑算力全生命周期模型和集等。<>.论坛产业成果丰硕,科技工业园与人工智能企业和机构签约人工智能场景创新实验室<> 会上还举行了论坛和演讲,探讨了人工智能模型升级和创新应用等焦点话题
阅读原文

【原创研究】AI应用:我们都被大模型忽悠了?

文章概要:

1. 当2022年底GPT横空出世,人们认为这是老天给的再一次的机会,因此义无反顾地投了一大堆钱进去,但快2年时间了,AI应用起不来。
2. 作者认为可以复盘互联网+,推演AI+,并通过复盘互联网时代兴起和发展脉络,解答以下问题:为什么可以复盘互联网+,推演AI+?新技术的落地和发展秉承怎样的规律和路径?AI应用是“雷声大雨点小”还是“不是不到,只是时机未到”?AI应用会如何落地和发展?
. 作者认为AI应用所处的时代确实不一样,从而对投资人和创业者提出了更高的要求。
4. 作者认为AI大模型是跨时代的意义,至少能像移动互联网可以改造千行百业,50%的可能能像发明第一台蒸汽机开启新一代的工业革命,甚至有人觉得如果真能实现通用型人工智能(AGI),那就像智人走出非洲那样带来全新的文明。
阅读原文

2024大模型ToG ToB生存现状,没有一顿酒解决不了的...

文章概要:

1. 大模型ToG ToB难的不是技术,而是甲乙双方共识以及对需求理解的偏差需要大量前期同频和教育成本
. 领导对AI的存在差异,业务中的领导大多不懂。br>. 大部分ToGB和大模型直接关系0都是传统需求。<>4.模型最大的阻力在于预算,实际业务中的预算往往较低。<>. 大模型G To销售往往需要通过喝酒解决问题。
6. 大能力和客户预期存在差距,交付的产品可能无法满足客户的期望。
阅读原文

大模型混战这一年: 进化之赛、效率之争、落地之战

文章概要:

1. 大模型混战这一年,行业竞争激烈,玩家们在技术迭代和产品更新以及商业化赚钱和应用落地的速度上展开竞争。
2. 技术和产品的迭代推动了大模型行业的发展,从语言大模型到文生视频大模型,再到3D生成大模型,行业在不断进化。
3. 大模型的局限性日益显现,行业在寻找下一个更“类人”的模型或应用,如空间智能、思考能力等。
4. 大模型的应用层面,人类与机器的互动方式正在发生范式转变,拥有对话功能的GPT逐渐进化能行动的AI Agent。
5. 大模型的商业落地进度越来越迫切,AI视频生成是大模型技术商业化落地更具潜力的赛道。
6. 大模型行业的特殊性在于“烧钱”,技术上的研发成本,应用上的运行成本,每一步都少不了真金白银的支持。
7. 大模型行业的淘汰赛已经开始,市场中99%的伪创新都将被淘汰,只有1%的企业能够脱颖而出。
阅读原文

Nature: ChatGPT 两岁了:大模型如何改变科学家的生活

文章概要:

1. 自ChatGPT两年前向公众发布以来,研究人员已经用它来润色学术写作、审阅科学文献以及编写数据分析代码。
2. 81%的受访者表示,他们曾在个人或专业领域使用过GPT,使其成为学术界最受欢迎的此类工具。
3. 四分之三的人认为,在未来五年内,研究人员需要发展AI技能以胜任工作。
4. 过去两年里,科学家发现使用ChatGPT草拟论文摘要、资助申请和学生推荐信,能让他们将更多时间投入到复杂任务中。
5. ChatGPT在文献综述方面的效果尚未令人满意。
6. 为规避风险,有些研究人员选择使用小型的本地模型而非ChatGPT。
7. 科学界对ChatGPT和其他大型语言模型(LLM)的研究和应用热情高涨,但也充满争议。
阅读原文

大模型专题:大语言模型威胁分类

文章概要:

1 报告构建全面风险管理框架以应对大语言广泛应用带来复杂风险挑战尤其聚焦、与领域
.剖析了LL关键资产,多类资产、云上运维、多种模型服务组件及AI。
3. 报告了LLM生命周期各阶段包括准备阶段开发阶段评估与确认、阶段交付阶段服务退出阶段。br4.将服务归为机密、、、/误用和隐私丧失五类,威胁模型操纵、数据投毒九。
阅读原文

【会员动态】理事单位 | 大模型赋能新质生产力,思谋科技持续引领智造创新生态

文章概要:

1. 思谋科技在AI领域实力强劲,其智造生态获多方认可,包括贾亚教授团队获SIGGRAPH Asia“时间检验奖”与富士康交流会、刘枢博士入选胡润U35中国创业先锋榜、谋AI-AOI产品获高工锂电奖·年度产品奖等
2. 贾佳的论文获SIGGRAPH Asia“时间”,该论文提出的新能有效处理各种纹理,推动了图像处理发展
3 思谋与富士康举办模型技术交流会,旨在推动工业大模型深度应用加速实现技术创新与突破
4 刘枢博士入选“202润U35创业,其主导开发的IndustryGPT以先进大模型企业提质降本增效
5. 思谋荣获2024高工“年度产品奖”其蓝膜电芯OI外观检测以SMore ViMo视觉检测平台为核心可实现对电芯本体360°无死角外观的高效检出
阅读原文

iPhone用百度AI大模型你还买吗?

文章概要:

1. 果子今年的重心有两个,是Vision Pro,另外一个是 Intelligence。
.为了推AI宁愿得罪老机主,去年的iPhone 15,了Pro系列,和Plus都不
3. 报道称苹果与百度合作,计划205年在中国推出Apple Intelligence。
4. 苹果百度们正改进百度大语言模型,更适合 用户。
5.的AI大模型能否经得起市场考验,从百度的技术市场来看,应该是肯定。
苹果与百度AI合作,能带来哪些实用的AI玩法了上述提到Siri的升级外, Intelligence还将为用户一系列新的功能。
阅读原文

写给小白的大模型应用科普:AI Agent篇

文章概要:

1. RAG与Agent是模型应用领域最被认可与看好的主流应用形态,本文教你快速认识AI Agent。
2. 大模型虽然强大,但存在“只懂回答,不懂行动”的问题,因此需要Agent。
3. AI Agent是一种能利用大模型进行自主的任务规划、决策与执行的系统。
4. AI Agent可以在大量的领域与场景下展现出非凡的能力,包括但不限于个人助理、客户服务、市场营销、决策支持、游戏仿真、智能家居、无人驾驶、机器人等。
5. AI Agent的工作原理可以总结为理解、任务规划、任务执行与反馈、任务完成与交付。
6. Agent系统的基本组成包括大模型、任务规划、工具使用、记忆。
7. 当前AI Agent仍然处于技术积累与实验阶段,在真正的生产力场景,还面临众多挑战。
8. AI Agent虽然还处于发展的初期,但未来潜力巨大,包括更强的自主性与智能化、深度行业化与定制化、更强的个性化,人性化、持续学习和自适应能力、伦理与法规考量更受重视。
阅读原文

秒懂数字化|大模型是如何训练出来的?

文章概要:

1 大模型应用关键概念有提示词、检索增强生成微调。
2. 提示词工程将问题细化以便大模型更好理解和回答br 3 检索增强生成是通过结合知识库来提高大模型的回答
阅读原文

大语言模型(Large Language Models, LLMs)的应用

文章概要:

1 大语言模型( Language Models, LL)应用大语言作为人工智能领域突破,深刻技术创新和产业的。
2. 他的优势在于:创新,Transformer架构、模块化设计、任务;涌现,监督学习迁移、能力。 阅读原文

大模型技术的军事应用综述

文章概要:

1 大模型技术以强大的自然、推理内容生成等,军事智能发展带来了前所未有的机遇和挑战
. 本文梳理了大模型的架构建模、适配微调、提示学习等技术,典型多模态大模型的发展现状
3.分析了国内外主流大模型军事应用,了大模型军事典型任务场景需求
4. 探讨了模型军事面临的挑战,展望军事领域大模型应用的发展,以期为提升基于大模型重大军事设计与实战研究提供
阅读原文

中文大模型(持续更新中)

文章概要:

1.推出通义系列AI产品,包括通义千问、通万相、通义听悟、通义灵码、通义法睿等;
2. 百度推出文心一言;
3. 华为推出盘古大模型;
4. 字节跳动推出云雀;
5. 腾讯推出混元;
6. 科大讯飞推出星火大模型;
7. 360推出智脑;9. 度小满推出轩辕;
10 清华大学推出ChatGLM-6B;
11. 北京大学推出ChatLaw;
12. 复旦大学推出MOSS;
13. 上海交通大学推出K2;
14. 哈尔滨工业大学推出本草;
15. 中科院自动化所推出紫东太初大模型
16. 东北大学推出TechGPT;
17. 上海人工智能实验室推出书生通用大模型;
18. 智媒开源研究院推出MediaGPT;
19. 智源人工智能研究院推出悟道·天鹰;21. 智谱推出智谱清言;
22. MiniMax推出ABAB大模型;<>23. 达观数据推出"曹植"垂直大语言模型;
24. 云知声推出山海;
25. OpenBMB推出CPM-Bee;
26. 虎博科技推出TigerBot;
27. 月之暗面科技推出KIMI chat。
阅读原文

“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any

文章概要:

1. 亚马逊云AI模态系列大模型Amazon Nova,对话图片生成视频生成等多个模型br 2. Amazon Nova系列模型以功能尺寸包括Amazon Micro、Amazon Nova Lite、 Nova Pro和Amazon Premier。
3. Nova在CRAG、CL、VisualWebBench和Mind2Web等Benchmarks上取得了较好的成绩,在检索增强生成(RAG)、函数调用和智能体应用方面具有较好的性能。
4. 亚马逊云科技宣布Amazon EC2 Trn2实例正式可用,采用了第二代Trainium芯片(Trainium2),与上一代Trn1实例相比,性能提升显著。
5. 亚马逊云科技同时推出了Trn2 UltraServer,这是一种全新的超大规模计算产品,每台UltraServer包含64个Trainium2芯片,并通过高带宽、低延迟的NeuronLink互连实现了卓越的性能。
6. 亚马逊云科技发布了AWS Trainium3芯片预览版,预计于2025年正式推出,将采用3纳米工艺制造,提供两倍于Trainium2的计算能力,并提升40%的能效。
7. 亚马逊云科技推出了Amazon S3 Tables,提供了一种新的存储方式,专为表格数据设计,支持使用Amazon Athena、Amazon EMR和Apache Spark等流行的查询引擎进行轻松查询。
8. 亚马逊云科技推出了Amazon S3 Metadata的预览版,提供了一种自动化、易于查询的元数据管理方式,这些元数据几乎实时更新,帮助用户整理、识别和使用S3数据进行业务分析、实时推理应用等。
9. 亚马逊云科技推出了新型无服务器分布式数据库Amazon Aurora DSQL,旨在解决传统数据库在扩展性和性能方面的挑战。
10. 亚马逊云科技在模型层和应用层方面添加第四块积木——推理(Inference),Amazon Bedrock作为亚马逊云科技在模型层的一项AI平台服务,与基础设施在推理上保持了同步。
11. 亚马逊云科技在Amazon Bedrock上推出了多项能力的升级,包括模型蒸馏(Model Distillation)、多智能体协作(multi-agent collaboration)和防止大型语言模型幻觉导致的事实错误的功能——自动推理检查(Automated Reasoning checks)
12. 亚马逊云科技在应用层上的代表作便是Amazon Q,针对越来越多的企业寻求从本地数据中心迁移到云的痛点,亚马逊云科技在Amazon Q Developer上推出了多项新功能。
13. 亚马逊云科技还推出了Amazon Q Developer Transformation for VMware Workloads功能,专为运行在VMware上的企业工作负载设计。
14. 亚马逊科技将AI和分析结合的产品——Amazon SageMaker,作为一个可以帮企业加速AI应用的开发、训练和部署的数据科学平台,今天也步入了“下一代”。
15. 亚马逊云科技在生成式AI时代的发展路径是从客户的真实业务需求出发,包括计算、存储、数据库上的瓶颈,客户在模型上的选择,再包括应用上的迁移服务等等。
阅读原文

大模型创业“生死局”:融资困难、造血乏力、卖身离场

文章概要:

1. 202.11.20-21日举办的GTC2024全球流量大会上海)已圆满结束,演讲嘉宾们的分享PPT,可在公众号聊天栏回复关键词【技术出海峰会演讲资料】获取
2. 投资方和创业者关系的紧张,只是大模型创业环境恶劣的一个缩影。AI大模型开发放缓,平台巨头和创业团队一同涌向了应用的开发
3. 2024年接近尾声,AI大模型创业进入了调整期,在这个阶段,企业或是寻求收购,或是裁员,更有甚者选择了离场
4. 大模型市场进入整合期,如同过往其他行业的创业走势一般,曾经围绕于创业公司资源最终还是回流到了大厂
5. 明星创业公司与投资人反目,让AI大创业,更加雪上加霜的是融资放缓
6. AI大模型行业热闹两年多后,很多人发现大模型“烧钱”似乎是个无底洞,无论是企业还是投资人,他们都难以在有限时间内收到投资回报
7. 今年下半年,从巨头到初创公司,一同将目光转向了AI应用领域,其中,AI搜索、AI陪伴、AI视频、AI生产力工具等赛道的竞争尤为激烈
阅读原文

如何使用大模型进行数据分类分级 - 拷贝

文章概要:

1. 数据分级分类是数据治理和数据安全,以来许多探索方法。
2 大模型后许多数据安全相关公司宣称使用大模型分类显著。
阅读原文

面试官扎心一问:大模型显存如何估算?

文章概要:

1. 面试官心理分析:模型显存估算问题在面试中被问到,包括推理和两种情况
.题:的显存主要包括模型权重、缓存和激活显存。模型大小的计算公式参数数量精度,可通过权重量化减少显存。KV缓存的计算公式为乘以批次大小乘以序列长度乘以层数乘以隐藏层大小乘以精度,通过PAttention优化。激活显存的较为复杂可通过agedAttention、并行和重计算等方式优化。
3 训练显存的需求更高,除了显存,还要加上优化器状态梯度。训练时的显存为总显存等于模型大小加上KV缓存加上加上(优化状态加上梯度)乘以训练。器状态需要额外存储一些辅助变量,可通过高级优化器或分页优化器来减少显存需求。一般以FP3精度存储通过累积或梯度检查点优化梯度显存。br>. 在微调中,优化器状态和梯度的计算,需求会。通过参数高效微调技术,如LoRA或QLoRA来减少显存占用。br>. 提供一个预估的经验法则:推理时,参数数量乘以精度(通常为24字节)训练时推理资源的4-6倍。
阅读原文

重磅!OpenAI发布满血o1、无限使用,最强大模型来了

文章概要:

1. OpenAI发布了产品ChatGPT Pro,可以无限完整版1模式,可以使用高级语音和上传功能。
.和Pro模式数学代码和级科学问题上了大幅度提升解决,模式也有改变获取的答案更、。br3. OpenAI已经了1模型的评估在模型数据训练,家族的过程涉及到多样化的数据集,这些数据集包括可用的数据、通过合作伙伴关系的专有数据,内部开发的定制数据集5.1在方面的与GPT-4相比有所提升仍有改进空间。br>6. Plus和Team用户今天已经可以1,企业和用户将在内获得权限GPT Pro价格0美元。
阅读原文

【每日精读】2024大模型落地企业现状:骤增的AI支出,和盛行的多模型部署

文章概要:

1 文章介绍了02年大模型落地的,包括骤增AI和盛行的多模型部署>2. 转自产业家
阅读原文

“2024年交通大模型案例征集活动”正式启动!

文章概要:

1. 《数字交通“十四五发展规划》以数字化、网络化、智能化为主线,推动交通领域的发展。
. 2024年政府工作报告中开展“人工智能+”行动,交通领域对于大模型等人工智能领域的研发与应用顺应了数字经济高质量发展的时代要求
. 数智交通建设取得了显著,但仍面临诸多挑战,大模型代表人工智能技术应运而生,推动数智更高层次跃升的重要力量。
4. 为持续推动交通模型发展进程,加快优秀经验复制推广,信通院依托数字化发展共建平台()正式启动“202交通模型案例征集” 活动。
5. 征集范围包括应用场景和典型领域,如智能交通管理、车路协同、基础设施改造、决策优化出行服务、绿色低碳发展等。br>6. 征集要求包括主体合规、真实合法、创新示范性和内容要求等。br>7.征集时间为至2025年月10日,案例评选时间为25年1日至2日,发布时间为025年智交通主题会议。
8.发布与推广包括入选典型应用将整理成册公布;部分优秀案例入选《大模型驱动的数智交通发展洞察(205)》相关专栏;优秀案例将推荐至2025第四届“鼎新杯”数字化转型应用案例征集活动成果将于2025年数智交通会议上发布;优秀案例将在中国信通院公众号视频号、网站等进行推广宣传;有机会后续研讨会、数字化转型大会等,并进行主题发言。
9. 申报方式材料填写和材料提交,申报材料需加盖扫描件及材料的word版本。
阅读原文

【会员动态】云天化与华为联合发布全球首个煤气化RTO大模型应用成果

文章概要:

1 119,云天化华为云南联合举办全球首个RTO模型的实践成果发布会,到云南、北京、、浙江、安徽、湖北、、、、新疆、、、河北等化工企业00参加
2 该项目基于华为盘古大模型和机理AIR模型训练,煤气化装置模拟并预测炉温、层厚度渣等运行保障过程深度优化与稳定> 3. 云天大为制作为本次创试点,半年稳定生产,大幅减少干预、降低强度装置运行的稳定性与;同时实现煤削减1.3%,节煤910吨/年、减少排放量008吨/,带来超千的直接经济效益
4和化学联合会副会长秘书长赵对项目成果表示高度认可。他指出,这是TO技术在化0到1的突破,将对日后推进化工AI工业化重要的示范和作用> 5. 李俊朋表示,是国民经济的支柱基础性产业,智能化应用前景。未来,华为将充分发挥ICT和技术优势,“工艺优化、安全生产、预测维护、开发等关键业务场景化工行业的智能应用形成行业联创机制,推动数智化技术和行业深度融合打造更多诸如煤气化RTO应用的创新成果助力化工行业化智能化、绿色发展
6 云天化与华为以此为样板展开经验复制和应用推广,切实加强煤炭清洁高效利用,践行“以绿色·美好生活的追求> 7. 据悉,华为大机理开展R模型作为“装置运行大脑,已云天化大为制氨气化炉、、两洗等取得了多个应用,解决了复杂控制、优化和异常预警等,有效助力行业全自主运行智慧
阅读原文

DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型,已开源

文章概要:

1. DeepMind大模型再登上Nature,气象预测大模型GenCast 8分钟完成15的预测,而且不管常规还是极端天气都能分析,在97.2场景中,Cast的都了全球的中期天气预报系统ENS。
2. GenCast基于扩散模型实现,为0.2经度/纬度相当于将地球成了超过10万个网格,每个网格都涵盖80地表和大气变量,每次预测都有数千万甚至上亿生成。br>3 在132种实验条件中,GenCast9.2%的任务,都比ENS更准确。
4. GenCast的预测速度也很快,一次1天的仅需8分钟ENS需要几个。br>5. GenCast基于扩散模型实现,的去噪过程,DeepMind又选择了交给Transformer来完成
6 GenCast从公开的ERA5再数据集中选取了979至21840的数据对GenCast了训练。
. 目前像去年发布的确定性预测模型GraphCastCast已经开源,代码模型权重均已发布
阅读原文

DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型,已开源

文章概要:

1 Deep大模型再Nature气象预测大模型GenCast能在分钟内完成1的预测,且在97.的场景中超过全球顶尖的中期天气预报系统。
2 GenCast基于扩散模型实现,分辨率为0.度/纬度,将地球表面分割成超过100万个网格。
3常规预报中,Cast在9%的中CRPS显著优于ENS,极端天气中,除个别场景外,GenCast的REV显著优于。br> 4.Cast在下游应用上也表现出了的预测能力,区域风电应用,其风电功率预报CRPS和REV天优于<> 5 GenCast基于扩散模型,具体的去噪过程交给Transformer来完成
6Mind已开源GenCast的代码模型,并表示将会很快GenCast生成的实时和历史预报。
阅读原文

大模型时代下的私有数据安全与利用

文章概要:

1. 大模型时代下的数据安全与利用问题:大模型是当前研究的热点之一,且已成为当前发展的主流趋势。
2. 隐私计算与联邦知识迁移技术:目前存在多种保护数据隐私的方法,包括常见的同态加密、多方安全计算和差分隐私技术。
3. 联邦知识计算平台 FLAIR:介绍一下我们团队最近开发的联邦知识计算平台 FLAIR。
阅读原文

史上最贵大模型正式上线:每月200美元的ChatGPT Pro比Plus有何区别?

文章概要:

1. OpenAI宣布将在未来的12进行1场直播,发布最新技术,在12天12场活动的首中,OpenAI宣布了o1完全体(Full Version以及GPT4.以及一项面向高级用户订阅服务——ChatGPT Pro,每月费用高达2美元
. OpenAI推出了1模型的预览版o1-preview,o1是使用大规模强化学习并使用链进行推理的模型,正式发布的1完整版在、和准确性上预览版有了显著,新增了多模态输入功能,允许用户上传图片以便获得更的
. ChatGPT Pro面向对模型能力要求更高的用户了无限量访问oo1和语音模式在内的所有模型,包含特别的o1模式
.AI在直播中,未来月内为1模型增加更多支持,例如网页浏览、等>5.AI宣布了捐赠计划,知名机构的人员10ChatGPT Pro订阅,并计划在扩展到学科的捐赠
阅读原文

大模型加速人工智能产业应用观察

文章概要:

1 大模型蓬勃发展,新应用,加速赋能千百。<>2 大通用转向垂直,领域不断细分,开发成本高
3. 大模型不是产品而是能力,结合场景才能产品。br>4.模型以前所未速度千行,开辟更多生产生活应用场景。>5.模型快速发展了人工智能安全风险,更多担忧。
大模型想获得与可持续发展,需突破多重壁垒。
阅读原文

OpenAI推出世界最贵大模型:每月200美元订阅费

文章概要:

1 OpenAI是一家研究安全应用人工智能(AI)的实验室,成立于205一系列科技界知名人士支持。
2 OpenAI的主要成就与产品有GPT系列模型、ChatGPT、ALL-E、Whisper等。
3.AI近期推出世界的大模型服务,来说是其推理大模型o1名为ChatGPT的新服务,订阅费用每月20美元(约合人民币150)<> 4. ChatGPT Pro的主要特点有高级功能、支持、无限制。
. 推出如此高额的订阅费,引起了广泛讨论,一方面,对于那些顶尖AI能力来业务发展的企业来说,的可能;,高昂的价格也让部分个人用户和小型企业而却步。
阅读原文

天津大学:大模型轻量化技术详解

文章概要:

1. 天津大学大模型轻量化技术
2 文章包含大量图片
阅读原文

中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会于11月29日至12月1日在浙江嘉兴成功举办

文章概要:

1. 中国中文学会204学术年会暨第三届全国大模型生成大会于11月9日至121日在成功举办br> 2. 大会由中国中文信息学会大模型生成专委会联合主办、复旦大学承办、市秀人民政府协办。> 3. 大会围绕“智聚模都,生成未来”主题,邀请多位院士、学术专家及企业技术专家参与主论坛致辞报告,同时了4个模型分论坛和场前沿技术班。
4 大会举行了“钱伟长信息处理科学技术奖”颁奖仪式和202中文信息博士论文计划”仪式。
.中文信息第九届第四次会议浙江嘉兴。
阅读原文

AI有具备理解能力吗?有意识吗?多数人认为没有,但是AI之父杰弗里∙辛顿告诉我们AI具备理解能力也有意识

文章概要:

1 人类大脑和AI的机制不同,人类大脑是为了的经验设计的,海量的连接试图用有限的经验和大量的连接实现最佳表现;而AI在上数据的处理和学习能力的扩展方面独特。
. 大模型是否真具备,人大模型自动全工具但是这种观点是基于“的自动补的推测实际上大模型工作是截然不同的,要想实现的自动,模型必须理解输入的
3 还有人以的幻觉现象来质疑模型的理解能力但是辛顿,人类也经常出现类似的情况。br>4. 辛顿教授的工作这两种理论不矛盾只要采用生成式的来处理关系图,知识从符号的静态存储,为用符号来学习良好词特征以及特征间交互就能更好的语言的大模型延续的这种方式这种交换更加复杂了,包括了词向量和机制等等。br>5.顿认为其实我们对的看法是错误的,一旦认识到这一点我们就会AI和其实没有上的区别只是是数字化的,可能永生。
阅读原文

2024年中文大模型基准测评报告,国内大模型关键进展及趋势分析

文章概要:

1. 自202年11月30日GPT发布以来,大模型全球范围内掀起了规模的人工智能浪潮。国内学术和产业过去一年也有了的突破。br> 2 OpenAI发布o1后,全球大模型加剧,1的推出进一步拉大了与其他的。br> 3 国内模型梯队激烈持续迭代表现不俗。
4. 国内外大模型任务上表现各有,o1-preview在Hard任务中表现卓越,有较大领先性,大则更理科和任务。
5. 端侧小模型惊艳,侧小迅速,部分小模型要好于上一代的稍大模型br> 6. 国内外大模型发展趋势,第一梯队大模型在中文领域的通用能力差距在持续缩小。
阅读原文

史上最强AI大模型Open AI - o1发布!|12.6实习汇总 | 同济实习KING

文章概要:

1. 介绍了同济校友创业项目、国海证券研究所、NEXA AI等17家公司的招聘信息,包括岗位、职责、要求、地点等。
2. 提供了简历投递的邮箱和命名方式。
3. 欢迎加入实习交流群,实习信息会最先发布在实习群。
阅读原文

如何使用 FP8 加速大模型训练

文章概要:

1. 本文主要介绍如何使用FP8技术加速大模型的训练,包括FP8的优势、挑战、应用案例等。
2. FP8是一种8位浮点数表示法,具有计算性能加速、内存占用降低、训练和推理阶段模型性能及数据算法一致等优势。
3. FP8对比FP16或FP32在数值表示范围上引入了新的挑战,需要针对FP8引入更细粒度的算法改进。
4. NVIDIA提出了一种Delayed Scaling的方法针对FP8 Tensor在训练过程中引入动态Scaling,使得在FP8训练过程中在加速矩阵运算的同时借助per-Tensor scaling的方法保持精度。
5. Transformer Engine是NVIDIA提供的开源的训练工具包,专门针对FP8大模型训练实现了一系列功能,包含针对大模型所常见模型结构如Transformer层等,同时针对FP8提供了Del这一方法的实现。
6. 当前Transformer Engine已与NVIDIA NeMo、Megatron-LM以及HuggingFace等业界开源社区训练框架融合,便于在大模型的训练中根据自己的需求方便调用FP8训练能力。
7. FP8在大模型训练中的特点,可简单总结为与之前的一些更高精度的方法相比,FP8具有更高的Flops数值,与更高精度的表示方法相比,FP8有E5M2和E4M3两种表示方式,NVIDIA Transformer Engine为提供了相应的recipe,通过简单传入参数,即可方便地利用FP8的高算力,同时保持模型收敛性的表现。
8. 我们也针对大模型训练的不同场景,对FP8的收敛性进行了测试和验证,结果显示FP8精度下和BF16的损失曲线差距很小,在包括MMLU等多个下游任务上,也可以看到两种精度所训练的模型的下游精度也是比较吻合的。
零一万物的双语LLM模型在NVIDIA GPU上进行了端到端FP8训练和推理,并完成了全链路的技术验证,取得了令人瞩目的成果。
10. Inflection AI的Inflection-2模型采用了FP8技术对其模型进行训练优化,在包括知名的MMLU、TriviaQA、HellaSwag以及8k等多项标准人工智能性能基准测试中,Inflection2展现出了卓越的,成功PaLM 2,彰显了其在模型训练方面的领先性。
阅读原文

“元古大模型”来了!地球科学与人工智能深度融合

文章概要:

1. 我校立足国家和长远发展需要,产学研协同的模式开展前瞻性研究,打造“古大模型”。
2 我校与科大讯飞强强联合产学研协同创新的新模式,专家定义学科难题、参与数据处理共同训练迭代部门挖掘应用场景模式开展学科大模型研究。. 元古大模型的架构是一个综合性,通过云端运行的智能算力基础设施和多模态大模型集成能力,形成一个全面、高效的地球科学、教育教学和社会服务智能化系统。
5. 古生物化石标本识别助手:能够识别20的古、岩石,并能以科学工作者视角描述化石数量、颜色、外形结构等多维度基于化石结构推理出化石种类,目前其能力已同步训练到星火模型最新可供公众及地学科研工作者和使用实现了科研成果向社会服务转化。<>6.挖掘依托训练完成的地学文献实体抽取任务大语言模型地学文献研读自动地学领域实体和属性了专业术语多、信息的隐式表达、数据稀缺导致通用大模型抽取覆盖率低等难点,基于大规模文献揭示极地温度演化新、发现古生物等新规律了有力的支持。>.师生及工作者打造的地学智能搜索引擎将逐步开放,利用了元古大模型推理能力实现地学专业知识的即即,并能针对各类地学专业网站科普、公开地音视频资源、预印本网站论文等数据的搜索。
阅读原文

AI专题培训直播回顾(第十一讲):AI大模型辅助科论文写作:“三位一体”整合式研究设计

文章概要:

. 12月日,学院世副教授蒙克,围绕“大模型辅助科论文:‘三位一体整合研究设计进行分享来自全国100多高校的3万教师在线参与直播进行互动。br> 2. 蒙老师首先了信任度的,指出对人工智能态度呈现极端一端是极端,另一端则是极端。
3 蒙克深入介绍基于的研究经验出的“”式,问题意识、理论构建方法,从问题意识理论构建通过推,选择的研究方法系统地和数据,回应问题意识,环环扣,紧密。br>.克表示在人工智能崛起的时代,的目标和势必要发生转型具体来说,培养四个:高质量的提问增强意识交流能力的,认识判断思维能力高质量的,学科底层逻辑思维方式理解能力以及高质量转化,提高对信息能力,培养适应发展的!
5.0秋季学期一期直播,21日周四)下午1:00与您云端,领导老师。br> 6. 1月1日(周四) 1:0-53学堂在线将邀请山东大学外国语学院张聪曾获22年教学奖二等奖,分享“人工智能大模型在与科研指导中的应用”。
阅读原文

Scaling Law撞墙?复旦团队大模型推理新思路:Two-Player架构打破自我反思瓶颈

文章概要:

1. 在AI领域,近期的新闻焦点无疑关于「Scaling Law是否撞墙?」的辩论。一曾经被视作大模型发展的第一性原理,如今却遭遇了挑战。
2. 复旦NLP团队提出了一种全新的双模型协作架构(Two-Player Paradigm)。简单来说,就是让评判模型(ritique Model)参与到行为模型(Actor Model)的推理过程中——行为模型专注推理,评判模型则以步骤级别的反馈为行为模型指路。
3. 为了研究Critique模型在架构中的作用与性能,作者们首先训练了一个可靠的Critique模型。鉴于步骤级别反馈数据的稀缺,作者们提出了一种新的框架AutoMathCritique,用于自动化构造多样性推理数据,并获得步骤级别的反馈。
4. 作者以Llama3-Instruct系列为基座模型,微调了一个专门用于步骤级别反馈的Critique模型。其了常用的数学推理数据集GSM8K与MATH为测试对象,进行了多种实验。
5. 研究人员将测试阶段所展现出来的优势用于训练阶段(Training-time)的探索与学习(Exploration&Learning),进一步探究Critique模型能否帮助Actor模型在训练时进行自我优化。为此,他们提出了一个有难度感知的双模型协作优化架构Critique-in-the-loop-Improvement,用于获得更高质量、多样化的数据,并缓解自我优化采样时的长尾难题。
6. 为探究Critique模型是否对多种模型——尤其是那些模型大小与性能高于自己的Actor模型——做到相类似的帮助,作者固定Critique模型为3B大小的Qwen-2.5模型,并使用不同模型大小的Qwen-2.5系列模型(1.5B、3B、7B、14B)作为Actor模型进行了实验。
7. 作者进一步探究Critique模型对Majority Voting性能的影响,探究当采样次数更大时的表现。
8. 作者继续探讨了多种计算提升消耗策略下Actor模型的表现。实验使用了并行采样与线性采样两种方式,并且比较了Pass@k、Majority Voting以及Sequential Final(仅选取最终答案)三种方式。
9. 受到OpenAI o1模型的推理启发,研究人员进一步探究Self-talk形式帮助模型自我纠错的可能性。Self-talk形式帮助模型在每一个推理步骤后立刻开始反思与改进,而不必等整个生成完之后再进行改进。
阅读原文

“基于多模态大模型的企业知识库能力要求”即将定稿

文章概要:

1 企业知识库是关键知识资产的和管理,“知识+大模型多模态”技术的发展,正从类型向多模态知识处理等方向演进为企业提供服务新范式。
2. 基于多大模型的知识库,知识的环节多模态AI大模型,技术支持,包括检索、创造和创新
. 云计算标准和开源推进委员会企业数字化共享平台CC企业智慧运营推进中心04年12日召开了《多模态的企业要求》的第三次研讨会,完善了标准指标框架明确了知识消费应用章节场景化研究的具体方向。
4.基于多模态大模型的企业能力要求标准探索如何通过单模态、多技术对知识库进行智能化升级,知识以更多样化形式被所见、所用、享,充分集成知识并对企业、业务的作用
阅读原文

AI大模型的第一批果实被谁摘了?

文章概要:

1. 文章以Applovin和Pinterest为例,探讨了AI大模型的发展趋势和应用场景,以及谁是大模型浪潮的最大受益者。
2. Applovin是一家移动广告技术公司AI应用主要是通过其引擎算法Axon实现,Axon 2.0相比1.0时代,进步几乎是全方面的,包括更高的自动化、素材生成、提高准确性和广告活动效果。
3. Pinterest大模型技术实现业绩增长,其广告业务也受益于大模型技术的驱动,在24年三季度财报中管理层透露,在过去的几个季度中人工智能(AI)已经逐渐成为用户和广告商转型业务的核心部分。
4. 文章认为,大模型的发展趋势是垂直应用,最大受益者隐藏在垂直应用领域。
阅读原文

35家央国企已落地66个大模型,国家队引领AI变革

文章概要:

1. 自2023年以来,国资委多次对中央企业发展人工智能提出要求,央正在成为一股先行力量,推动着国内大部分的AI大模型落地项目。本文整理了央国企已落地的66个AI模型布局,供大家参考。
2. 国资央企在大模型的相关投入上基于其自身能力承担不同的研发任务:在通用大模型(L0)的研发方面,三大通信运营商承担主力军;行业大模型(L1)和领域专用大模型(2)是大部分央企的投入重点。
3. 文章列举了35家央国企已落地的66个AI大模型,包括中核集团、中国核电、中国航天科工、中国船舶、中国电科、中国石油等企业。
阅读原文

AI 搜索研究:大模型C端商业落地“第一束光”

文章概要:

1.搜索——改变的不二选择。搜索模式从线性搜索不断跃迁至AI搜索,其本质是检索方式演进。
. AI有望成为首个商业化落地的C端超级应用全球的搜索正在搜索模式呈现的流程,搜索技术借助深度学习和语言相较于传统,更精准地用户的查询意图据此提供定制化的搜索结果
3 全球科技巨头AI搜索,化与专业化交相辉映。Perplexity开启搜索进程,OpenAI微软、纷纷下厂搜索成为的必之地。br>. 投资建议:AI有望成为首个商业化落地的C端超级应用,科技纷纷,搜索变革有望带来商机,形成软件+终端等多入口平台型AI搜索垂直型全新搜索模式重塑搜索的行业。
. 风险提示行业加剧;技术发展;政策法规。
阅读原文

大语言模型还没搞懂,“大世界模型”又来了

文章概要:

1. 人工智能科学家李飞飞创立的科技公司 Labs推出仅通过一张图片生成D的系统
2.系统可以将输入的场景三维化,用户可以像里的第一人称控制视角,探索场景。
3. 该系统生成的场景符合基本空间原理和定律,了像素层面生成不具备一致性和稳定性缺陷。
.系统的场景里,用户用“前后左右”生成的内鼠标转换视角能调节、添加效。
5. 该系统还存在一些问题比如移动受限、画质模糊、镜头控制选项较少等。br> 6. Labs表示正在生成世界的规模和质量探索方式。<> World计划构建对艺术家、设计师、开发人员、电影制片人和等专业人士有用的,允许任何人想象和创造自己的。>. 该系统可以结合市面上的AI工具,3D游戏场景,设计镜头运动,这开发者来说是新的创作方式。> 该系统小范围的生成远到专业的程度,但又极大了游戏场景的门槛,视觉甚至交互层面,给予了独立游戏更多可能。
10 该系统与其他媒介结合的可能性很大,比如可以生成虚拟的拍摄场地、文学作品中的世界、画作中的场景等。
阅读原文

观察 | AI大模型的第一批果实被谁摘了?

文章概要:

1. 大模型走向垂直早已成为共识,Meta上个月到位了一位AI Business Lead,帮助Meta AI尽早找到商业化路径
2. Applovin是一家移动广告技术公司借助大模型东风,过去两年市值从低点翻了10倍目前市值达到了1100亿美元,PE接近100
3. Pinterest同样受益于大模型技术实现业绩增长的公司,从2023年开始营收同比再次加速,2024年三季度营收同比增长了17.7%,2024年三个季度营收接近25亿美元,预计2024年全年相比2023年增长5亿美元左右
4. 是不是大模型一定会给公司带来正向收益?并非所有加入大模型赛道的公司都是受益者,我们发现不少公司尽管大模型产品已经进入应用,但并未直接转化为收入,这当中重要原因模型基础设施不足,以及C端体验改善尚未转化成商业收入,但成本端却是实实在在的投入,算力、存储成本、人员投入等等
阅读原文

成果发布 | 大模型的软硬件协同优化和高效部署技术

文章概要:

1 本项目提出面向大模型的协同优化高效部署技术,模型、算法与硬件的跨层优化实现面向异构算力的模型和推理流程全式优化> 2.项目专注于软件和芯片硬件的层优化适配,专注于一个高效软硬件协同优化适配系统,在上游软件和硬件之间起到的作用
3 2023年,以ChatGPT为大模型标志一个崭新时代开启,大模型应用将渗入千家万户,并助力全球生产力跃迁
4.项目已形成“大模型的软硬件协同和部署技术”初步科研,未来在模型算法创新、/软硬件协同和大模型芯片等技术方向继续研究,并推动成果
5 希望与更多算力供给方,国产芯片、服务器厂商等生态伙伴,及算力消,如大模型厂商或相关行业等算力产业链上下游战略合作或生态合作关系
6.电子工程纳米集成电路与系统实验室高能效计算组面向、无人驾驶、数据、等领域中高能效与系统设计的技术开展研究为人工智能和大数据应用提供效计算能力
阅读原文

谨防金融大模型应用风险

文章概要:

1. 人工智能大模型正在逐步各行各业,领域也不大模型有望给全球金融行业带来2500亿美元至10亿美元的价值>. 随着大模型广泛应用,新也逐渐显露出来一旦应对不当可能金融严峻的挑战>. 大模型进一步推广可能会加剧金融两极分化
. 目前大模型存在的缺陷也可能给金融系统带来安全风险>5. 金融机构对少数大型科技公司提供的基座模型的依赖可能新的风险点
6.模型深入应用金融提出要求,防患于未,在深刻模型的特点并妥善应对这些风险的基础上,才能推动大模型更好发挥作用促进金融业发展
阅读原文

最易懂的大模型基础概念,新手小白入门必看!

文章概要:

1. 大模型是参数数量极多的深度学习模型,能执行多种语言。
2是模型中的变量,模型规模指的是参数的数量。<> 3. 预训练大量数据上模型,微调在特定任务进一步训练训练。br> 迁移学习是将在一个任务上学到的知识到一个相关任务上
5. 单模态仅处理一种类型的数据,模态能够同时处理理解多种类型的数据。br 6.模型通常基于复杂的神经网络架构,Transformer
7 大模型大量的训练数据来学习语言的复杂性。
8. 训练大模型需要计算资源<> 9. 可解释是模型能够以人类可理解的方式解释其决策的能力,透明度是指的可视化和理解。
10 大模型世界在,持续学习。
阅读原文

全国首个金融大模型成绩单:服务超2亿用户8大应用场景

文章概要:

1. 全国首个零售金融领域大模型天镜揭晓成绩单,已实现八大应用场景,1.0版本人机交互模型完成100亿交易额,全面服务超2亿用户
2. 马上消费推出全面迭代升级的天镜大模型2.0版本,在模型技术创新、制定、科研转化成果、具体应用等核心领域都有所升级
3. 天镜2.0从模型训练、场景泛化再到应用落地都有了全方位的升级,更多的关键词是在于泛化、成本以及合规安全
4. 马上消费牵头制定了IEEE全球大模型标准,意味着金融大模型走向标准化规范化,来到了规模化落地应用的前夜
5. 马上消费搭建了个平台,等待着各位生态伙伴在这个平台上生长出各式各样的垂直应用
6. 首届数字产业生态伙伴大会在重庆召开,大模型成为当之无愧的主角,良好的生态环境为大模型在金融领域的应用提供了丰富的资源和协作机会,促进了技术的创新与融合
7. 政府的支持则表现在政策引导、资金扶持和监管规范等方面,为金融大模型的发展创造了有利政策环境和稳定的市场秩序
8. 金融大模型本身已经有利提升整个大模型的技术发展,进而推动全场景的突破
阅读原文

2024科创大会 | 大模型社区重塑区域产业空间

文章概要:

1. 模速空间是首个模型专业孵化和加速载体立足徐汇滨江,基于“百千万”目标,打造数据、算力、、金融、综合等平台,各通用大模型、垂类大模型、大模型应用创新初创企业上海、引领全国、世界。
2.12月5日举行的224科创大会“‘模速’赋能空间共塑”论坛上,在AI大模型关键三要素“算力、、”,领域的代表围绕今年政府工作报告中提到的“加快发展新生产力”提出了真知灼见。
论坛上发布了上海库思科技的“库帕思语料”及其联合体,华为、商汤兆芯、、、信息等头部企业首批。
4. 华院计算技术(上海有限公司董事长宣晓华最近观察到,模型领域一系列算法创新正在为不同提升效率添砖加瓦。<5. 商汤科技创始人、大装置事业群总裁杨帆表示无论是算力、算法语料数据,研发成本、少弯路都需要的专业能力在背后。>. 浪潮集团郭强表示,目前市面上常见的算力包括算力以及国产自主可控芯片产品三种算力多元共存,出算力出海、算力、算力购买等的应用。br7. 过去一年来,一段时间参与此类科技,模速空间的成绩单动态变化的,反映出大模型的发展速度。br>8. 本周,模速空间将发放完毕第三批补贴,累计已达亿元预计到四季度全年为入驻企业发放的算力补贴将达15亿元。
阅读原文

6 款大模型官宣后,生成式 AI 淘汰赛的号角正式吹响了

文章概要:

1. 亚马逊云科技在 re:Invent 大会上发布了六款自研基础模型 Amazon Nova 系列包括 Nova Micro、Nova Lite、Nova Pro、Nova Premier、Nova Canvas 和 Nova Reel,这些模型在评测中表现优秀,价格、推理速度和易用性也很出色。
2. Amazon Bedrock 是一个大模型货架,拥有模型蒸馏和降低幻觉的新能力,全部是业内最迫切需要的功能。
3. Amazon Q 由 Amazon Q Developer、Amazon Q Business、Amazon Q Apps 三部分组成,Amazon Q Developer 进行了新一轮增强,包括自动执行单元测试、提供文档与代码审查智能体,旨在帮助开发人员在整个软件开发过程中加快构建速度,并帮助用户在短时间内解决运营问题。
阅读原文

一文读懂AI大模型

文章概要:

1. AI大模型正在成为智能时代的超级大脑。
2. AI的发展可以概括为3个主要阶段:符号智能、感知智能和认知智能。
3. AI的核心在于机器学习,它通过开发算法和统计模型,赋予系统从数据中学习并做出预测或决策的能力。<> 4. 大模型是深度学习的一种应用,它们的参数量可以达到数十亿甚至数万亿,能够捕捉数据中的细微和复杂特征,从而在各种任务上展现出卓越的性能。
5. Transformer是一种基于自注意力机制的深度学习模型架构,能够有效地处理长文本和捕获长距离语义关系。
6. 大模型的训练是一个复杂的过程,以ChatGPT为例,它的训练过程可以分为无监督预训练、监督微调、强化学习三个步骤。
7. 为了解决AI编造事实、计算不准确、数据过时的问题,研究人员开发了多种方法来增强AI的能力,如检索增强生成(RAG)、程序辅助语言模型(PaLM)、REACT等。
8. 提高AI使用效率的关键在于有效的沟通策略,如小样本提示、思维链等。
9. 大模型应用场景十分广泛,包括自然语言处理、视觉、游戏、金融等领域。
10. 大模型在人工智能领域带来了显著进步,但同时也引发了挑战,包括如何高效训练与部署、消除偏见、保障隐私等。
阅读原文

时间序列卷到大模型了!最新10种前沿方法汇总

文章概要:

1. “大模型时间序列”是当前人工智能领域极具创新性的它融合了两者的,能够在处理类型时间序列的同时,数据的和异常情况,提高的和稳定性。br> 文章整理了最新的1大模型时间创新同学扫下方二维码,“大。br>3 本文提出了一种名为FedTime学习框架专门用于时间。该通过在边缘设备上使用数据训练大型模型LLM采用K-me聚类、通道独立性和技术来模型训练,在数据隐私的同时提高预测精度和通信效率<>4. 本文综述了时间序列基础模型的发展,了从头训练适应大规模语言模型研究路线了3E分析框架(、效率、解释性,提供领域分类法和资源汇总,促进领域的进一步发展
.提出了基于大规模语言模型(LL)的时间序列检测(AD)方法MAD,方法不仅能够提供准确检测结果,还能可的异常报告。通过引入数据和领域知识,M少量样本的异常,并通过思维(ACoT方法其解释能力<>6 本文提出结合开源大小规模语言传统方法框架,用于多变量序列预测。通过动态提示和查询多头注意力机制,捕捉时间序列数据中的依赖,并通过低秩与激活内存减少技术实现企业级化。
阅读原文

【科普一下】AI跟市面上的大模型到底有啥区别?

文章概要:

1. 本文探讨了AI与模型。<> 2. 来源为科普。
阅读原文

干货! 经验总结出的13个大模型提示词的迭代小技巧

文章概要:

1. 角色迭代:为模型设定一个或多个角色以改善对特定任务响应
2 任务迭代:将复杂任务分解为更的任务,并逐步解决。
.步骤迭代:通过明确模型执行特定任务步骤来提高任务完成的准确性br> 4-shot迭代:通过少量来引导模型学习特定任务。
5 分隔符:在提示词中使用特定的或短语区分不同的或。br> 6.条目通过使用列表或项目符号来信息。<> 7 顺序:在中指示信息的处理。
9 位置:提示特定信息引导模型特定信息或任务。<> 10. 精准定位任务需求:明确界定模型需要完成的任务进一步细化需求。br> 11 引导性:在提示词指导性语言,帮助提高生成的。
12 情境依赖:情境,AI输出内容需要的背景、环境使用场景。<>3. 重复与强调提示词中的重复强调可以帮助理解哪些内容用户特别关心或重视的
阅读原文

上海AI实验室发布一种基于主题级自我校正的方法以缓解多模态大模型(MLLMs)的幻觉问题

文章概要:

1. 上海AI实验室发布一种基于主题级自我校正的方法以缓解多模态大模型(MLLMs)的幻觉问题
2. 提出主题级偏好覆盖(TPO)方法,能够引导模型在主题级别上缓解自身的幻觉问题
3. 通过一种去混杂策略(deconfounded strategy),将响应中的每个主题替换为模型自身生成的最佳或最差替代项,TPO能够生成更性的成对偏好反馈,从而提高反馈质量,无需人为干预或模型的参与
4. 实验结果表明,所提出的TPO方法在可信度上达到了最先进的性能,将目标幻觉减少了约92%,总体幻觉减少了约38%
5. 代码、模型和数据很快发布
阅读原文

你还不知道?SiliconCloud上30多款大模型免费使用,还支持API调用

文章概要:

1 SiliconCloud提供多种开源大语言模型及图片生成模型用户可自由适合不同应用场景的
2 SiliconCloud提供即用的模型推理加速服务GenAI应用带来高效用户体验> 3 通过SilCloud即可一键接入开源大,显著降低开发的错
4 Silicon包含各种文本到和文本到>. SiliconCloud还提供功能丰富的其他高效模型,包括嵌入、重排序语音、生成等
. 用户可以通过该平台、无缝将自定义模型部署为,并根据上传的数据进行模型微调>. 创建包含SiliconFlow实例集合的自动缩扩容,将按需调整服务规模>代码,即可快速使用iconCloud的模型,支持OpenAI协议的SDK
上传模型服务描述,获取模型服务API,负载自动缩扩容,保持资源最优化
阅读原文

企业大模型应用顶层架构设计经验

文章概要:

1. 企业构建大模型是系统工程,除资源外,顶层架构设计至关重要,技术社群文章《企业大模型应用的顶层架构》可学习借鉴;
2. 大模型技术加速人工智能赋能产业升级,本文提出“四维认知”框架,包括问题诊断、能力评估、焦点确认、行动计划,企业可从算力规划、数据治理、模型优化、组织进化四个维度推进;
3 大模型技术应用现状与趋势:大模型技术迅速崛起,展现广阔商业应用前景,但落地应用面临诸多挑战,产业界加速拥抱,大模型项目如火如荼展开;
4. 大模型应用落地总体“四维认知”框架:包括问题诊断、能力评估、焦点确认、行动计划四个维度,循序渐进推进大模型应用项目实施;
5. 解构大模型落地路径:企业需进行顶层规划,做好分层解耦的架构设计,建立算力资源集中管控机制和闭环运营体系,从算力规划、数据治理、模型优化、组织进化四个维度推进;
6. 算力规划:重点分析大模型对企业IT架构的冲击和应对策略,构建弹性算力平台,具备弹性伸缩能力,掌握芯片选型之道;
7. 数据治理:进行体系化考虑和安排,包括数据清洗与标注、数据有效组织与管理、数据共享与隐私保护等;
8. 模型优化:聚焦大模型应用效果与效率提升,包括选择恰当的预训练模型进行微调、模型压缩、知识蒸馏、推理优化等技术;
9. 组织保障:大模型落地背后的组织变革之道,建立的大模型项目团队,建立跨部门的大模型应用协调机制,建立全方位的人才培养体系;
10. 大模型技术方兴未艾,产业化之路任重道远,新型数据中心至关重要,面临诸多难题,需以开放心态参与跨界交流,以多学科协同攻关推动大模型技术和产业化落地。
阅读原文

基于大模型提升新闻传播效能

文章概要:

1 加强国际传播能力建设,全面提升国际效能,我国传媒业的任务。适应数字化、智能化新闻发展新要求,大胆探索运用基于人工智能(AI的大模型等新技术新方法,新闻传播效能和影响力
2 大模型指的是拥有千亿级参数具有强大的表达能力学习能力在复杂任务展现出优异深度学习模型。在新闻传媒中的服务主要体现在为用户定制个性化的新闻;筛选出有的,用户避免信息过载;提供精准广告推荐,增强广告效果;用户与新闻内容的,提升用户体验;提供逼真体验,实现用户仅凭文字描述即可获得高质量视觉体验
3. OpenAI推出的S AI模型与传统媒体的深度融合,有助于完成后期制作剪辑和包装。这些技术可凸显视频制作的便捷化和个性化,显著提高新闻事件响应速度、制作,辅助内容编排和节目设计大幅降低视频制作门槛和成本,视频剪辑师、后期制作和动画师,实现在文字、3D生成、、电影、、、剧集等方面的AI多模态智能展示提高新闻效率
.加持引发新闻传播业的能效提升,受到媒体追捧。美西方媒体积极运用AI技术提升传播能效的做法,给我们了启示在推动中国式现代化稳健前行的进程中新闻有必要新闻传播、智能化要求,不仅要在内容创新方面加大发力,更在方法、人才培养和产品等创新,塑造新闻传播质态和效能,赋能讲好中国故事。
5 面对模型AI技术融入传播发展态势,应积极环境变化发挥首创精神在传播实践开发运用新技术。要有积极拥抱运用新技术的态度,大力培养新型新闻传播人才,开发基于人工智能的模型新产品,将中国文化、中国故事大方法场景有机,提高中国国际传播效果。大模型时注意兼顾合法与。
阅读原文

LiblibAI x 星流:今天,我们正式推出新一代自研图像大模型

文章概要:

1. LiblibAI与千万用户一起揭幕的自研图像模型,推出Star-3 Alpha图像基座模型。
2. 相较于以往的所有模型,Star-3 Alpha在生图上实现了的在图像精准度、色彩表现力、捕捉的表达等成为新的标杆。
3. Star-3 Alpha的审美已到Next level,图片光线细腻、纹理丰富质感无限逼近真实拍摄照片,有情绪生命力
4. Star-3 Alpha 带来一眼难忘的高级感提示词响应相当到位
. Star-让生产力爆发So easy,塑造场景式和视觉叙事内容能力惊艳。
6. AI文生图永远有的,- 在全方面的基础能力达到世界。
阅读原文

大模型在军事领域的应用与展望

文章概要:

1 文章探讨了模型的应用,包括控制、分析、训练方面
2.指出大模型应用着计算资源需求、解释性、安全性等
. 文章提出加强技术创新提升计算支持、数据安全模型解释性、安全风险建议
4 文章介绍大概念、,以及在中的具体应用>.分析大在军事领域应用的,数据安全、偏见等>. 文章探讨了在这一的和未来发展方向>. 文章总结全文展望
阅读原文

谷歌发布Genie 2大模型:一键生成3D游戏,时长多达1分钟 | LeetTalk Daily

文章概要:

1 谷歌Genie 2,一键生成D游戏,多达1分钟还能张图片文字塑造可玩3D,出接近A级别的
. Genie 2在空间记忆、模拟、自回归潜在扩散模型等方面有技术突破,生成连贯世界,模拟物体交互、动画效果、物理现象等,还成长视频并维持一致的世界>3 Genie游戏提供了原型制作工具,用户在与生成的3交互,能够智能响应键盘操作
. 2姿态交互、动作效果和现象方面技术能力,能够虚拟的3环境,并在实现的姿态交互动画
5. Gen 2模型的未来方向主要在和方面的改进潜力,生成多样化3D环境、保持视觉和物理特性的连贯性以及提升AI智能体交互能力
阅读原文

多模态大模型在具身智能领域里程碑工作!清华&字节开源DeeR-VLA:让算力内存双降

文章概要:

1. 多模态大模型在具身智能领域里程碑工作!清华&字节开源DeeRLA:让算力内存双降
2. 亮点直击:提出动态早退出机制DeeR,实现高效的资源利用,灵活的计算成本控制,性能优化与资源节约显著
3.速览:提出了一个动态早退出框架,称为DeeR-VLA ,能够根据不同情境自动调整激活模型的大小,从而减少不必要的计算负担
4. 应用的技术:多出口架构、早退出算法、时间信息集成的训练方法
5. 达到的效果:在CALVIN机器人操作基准测试中,DeeR实现了5.2-6.5倍的计算成本降低和2-6倍的GPU内存消耗减少,同时保持了性能不变
6. 动态早退出的机器人MLLM:MLLM强大的任务指令理解和视觉定位能力展示了其在语言指导的多任务机器人操作方面的巨大潜力。然而,现有工作通常计算量巨大,因为机器人动作是通过推理MLLM的所有层来获得的
7. 机器人多出口架构:引入了一个具有多个中间出口的M架构,能够根据机器人面临不同情况动态调整MLLM的大小
8. 自适应推理:展示了DeeR如何在预定义的计算和GPU内存限制下,通过自适应地激活适当大小的MLLM来高效地执行机器人任务
9. 训练算法:训练动态机器人MLLM并非易事。特别是,网络架构的动态调整导致了训练和推理之间的差异。在推理过程中,使用确定性的标准在每个时间步选择适当的中间特征。然而,在训练过程中,没有明确定义的终止标准,而且不知道特征在各个出口之间的分布。为了有效地集成时间信息,提出了一个量身定制的训练算法
10. 实验:进行实验验证DeeR作为一种高效机器人策略的有效性
11 结论与局限性:本文提出了用于机器人MLLM的动态提前退出(DeeR),旨在根据机器人代理所遇到的每个情况的具体需求动态配置MLLM的大小。具体来说,提出了一种新型的具有多个中间退出的MLLM架构。此外,为DeeR建立了基于动作一致性的提前终止标准,并通过数据集或在线交互解决阈值问题。本文设计了一种定制的训练方法,将时间集成到这个多退出框架中,以增强机器人控制能力。大量的机器人实验表明,DeeR显著减少了M的计算成本和GPU内存使用,突显了其在资源受限的平台上帮助更广泛的用户管理机器人操作的潜力
阅读原文

321. 为啥要搭建本地大模型?

文章概要:

1 使用在线版大模型本地部署大模型使用
2 仅询问简单问题时,在线大模型更,其使用逻辑为公共数据+模型信息,可替代搜索引擎
3指定数据范围内与大模型时,逻辑为数据模型=,Get笔记的“ai助手”可实现惊艳的搜索效果
4.想在本地logseq数据上建立系统,只能搭建本地模型,逻辑为数据+本地本地知识库
.seq系统有时无法准确搜索到所需内容而大模型实现语义搜索,可将logseq与ollama结合搭建本地知识库框架
6 上手在线知识库使用Get笔记简单使用大模型可直接用版,若本地有私有笔记数据且不想,搭建本地模型> 7. 数据本地化是数据的,ollama-logseq可将ollamalogseq,但只能用于局部,无法达到知识库程度
阅读原文

使用 MLLMU-Bench 保护多模态大模型中的隐私

文章概要:

1. 文章介绍了“多模态大机器遗忘基准”(MU-Bench)解决模态(Ms)中关于隐私保护的
2. MLL-Bench500个虚构和153个名人档案,每个档案配备14定制问答支持模态(图像+文本)模态文本)
4 这项工作为多模态机器遗忘理解提供的和
阅读原文

使用ollama本地化运行大模型

文章概要:

1. 文章介绍了ollama,它可以在本地部署大模型,支持多种操作系统,部署简单,以linux为例,命令行执行相应命令即可完成安装
2. 安装好后,本地没有模型文件,可在ama.com/library找到官方支持的模型,中文环境下可试试千问qwen。
3. 命令行运行ollama run qwen,初次运行需下载几个G模型文件到本地,完成后可直接在终端与qwen模型交互。
4. 除命令行交互外,还可通过api接口交互,ollama默认提供restful接口,监听11434端口,通过curl测试。
阅读原文

AI大模型的第一批果实被谁摘了?

文章概要:

1. 深圳前海普投资管理有限公司是一家在中国证券投资基金业协会登记的专业股权投资和基金管理机构。公司深耕PE/VC投资,主要投资领域包括先进制造、医疗健康、现代科技(电子/智能/生物)、新能源和新材料等。
. 2023年初,GPT3.5发布,效果让全世界咋舌。人们恐慌,人工智能时代来临了。随之而来的是各大互联万公司纷纷下场比拼大模型,几乎每个月都能耳听目见新的大模型诞生,并且某个参数上和“GPT几点几”媲美。
3. 随着大模型不断迭代与渗透,一个关键问题随之而来:谁是大模型浪潮的最大受益者
4. 最大受益者在垂直应用领域,经过了2年的发展,大模型走向垂直应用早已成为共识,Meta上个月到位了一位AI Business Lead,帮助Meta AI尽早找到商业化路径。
5. Applovin是一家移动广告技术公司,截止目前旗下产品包含了广告商、发布商、素材生成等全套的移动在线营销产品。上线之初,Applovin就直奔效果营销,强调通过技术升级来提高广告的投入产出比。
6. AppLovin的AI应用主要是通过其引擎算法on实现,截止2024年三季度财报发布的时候,Axon已经迭代到2.0。
7. AppLovin业绩起飞的原因成为自2023年以后历次季度财报中,投资者关心的问题,我们从管理层的解答中发现,大模型的助力并非唯一原因。广告客户的增加也是另一重要因素,除了公司基本盘游戏领域的广告商,近2年爆发的短剧以及短视频等垂直赛道竞争也是公司收入增长的重要驱动力。
8. Pinterest同样受益于大模型技术实现业绩增长的公司,从2年开始营收同比2年三季度营收同比增长了17.7%,2024年三个季度营收接近25亿美元,预计2024年全年相比2023年增长5亿美元左右。
9. Pinterest的广告业务也受益于大模型技术的驱动,在24年三季度财报中管理层透露,在过去的几个季度中人工智能(AI)已经逐渐成为用户和广告商转型业务的核心部分。
10. 是不是大模型一定会给公司带来正向收益?并非所有加入大模型赛道的公司都是受益者,我们发现不少公司尽管大模型产品已经进入应用,但并未直接转化为收入这当中一个重要原因是大模型基础设施不足,以及C端体验改善尚未转化成商业收入,但成本端却是实实在在的投入,算力、存储成本投入等等。
阅读原文

中国测绘科学研究院燕琴院长:智能遥感大模型研究进展与发展方向

文章概要:

1. AI大模型是人工智能预训练大模型的简称,其主要采用卷积神经网络、循环神经网络、自注意力机制、Transformer等架构,在海量数据上进行训练,能适应多种下游任务,具有很好的泛化性、通用性和实用性,是计算机视觉、自然语言处理等各类AI应用的基石。
. AI模型的发展历程经历了萌芽期、沉淀期和迅猛发展期三个阶段。
3. AI大模型具有高泛化通用性、高精度、降低门槛等价值。
4. 遥感大模型是利用卷积神经网络、循环神经网络、自注意力机制、Transformer等先进的深度学习结构,通过对大规模遥感数据进行训练,实现对地物分类、目标检测、语义分割、变化检测等任务的高效处理。
5. 遥感大模型构建存在高质量样本体量很小、语言、视觉大模型在遥感领域应用研究比较缺乏、模型迭代优化亟待突破、多源数据融合不足、物理、地理、物候、专家等知识未有效利用等挑战。
6. 对于遥感大模型的研究及面临的挑战,武汉大学张良培教授团队以遥感大模型的预训练技术为主线,归纳分析了有监督单模态、监督单模态、视觉-文本联合多模态预训练遥感大模型的研究进展,探讨了结合遥感领域知识与物理约束、提高数据泛化性、扩展应用场景、降低数据成本4个方面展望。
7. 本文从数据、模型、下游任务3个方面阐述其研究进展,探讨多模态、可解释、人类反馈强化学习3个重要研究方向,并开展自监督单模态遥感大模型初步试验,旨在推动遥感大模型的研究应用实践,赋能遥感智能化发展。
8. 遥感大模型的研究方向包括多模态遥感大模型、可解释遥感大模型、人类反馈强化学习。
9. 试验验证了遥感大模型的高泛化通用性、高精度的应用价值。
10. 遥感大模型作为重要的新型基础设施,将带动上游软硬件计算平台的革新,促进高性能软硬件与大模型协同发展,将打造下游良好的应用生态,促进遥感智能化升级与高质量发展。
阅读原文

大模型提效-大模型如何为运营与产品经理赋能

文章概要:

1. 介绍人工智能大模型基本概念和应用场景,掌握利用人工智能大模型优化和升级数字营销业务的方法和技巧。
2. 设计和实现人工智能大模型加持的数字营销系统的产品方案,创造更具创新性和竞争力的数字营销业务。
3. 参与探讨共创活动,针对自己的产品和业务现状和诉求,进行营销业务分析和创新应用演练。
4. 介绍如何利用人工智能大模型优化数字营销业务中的基础营销策略,如定价、广告、推荐、、营销活动和内容展示等。
5. 介绍如何利用人工智能大模型设计和实现一个低代码策略平台,该平台可以帮助算法人员、业务系统研发、产品经理、业务运营和领导等角色快速搭建和运行各种营销策略。 7. 介绍如何利用人工智能大模型升级营销活动系统的方法,该系统可以根据用户和活动的特征和效果,设计和实施各种营销活动的策略。br> 8. 介绍如何利用人工智能大模型打造一个客户关系维护系统的产品方案,该系统可以根据客户的信息和维护的效果,分析和制定各种维护策略。
9 介绍如何利用人工智能大模型升级广告系统的方案设计,该系统可以根据用户和广告的价值和竞争,决策和优化广告的匹配、出价、素材等。
10. 介绍如何利用人工智能大模型创造一个内容展现系统,该系统可以根据用户和内容的特征和反馈,匹配和优化内容的展现、素材等。
阅读原文

国内热门推理大模型指南

文章概要:

1. 介绍LLaVA-o1模型,它是由北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学联合研发的视觉语言模型旨在自主多阶段推理。
2. 介绍k0-math,它是KIMI的数学推理模型,在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。 阅读原文

市场潜力释放,为什么说端侧大模型是AI行业的新增长引擎?

文章概要:

1. 近年来,生成式AI市场蓬勃发展,端侧大模型应用成为AI行业的重要增长点,各大手机厂商和汽车厂商纷纷推出端侧大模型,推动行业发展。
2. 端侧市场潜力巨大,将在更多领域实现广泛应用,成为推动AI产业持续发展的重要力量。
3. 中国端侧大模型行业上游主要包括AI芯片供应商、云计算服务商以及数据服务商,中游为端侧大模型科技厂商和端科技企业下游应用场景广泛。
4. 端侧大模型行业壁垒包括技术复杂性与硬件限制、数据隐私和安全、开发和维护成本、行业标准及市场应用等。
5. 端侧大模型行业竞争格局呈现出技术深度融合与创新驱动的新态势,头部大模型厂商依托其深厚的技术积累和成熟的生态系统,正布局端大模型市场。
阅读原文

AI大模型盘点

文章概要:

1 文章标题为《AI模型》
阅读原文

免费送书!基于大模型的RAG应用开发与优化

文章概要:

1. 大模型存在“幻觉”问题,即输出结果不完全正确甚至错误,主要原因包括训练知识存在偏差、过度泛化地推理、理解存在局限性和缺乏特定领域的知识。
2. RAG是为了解决大模型在实际应用中面临的问题而诞生的,其基本思想是将传统的生成式大模型与实时信息检索技术相结合,为大模型补充来自外部的相关数据与上下文,以帮助大模型生成更丰富、更准确、更可靠的内容。
3. 要想提高大模型在特定行业与场景中输出的适应性与准确性,除了使用RAG,还可以使用的数据对大模型进行微调。微调是对基础模型在少量已标注的数据上进行再次训练与强化学习,以使得更好地适应特定的场景与下游任务。
4. 我们从技术层来看一个最基础、最常见的RAG应用的逻辑架构与流程,通常情况下,可以把一个简单的RAG应用从整体上分为数据索引与数据查询两个大的阶段,而在每个阶段都包含不同处理环节。
阅读原文

MiniMax副总裁刘华:标准化大模型是未来,技术进化优于定制化 | 智涌要闻

文章概要:

1. 高昂的算力投入和海量的数据需求,了大模型的研发门槛极高,领先国家的模型厂商正在技术中较早模型uoAI、Talkie两大C端产品,分别主打AI视频生成和AI内容社区
3. MiniMax的海外主要收入来源,除出海C端应用Talkie目前占比较大,Hailuo订阅服务和端服务有所提升。br>4.Max副总裁刘华表示,Talkie除了有的付费订阅制之外,广告业务也是收入来源之一。
5. MiniMax海外市场暂时不会开发定制化模型项目仍以API接口服务B端客户8. 刘华认为中国的AI创业公司仍有着广阔发展空间,MiniMax得到了腾讯云厂商支持,同时通过成功的商业化实现了资金循环
. 谈及与MiniMax的,云云原生总经理田丰介绍腾讯云为MiniMax提供了一系列集计算、存储、为一体的高性能智能产品,让Mini释放更多的精力在模型本身的和化
1 未来只有少数企业研发基础大模型,大多数企业将逐渐转向AI应用层面的。
1. 至于MiniMax,将依然坚持投入核心技术研发,用好的技术驱动好的产品让好的带来好的服务和口碑,反哺。
阅读原文

MiniMax副总裁刘华:标准化大模型是未来,技术进化优于定制化 | 智涌要闻

文章概要:

1 高昂的算力和海量的数据需求,大模型的研发极高,少数领先国家的模型厂商正在技术竞赛中争夺优势br>. MiniMax较早出海的国内大模型之一,据报道,MiniMax今年的海外收入将超过7000万美元。> MiniMax在市场ailuo、Talkie两大C端产品主打AI视频/生成和AI内容社区。
4.Max的海外主要收入来源,除出海C端AI应用Talkie目前占比较大,Hail服务和端API服务也有所提升。
5. MiniMax副总裁刘华表示,Talkie除了有的付费订阅制之外,广告业务商业化收入来源。
MiniMax在海外市场暂时不会开发定制化模型项目,仍以API接口服务B客户。<> 刘华,MiniMax已确定未来研发,聚焦于降低模型错误率实现长和输出、多模态路线。br>8 美国的大仍保持一定程度
9 中国大模型厂商追赶的速度快在语音和等领域中国的语音服务已接近GPT-4o的水平
刘华认为,的创业公司仍有着广阔发展空间。
11. 腾讯云北区云总经理田介绍腾讯云为MiniMax提供了集计算、存储、为一体的智能产品,让Max释放更多的聚焦在模型本身的训练和化上。<>12. 刘,未来只有少数研发基础大模型,大多数企业将转向AI应用层面的研发。>3.MiniMax将依然坚持投入技术研发,用好的技术驱动好的产品,让的带来好服务体验和口碑,反技术。
阅读原文

写给小白的大模型应用科普:AI Agent篇

文章概要:

1. RAG与Agent是大模型应用领域最被认可与看好的主流应用形态,本文用最易懂的语言教你快速认识AI Agent
2. 大模型虽强大但存在局限性,无法自主完成复杂任务,因此需要Agent,它能利用大模型进行自主的任务规划、决策与执行
3. Agent是的任务规划、的系统,它的核心思路是让人工智能不仅能回答问题,还能像人一样主动完成一系列关联性的任务
4. Agent可以在大量的领域与场景下展现出非凡的能力,包括但不限于个人助理、客户服务、市场营销、决策支持、游戏仿真、智能家居、无人驾驶、机器人等
5. AI Agent的工作原理可以总结为输入理解、任务规划、任务执行与反馈、任务完成与交付
6. Agent系统的基本组成包括大模型、任务规划、工具使用、记忆,除此之外,通常Agent还需要提供一个直观的入口,让用户可以方便地给Agent下达指令或查看结果
7. 当前AI Agent仍然处于技术积累与实验阶段,在真正的生产力场景,面临众多挑战,最主要的问题来自LL的不确定性
8. AI Agent虽然还处于发展的初期,但未来潜力巨大,其发展趋势包括更强的自主性智能化、深度行业化与定制化、更强的个性化,人性化、持续学习和自适应能力、伦理与法规考量更受重视
阅读原文

腾讯疯了:忘了Sora吧,混元大模型开源!

文章概要:

1. 腾讯发布混元视频大模型,并开源。
2. 混元将开源文生视频模型和图生视频模型,目前已经开源了文生视频模型的推理代码和模型权重。
3. 对于使用消费级显卡的用户来说,也很难在本地部署,因为目前该模型最小显存要45G。
4. 如果想要体验,可以下载腾讯元宝,能够限次数使用该模型。
5. HunyuanVideo 的架构是一个隐空间模型,训练时它采用了 3D VAE 压缩时间维度和空间维度的特征。
6. HunyuanVideo 采用了 Transformer 和 Full Attention 的设计用于。8. 为了解决用户输入文本提示的多样性和不一致性的困难,我们微调了 Hunyuan-Large model 模型作为我们的 prompt 改写模型。
9. 为了评估 HunyuanVideo 的能力,我们选择了四个源视频生成模型作为对比。11. 首先克隆 git 仓库,然后按照安装指引进行安装和依赖。
12. 下载预训练模型参考 这里。
13. 我们在下表中列出了支持的高度/宽度/帧数设置。
14. 使用命令行进行推理。
阅读原文

大模型应用开发平台Dify搭建!

文章概要:

1. Dify是开源的M应用,从Agent构建到AIFlow编排、AG、模型等能力,轻松和运营式AI原生应用。br> 2. 搭建包括安装Ollama、下载大模型、Docker、Dify至本地、启动Dify。
3.ama是大语言模型环境,官网地址为https://oll.com/。<>. 到Ollama的模型页面挑选模型使用Llama 3.。<> 5. 克隆Dify至执行一键启动命令
6. 启动完成后浏览器输入http://localhost,首次Dify需要管理员。
阅读原文

从大数据到大模型:如何做到“心无桎梏,身无藩篱”?

文章概要:

1. 本文介绍了现代数据技术如何对数据祛魅,重点从应用视角审视数据库功能和数据架构的演进。现代数据具有4V特性,对企业数据基础设施了很大的挑战,需要能够应对数据海量、多样性的存储挑战,异构数据的检索挑战,数据量大及价值密度低的分析挑战。
2. 关系型数据库在时代得到了蓬勃发展,NoSQL的兴起解决了传统关系型数据库在数据量爆炸式增长和应用模型复杂化时遇到的问题。NoSQL本质上舍弃了传统关系型数据库的一些功能,从而可以实现更加灵活的特性。NoSQL与型数据库具备非常好的特性互补,应用程序往往搭配使用并形成了标准架构。
3.结构化数据在大数据时代的重要地位已成为共识,现代AI/ML技术的发展提供了一种从非结构数据中提取语义信息的方式——embedding。服务是专门存储、索引和查询由机器学习模型生成的非结构化数据的向量表征的服务。
4. 混合检索将传统检索技术与向量检索技术相结合,能够提供更准确的检索结果。RAG是检索技术与大模型技术相结合的数据范式大模型能够利用最新数据和私域数据。
5. 信息化时代定义了关系型数据库的数据范式,解除了数据存储的桎梏。大数据时代定义了NoSQL的数据范式,解除了数据规模和业务数据复杂性的桎梏。生成式AI时代定义了LLM+VectorDB的数据范式,解除了非结构化数据的桎梏。
阅读原文

大模型压缩和推理加速

文章概要:

1 模型压缩和加速
1.1 量化> 12 蒸馏
13 剪枝> 1.4激活
. 推理服务加速>1V
2.2 Paged
3. 常见推理框架
阅读原文

大模型数学推理的终极拷问:OpenAI o1模型真的"会思考"吗?| 开创性"稀疏模型"横空出世,大模型效率提升30%

文章概要:

1. 大模型数学推理的终极拷问:Open o1模型真的会思考"吗?br>2. 开创性"稀疏模型"横,模型效率提升30%
阅读原文

浪潮安澜大模型加速落地,探索水利行业新实践

文章概要:

. 浪潮安大模型加速落地,探索水利行业新实践
2. 浪潮水利机器人“水小梦”搭载了安模型,水利行业数据进行深度处理与挖掘分析,水文模型水,可以精准河湖水位变化趋势、的和洪等有效应对各种极端条件下的复杂情况各地水利部门提供智慧化决策支持以及全方位的保障。br> 3 浪潮安澜大在多地试点应用,智慧水务率先了模型服务。<> 4. 浪潮安大模型还广泛服务水文水资源、水旱灾害、工程调度、管理等多个关键领域。
5. 浪潮安澜模型在淄博岔河水文站、山东水文中心、灌区等地纷纷试点应用水利行业向数字化、智能化转型
6. 未来,浪潮安澜大将深度服务水利行业,优化模型算法,拓展应用场景,推动水利行业数字化转型和高质量发展做出贡献。
阅读原文

基于验证链(Chain of Verification)的大语言模型幻觉问题解决方案

文章概要:

1. 大语言模型M在生成内容时会遭遇幻觉问题,模型自信地输出或误导信息,依赖其准确的、工程师及用户了的挑战
2. 为解决这一,研究者提出了 of(验证链),该方法通过一层验证机制,降低模型的,了语言模型的。<>. 验证链是一种新兴方法,核心思想是在模型生成输出后,一个验证,类似于在工作流程了事实核查机制。br>.链的流程输出分解与组件验证、重新评估与最终答案。 阅读原文

产品发布第一天:推理大模型o1的满血版本和进阶模式震撼登场!

文章概要:

1. OpenAI发布推理大o的满血版本和模式,以及GPT Pro订阅服务> 2.1模型在思维简洁性上提升5%,回答复杂现实问题重大错误概率下降34%br> 3. o1支持图片输入未来几个月逐步网页浏览、文件上传等功能> 4. OpenAI推出ChatGPT Pro订阅服务,月20美元,可无限制o模型等功能
5. o1模式将利用更多计算资源深度思考,为最艰难的难题提供最佳解答
6.人员或若发觉o1模型推理能力,可考虑1 pro模式
7. 现正是体验大模型1的满血版本最佳,可访问小陀螺官方网站xtlai.cn了解更多信息
阅读原文

YOPO:LLaVA做剪枝,大幅缩减多模态大模型计算量至12%!

文章概要:

1. 本文以LLaVA为实验对象,一系列剪枝策略,将量压缩至12%保持了与原始模型同等的性能,并进一步在Qwen2-VL和InternVL2.上验证了剪枝策略的普性
本文提出从和计算模式面对多模态模型剪枝,以LLaVA对象将计算量至12%获得原始模型同等的性能进一步在Qwen2-VLInternVL20上了此种剪枝策略普。<>3 本文针对视觉token数量的快速增长导致计算复杂度呈二次方增长严重了模型可扩展性效率的问题,以LLa为例,分析了视觉计算中的冗余,并提出了一系列的枝,邻域的视觉注意力非注意力头的枝稀疏前馈网络投影和选择性丢弃视觉层。br>4 本文提出了四种核心策略,分别注意力机制、前馈网络和层剪枝多个角度优化视觉计算:邻域感知的视觉注意力非活跃头枝、稀疏投影的前馈选择性层丢弃。
5 研究对LLaVA-1.5-7B和aVA-.5-3B模型应用提出的四种剪枝并进行评估,显示剪枝后FLO分别减少至原始模型的25和12。
6. 为验证方法在剪枝计算冗余方面的可扩展性,将提出的策略与Pyramid和FastV方法在QAv2GQA大型基准上的剪枝进行了比较。<> 为验证枝策略适用性,将应用于其他多模态大(如wenL-7和VL-20)并在无需微调的情况下评估。
阅读原文

大模型驱动商业流程自动化,Text2Workflow实现高效业务流程管理

文章概要:

1. 业务流程自动化是企业提高效率、减少错误和节约成本的重要工具,传统的机器人流程自动化(RPA)通过执行预先编写脚本来自动化重复性任务,从而在减少人工干预的同时加快业务流程。
2. 随着业务环境的复杂化和动态变化,RPA的局限性也愈发明显,如依赖于预定义的规则和脚本,在处理非结构化数据或异常情况时无能为力等。
3. 生成型人工智能(GenAI)和大型语言模型(LL业务流程自动化带来了新的希望,它们能够处理更加复杂和动态的任务,如通过自然语言理解用户需求,并自动生成相应的工作流程。
4. Text2Workflow是一种创新的方法,旨在通过自然语言请求自动生成业务流程的工作流,它结合了GenAI和LL能够将的自然语言输入转换为可执行的JSON格式工作流。
5. Text2Workflow的方法分为多个步骤,包括分解创建、用户反馈循环、工作流创建和问题生成、手动完成工作流和工作流修改机制。
6. 在开发和验证Text2Workflow的过程中,研究团队设计了一套全面的评估方法,包括构建数据集、设计评估标准和指标等。
7. 实验结果显示,Text2Workflow在处理复杂任务时具有高效的自动化能力和较高的准确性,但存在一些局限性,如在处理某些特定工具和API时存在依赖性等。
8. 未来的工作将致力于解决这些问题,进一步提升系统的性能和适用范围,包括开发更加灵活和适应性强的提示框架、采用多个评估者的平均或共识评分、提升模型在处理复杂任务时的能力等。
阅读原文

数字中国迈向AI大航海时代,不同行业大模型构建智慧城市新质生产力和生产关系,以数据要素提升产业运营、管理和发展的预测和决策能力!

文章概要:

1. 数字中国迈向AI大航海时代,不同行业大模型构建智慧城市新质生产力和生产关系,以数据要素提升产业运营、管理和发展的预测和决策能力。
2. 介绍了多个行业大模型在城市建设中的应用,包括华知大模型、百舸船舶行业大模型、爱信诺信诺GPT财税产业大模型等。
3. 强调AI大模型在城市管理、规划、能源、医疗、交通等领域的重要作用。
4. 探讨AI大模型面临的数据隐私、算法偏见、伦理道德等问题,以及应对措施。
5. 指出AI大模型的应用推动了相关产业的发展和创新。
6. 对AI大模型的应用前景进行了展望。
阅读原文

漫画大模型简史 | IDCF

文章概要:

1 1943年伦·麦卡和沃尔特·皮茨提出人工神经元模型TLU
2 10灵《计算机器与》,“图测试”br> 3. 156年,在美国达特斯学院首次提出“人工智能的概念
. 159年,·塞缪尔了上自学习程序——西洋跳棋程序
.966年,·魏岑鲍姆开发了IZA是一个早期自然语言处理程序
6 19年,文·斯基和西摩·珀特《感知器》,指出了单层神经网络的
12年,约翰·霍普尔德霍普菲尔德网络
8. 16年,·鲁梅尔哈特等人重新引入了反向算法
199年杨立应用卷积神经网络于手写字符识别
0. 2006年,弗里·顿等人提出了深度信念网络
11. 202克斯·克里夫斯基开发出Net模型
1. 2014年,伊恩·德费罗提出了生成式对抗网络
13. 20年,论文《Attention Is All You》提出了Transformer架构
14. 201年,发布B>5 21年,AI发布了2>. 200,AI发布了GPT-3
. 202年,AI了对话模型ChatGPT
8 203年,AI了GPT
阅读原文

人工智能大语言模型:技术进展与未来展望

文章概要:

1.语言模型的基石算力增长深度学习框架数据集的。< 2 大语言的训练推理效率性能提升、生成与推理能力应用生态更加多样、海量处理能力增强多模型加速应用落地
3. 大语言模型核心能力进阶:语境分析与知识融合、精确内容生成与搜索技术。br> 4 大模型未来趋势:体重要方向自适应与迁移学习能力的。> 5 面临挑战应对策略与数据挑战、保护数据安全能效与绿色计算。
阅读原文

全球大模型应用跟踪报告(11月)发布,洞察最新落地进展与未来趋势

文章概要:

1. 沙丘智库发布《大模型跟踪月报2241》,报告指出大模型正以前所未方式提供生产力和创造力,需持续跟踪其最新。br>. 20211收录49个大模型,IT/、银行、物流、、等行业的应用。
明星案例包括工商银行网络金融运营助手、证券大模型Grab利用GPT-4o打造智能的服务
阅读原文

生成+理解一体多模态大模型的思考

文章概要:

1. 文章介绍了生成+理解一体多模态大模型的主要方案,包括以语言模型核心和语言模型+扩散模型两类
2. 不同方案的结论:以LLM为的架构在训练和推理阶段更容易,但效果不是特别突出;加上扩散模型后视觉生成效果更好;使用两种编码器对多模态理解和生成任务有
.多模态训练细节:Chameleon从零开始训练Emu3分享了预训练后训练和PO的细节,Janus系列文章分享框架、时长使用打包提高训练效率>4. 未来方向:如何设计统一的视觉编码器,如何统一视觉生成和理解任务,LLM+扩散模型的方案值得持续投入
阅读原文

全球首个「社交大模型」强势来袭,人人将拥有“虚拟分身”,{数字人}行业原地起飞!

文章概要:

1. 介绍了全球首个「社交大模型」SOLAMI,它可以让用户通过语音和肢体语言与3D自主角色进行。
3. 展示了SOLAMI的性能评估结果,包括主观效果和客观指标,表明SOLAMI在社交互动方面具有优异的表现。
4. 讨论了SOLAMI优化方向,包括增加输入模态、收集更多数据、交叉实施、长期短期设计和利用更高效的学习方法等。
阅读原文

肖宇 李博文丨大模型应用对商业银行新质生产力的影响研究

文章概要:

1. 大模型应用对商业银行新质生产力的影响研究。2. 大模型的技术溯源和发展趋势。3. 商业银行大模型的技术路线。4. 大模型应用对商业银行新质生产力发展促进作用。5. 大模型应用推动商业银行新质生产力发展的路径探析。
阅读原文

大模型如何导演智能家居场景?技术架构与应用解析

文章概要:

1 从通用大到大智能家居的技术进化路径通用大模型AI的基石能力,行业审计局通过知识迁移、和优化,打造更懂的。
2 四大核心引擎包括安全计算引擎、数据转换引擎、家庭知识场景引擎,是技术能力与实际需求关键纽带。
3. 智能家居模型的价值现在用户端和研发端,体验将更加和智能化研发团队的开发效率也得到提升。< 4的未来将实现个性化服务再全场景互联的生态全面的数据隐私保护。<> 5. 从通用大到大,再到家庭场景的实际应用,行业大模型正在从多个维度定义的体验
阅读原文

OpenAI第一场直播就炸场!o1满血版上线,史上最贵订阅费:1450元/月

文章概要:

1. OpenAI发布最强推理模型o1满血版,同时推出ChatGPT Pro订阅计划,价格为每月0美元。<>.版o1在数学、代码和博士级科学问答三类任务上表现出色,速度比preview版快60%且具备多模态输入和视觉推理能力。br> 团队展示了Pro版在高难度生化问题上的,并表示将以API形式提供o1模型的功能。 阅读原文

痛失风口,数据中台和 AI 断层

文章概要:

1. 数据和人工智能(AI)是数字化时代的两大核心要素,数据决定了AI的上限,AI反哺数据,两者共同推动企业的智化< 2. 数据中台主要处理结构化和半结构化数据,难以实现对非结构化数据的有效管理、开发及治理,这是数据中台的薄弱点。
3. 企业对内部的非结构化数据做治理没有答案和成熟解决方案,我国依然处于智能化转型初期,很大比例的公司甚至还处于数据仓库搭建和摸索阶段。
4. AI是可见的巨型风口,数据中台略显尴尬,市面上已经有企业开始对当前数据中台进行架构升级,以适配AI发展的需求。
阅读原文