大模型-2024年10月5日最新技术资讯

成果分享 | “读懂地图”的多模态大模型MapReader

文章概要：

1. 成果负责人为中国地质大学（武汉）与工程学院教授禹文豪，主要从事地图综合、空间数据挖掘及大模型等。
2. 系统链接为https.bilibili.com/BV1dpszeoEew。
3. MapReader是一个用于地图分析的大型语言模型，其参数规模为17B（170亿）主要由 Transformer 编码器预训练的大型语言模型构成。
4. 为了使模型适应地图领域，收集了2000对高质量的地图对数据进行微调。
5. 训练策略采用了LoRA微调，将LoRA于T和LLM。
6Reader处理的最大目标长度为2048个tokens。预训练过程在4个A100 GPU上进行。

阅读原文

打造自己的RAG解析大模型：Windows部署OCR服务（可商业应用）

文章概要：

1. 文章介绍了如何在 Windows 环境中配置 OCR 相关模型，并完成了模型验证，还讲解了如何将文本检测、方向分类和文本识别模型进行串联，最终搭建一个基础的 OCR 应用服务。
2. 文章详细描述了文本检测、检测框矫正、文本识别、得分过滤的过程。
3. 文章介绍了文本检测、文本识别串联模型推理验证的过程。
4. 文章介绍了基于PaddleHub Serving的服务部署的过程。
5. 文章介绍了安装服务模块的过程。
6. 文章介绍了启动服务的过程。
7. 文章介绍了请求服务的过程。
8. 文章介绍了文本检测、方向分类器和文本识别服务成功发布后，整个系统便可以解析 PDF、图片等文档中的文本内容。

阅读原文

1.3 国内外大模型『公司&模型&产品』现状概览及分析

文章概要：

1. 文章主要介绍当前格局和国内玩家。国外第一梯队目前还处于领跑状态，国内玩家主要分为传统互联网大厂、厂商。> 国外大模型主要包括AI、Google、Ant、Meta、Apple、xAI、Mistral AI，呈现OpenAI、Google、Antropic三家在轮番做SOTA模型的宝座，Meta始终占据开源领导者的地位的态势。
3. 国内大模型玩家主要包括传统互联网大厂如字节跳动、阿里巴巴、腾讯、百度，新AI六小龙如智谱AI、百川智能、零一万物、月之暗面、Minimax、阶跃星辰，以及其他AI厂商如DeepSeek、面壁智能等。
4. 文章还介绍了中文综合性能测评的SuperCLUE，包括总排行榜、开源排行榜、小模型排行榜。

阅读原文

【推荐】大模型落地路线图研究报告2024|附下载

文章概要：

1. 大模型技术能力不断创出新高，产业应用持续走深实，显著加快人工智能通用化、实用化、普惠化发展进程
2. 报告重点梳理了大模型应用落地遵循的诊断、建设、应用、管理四个重要阶段，归纳总结出能力分析、挖掘、方案、研发测试、应用开发、效能评估、运维监测、运营管理八个关键步骤
3. 大模型发展情况概述：算力水平的飞跃、数据规模的激增、算法能力的突破为大模型的长足发展提供了的技术基础
4. 大模型技术的突破得益于算力设施、数据资源、计算模式、网络架构等方面的源头创新
5. 在上述底层技术的有力支撑，大模型的技术能力不断提升，在“听、说”等感知领域已接近或超越了人类水平理解、思考和创造等认知领域已取得显著进展

阅读原文

必知！5大深度生成模型！

文章概要：

1. 本文汇总了常用的深度学习模型，深入介绍其原理应用。
2. 文章汇总了5种常用的深度学习模型，包括VAE、GAN、AR、Flow的原理、训练过程、优缺点和适用场景。
3. VAE，结合推断贝叶斯的深度生成模型。由生成器和判别器，通过相互竞争与对抗，共同进化，最终生成器能够生成非常接近真实数据的样本。AR是一种基于序列数据的生成模型，它通过预测序列中下一个元素的值来生成数据。Flow是一种基于可逆变换的深度生成模型。Diffusion Model通过模拟数据从随机噪声逐渐扩散到目标数据的过程来生成。

阅读原文

AI大模型架构解析与产业链浅析（一）

文章概要：

1. 本篇章开启AI大模型分析，基于人工智能架构识别AI大模型架构，从其组成部分思考产业链并浅析。
2. 人工智能架构包括应用层层、基础层，应用层按服务对象和功能分类，技术层可从感知层、认知层、平台层或通用技术层、算法层、框架层分类，基础层数据和算力。
3. AI大模型架构在人工智能架构基础上对数据层和计算能力层要求更高，在应用层和技术有扩展。
4. 基于AI大模型架构的行业现状浅析，应用层解决方案进入门槛低，短期价值高，演化路径为垂直或跨行业应用；应用平台进入门槛高，短期价值低，演化路径为向app store发展；技术层算法和框架进入门槛高，短期价值高，演化路径为向算法工具平台和开发者生态发展；基础层数据进入门槛高，短期和长期价值天花板高，演化路径为数据资产化；计算能力进入门槛高，短期和价值天花板高，演化路径为通用计算平台和计算服务生态趋势。

阅读原文

什么是transformer大模型，答案就在这里。

文章概要：

1. Transformer大模型是一种在自然语言（NLP）领域中广泛使用的模型，本质上是一个Encoder-Decoder架构。br>2. 自注意力机制是Transformer模型的核心，允许模型在处理序列中的每个元素，同时考虑序列中的其他所有元素，从而捕捉序列内部的长距离依赖关系。<> 为了增强模型的表示能力，Transformer引入了多头注意力机制，该机制在多个不同的空间并行地执行自操作。
4. 由于Transformer模型本身不包含循环或卷积，无法直接获取序列中元素的顺序信息因此需要位置编码来为中的每个元素添加位置信息。br>5. Transformer大模型通过自注意力机制和编码器-解码器结构，地数据，并在自然语言处理等多个领域取得了显著的性能提升。

阅读原文

AI大模型有哪些，收藏起来防踩坑。

文章概要：

1. 大模型是指具有数千万数亿参数的模型，通常由深度神经网络构建而成，数十亿甚至数千亿个参数。br>2. 大数据的收集是一个复杂而系统的过程，它涉及到多个环节和步骤：确定数据需求、选择数据来源、制定数据收集计划数据收集、数据清洗和预处理、数据存储和管理。
3. 大模型的数据处理是一个复杂且关键的直接关系到模型训练的效果和最终的性能。在数据处理之后，大模型可以通过用户数据预处理、数据建模、数据分析等方式进行分析。br>4. 大模型输入数据类型的不同，可以分为语言大模型、大多模态大。按照应用领域的，大模型主要可以分为L0通用模型L1大模型和L垂直大模型。大模型应用范围广泛，包括自然语言、图片生成、工业数字化等领域。
5. 大模型性能可以通过多种方式进行评估测试，包括基于公开的benchmark测试集跑分、在特定上的性能评估等。

阅读原文

大模型盘点④ | AI科创之城，中国VS全球

文章概要：

1. 文章介绍了生成式AI浪潮中各个城市的发展情况，包括蒙特利尔、硅谷、纽约、伦敦、巴黎、新加坡、北京和东京等。
2. 蒙特利尔和纽约在AI领域寻求突破，蒙特利尔拥有丰富的学术和技术大厂，纽约则在AI商业繁荣方面具备优势。
3. 伦敦和巴黎在欧洲AI领域竞争激烈，伦敦拥有更多的经验和人才，而巴黎在政府支持和产业多元化方面更具优势。
4. 亚洲的新加坡、北京和东京也在AI领域发展迅速，新加坡吸引了众多外来创业项目，北京成为亚洲的AI创新引擎，而东京在具身智能等领域表现强势。

阅读原文

大模型技术进阶路线，有了基础应该怎么进阶？

文章概要：

1 大模型技术的进阶包括模型优化、硬件加速、分布式并行计算等方面。br>2 模型优化的目的是用最小的成本，快速打造出一款能用的好用的大模型的方法有模型剪枝、模型量化和知识蒸馏等。
3 硬件加速可以通过增加GPU数量、优化模型架构和使用更高效的算法等方式实现，常见的加速设备有GPU、FPGA和ASIC
4. 分布式并行计算是把大模型根据模块或功能拆分，然后部署到多上进行计算，是模块的拆分，以及不同机器上协调和整合。

阅读原文

报告 | 《AI系列深度报告大模型篇：大模型发展迈入爆发期，开启AI新纪元》

文章概要：

1. 该报告对AI大模型进行了深入分析
2. 技术方面大模型发展呈现“规模定律”，是其
3. 市场方面，大模型竞争白热化，国产大模型能力对标GPT-.Turbo
4. 变现方面，大模型商业形态多元，API同质化且价格呈下降趋势，订阅实现难度高
5. 算力方面，大模型发展催生海量算力需求，增长的大模型与AI产品研发需求推升科技巨头支出

阅读原文

GPTs、扣子、Dify：为什么这些平台无法替代大模型开发技能？

文章概要：

1. GPTs、扣子、Dify等平台的：模板化开发限制灵活性，数据隐私和安全问题，依赖预训练模型的性能瓶颈，难以实现性能优化与深度自定义。
2 大模型原生技术的优势：完全的灵活性与控制权，数据安全性与合规性，性能优化与高效部署，长期成本控制与可持续性。

阅读原文

2025年大部分大模型企业会出问题

文章概要：

1 多模态通用大模型并不是人工智能的主要方向，人工智能是一个大系统，由智能感应、信息存储、信息传输、信息处理、智能终端这5个部分相辅相成，缺一不可。
2. 专用大模型才是市场机会，多模态通用大模型需要大量消耗算力和能源，会产生幻觉，无法输出高质量的结果，而专用模型可以实现高效率训练和推理。
3. 中国市场不可能支持百个通用大模型，的大模型投资是没有回报的，到了2025年大部分的大模型都会转向专用模型，去做一个专用的服务。

阅读原文

中国工业大模型行业发展研究报告

文章概要：

1. 工业大模型处于萌芽阶段，本质是概率模型，具有不可解释性和幻觉不可消除等特征。
2. 大模型落地工业具有可行性，部分工业企业已准备好数据原料，工业大模型进程可能快于工业互联网。
3. 工业大模型玩家与工业互联网平台玩家重合度高，产品、服务、落地场景都处于探索阶段。
4. 大模型落地工业的探索聚焦于偏运营、有一定容错能力的场景，生产制造等核心场景需静待模型进化。
5. 大模型落地工业的竞争要素包括基础能力、模型能力、模型应用，短期看大模型技术，长期看模型应用深度。
6. 工业大模型服务走向平台化，形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案。
7. 产业数据拉通助力工业大模型能力进化，对大模型落地工业的广度、深度都大有裨益。
8. 大模型落地工业的变现方式主要是定制化的综合解决方案服务收费，未来存在诸多可能。
9. 工业大模型市场还处于非常初期的阶段，成长路径可借鉴工业互联网平台。
10. 大模型落地工业的产品服务架构包括基础底座、模型及服务、模型应用，模型及服务是核心。
11. 大模型落地工业的产品落地模式主要以软件为主，具体产品形态还在摸索中。
12. 大模型落地工业的应用场景包括偏运营、有一定容错能力的场景，生产制造等核心场景需静待模型进化。
13. 大模型落地工业的挑战主要聚焦于模型、数据、应用、商业变现，各方相互影响。
14. 大模型落地工业的竞争要素包括基础能力、模型能力、模型应用，短期看大模型技术，长期看模型应用深度。
15. 工业大模型与工业专用小模型并存，且是协同融合赋能工业应用的关系。
16. 大模型落地工业的服务平台化特征以开始显现，且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案。

阅读原文

融资、投流、造血，大模型「新星」开启变现竞速

文章概要：

1. 2024年被称为“AI大模型应用元年”，行业变化太快，充斥着各种声音。原本漫长的技术发展周期，在大模型身上被装上了加速键。从卷参数、到卷应用，短短两年时间，玩家“百模大战”、资本烈火烹油，都在探索，又备受质疑。步入下半年，整个行业的风向更加微妙。
2. 分析机构Similarweb的最新数据指出ChatGPT网站的月度访问总量遭遇断崖式暴跌；OpenAI发布新品的节奏明显变慢；英伟达股价震荡，跌出美股市场的单日最高值；在国内也不乏给大模型“泼冷水”的大佬们……另一方面，国内大模型“新星”仍炙手可热。月之暗面被曝腾讯入局投资的消息，公司投后估值已达30亿美元；智谱AI拿到新一轮融资，金额高达数十亿元，投前估值200亿元；李飞飞首次创业项目World Labs宣布获得2.3亿美元融资，背后站着英伟达。
3. 行业正陷入“冰与火”的焦灼之中。而这背后，是市场逐渐对大模型祛魅，资本也回归理性，也只有当热潮退去，真正有价值的企业或应用才会浮现出来。
4. 但无论是哪个阶段，商业化都是大模型行业反复提到的话题。大模型的特殊性在于“烧钱”，技术上的研发成本，应用上的运行成本，每一步都少不了真金白银的支持，这也是大模型企业们的“紧箍咒”。
5. 尤其是像月之暗面、智谱AI这样的创业企业，它们不及巨头们的资金雄厚、资源丰富，如果一味地依赖融资输血，无法无法自我造血，则势必会被淘汰。
6. 潮水方向的变化推着大模型行业向前走。从“百模大战”走到“应用之战”，大模型行业即将进入新的阶段，而这个阶段，除了产品、应用外，找到一条属于自己的变现之路极为重要。

阅读原文

什么是大模型

文章概要：

1. 谈论“生成式人工智能”时，有两种不同的叫法偏好，分别是“生成式人工智能”和“大模型”。
2. “生成式人工智能”直接描述了技术的核心功能：生成内容，专业性强，方便学术界和工业界通用。
3. 很多人更喜欢用“大模型”这个词的原因主要源于文化的差异，包括强调技术实力和规模、符合中文表达习惯、市场营销和品牌定位。
4. 不管怎么称呼，关键是这些技术真真切切地影响着我们的生活。

阅读原文

如何搭建基于大模型的智能知识库

文章概要：

1. 从企业端观察到的情况来看，基于大模型的知识库是一个比较有潜力和价值的应用场景，能够帮助企业大幅提高知识的整合和应用效率。然而由于通用预训练大模型的训练数据主要来源于公开渠道，缺乏企业专业和私有知识，直接使用将难以支撑企业内部的专业知识问答。
2. RAG（Retrieval-Augmented Generation，检索增强生成）技术，能够在一定程度上解决以上问题。RAG，顾名思义，即通过引入存储在外部数据库中的知识以增强大模型的问答能力。具体来说，大模型在回答问题或生成内容前，首先在外部数据库中进行检索，将相似度高的内容返回给大模型再进一步整理生成。这种模式能够提高输出的准确性和相关性，避免大模型产生“幻觉”生成事实不正确的内容。RAG与LLM的集成正被迅速应用于构建知识库、聊天机器人以及其他大模型应用中。
3. 本文将简要介绍基于RAG与LLM的智能知识库的搭建过程，并展示一些开源的知识库项目。

阅读原文

今日AI-大模型-2024年10月5日

成果分享 | “读懂地图”的多模态大模型MapReader

文章概要：

打造自己的RAG解析大模型：Windows部署OCR服务（可商业应用）

文章概要：

1.3 国内外大模型『公司&模型&产品』现状概览及分析

文章概要：

【推荐】大模型落地路线图研究报告2024|附下载

文章概要：

推荐6个支持本地运行大语言模型的工具

文章概要：

推荐6个支持本地设备运行大语言模型的工具

文章概要：

必知！5大深度生成模型！

文章概要：

AI大模型架构解析与产业链浅析（一）

文章概要：

什么是transformer大模型，答案就在这里。

文章概要：

AI大模型有哪些，收藏起来防踩坑。

文章概要：

大模型盘点④ | AI科创之城，中国VS全球

文章概要：

大模型技术进阶路线，有了基础应该怎么进阶？

文章概要：

报告 | 《AI系列深度报告大模型篇：大模型发展迈入爆发期，开启AI新纪元》

文章概要：

GPTs、扣子、Dify：为什么这些平台无法替代大模型开发技能？

文章概要：

2025年大部分大模型企业会出问题

文章概要：

中国工业大模型行业发展研究报告

文章概要：

融资、投流、造血，大模型「新星」开启变现竞速

文章概要：

什么是大模型

文章概要：

如何搭建基于大模型的智能知识库

文章概要：