百图生科将于10月27日发布新一代全模态生命科学基础大模型|钛媒体AGI
文章概要:
1. 202年诺贝尔化学奖揭晓,一半授予美国华盛顿大学教授大卫·贝克,另一半授予英国人工智能公司谷歌DeepMind公司的丹米斯哈萨比斯和约翰·乔普。<> 2. 2024年10月26日-27日,百图生科&播禾创新联合主办的“AI解码生命,塑造—第三届中国计算大会,将在苏州工业园区金鸡湖畔的苏州国际中心举行。
3.此次大会上,BioMap百图生科发布新一代全模态生命科学基础大模型平台,覆盖蛋白质、DNA等7大生命科学主流模态。
4. BioMap百图科是全球生命基础大模型领域的领航者,由李彦宏刘维在2020年创立。
5. 公司致力于研发和应用前沿AI与生物技术,生命科学领域创新进程。<> 6. 会议主办方表示,本次大会将聚焦AI大模型如何驱动生命的创新与发展,而AI正在成为生物计算的推动力,将助力科研高效发展和成果的落地。
阅读原文
3.此次大会上,BioMap百图生科发布新一代全模态生命科学基础大模型平台,覆盖蛋白质、DNA等7大生命科学主流模态。
4. BioMap百图科是全球生命基础大模型领域的领航者,由李彦宏刘维在2020年创立。
5. 公司致力于研发和应用前沿AI与生物技术,生命科学领域创新进程。<> 6. 会议主办方表示,本次大会将聚焦AI大模型如何驱动生命的创新与发展,而AI正在成为生物计算的推动力,将助力科研高效发展和成果的落地。
新手友好 | 什么是大语言模型和RAG?
文章概要:
1. 大语言M)是一种旨在理解和生成人类的模型,在海量的数据上进行训练获得语言深层次的理解 涌现能力惊讶,它在模型中不,但在中突出类似中的相变现象,涌现能力像是模型性能规模增大而迅速提升,超过了随机水平,也就是我们质变br. 检索增强RAG)一种的架构,它庞大知识库中检索的以此为指导语言模型生成更为的,与>5. R是一个完整的系统,工作简单地分为数据处理检索、和生成。
阅读原文
Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic
文章概要:
1. 字节跳动和马里兰大学的研究团队发布了首个用于多任务评测的开源多模态大模型aVA-Critic。
2. 该团队构建了一个涵盖多样化评测场景和评分标准的评测指令遵循数据集。
3. 为使模型具备通用的评测能力,该团队对一个已经具备强大指令遵循能力的预训练多模态大模型进行指令微调。
4. 实验展示了LLaVA-Critic在两个关键领域的有效性。
阅读原文
2. 该团队构建了一个涵盖多样化评测场景和评分标准的评测指令遵循数据集。
3. 为使模型具备通用的评测能力,该团队对一个已经具备强大指令遵循能力的预训练多模态大模型进行指令微调。
4. 实验展示了LLaVA-Critic在两个关键领域的有效性。
新手友好 | 什么是大语言模型和RAG?
文章概要:
1 大语言(M)是一种旨在理解和人类人工智能模型与之对应的还有VLM,也称为视觉语言模型,是一种结合了视觉处理和理解的人工智能模型。
2语言LLM预的之一是它们的能力。涌现能力是一种令人惊讶能力,它在小型模型中不明显,但在大型模型中特别突出。
3.语言模型多种显著特点,这些特点使它们在自然语言处理和其他领域中了广泛的兴趣研究。
4. 检索增强生成(RAG)是一个完整的系统,其工作流程可以简单地数据处理、增强和生成四个阶段。
5. RAG是一个完整的系统其工作流程可以简单地分为处理、检索、增强和生成四个阶段。
阅读原文
2语言LLM预的之一是它们的能力。涌现能力是一种令人惊讶能力,它在小型模型中不明显,但在大型模型中特别突出。
3.语言模型多种显著特点,这些特点使它们在自然语言处理和其他领域中了广泛的兴趣研究。
4. 检索增强生成(RAG)是一个完整的系统,其工作流程可以简单地数据处理、增强和生成四个阶段。
5. RAG是一个完整的系统其工作流程可以简单地分为处理、检索、增强和生成四个阶段。
苹果一篇论文把大模型圈子得罪了!“踩着”OpenAI、Meta大模型上位,Gary Marcus:早就说大模型不会推理!
文章概要:
1. 苹果公司六位AI研究人员发表在语言模型中发现推理证据,引发争议。
2. 论文对一系列领先语言模型进行测试,发现问题措辞的会导致模型性能出现重大差异。
3. 苹果研究人员建议人工智能可能需要将神经网络传统的基于符号的推理相结合。4 部分网友认为该论文逻辑性和目的存疑,是“带货论文”。
5. Geometric Intelligence创始人兼首席执行官Gary Marcus认为,大模型无法进行足够抽象的形式推理的问题早已有之,标准神经网络架构进行可靠的推断和形式推理。
阅读原文
2. 论文对一系列领先语言模型进行测试,发现问题措辞的会导致模型性能出现重大差异。
3. 苹果研究人员建议人工智能可能需要将神经网络传统的基于符号的推理相结合。4 部分网友认为该论文逻辑性和目的存疑,是“带货论文”。
5. Geometric Intelligence创始人兼首席执行官Gary Marcus认为,大模型无法进行足够抽象的形式推理的问题早已有之,标准神经网络架构进行可靠的推断和形式推理。
因为简历上写了“熟悉大模型解码”,我被面试官问傻了...
文章概要:
1. 本文基于llama模型的源码,学习一些大模型的解码细节,属于初学者比较基础的学习笔记。
2. 首先抛出几个问题:大模型的解码速度和prompt有关系吗?大模型的解码速度是怎么计算的?大模型的解码超参数在源码中是怎么生效的?
3. 假设prompt为batch_size为1的10个token大部分场景下,模型的生成速度与prompt长度无关,仅与生成文本长度有关。如果使用大模型代替BERT做分类任务,即输出很短,那么耗时便与prompt的长度有直接关系。
4. 模型解码时,每次都会保存上一次decode时留下的past_key_value[0]与past_key_value[1],然后与新的key_states和value_states进行cat操作。
5. 首先推荐大模型新人都读一下:如何生成文本: 通过 Transformers 用不同的解码方法生成文本,下面均为huggingface的源码。
6. temperature的生效逻辑:scores在softmax之前除以temperature。
7. top_p的生效逻辑:先按照概率从大到小排序(源码是记录排序的index),找到最小token数量的集合,使得这些token的概率和>top_p。
8. top_k的生效逻辑:先按照概率从大到小排序(源码是记录排序的index),找到前top_k个token。
9. repetition_penalty生效逻辑:已经出现过的token,在后续计算其概率的时候,要除以self.penalty。
阅读原文
2. 首先抛出几个问题:大模型的解码速度和prompt有关系吗?大模型的解码速度是怎么计算的?大模型的解码超参数在源码中是怎么生效的?
3. 假设prompt为batch_size为1的10个token大部分场景下,模型的生成速度与prompt长度无关,仅与生成文本长度有关。如果使用大模型代替BERT做分类任务,即输出很短,那么耗时便与prompt的长度有直接关系。
4. 模型解码时,每次都会保存上一次decode时留下的past_key_value[0]与past_key_value[1],然后与新的key_states和value_states进行cat操作。
5. 首先推荐大模型新人都读一下:如何生成文本: 通过 Transformers 用不同的解码方法生成文本,下面均为huggingface的源码。
6. temperature的生效逻辑:scores在softmax之前除以temperature。
7. top_p的生效逻辑:先按照概率从大到小排序(源码是记录排序的index),找到最小token数量的集合,使得这些token的概率和>top_p。
8. top_k的生效逻辑:先按照概率从大到小排序(源码是记录排序的index),找到前top_k个token。
9. repetition_penalty生效逻辑:已经出现过的token,在后续计算其概率的时候,要除以self.penalty。
沈向洋院士:关于大模型的10个思考
文章概要:
1. 沈向洋院士在第四届“青年科学家50²论坛”上做了主题演讲,给出了他对大模型的10个思考。
2. 这10个思考分别是:算力是门槛、关于数据的数据、大模型的下、人工智能的范式转移、大模型横扫千行百业、AI Agent愿景到落地、开源vs闭源、重视AI的治理、重新思考人机关系、智能的本质。
3. 沈向洋院士认为,大模型的发展需要算力、数据和算法的支持,做GPT-5,需要更多的多模态数据和人工合成的数据。
4. 大模型的下一章是多模态的理解和生成的统一,需要做机器人和自动驾驶。
5. 人工智能的范式转移是从原来的GPT的预训练思路,变成了今天的自主学习的道路,需要非常多的算力。
6. 大模型横扫千行百业,不需要每个公司都做通用的大模型,可以在通用大模型上做行业大模型和个人大模型。
7. AI Agent是大模型的超级,需要理解工作流,才能做事情。
8. 开源和闭源都有各自的优势,需要根据实际情况选择。
9. 重视AI的治理,因为人工智能对千行百业、对整个社会的冲击非常大。
10. 重新思考人机关系,真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。
阅读原文
2. 这10个思考分别是:算力是门槛、关于数据的数据、大模型的下、人工智能的范式转移、大模型横扫千行百业、AI Agent愿景到落地、开源vs闭源、重视AI的治理、重新思考人机关系、智能的本质。
3. 沈向洋院士认为,大模型的发展需要算力、数据和算法的支持,做GPT-5,需要更多的多模态数据和人工合成的数据。
4. 大模型的下一章是多模态的理解和生成的统一,需要做机器人和自动驾驶。
5. 人工智能的范式转移是从原来的GPT的预训练思路,变成了今天的自主学习的道路,需要非常多的算力。
6. 大模型横扫千行百业,不需要每个公司都做通用的大模型,可以在通用大模型上做行业大模型和个人大模型。
7. AI Agent是大模型的超级,需要理解工作流,才能做事情。
8. 开源和闭源都有各自的优势,需要根据实际情况选择。
9. 重视AI的治理,因为人工智能对千行百业、对整个社会的冲击非常大。
10. 重新思考人机关系,真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。
AI大模型技术层行业分析
文章概要:
1. 组成部分与市场参与者:算法基础、创作者生态、相关算法/模型研究机构、框架供应商、AI开发平台供应商、开源社区。
2. 商业模式:算法基础商业模式、相关算法/模型研究机构商业模式、框架供应商商业模式、AI开发平台供应商商业模式、开源社区商业模式。
3. 主流算法:人工智能&机器学习&深度学习&强化学习的特征与关系、机器学习的分类、深度学习相关算法、强化学习相关算法。
4. AI大模型的相关算法:开发流程、应用。
5. 技术趋势:算法方面、开发框架方面。
6. 商业化趋势:算法基础商业化模式、相关算法/模型研究机构商业化模式、框架供应商商业化模式、AI开发平台供应商商业化模式、开源社区商业化模式。
阅读原文
2. 商业模式:算法基础商业模式、相关算法/模型研究机构商业模式、框架供应商商业模式、AI开发平台供应商商业模式、开源社区商业模式。
3. 主流算法:人工智能&机器学习&深度学习&强化学习的特征与关系、机器学习的分类、深度学习相关算法、强化学习相关算法。
4. AI大模型的相关算法:开发流程、应用。
5. 技术趋势:算法方面、开发框架方面。
6. 商业化趋势:算法基础商业化模式、相关算法/模型研究机构商业化模式、框架供应商商业化模式、AI开发平台供应商商业化模式、开源社区商业化模式。
双工大模型—真正的对话大模型
文章概要:
1. 论文分享会要开始了。2. 这篇为了解决交互体验不佳的问题,构造双工模型即生成输出的同时倾听用户,并进行动态调整,以及时生成合适的响应。3. 该方法两部分组成,首先作者描述了双工模型的设计实现,然后构建了双对齐数据集,以实现现存模型向双工模型的调整4. 实验模型:MiniCPM.B和基于MiniCPM2.4B微调的双工模型MiniCPMplex评估方式:GPT4和Human Evaluation。5. 对于GPT4评估,MiniCPM 表现更好 MiniCPMplex倾向于生成较短的输出。对于人类评估,MiniCPM在忠诚程度上表现更好,作者归因于MiniCPM更多样化的SFT。而对于其他的响应性,性,人类相似度,都是MiniCPM-duplex相对更高说明双工模型具有更好的体验。
阅读原文
国产大模型首次超过 GPT-4o!零一万物「闪电」只用 2000 张 GPU 追平马斯克 Grok
文章概要:
1. 零一万物发布新的预训练旗舰模型Yi-Lightning,在国际权威盲测榜单LMSYS上超越了OpenAI今年5月发布的GPT-4o、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一
2. Yi-Lightning的推理速度大幅提升首包时间较上半年发布的Yi-Large减少一半,最高生成速度提速近四成,堪称“极速”
3. Yi-Lightning还在保持高性能的同时,了推理成本的进一步下降,每百万token需0.99元,直逼行业最低价
4. 零一万物用了xAI的2%左右的成本就打平了Grok
5. Yi-Lightning在LMSYS总榜上的最新排名胜过硅谷头部企业OpenAI、Anthropic发布的GPT-4o-2024-05-13、Claude 3.5net,在一众国内大模型中拔得头筹
6. Yi-Lightning在中文分榜上,超越了xAI发布的Grok-2-08-13、智谱发布的GLM-4-Plus等国内外优质模型,与o1-mini等模型并列排名世界第二
7.ning在多轮对话分榜上,超越了Google所发布的Gemini-1.5-Pro、Anthropic发布的Claude 3.5 Sonnet等知名旗舰模型,排名第三
8. Yi-Lightning在数学、代码分榜上,分别取得第三、第四名
9. Yi-Lightning在艰难提问、长提问榜单上,均取得世界第四的优异成绩
10. Yi-Lightning能够丝滑地由实验室场景过渡到模拟真实用户场景,能够更快、更高质量地实现模型能力落地
11. 零一万物在AI Infra方面也做出了进一步优化,结合Yi-Lightning的自身特性,共同确保了模型即便在资源受限的环境下也能够保持稳定、出色的表现
12. 零一万物选择引入动态Top-P路由机制,这使得Yi-Lightning能够更加智能地适应各种任务需求,这也是它能够实现“极速推理”的一大
13. 零一万物还改进了单阶段训练,使用了多阶段的训练模式
14. 零一万物可探索的落地场景将会进一步扩展
15. 零一万物也首度对媒体公布了全新ToB战略下的首发行业应用产品AI 2.0数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案
16. 零一万物能够基于客户的特殊需求,进行高效地针对性训练,快速交付贴合特定服务场景、极速推理、成本极低的私有化定制模型
17. 零一万物此次推出的Yi-Lightning模型一经亮相,就在世界权威的盲测榜单LMSYS中击败了OpenAI今年五月发布的GPT-4-2024-0513
18. 零一万物会坚持“模型+AI Infra+应用”三位一体的全栈式布局,以国际SOTA的基座模型为基础,积极在ToB企业级解决方案上探索TC-PMF,以更从容的姿态迎接即将到来的AI普惠时代
阅读原文
2. Yi-Lightning的推理速度大幅提升首包时间较上半年发布的Yi-Large减少一半,最高生成速度提速近四成,堪称“极速”
3. Yi-Lightning还在保持高性能的同时,了推理成本的进一步下降,每百万token需0.99元,直逼行业最低价
4. 零一万物用了xAI的2%左右的成本就打平了Grok
5. Yi-Lightning在LMSYS总榜上的最新排名胜过硅谷头部企业OpenAI、Anthropic发布的GPT-4o-2024-05-13、Claude 3.5net,在一众国内大模型中拔得头筹
6. Yi-Lightning在中文分榜上,超越了xAI发布的Grok-2-08-13、智谱发布的GLM-4-Plus等国内外优质模型,与o1-mini等模型并列排名世界第二
7.ning在多轮对话分榜上,超越了Google所发布的Gemini-1.5-Pro、Anthropic发布的Claude 3.5 Sonnet等知名旗舰模型,排名第三
8. Yi-Lightning在数学、代码分榜上,分别取得第三、第四名
9. Yi-Lightning在艰难提问、长提问榜单上,均取得世界第四的优异成绩
10. Yi-Lightning能够丝滑地由实验室场景过渡到模拟真实用户场景,能够更快、更高质量地实现模型能力落地
11. 零一万物在AI Infra方面也做出了进一步优化,结合Yi-Lightning的自身特性,共同确保了模型即便在资源受限的环境下也能够保持稳定、出色的表现
12. 零一万物选择引入动态Top-P路由机制,这使得Yi-Lightning能够更加智能地适应各种任务需求,这也是它能够实现“极速推理”的一大
13. 零一万物还改进了单阶段训练,使用了多阶段的训练模式
14. 零一万物可探索的落地场景将会进一步扩展
15. 零一万物也首度对媒体公布了全新ToB战略下的首发行业应用产品AI 2.0数字人,聚焦零售和电商等场景,将最新版旗舰模型实践到行业解决方案
16. 零一万物能够基于客户的特殊需求,进行高效地针对性训练,快速交付贴合特定服务场景、极速推理、成本极低的私有化定制模型
17. 零一万物此次推出的Yi-Lightning模型一经亮相,就在世界权威的盲测榜单LMSYS中击败了OpenAI今年五月发布的GPT-4-2024-0513
18. 零一万物会坚持“模型+AI Infra+应用”三位一体的全栈式布局,以国际SOTA的基座模型为基础,积极在ToB企业级解决方案上探索TC-PMF,以更从容的姿态迎接即将到来的AI普惠时代
国产大模型,首次在榜单上干翻GPT-4o
文章概要:
1 1月16日上午,零一万物在线上举办新品发布会,推出全新旗舰大模型“Yi-Lightning”
2. 在国际权威盲测榜单LMSYS上,Yi-Lightning超越了Open的GPT-o-2024-05-13、Anthropic的Claude 3.5 Sonnet,总榜排名世界第六(与马斯克xAI的Grok并列),国产模型细分下暂列第一。<> 3. 新模型通过引入混合注意力机制和优化KV缓存,显著提高了模型
4. 目前,AI六小虎中有几家公司放弃预训练的消息在圈内传沸,开复在会上做了直接的回应。
5. 李复认为,如果将对手设定为,那么,国内这些大模型厂商在资金和资源,长期来看依然会有的差距
6 此前官宣不参团价格战的零一这次终于宣布API降价方案,价格降至每百万token仅收费0.99的极低水平,直逼行业最低价
阅读原文
2. 在国际权威盲测榜单LMSYS上,Yi-Lightning超越了Open的GPT-o-2024-05-13、Anthropic的Claude 3.5 Sonnet,总榜排名世界第六(与马斯克xAI的Grok并列),国产模型细分下暂列第一。<> 3. 新模型通过引入混合注意力机制和优化KV缓存,显著提高了模型
4. 目前,AI六小虎中有几家公司放弃预训练的消息在圈内传沸,开复在会上做了直接的回应。
5. 李复认为,如果将对手设定为,那么,国内这些大模型厂商在资金和资源,长期来看依然会有的差距
6 此前官宣不参团价格战的零一这次终于宣布API降价方案,价格降至每百万token仅收费0.99的极低水平,直逼行业最低价
李开复:大模型性能与推理成本,决定落地成败
文章概要:
1. 零一万物创始人李开复开宗明义,辟谣零一万物绝不放弃预训练,上线了新的预训练模型Yi-Lning。
2. 李开复称做好预训练模型是技术活,耗费大量资源,一定程度上是厂商技术能力和资金实力的体现。
3. 李开复认为中国的六家大模型公司只要有够好的人才,想做预训练的决心,额跟芯片都不会是的。
4. 零一万物今天正式宣布上线新旗舰大模型Yi-Lightning闪电模型,每百万token仅需0.99元,直逼最低价。
. 公司还公布了全新ToB战略下的首发行业应用产品AI 2.0数字人,零售和电商等场景,将最新旗舰模型Yi实践于具体行业。
6. 李开认为无论是to C还是to B、如何预判TC-PMF 是绕不开的命题。模型,两项关键因素直接影响着大模型的成败。
7. 李复重申了此前“不做赔钱的 B”这一观点,他称零一万物大模型toB的打法,首要任务是寻找少数能够按使用情况收费的方法,高的订单而不是项目定制方法。br>8. 零一toB整体解决方案是以自身技术能力和积累,凝练出标准化的to B解决方案。
阅读原文
2. 李开复称做好预训练模型是技术活,耗费大量资源,一定程度上是厂商技术能力和资金实力的体现。
3. 李开复认为中国的六家大模型公司只要有够好的人才,想做预训练的决心,额跟芯片都不会是的。
4. 零一万物今天正式宣布上线新旗舰大模型Yi-Lightning闪电模型,每百万token仅需0.99元,直逼最低价。
. 公司还公布了全新ToB战略下的首发行业应用产品AI 2.0数字人,零售和电商等场景,将最新旗舰模型Yi实践于具体行业。
6. 李开认为无论是to C还是to B、如何预判TC-PMF 是绕不开的命题。模型,两项关键因素直接影响着大模型的成败。
7. 李复重申了此前“不做赔钱的 B”这一观点,他称零一万物大模型toB的打法,首要任务是寻找少数能够按使用情况收费的方法,高的订单而不是项目定制方法。br>8. 零一toB整体解决方案是以自身技术能力和积累,凝练出标准化的to B解决方案。
央国企,开始猛扑大模型!(附30家名单)
文章概要:
1. 有人认为大不接地气,无法落地央国企开始加速布局大模型推动其落地动力。<> 2. 文中列举了30已成功发布的大模型,包括中国海国家电网、国网湖南电科院、中核八所、国家能源集团数智科技公司、中国中煤能源集团天津设计公司、中航信移动有限公司、中国石油、煤炭科学总院北大荒信息有限公司等。
3. 央国企发布和大模型是风向标,其背后有整个大模型产业链的支撑,也将让众多ICT和AI企业受益。
阅读原文
3. 央国企发布和大模型是风向标,其背后有整个大模型产业链的支撑,也将让众多ICT和AI企业受益。
沈向洋院士:关于大模型的10个思考
文章概要:
1. 近日,第四届“青年科学家50²论坛”在南方科技大学举行,美国国家工程院外籍院士沈向洋做了《通用人工智能时代,我们应该怎样思考大模型》的主题演讲,并给出了他对大模型的10个思考。
2. 沈向洋的10个思考包括:算力是门槛、关于数据的数据、大模型的下一章、人工智能的范式转移、大模型横扫千行百业、AI Agent,从愿景到落地、开源vs闭源、重视AI的治理、重新思考人机关系、智能的本质。
3. “青年科学家50²论坛”为新基石科学基金会的学术年会,由南方科技大学腾讯可持续社会价值事业部、新基石科学基金会联合主办。新基石科学基金会由腾讯在10年内出资100亿元人民币设立、独立运营,是目前国内最大的公益性科学基金会之一,它的设立和运行,是腾讯践行科技向善、长期主义投入科学资助的具体行动。
4. “青年科学家50²论坛”是“科学探索奖”获奖人的跨学科学术交流平台。“科学探索奖”于2018年设立,是一项由新基石科学基金会出资、科学家主导的公益奖项,是目前国内金额最高的青年科技人才资助项目之一。每位获奖人在受资助的5年期间,至少在论坛上分享一次自己的 BIG IDEA 和最新探索。“50²”寓意“科学探索奖”每年评选出的50位青年科学家,将对未来50年的科学技术突破产生重大影响。
阅读原文
2. 沈向洋的10个思考包括:算力是门槛、关于数据的数据、大模型的下一章、人工智能的范式转移、大模型横扫千行百业、AI Agent,从愿景到落地、开源vs闭源、重视AI的治理、重新思考人机关系、智能的本质。
3. “青年科学家50²论坛”为新基石科学基金会的学术年会,由南方科技大学腾讯可持续社会价值事业部、新基石科学基金会联合主办。新基石科学基金会由腾讯在10年内出资100亿元人民币设立、独立运营,是目前国内最大的公益性科学基金会之一,它的设立和运行,是腾讯践行科技向善、长期主义投入科学资助的具体行动。
4. “青年科学家50²论坛”是“科学探索奖”获奖人的跨学科学术交流平台。“科学探索奖”于2018年设立,是一项由新基石科学基金会出资、科学家主导的公益奖项,是目前国内金额最高的青年科技人才资助项目之一。每位获奖人在受资助的5年期间,至少在论坛上分享一次自己的 BIG IDEA 和最新探索。“50²”寓意“科学探索奖”每年评选出的50位青年科学家,将对未来50年的科学技术突破产生重大影响。
楚秀训练营 | 大模型:未来科技引擎
文章概要:
1. 大模型的起源可以追溯到20世纪的人工智能初期,那时的发展主要小规模专家系统和逻辑推理。
2. 近年来,大模型技术迅速迭代,迈入了多模态时代。
随着技术的不断进步,端侧大模型的落地速度也在加快。
4. 大模型在各行各业渗透日益加深,展现出强大的应用潜力。
5. 大模型应用开发得到了多方面的政策支持从中央到,政府都积极出台大模型产业的快速发展
6. 大模型的核心目标是提高模型的表达能力和预测性能,使其能够处理更加复杂的任务和数据。
阅读原文
2. 近年来,大模型技术迅速迭代,迈入了多模态时代。
随着技术的不断进步,端侧大模型的落地速度也在加快。
4. 大模型在各行各业渗透日益加深,展现出强大的应用潜力。
5. 大模型应用开发得到了多方面的政策支持从中央到,政府都积极出台大模型产业的快速发展
6. 大模型的核心目标是提高模型的表达能力和预测性能,使其能够处理更加复杂的任务和数据。
生成式AI大模型,高质量赛道上的“竞速跑”,各路纷纷入局!
文章概要:
1. 人工智能是质生产力的,AI大模型成为全球科技竞争核心、产业关键赛道及经济发展。
2. 在大模型快速发展,AI算力至关重要,是否拥有强大算力成为大模型及AI产业发展的关键。br>3 中国在大模型发展方面同样不遗余力,北京市经济和信息化局发布政策支持头部企业打造对标ChatGPT的模型。
4. AI大模型的真正价值最终将体现在具体中,未来产业竞争将从“规模”转向应用”,大模型的应用落地将面临高知识密度的挑战。br>5. 拓世集团从研发初期开始就注重数据参数的注入和学习吸收,提升了其知识检索和运用能力
6. 拓世集团始终以满足产业实际需求为出发点,推动各类产业智能化发展。
阅读原文
2. 在大模型快速发展,AI算力至关重要,是否拥有强大算力成为大模型及AI产业发展的关键。br>3 中国在大模型发展方面同样不遗余力,北京市经济和信息化局发布政策支持头部企业打造对标ChatGPT的模型。
4. AI大模型的真正价值最终将体现在具体中,未来产业竞争将从“规模”转向应用”,大模型的应用落地将面临高知识密度的挑战。br>5. 拓世集团从研发初期开始就注重数据参数的注入和学习吸收,提升了其知识检索和运用能力
6. 拓世集团始终以满足产业实际需求为出发点,推动各类产业智能化发展。
国产大模型首超GPT-4o,李开复:中美顶尖模型的时间差只有五个月
文章概要:
1. 零发布全新SOTA旗舰模型Yi-Light,在LMSYS Org发布的Chatbot Arena测评中排名世界第六中国第一在中文子榜单上超越了xAI发布的Grok--8-3、谱发布的GLM-4-等优质模型,o1-mini模型排名世界。
2 李开复在发布会上展示Yi-Lightning莎士比亚作品《尔王的翻译,展现了的互通能力。
3 李开复表示,GPT新发布o1之后的确带来了新灵感,后训练的性变高,不代表要彻底放弃预训练。
4. 零一万物toB和toC的业务,有了更明确侧重。针对国内的环境,推出了“AI 2.0”数字人,提供了动作训练、表情生成等能力,并配备 2.0门店短视频。
5. 零一万物也在观察什么时候适合在国内做什么样的产品。
6.Yi-Lning已上线Yi大模型开放平台,每百万token仅需0.99,直逼行业最低价。
阅读原文
2 李开复在发布会上展示Yi-Lightning莎士比亚作品《尔王的翻译,展现了的互通能力。
3 李开复表示,GPT新发布o1之后的确带来了新灵感,后训练的性变高,不代表要彻底放弃预训练。
4. 零一万物toB和toC的业务,有了更明确侧重。针对国内的环境,推出了“AI 2.0”数字人,提供了动作训练、表情生成等能力,并配备 2.0门店短视频。
5. 零一万物也在观察什么时候适合在国内做什么样的产品。
6.Yi-Lning已上线Yi大模型开放平台,每百万token仅需0.99,直逼行业最低价。
大模型技术学习过程梳理
文章概要:
1. 作者梳理大模型技术的框架,从理论、技术、应用等多个方面对大模型进行梳理。
2. 作者认为大模型技术是人工智能技术的一个分支,是目前主流的一个研究方向。
3. 大模型技术是一种仿造人类学习进化的一种方式,使用深度学习(机器学习)算法模仿人类大脑神经元,来实现智能的一种方式,其主要载体是神经网络。
4. 神经网络的主要结构为一个输入层,一个输出层,以及隐藏层(一个或多个层组成),不同网络层之间使用全连接的方式进行连接,每一个圆都代表着一个神经元。
5. 神经网络一种叫正向传播,损失计算和反向传播的方式来调整神经网络模型中每个神经元的参数。
6. 目前的大模型主要采用的是预训练的方式来实现智能的,简单来说就是给神经网络模型一堆资料,让它自己学,自己看,自己总结。
7. 大模型技术虽然很强大,但其有几个明显的缺点,第一就是知识是有限制的,因为采用的是预训练方式,因此大模型的知识最多只能到训练开始的时间节点,之后产生的新的知识大模型无法获取。
8. 其次,由于训练大模型的成本问题,导致很多企业无法承担大模型的训练成本,因此只能使用第三方的大模型,但第三方大模型没有在特定领域的数据上进行训练或微调,因此,其表现能力一般。
9. 这时RAG就出现了,RAG中文是检索增强,是通过外挂知识库的方式,提问大模型之前先从向量数据库中查询数据,然后一起输入到大模型,这样大模型就相当于有了一个外部资料库,遇到不懂的问题就可以通过查资料的方式解决。
10. 微调是在相似任务的预训练模型的基础之上,通过少量的数据对模型参数进行调整,使得其能够更加适应当前任务的一种方式。
11. 提示词的作用就是怎么更好的使用一个大模型。
12. 智能体就是大模型+外部工具实现的一种能够独自分析和解决复杂任务的一种载体,利用大模型的独立规划能力,让它根据自己的判断去调用外部工具完成任务。
13. 目前,大模型解决复杂任务,主要通过思维链(CoT)的方式来实现对复杂问题的分解。
14. langchain是一种人工智能开发框架,它封装了大部分调用大模型的细节,以及其它辅助功能,比如文档的加载,多个大模型的链式调用,提示模板的封装等。
阅读原文
2. 作者认为大模型技术是人工智能技术的一个分支,是目前主流的一个研究方向。
3. 大模型技术是一种仿造人类学习进化的一种方式,使用深度学习(机器学习)算法模仿人类大脑神经元,来实现智能的一种方式,其主要载体是神经网络。
4. 神经网络的主要结构为一个输入层,一个输出层,以及隐藏层(一个或多个层组成),不同网络层之间使用全连接的方式进行连接,每一个圆都代表着一个神经元。
5. 神经网络一种叫正向传播,损失计算和反向传播的方式来调整神经网络模型中每个神经元的参数。
6. 目前的大模型主要采用的是预训练的方式来实现智能的,简单来说就是给神经网络模型一堆资料,让它自己学,自己看,自己总结。
7. 大模型技术虽然很强大,但其有几个明显的缺点,第一就是知识是有限制的,因为采用的是预训练方式,因此大模型的知识最多只能到训练开始的时间节点,之后产生的新的知识大模型无法获取。
8. 其次,由于训练大模型的成本问题,导致很多企业无法承担大模型的训练成本,因此只能使用第三方的大模型,但第三方大模型没有在特定领域的数据上进行训练或微调,因此,其表现能力一般。
9. 这时RAG就出现了,RAG中文是检索增强,是通过外挂知识库的方式,提问大模型之前先从向量数据库中查询数据,然后一起输入到大模型,这样大模型就相当于有了一个外部资料库,遇到不懂的问题就可以通过查资料的方式解决。
10. 微调是在相似任务的预训练模型的基础之上,通过少量的数据对模型参数进行调整,使得其能够更加适应当前任务的一种方式。
11. 提示词的作用就是怎么更好的使用一个大模型。
12. 智能体就是大模型+外部工具实现的一种能够独自分析和解决复杂任务的一种载体,利用大模型的独立规划能力,让它根据自己的判断去调用外部工具完成任务。
13. 目前,大模型解决复杂任务,主要通过思维链(CoT)的方式来实现对复杂问题的分解。
14. langchain是一种人工智能开发框架,它封装了大部分调用大模型的细节,以及其它辅助功能,比如文档的加载,多个大模型的链式调用,提示模板的封装等。
打完“价格战”,大模型还要比什么?
文章概要:
1. 文章标题为微信公众平台。
阅读原文
从医学角度总结并点评已问世的中医药大语言模型
文章概要:
已问世的大语言模型、·岐伯、黄智、TCMM中医药大、-D·中医药模型、盘古大模型、华佗”中医药大模型”模型星火模型聪宝素问模型模型br>. 这些模型预训练和微调策略进行构建,了文献临床语应用于问答、辅助、药物研发及健康管理等场景。的主要问题高质量语料、模型透明度与、所提供和内在逻辑。<>. 交互应答类医学大模型真要。
阅读原文
车圈大模型落地竞速:从好用到易用,从尝鲜到常用
文章概要:
1. 大模型上车的口号越来越响,但无论是在智能驾驶、智能座舱等智能化配置,还是在汽车行业整个生态链条上,大模型还未实现最广泛地落地,上车效果也和理想状态存在差距。
2. 为了让更多用户用上大模型,并持续提升上车效果,大模型企业该如何布局“落子”呢?抓住汽车需求场景,满足用户多样化需求是大模型企业突围的关键方向。br>3. 在未来,大模型将持续改变汽车行业生态。而在汽车大模型竞速赛中,引擎为车圈提供了强大的豆包大模型系列,以及扣子专业版等完备的应用开发工具,豆包大模型也成为了AI原生应用生长的肥沃土壤。
4. 全民AI浪潮袭来,大模型不仅加速汽车行业向智能化迈进,还有望重塑全行业,成为新质生产力的关键支持技术。
阅读原文
2. 为了让更多用户用上大模型,并持续提升上车效果,大模型企业该如何布局“落子”呢?抓住汽车需求场景,满足用户多样化需求是大模型企业突围的关键方向。br>3. 在未来,大模型将持续改变汽车行业生态。而在汽车大模型竞速赛中,引擎为车圈提供了强大的豆包大模型系列,以及扣子专业版等完备的应用开发工具,豆包大模型也成为了AI原生应用生长的肥沃土壤。
4. 全民AI浪潮袭来,大模型不仅加速汽车行业向智能化迈进,还有望重塑全行业,成为新质生产力的关键支持技术。
大模型如何助力企业提升数据处理与分析能力
文章概要:
1. 大模型能够帮助企业高效处理和分析数据提升竞争力。br>2 九思智联模型广泛应用于多个业务场景,提供全方位服务支持。
3. 大模型具有海量数据处理能力,能同时处理结构化和结构化数据。br>4. 大模型具备高速数据处理与实时分析能力,满足企业对数据实时性的要求。
5. 大模型能自动化数据分析流程,提高效率、降低率。
. 大模型具有强大的自我学习,能自动优化分析过程。
7. 部分大模型支持模态数据与分析帮助企业更全面地理解数据。
8.说明大模型在电商、金融、制造等的应用效果。
. 未来,大模型将智能化、自动化和个性化,其他先进技术深度融合。
阅读原文
3. 大模型具有海量数据处理能力,能同时处理结构化和结构化数据。br>4. 大模型具备高速数据处理与实时分析能力,满足企业对数据实时性的要求。
5. 大模型能自动化数据分析流程,提高效率、降低率。
. 大模型具有强大的自我学习,能自动优化分析过程。
7. 部分大模型支持模态数据与分析帮助企业更全面地理解数据。
8.说明大模型在电商、金融、制造等的应用效果。
. 未来,大模型将智能化、自动化和个性化,其他先进技术深度融合。
太全面了!腾讯如何搭建适合自己的大模型
文章概要:
的2年6月发布行业大模型解决方案,以及20自研大模型br> 2. 腾讯的大模型业务起步较早,其投资策略也显示了公司对这一领域的重视。
3. 腾讯云通过自身算力、工程平台工具、开源其在大模型业务的发展。
4. 混元大模型的能力特点主要包括多轮对话能力、内容创作能力、逻辑推理能力和知识增强能力。
6. 腾讯MaaS服务案例包括文旅、金融、传媒、、政务和文创等领域。
阅读原文
3. 腾讯云通过自身算力、工程平台工具、开源其在大模型业务的发展。
4. 混元大模型的能力特点主要包括多轮对话能力、内容创作能力、逻辑推理能力和知识增强能力。
6. 腾讯MaaS服务案例包括文旅、金融、传媒、、政务和文创等领域。
大模型在行业垂直领域的应用前景
文章概要:
1. 大模型在行业垂直领域的应用前景是热门话题,对大模型应用可能率先突破的和场景进行了探讨。br> 2. 法律行业可能是大技术最先实现落地的领域之一,因其数字化程度高文本逻辑性强、规范性高,大模型在合同分析、法律条文解读等方面有应用潜力。
3. 金融行业对数据隐私和安全要求高,限制了大模型全面应用在风控系统中的异常检测、客户画像构建、智能等方面有应用。
4. 制造业是大模型应用的潜在领域,用于生产流程优化、故障预测性维护等方面,但信息化水平参差不齐,应用需要从数据收集和数字化入手。
. 医疗行业影像分析和辅助诊断方面备受关注,但医疗数据隐私保护要求严格,数据格式不统一,了应用难度。
6. 大模型的输入能力只是第一步,关键是如何利用信息解决企业实际问题目前大多数大模型难以实现有效落地。
7. 企业要实现大模型落地,数据的数字化和结构化工作,明确业务需求,人才培养,保持敏捷性和迭代性。
8. 未来,大模型在行业中的落地应用的不断迭代与行业需求的深度结合。
阅读原文
3. 金融行业对数据隐私和安全要求高,限制了大模型全面应用在风控系统中的异常检测、客户画像构建、智能等方面有应用。
4. 制造业是大模型应用的潜在领域,用于生产流程优化、故障预测性维护等方面,但信息化水平参差不齐,应用需要从数据收集和数字化入手。
. 医疗行业影像分析和辅助诊断方面备受关注,但医疗数据隐私保护要求严格,数据格式不统一,了应用难度。
6. 大模型的输入能力只是第一步,关键是如何利用信息解决企业实际问题目前大多数大模型难以实现有效落地。
7. 企业要实现大模型落地,数据的数字化和结构化工作,明确业务需求,人才培养,保持敏捷性和迭代性。
8. 未来,大模型在行业中的落地应用的不断迭代与行业需求的深度结合。
AI大模型行业分析
文章概要:
1. 2022年2月GPT-5的引发全球对大模型广泛关注,2023年国内高校率先发布产品,随后企业陆续推出大模型,目前国内大模型已超过300个,竞争激烈
2. 中国大模型市场发展迅速,2023年市场规模突破100亿元,未来将保持高速增长
3. 202年AI领域融资事件总数为585件,技术算法层融资事件182件,AI领域的31%
4 训练成本高昂,当前训练一次千亿时费用至少1.5亿RMB
5. 高端人才匮乏,中国能够做大模型的人才不超过百人
6. 训练过程不稳定,千亿模型的混合精度训练本身非常不稳定,且调试困难
7. 大模型推理都高算力,市场需求高涨叠加产能限制导致GPU市场严重供需失衡高性能GPU价格持续增长
8. 作为技术密集型产业进入大模型和激烈市场竞争中获得,都需要大量支持人才团队构建,高质量训练数据和大规模率保证>. 大模型产业的技术进步来源于科研创新和技术全球范围来看、欧洲和美国在领域的积累较多,三地论文发表量超过全球总数80%br> 10. 通用大模型正在经历创业爆发期,目前正处于“百模大战”深水区,市场竞争严重,资源、技术、人才和商业落地能力成为厂商迈向下一阶段的核心竞争力
阅读原文
2. 中国大模型市场发展迅速,2023年市场规模突破100亿元,未来将保持高速增长
3. 202年AI领域融资事件总数为585件,技术算法层融资事件182件,AI领域的31%
4 训练成本高昂,当前训练一次千亿时费用至少1.5亿RMB
5. 高端人才匮乏,中国能够做大模型的人才不超过百人
6. 训练过程不稳定,千亿模型的混合精度训练本身非常不稳定,且调试困难
7. 大模型推理都高算力,市场需求高涨叠加产能限制导致GPU市场严重供需失衡高性能GPU价格持续增长
8. 作为技术密集型产业进入大模型和激烈市场竞争中获得,都需要大量支持人才团队构建,高质量训练数据和大规模率保证>. 大模型产业的技术进步来源于科研创新和技术全球范围来看、欧洲和美国在领域的积累较多,三地论文发表量超过全球总数80%br> 10. 通用大模型正在经历创业爆发期,目前正处于“百模大战”深水区,市场竞争严重,资源、技术、人才和商业落地能力成为厂商迈向下一阶段的核心竞争力
大模型时代通信网络技术及新能力研究
文章概要:
1. 大模型的发展趋势和方向:AI加速智能算力的发展,大模型对算力、数据、应用形成新需求,大模型推动AI产业化和产业AI化。
2. 大模型对网络的需求和挑战:大规模训练对智算网络的需求与挑战,在线推理应用提出对网络架构的创新需求。
3. 应对方案:以网强算建设新一代智算中心网络,弹性调度,实现数据高通量极速传输,算网协同,实现跨DC协同训练,构建算网一体的智能调度体系,构建高品质入算网络。
4. 结束语:大模型时代运营商网络面临众多挑战,针对大规模训练能效低,样本上传慢、跨DC协同训练难问题,通过以算强网提供运得多、运得快、运得稳的智算中心网络,构建多路径聚合、带宽池化的弹性服务,以及算网协同来实现跨DC协同训练。在线推理应用存在算力获取难的问题,可引入SDN+SRv6可编程能力构建智能调度体系以及高品质入网络。未来,还将探索更多DC间协同训练的场景,满足用户随时随地获取智能算力的需求,让人工智能普惠千行万业。
阅读原文
2. 大模型对网络的需求和挑战:大规模训练对智算网络的需求与挑战,在线推理应用提出对网络架构的创新需求。
3. 应对方案:以网强算建设新一代智算中心网络,弹性调度,实现数据高通量极速传输,算网协同,实现跨DC协同训练,构建算网一体的智能调度体系,构建高品质入算网络。
4. 结束语:大模型时代运营商网络面临众多挑战,针对大规模训练能效低,样本上传慢、跨DC协同训练难问题,通过以算强网提供运得多、运得快、运得稳的智算中心网络,构建多路径聚合、带宽池化的弹性服务,以及算网协同来实现跨DC协同训练。在线推理应用存在算力获取难的问题,可引入SDN+SRv6可编程能力构建智能调度体系以及高品质入网络。未来,还将探索更多DC间协同训练的场景,满足用户随时随地获取智能算力的需求,让人工智能普惠千行万业。
大模型专题:2024人工智能中文大模型使用手册
文章概要:
1. 大模型概述:大具有庞大参数规模、复杂网络结构、性能和高计算资源需求等特点应用于自然语言、图像识别、语音识别和推荐系统等领域,发展趋势包括模型压缩与轻量化、模态学习与融合、保护与以及可持续性环保性随着深度学习在自然语言处理的进展,中文大模型,通过中文数据预训练提升能力,并介绍了一些国内知名的中文大模型AI平台及其特长。
2. 主要中文大模型介绍:文心一言是百度推出的,具有自然语言理解、智能推荐、多样化等功能,可通过官网或APP使用;Kimi是月之暗科技的,中英文对话、长文处理等,可通过APP或网页端使用;GLM是清华大学研发的开源模型,自编码和自回归预训练,官方或平台获取并安装使用;MiniMax是自主研发的大型语言模型,具备多种自然语言处理功能,可通过版或安装软件;通义千问是阿里云推出的,多轮对话、文案创作等功能,可浏览器插件或官网等方式;天工AI是昆仑万研发的,集成多种,可在电脑端、手机或小程序使用星火是讯飞具有语音识别、交互等功能,通过官网下载安装使用。
阅读原文
2. 主要中文大模型介绍:文心一言是百度推出的,具有自然语言理解、智能推荐、多样化等功能,可通过官网或APP使用;Kimi是月之暗科技的,中英文对话、长文处理等,可通过APP或网页端使用;GLM是清华大学研发的开源模型,自编码和自回归预训练,官方或平台获取并安装使用;MiniMax是自主研发的大型语言模型,具备多种自然语言处理功能,可通过版或安装软件;通义千问是阿里云推出的,多轮对话、文案创作等功能,可浏览器插件或官网等方式;天工AI是昆仑万研发的,集成多种,可在电脑端、手机或小程序使用星火是讯飞具有语音识别、交互等功能,通过官网下载安装使用。
中国移动发布九天善智多模态基座大模型及30款自研行业大模型
文章概要:
1. 10月12日,中国移动在第12届全球合作伙伴大会主论坛上九天善智多模态基座大模型,并推出30款自研行业大模型
2. 九天善智模态基座九天系列通用大模型的最新研发成果,模型四大功能提升,包括文本智能化解析、双工语音、视频与图像处理的双重、数据的深度洞察
3 九天善智多模态基座大模型多项关键技术指标达到业界领先,背后是中国移动的自主创新、栈国产化、化AI技术、复杂系统智能化能力等特有技术积累
4. 为促进国民经济智能化转型升级,中国移动深入金融、交通能源、制造等10+个行业,全自研30+横跨多领域的行业大模型,基于大模型的规模化应用蓬勃发展> 5.善多模态基座大模型及30款自研行业大模型的不仅是中国移动在构筑经济社会智能化引擎方面迈出了一步,更是加速了“AI+”战略在中的深度融合与应用
阅读原文
2. 九天善智模态基座九天系列通用大模型的最新研发成果,模型四大功能提升,包括文本智能化解析、双工语音、视频与图像处理的双重、数据的深度洞察
3 九天善智多模态基座大模型多项关键技术指标达到业界领先,背后是中国移动的自主创新、栈国产化、化AI技术、复杂系统智能化能力等特有技术积累
4. 为促进国民经济智能化转型升级,中国移动深入金融、交通能源、制造等10+个行业,全自研30+横跨多领域的行业大模型,基于大模型的规模化应用蓬勃发展> 5.善多模态基座大模型及30款自研行业大模型的不仅是中国移动在构筑经济社会智能化引擎方面迈出了一步,更是加速了“AI+”战略在中的深度融合与应用
垂直大模型的第一关:把数据“煮熟”
文章概要:
1. 垂直大模型的第一关:把数据“煮熟”。在应用上下功夫,被很多人认为是中国大模型超车的捷径。应用就要落脚到各个行业和场景,也就是垂直大模型。但是做垂直模型也面临着很多难关。
2. 垂直模型初具数据基础。随着各行业数字化水平持续提高以及大数据前沿技术的进步,许多企业和单位已经建立起自己中心、数据仓库等,积累了大量的行业性数据、商业性数据和用户数据,其内容和种类丰富,已经初步具备了发展大模型的技术和数据基础。
3. 数据管理的国家标准。近年来虽然对于数据管理和治理领域的标准重视程度日益提高,但其内容和方法确实缺少统一定义,通常以信息化、数字化系统建设为主要手段。
4. 挑战:大部分企业还处于2级阶段。从企业方面来说,领导层面的认识和决心是最重要的,是数智化转型的原动力。面对数据管理这样一项涉及众多部门、需要耗费大量精力和财力的工作,不同行业和地区的现状也差异较大。
5. 政务数据的特点与尝试。政府和政务数据是我国近年在数据治理领域意识比较领先的,发挥着积极作用。一方面各地政数局等数据主管部门牵头制定公共数据共享服务标准,规划和规范各地区数据治理的顶层设计。
6. 金融业数据“成熟度”较高。金融行业在数据管理方面,目前整体呈现出积极向好的态势,持续完善和提升,积极探索金融大模型的发展。
阅读原文
【直播预约通道开启】北京友谊医院王力华:医疗大模型应用实践与思考
文章概要:
1. 直播时间为10月17日(周四)下午14:30
2. 直播平台为E-CHINC融媒体平台
3 人工智能是推动医学研究创新的重要支撑,大模型在医学领域的研究应用智能医学发展提供和方法,也是落实“健康中国”战略的重大创新举措与实践
4. 《中国数字医学》杂志社策划推出精准医疗的未来——大模型助力下新突破专题研讨,邀请业内分享大模型在医学领域的最新研究和进展
5. 第一期邀请北京友谊医院信息中心王力华主任,她将以“医疗大模型应用实践与思考”主题进行分享
6. 王力华主任将以北京友谊医院为背景,通过医疗大模型结合语音技术生成门诊电子病历实践,以及在此过程中的问题和挑战,医疗大模型医疗机构场景应用进行、思考和展望
阅读原文
2. 直播平台为E-CHINC融媒体平台
3 人工智能是推动医学研究创新的重要支撑,大模型在医学领域的研究应用智能医学发展提供和方法,也是落实“健康中国”战略的重大创新举措与实践
4. 《中国数字医学》杂志社策划推出精准医疗的未来——大模型助力下新突破专题研讨,邀请业内分享大模型在医学领域的最新研究和进展
5. 第一期邀请北京友谊医院信息中心王力华主任,她将以“医疗大模型应用实践与思考”主题进行分享
6. 王力华主任将以北京友谊医院为背景,通过医疗大模型结合语音技术生成门诊电子病历实践,以及在此过程中的问题和挑战,医疗大模型医疗机构场景应用进行、思考和展望
《大模型落地路线图研究报告》系列解读(7/18):剖析大模型关键落地路线,科学确立技术选型原则
文章概要:
1. 大模型能力提升,应用场景丰富,但在落地应用中面临多方面困难和挑战,应用方需根据自身情况选择合适的技术路线落地方案。
2 应用方应通过完善设计和系统的研发测试筑牢大模型技术底座,包括基础软硬件、数据集构建、模型选型等方案的设计,以及构建训练推理平台、应用服务平台,确立的安全风险处理机制。
阅读原文
2 应用方应通过完善设计和系统的研发测试筑牢大模型技术底座,包括基础软硬件、数据集构建、模型选型等方案的设计,以及构建训练推理平台、应用服务平台,确立的安全风险处理机制。
大模型时代通信网络技术及新能力研究
文章概要:
1. 随着大模型的高速发展,智算需求的增长速度远超芯片性能提升速度,计算集群方案和“DC as a Computer”概念应运而生,数据中心网络变得尤为重要。在大模型训练和推理时,集群对网络系统的稳定性要求极高。针对大业务特点结合主流集群网络技术,研究了训练场景下的超大规模组网、超高吞吐和超稳定的新一代智算中心网络技术,以及推理场景下通过SDN+SRv6可编程算网一体智能调度和切片技术构建高品质的入算网络,并研究了DC间协同训练的技术难点和应对方案。
2. 大模型的出现给国内电信运营商领域带来了技术创新的契机,更为其业务增长和竞争力提升提供了新的驱动力。本文旨在探讨大模型对运营商的影响,分析其在技术攻关、业务创新、产业升级的推动作用,探讨大模型如何助力运营商在算网融合进程中抓住机遇,并提出有效的应对方案和可持续发展的演进思路。
3. 大模型时代运营商网络面临众多挑战,针对大规模训练能效低,样本上传慢、跨DC协同训练难问题,通过以算强网提供运得多、运得快、运得稳的智算中心网络,构建多路径聚合、带宽池化的弹性服务,以及算网协同来实现跨DC协同训练。在线推理应用存在算力获取难的问题,可引入SDN+SRv6可编程能力构建智能调度体系以及高品质入算网络。未来,还将探索更多DC间协同训练的场景,满足用户随时随地获取智能算力的需求,让人工智能普惠千行万业。
阅读原文
2. 大模型的出现给国内电信运营商领域带来了技术创新的契机,更为其业务增长和竞争力提升提供了新的驱动力。本文旨在探讨大模型对运营商的影响,分析其在技术攻关、业务创新、产业升级的推动作用,探讨大模型如何助力运营商在算网融合进程中抓住机遇,并提出有效的应对方案和可持续发展的演进思路。
3. 大模型时代运营商网络面临众多挑战,针对大规模训练能效低,样本上传慢、跨DC协同训练难问题,通过以算强网提供运得多、运得快、运得稳的智算中心网络,构建多路径聚合、带宽池化的弹性服务,以及算网协同来实现跨DC协同训练。在线推理应用存在算力获取难的问题,可引入SDN+SRv6可编程能力构建智能调度体系以及高品质入算网络。未来,还将探索更多DC间协同训练的场景,满足用户随时随地获取智能算力的需求,让人工智能普惠千行万业。
大模型之网络安全分析
文章概要:
1. 本文优先对语言、多模态等各类基础大模型系统的安全风险进行系统梳理、算法模型、系统平台和业务应用四个重要组成部分,并通过描绘这四个组成部分面临的重要和一般安全风险,形成大模型安全风险地图。
2. 大模型在风险识别环节拥有显著模型自动化漏洞挖掘、自动化代码审计、智能网络攻击溯源等场景的商业化应用情况。
3. 大模型、自动化挖掘、审计、智能网络攻击溯源、动态管理、自动化告警分析、智能报文检测、智能钓鱼邮件检测、智能未知威胁检测、智能响应、智能事件报告生成、智能应急策略制定。
阅读原文
2. 大模型在风险识别环节拥有显著模型自动化漏洞挖掘、自动化代码审计、智能网络攻击溯源等场景的商业化应用情况。
3. 大模型、自动化挖掘、审计、智能网络攻击溯源、动态管理、自动化告警分析、智能报文检测、智能钓鱼邮件检测、智能未知威胁检测、智能响应、智能事件报告生成、智能应急策略制定。
哈工大“风筝”航天知识大模型开放测试
文章概要:
1. 哈尔滨工业大学社会计算与信息检索研究中心文本生成组(HIT-SCIR-TG)推出航天知识大模型“风筝”,主要面向青少年航天爱好者、航天领域从业人员。
2. “风筝”航天知识大模型在语言模型航天知识占比量以及航天领域问题回答能力的基准上超越了一众同等参数量级的开源模型。
3. 基于“风筝”航天知识大模型,研究中心与国内知名的航天科普及研讨社群“卫星百科”进行了合作,在其网站首页上线了卫星百科航天大模型。
4. 面向航天领域的大语言模型继续预训练需要高质量数据与高效训练算法的支撑,其中预训练数据是支撑模型各项能力的基础,决定了模型的性能上限;训练算法则是将数据中蕴含的知识转换为模型能力的关键部分,同时也是影响模型学习效率核心要素
5. 为了提升数据质量与训练效率,“风筝”大模型的构建流程针对两者分别进行了相应的优化。
6. 现有的领域大模型相关研究中,缺乏能够评价大模型在航天领域知识运用的数据集,因此研究中心构建了一个面向航天领域的评价基准。
7. 为了评价模型的知识问答能力,研究中心将评价基准分为两类任务。
8. 研究中心在评价基准上,比较了Qwen-2-7B-Instruct、Llama3-8B-Instruct、glm4-9B-chat和“风筝”航天知识大模型(FengZheng)。<>9. 结果表明“风筝”大模型在两类任务上均展现出较大优势。
10. 即使使用高质量数据对“风筝”航天知识大模型进行训练,它也可能由于幻觉或过时的知识而产生不准确的回复。为了解决这些问题,研究中心构建了检索增强生成 (RAG) 模块来增强“风筝”大模型的能力。
11. 受限于计算资源以及数据来源等原因,当前“风筝”航天知识大语言模型还存在以下局限性:
12. 目前的交互以及航天领域知识增强主要聚焦于中文,欠缺对包括英文在内的更多语言的优化,具备多语言能力的“风筝”大模型将于后续版本发布。
13. 模型目前更多关注航天基础知识的运用,后续将着重强化“风筝”大模型在航天科学研究中的落地,探索大语言模型赋能航天研究的技术路径。
阅读原文
2. “风筝”航天知识大模型在语言模型航天知识占比量以及航天领域问题回答能力的基准上超越了一众同等参数量级的开源模型。
3. 基于“风筝”航天知识大模型,研究中心与国内知名的航天科普及研讨社群“卫星百科”进行了合作,在其网站首页上线了卫星百科航天大模型。
4. 面向航天领域的大语言模型继续预训练需要高质量数据与高效训练算法的支撑,其中预训练数据是支撑模型各项能力的基础,决定了模型的性能上限;训练算法则是将数据中蕴含的知识转换为模型能力的关键部分,同时也是影响模型学习效率核心要素
5. 为了提升数据质量与训练效率,“风筝”大模型的构建流程针对两者分别进行了相应的优化。
6. 现有的领域大模型相关研究中,缺乏能够评价大模型在航天领域知识运用的数据集,因此研究中心构建了一个面向航天领域的评价基准。
7. 为了评价模型的知识问答能力,研究中心将评价基准分为两类任务。
8. 研究中心在评价基准上,比较了Qwen-2-7B-Instruct、Llama3-8B-Instruct、glm4-9B-chat和“风筝”航天知识大模型(FengZheng)。<>9. 结果表明“风筝”大模型在两类任务上均展现出较大优势。
10. 即使使用高质量数据对“风筝”航天知识大模型进行训练,它也可能由于幻觉或过时的知识而产生不准确的回复。为了解决这些问题,研究中心构建了检索增强生成 (RAG) 模块来增强“风筝”大模型的能力。
11. 受限于计算资源以及数据来源等原因,当前“风筝”航天知识大语言模型还存在以下局限性:
12. 目前的交互以及航天领域知识增强主要聚焦于中文,欠缺对包括英文在内的更多语言的优化,具备多语言能力的“风筝”大模型将于后续版本发布。
13. 模型目前更多关注航天基础知识的运用,后续将着重强化“风筝”大模型在航天科学研究中的落地,探索大语言模型赋能航天研究的技术路径。
从“AI四小龙”看“六小虎”,大模型独角兽难破盈利困局
文章概要:
1. OpenAI是全球最有价值大模型初创公司,主导大模型发展趋势。国内涌现出的百川智能等六家大模型初创企业,有大模型“六”之称。
2 昔日的“AI四小龙今不如昔,商汤、云从已成功登陆资本市场,但市值缩水严重,旷视科技上市进程尚未有实质性进展。
3. 大模型属于技术与资金密集型产业,需要投入庞大的资金,售卖大模型的未能从大模型中赚到钱,英伟达是当前唯一能赚到大钱的AI。
.模型初创公司需要融资,用以提升AI大模型能力,在大模型浪潮下,初创大模型企业要想变现尤为艰难<>. AI大模型风头虽盛,但存在巨大泡沫成份,其应用落地是核心,能够扎实稳健促进模型发展商业化成果转化,才是AI大模型“六”的出路。
阅读原文
2 昔日的“AI四小龙今不如昔,商汤、云从已成功登陆资本市场,但市值缩水严重,旷视科技上市进程尚未有实质性进展。
3. 大模型属于技术与资金密集型产业,需要投入庞大的资金,售卖大模型的未能从大模型中赚到钱,英伟达是当前唯一能赚到大钱的AI。
.模型初创公司需要融资,用以提升AI大模型能力,在大模型浪潮下,初创大模型企业要想变现尤为艰难<>. AI大模型风头虽盛,但存在巨大泡沫成份,其应用落地是核心,能够扎实稳健促进模型发展商业化成果转化,才是AI大模型“六”的出路。
预训练停摆,有一半大模型企业去做应用了?
文章概要:
1. 自年初以来,AI应用层的井喷被业界寄予厚望,成为今年AI领域的最强看点。近日有传闻指出,“大模型六小虎”中的百川智能与零一万物已经停止了大型模型的预训练工作,两家公司均予以否认。
. 据经济观察报统计,截至2024年10月9日,已有188项生成人工智能服务大模型通过网信办的备案,然而,在这些备案的大模型中,超过三成在通过备案并未进一步公开其进展情况;仅有约一成的大模型仍在持续加速模型训练;而接近一半的大模型则选择将重心转向AI应用开发。
3. 面对成本飙升与模型变现路径不明确的双重挑战,部分企业开始深刻反思自身的核心竞争力与资源分配。在这种背景下,一些企业选择了战略调整,放弃直接参与预训练,将重心转移至后训练阶段与应用开发。
4. 在这场AI的激烈角逐中,最终胜出的关键或许并不在于技术本身的先进性,而在于谁能更精准地将技术融入实际应用场景,满足用户的真实需求,创造出实实在在的价值。
阅读原文
. 据经济观察报统计,截至2024年10月9日,已有188项生成人工智能服务大模型通过网信办的备案,然而,在这些备案的大模型中,超过三成在通过备案并未进一步公开其进展情况;仅有约一成的大模型仍在持续加速模型训练;而接近一半的大模型则选择将重心转向AI应用开发。
3. 面对成本飙升与模型变现路径不明确的双重挑战,部分企业开始深刻反思自身的核心竞争力与资源分配。在这种背景下,一些企业选择了战略调整,放弃直接参与预训练,将重心转移至后训练阶段与应用开发。
4. 在这场AI的激烈角逐中,最终胜出的关键或许并不在于技术本身的先进性,而在于谁能更精准地将技术融入实际应用场景,满足用户的真实需求,创造出实实在在的价值。
独家盘点!2024中国通用及垂直大模型 | 104家一览
文章概要:
1. 文章介绍了2024中国通用及垂直大模型的盘点情况,共104家
2.提供了下载无水印的方式。
3. 文章提到了“雷军”追着骂引热议,AI配音或引官司的事件。
4. 文章探讨了当声音像真人时,普通人该如何避免被“录音门”。
5. 文章报道了2024中国数字人大会丨数字人赋能媒体创新论坛在京成功召开的消息。
阅读原文
2.提供了下载无水印的方式。
3. 文章提到了“雷军”追着骂引热议,AI配音或引官司的事件。
4. 文章探讨了当声音像真人时,普通人该如何避免被“录音门”。
5. 文章报道了2024中国数字人大会丨数字人赋能媒体创新论坛在京成功召开的消息。
文章推荐 | 军事大模型发展现状与算力基础设施需求分析
文章概要:
1. 本文探讨了大模型在军事领域的应用,包括信息收集与情报、武器系统开发、军事训练与作战仿真、医疗诊断与治疗、认知渗透攻击与网络安全防御、任务规划与供应链管理等方面,并对国内外主流军事大模型产品进行了分析。
2. 文章认为,大模型在军事领域的应用具有巨大潜力,但也面临着一些挑战,如政策限制、芯片短缺、投入产出比低、数据可用性和可解释性差,以及对战场人工智能失去控制的担忧等。
3. 文章建议,我国应开展军事人工智能大模型研究,加强算力基础设施建设,以提升我国在军事大模型领域的竞争力。
阅读原文
2. 文章认为,大模型在军事领域的应用具有巨大潜力,但也面临着一些挑战,如政策限制、芯片短缺、投入产出比低、数据可用性和可解释性差,以及对战场人工智能失去控制的担忧等。
3. 文章建议,我国应开展军事人工智能大模型研究,加强算力基础设施建设,以提升我国在军事大模型领域的竞争力。
要闻动态|金融行业大模型应用工作推进会举办
文章概要:
1. 10月16日市委金融办、市经信委召开行业大模型垂直应用推进会。市国资委、人民银行总部、上海金融监管局上海监局等相关政部门和金融管理与会,相关金融市场和金融基础设施、本市金融机构和通用大模型机构、行业三方服务等上海金融科技产业联盟作为行业组织受邀> 2. 会上,联盟介绍了依托各专委会创新中心、监管实验室以及人才基地平台,服务和促进金融行业开展大模型共创共研的工作举措与阶段成效
3. 上海金融联盟表示后续将紧密配合行业管理部门,好联盟成员覆盖面广、持续服务金融科技创新试点工作的特点,着力搭建好大模型在金融业应用中的公共服务平台,尤其针对大模型在行业应用落地过程中的痛点和共性需求,在行业语料库、模型训练场、人才策源地、场景挖掘和成果转化推广等方面努力形成机制,汇聚金融行业各方力量一批示范性、标杆性、可复制、可推广的大模型示范场景推动金融垂类大模型应用,促进本市新一代人工智能生态发展壮大
阅读原文
3. 上海金融联盟表示后续将紧密配合行业管理部门,好联盟成员覆盖面广、持续服务金融科技创新试点工作的特点,着力搭建好大模型在金融业应用中的公共服务平台,尤其针对大模型在行业应用落地过程中的痛点和共性需求,在行业语料库、模型训练场、人才策源地、场景挖掘和成果转化推广等方面努力形成机制,汇聚金融行业各方力量一批示范性、标杆性、可复制、可推广的大模型示范场景推动金融垂类大模型应用,促进本市新一代人工智能生态发展壮大
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
文章概要:
1 国产大模型首次在公开榜单上GPT-4o,零一万物对外发布新旗舰模型——Yi-Lightning(闪电)在模型竞技场(Chatbot Arena),-Lning性能直冲总并列第6,数学分榜并列第3,代码等其它分榜也名列前茅
2. 同时,国内清华系大模型公司智谱AI的GLM-4-Plus也进了总榜第9位
3. 细看大模型竞技场分类榜上的“赛况Yi-Lning各项能力都排在前头
. 发布会上,零一万物兼CEO李开复博士展示了Yining在场景上的
5. Yi-Lightning采用MoE混合专家模型,底层技术上,Yi-Lightning在优化混合注意力机制(Hybrid Attention),了跨注意力(Cross-Layer Attention, CLA),了动态Top-P路由机制等方面进行了提升
6. 零一绝不放弃预训练,而且在模型训练阶段,团队还积累了的多阶段训练方法
. 零一万物开发模型讲究“模基共建”共建模型基础架构
. Yi-Lightning这次也是打到白菜价——0.9每1M token
. 除了发布新模型,零一这次还首发了2.0数字人方案
10. 谈起和国外头部大模型差距,李开复博士表示这次Yi-Lightning的证明了国产模型跟硅谷最顶尖模型的差距缩小到五个月
阅读原文
2. 同时,国内清华系大模型公司智谱AI的GLM-4-Plus也进了总榜第9位
3. 细看大模型竞技场分类榜上的“赛况Yi-Lning各项能力都排在前头
. 发布会上,零一万物兼CEO李开复博士展示了Yining在场景上的
5. Yi-Lightning采用MoE混合专家模型,底层技术上,Yi-Lightning在优化混合注意力机制(Hybrid Attention),了跨注意力(Cross-Layer Attention, CLA),了动态Top-P路由机制等方面进行了提升
6. 零一绝不放弃预训练,而且在模型训练阶段,团队还积累了的多阶段训练方法
. 零一万物开发模型讲究“模基共建”共建模型基础架构
. Yi-Lightning这次也是打到白菜价——0.9每1M token
. 除了发布新模型,零一这次还首发了2.0数字人方案
10. 谈起和国外头部大模型差距,李开复博士表示这次Yi-Lightning的证明了国产模型跟硅谷最顶尖模型的差距缩小到五个月
数据“跃动”,“新”力量重塑商业格局
文章概要:
1. 在中经传媒智库举办的“发掘数据新力量”闭门会上,与会人员共同探讨了当前数据应用所展现的可见商业场景及数据治理、合规方面面临的问题。
2. 数据应用新场景:数字化时代,数据已成为关键的生产要素,不断催生出新的商业模式和丰富的应用场景,它打破了传统的商业边界,重塑着产业格局。从精准营销到个性化定制服务,从智能供应链管理到金融科技创新,数据的力量无处不在。企业通过挖掘和分析海量数据,能够更准确洞察消费者需求,优化产品和服务,提高运营效率,开拓新的市场空间。可以说,谁能更好地驾驭数据,谁就能够在激烈的市场竞争中抢占先机,引领行业发展的潮流。
3. 优质数据即竞争力:在数据新场景的不断拓展中,数据与实际业务结合带来了诸多的创新与变革,在此过程中,数据不仅仅是一种资源,更是企业在激烈市场竞争中脱颖而出的关键。
4. 数据资产入表的意义与价值:数据已成为企业的重要资产,特别是在优质数据成为企业核心竞争力的当下,如何有效管理和利用这些数据资产,使其发挥最大价值,是企业面临的关键问题。其中数据资产入表是一项重要的举措。
5. 数据治理:吴沈括将2019年定义为数据领域具有战略意义的一个年份。这一年,全行业对于数据有了全新的认知,特别是在人工智能语境下,数据资源、数据流转等问题的重要性,被提升到了关系国家未来发展及重塑国际格局的重要高度
阅读原文
2. 数据应用新场景:数字化时代,数据已成为关键的生产要素,不断催生出新的商业模式和丰富的应用场景,它打破了传统的商业边界,重塑着产业格局。从精准营销到个性化定制服务,从智能供应链管理到金融科技创新,数据的力量无处不在。企业通过挖掘和分析海量数据,能够更准确洞察消费者需求,优化产品和服务,提高运营效率,开拓新的市场空间。可以说,谁能更好地驾驭数据,谁就能够在激烈的市场竞争中抢占先机,引领行业发展的潮流。
3. 优质数据即竞争力:在数据新场景的不断拓展中,数据与实际业务结合带来了诸多的创新与变革,在此过程中,数据不仅仅是一种资源,更是企业在激烈市场竞争中脱颖而出的关键。
4. 数据资产入表的意义与价值:数据已成为企业的重要资产,特别是在优质数据成为企业核心竞争力的当下,如何有效管理和利用这些数据资产,使其发挥最大价值,是企业面临的关键问题。其中数据资产入表是一项重要的举措。
5. 数据治理:吴沈括将2019年定义为数据领域具有战略意义的一个年份。这一年,全行业对于数据有了全新的认知,特别是在人工智能语境下,数据资源、数据流转等问题的重要性,被提升到了关系国家未来发展及重塑国际格局的重要高度
高效的大模型量化感知训练方案,单卡完成70B模型QAT
文章概要:
1. 本文介绍一种新型量化量化方式EfficientQAT,它可以在保持INT量化容易落地部署的特性下,使INT量化达到与vector量化相当的性能,特别是可以在41小时内在单个A10080GB GPU上完成对2-bit Llama-2-70B模型的量化感知训练。
2. 本文也在huggingface上提供了量化后的模型,以及将量化模型repack成更多不同的格式,例如GPTQ格式以及BitBLAS格式。
3. 为了更好得理解量化操作是如何加速大语言模型的,本文首先介绍模型推理过程中的计算瓶颈。
4. 本文提出EfficientQAT的主要思路有两点:将整体的End-to-End Training解耦成同时包含Block-wise Training和End-to-End Training的两阶段训练方式;将weight的更新限制在Block-wise Training阶段
5. 本文实验结果表明,EfficientQAT在低bit场景相较于此前的uniform量化方案性能优势明显,同时产生于vector量化方案comparable的结果。
6. 本文总结EfficientQAT在内存使用和训练时间上均提高了量化感知训练的效率,经过全面测试,EfficientQAT在多样性和性能方面超越了现有的后训练量化、量化感知训练以及量化参数高效微调方法,适用于不同模型和量化级别。
阅读原文
2. 本文也在huggingface上提供了量化后的模型,以及将量化模型repack成更多不同的格式,例如GPTQ格式以及BitBLAS格式。
3. 为了更好得理解量化操作是如何加速大语言模型的,本文首先介绍模型推理过程中的计算瓶颈。
4. 本文提出EfficientQAT的主要思路有两点:将整体的End-to-End Training解耦成同时包含Block-wise Training和End-to-End Training的两阶段训练方式;将weight的更新限制在Block-wise Training阶段
5. 本文实验结果表明,EfficientQAT在低bit场景相较于此前的uniform量化方案性能优势明显,同时产生于vector量化方案comparable的结果。
6. 本文总结EfficientQAT在内存使用和训练时间上均提高了量化感知训练的效率,经过全面测试,EfficientQAT在多样性和性能方面超越了现有的后训练量化、量化感知训练以及量化参数高效微调方法,适用于不同模型和量化级别。
大模型关键技术与未来发展方向 :从ChatGPT谈起
文章概要:
1. 2020年OpenAI提出“规模定律”,模型的随着数量、数据量、训练时长的指数级增加呈现出线性,并且该提升对架构和优化超参数非常弱。
2. 除了GPT系列模型,、Meta等公司同样开始不断发布百亿到千亿的大型语言模型,Gopher、Chinchilla、PaLM但是这些模型不开源。br>3. 在模型架构方面,的大模型普遍为Transformer架构。模型的基座设计大体上可以分为三种:仅包含解码器(Decoder-only),即自回归(Autoregressive)模型;仅包含编码器(Encoder-only),即自编码(Autoencoder)模型;编码器—解码器(EncoderDecoder),即完整的Transformer结构。
4. 大模型在预训练阶段的主要任务是将世界知识融入模型中,是模型学习知识的过程。对齐大模型与人类偏好的目标是激发模型理解、适应人类意愿和解决问题的,强调的是使模型能够有效地应用预训练阶段获取的知识,使其具有多样化的能力,能够解决各种问题。
5. 目前主要通过方法实现:有监督调和人类反馈学习算法(ReinforcementLearningfromHumanFeedback,RLHF),有监督微调(SupervisedFine-tuning,SFT)是主要的大模型人类偏好对齐方法。<>6. 尽管大语言模型在多种任务中表现出强大的,但它们也存在生成“幻觉”内容的倾向,生成与用户输入、之前的上下文或者已知的知识不一致的内容。这一挑战对大模型在实际应用中的可靠性构成威胁。
7. 大模型具有强大的通用性,但往往缺乏特定领域的专业知识。为解决这些问题研究结合内外部知识,利用模型自身的通用能力从外部知识库中检索相关信息,同时完整的检索路径以增加可解释性。
阅读原文
2. 除了GPT系列模型,、Meta等公司同样开始不断发布百亿到千亿的大型语言模型,Gopher、Chinchilla、PaLM但是这些模型不开源。br>3. 在模型架构方面,的大模型普遍为Transformer架构。模型的基座设计大体上可以分为三种:仅包含解码器(Decoder-only),即自回归(Autoregressive)模型;仅包含编码器(Encoder-only),即自编码(Autoencoder)模型;编码器—解码器(EncoderDecoder),即完整的Transformer结构。
4. 大模型在预训练阶段的主要任务是将世界知识融入模型中,是模型学习知识的过程。对齐大模型与人类偏好的目标是激发模型理解、适应人类意愿和解决问题的,强调的是使模型能够有效地应用预训练阶段获取的知识,使其具有多样化的能力,能够解决各种问题。
5. 目前主要通过方法实现:有监督调和人类反馈学习算法(ReinforcementLearningfromHumanFeedback,RLHF),有监督微调(SupervisedFine-tuning,SFT)是主要的大模型人类偏好对齐方法。<>6. 尽管大语言模型在多种任务中表现出强大的,但它们也存在生成“幻觉”内容的倾向,生成与用户输入、之前的上下文或者已知的知识不一致的内容。这一挑战对大模型在实际应用中的可靠性构成威胁。
7. 大模型具有强大的通用性,但往往缺乏特定领域的专业知识。为解决这些问题研究结合内外部知识,利用模型自身的通用能力从外部知识库中检索相关信息,同时完整的检索路径以增加可解释性。
AI大模型、中模型、小模型谁主沉浮?
文章概要:
1. 通用人工智能需平衡成本与性能,产品定义要明确范围和性能,用低成本硬件实现满足需求的产品。
2. 通用人工智能的最大价值在于提供了更好的通用人机接口,使得人们可以用更接近自然语言的方式与计算机交互。
3. 大模型的应用可以非常广,但在其他绝大多数应用领域,大模型也就只是承担一个比较方便的人机接口而已,这个环节很快就体现不出什么直接的商业价值。
. 将人工智能与各个行业相结合,是商业价值最高的。而这些领域的人工智能应用在过去早就存在,未必一定要采用大模型技术。
5. 小模型的人工智能算法极强,应用范围及场景极为有限,因此所需要的训练硬件性能要求非常小,它甚至可以把人工智能算法应用都直接集成在摄像头里。
阅读原文
2. 通用人工智能的最大价值在于提供了更好的通用人机接口,使得人们可以用更接近自然语言的方式与计算机交互。
3. 大模型的应用可以非常广,但在其他绝大多数应用领域,大模型也就只是承担一个比较方便的人机接口而已,这个环节很快就体现不出什么直接的商业价值。
. 将人工智能与各个行业相结合,是商业价值最高的。而这些领域的人工智能应用在过去早就存在,未必一定要采用大模型技术。
5. 小模型的人工智能算法极强,应用范围及场景极为有限,因此所需要的训练硬件性能要求非常小,它甚至可以把人工智能算法应用都直接集成在摄像头里。
媒体智能从人工智能到“专家”智能,大模型如何深度赋能智能媒体创新发展?
文章概要:
1 中国传媒大学新媒体研究院院长赵子忠发布《大模型深度赋能媒体智创融合——中国智能媒体发展报告(2023—2024)》。
2. 大模型产业发展迅速,层次清晰,包括基础层模型层、工具层、生态层和应用层。
3. 大技术在规模与参数能力、泛化能力以及技术创新等多个关键领域取得突破性进展。
4. 大模型在媒体中的运用方向增加,包括内容生产、链条提质增效、视听产业链等。
5. 主流媒体应打造安全可控的媒体大模型技术底座,以推进媒体深度融合<>6. 2024年是智能体兴起之年,大模型智能体是基于大型预训练语言模型或多模态模型构建系统。
7. 智能体模式赋予AI更高自主性和独立性,大模型基于智能体应用创新有望赋能媒体全流程的内容生产与传播。
8. 媒体机构应践行生态思维,立足自身优势,参与大模型产业生态共建。
阅读原文
2. 大模型产业发展迅速,层次清晰,包括基础层模型层、工具层、生态层和应用层。
3. 大技术在规模与参数能力、泛化能力以及技术创新等多个关键领域取得突破性进展。
4. 大模型在媒体中的运用方向增加,包括内容生产、链条提质增效、视听产业链等。
5. 主流媒体应打造安全可控的媒体大模型技术底座,以推进媒体深度融合<>6. 2024年是智能体兴起之年,大模型智能体是基于大型预训练语言模型或多模态模型构建系统。
7. 智能体模式赋予AI更高自主性和独立性,大模型基于智能体应用创新有望赋能媒体全流程的内容生产与传播。
8. 媒体机构应践行生态思维,立足自身优势,参与大模型产业生态共建。
智谱张帆:大模型尚处于iPhone2时刻
文章概要:
1. 智谱张帆表示大模型尚处于iPhone2时刻,虽然发展迅速,但仍处于早期阶段,需要更多的探索和创新。
2. 智谱在过去两年经历了多个里程碑事件,包括模型产品的推出、与场景的结合以及解决方案的打造。
3. 大模型的业务价值已经得到证明,更多的是需要找到与业务的最大公约数。
4. 智谱的商业化过程中,北极星指标是客户价值,希望通过持续提供价值,加深合作,实现客户的续费和消耗量的稳定增长。
5. 智谱的战略是ToB、ToC并重,通过拓展广度和加深深度,实现价值验证。
6. 智谱未来的规划是通过技术洞察和价值验证的循环,推动大模型AI能力的进化。
7. 大模型的发展速度比预想的要快,但仍需要时间来实现超大规模商用。
8. 合作伙伴在考虑和智谱合作时,可能会担心模型能力与应用落地的契合点,智谱会通过提供方法论来帮助企业实现落地模型价值。
9. 快速拥抱大模型的客户特点是有足够的投入、信息化基础好、对新技术有拥抱,典型的行业包括金融、互联网、汽车手机、医疗、消费、教育等。
10. 客户在选择大模型时,会注重基座选择、组织的构建、数据资产的定义以及能力与业务场景的融合。
11. 人类达到AGI的速度在加快,大模型时代Killer App的出现一定会比互联网时代快。
12. 智谱希望在3年后成为AI时代的全新基础设施,通过合作伙伴将大模型转换为业务价值,推动社会科技的发展。
13. 创业者应该拥抱大模型,因为这是一个底层的、范式级变化,会带来更多的发展机会。
阅读原文
2. 智谱在过去两年经历了多个里程碑事件,包括模型产品的推出、与场景的结合以及解决方案的打造。
3. 大模型的业务价值已经得到证明,更多的是需要找到与业务的最大公约数。
4. 智谱的商业化过程中,北极星指标是客户价值,希望通过持续提供价值,加深合作,实现客户的续费和消耗量的稳定增长。
5. 智谱的战略是ToB、ToC并重,通过拓展广度和加深深度,实现价值验证。
6. 智谱未来的规划是通过技术洞察和价值验证的循环,推动大模型AI能力的进化。
7. 大模型的发展速度比预想的要快,但仍需要时间来实现超大规模商用。
8. 合作伙伴在考虑和智谱合作时,可能会担心模型能力与应用落地的契合点,智谱会通过提供方法论来帮助企业实现落地模型价值。
9. 快速拥抱大模型的客户特点是有足够的投入、信息化基础好、对新技术有拥抱,典型的行业包括金融、互联网、汽车手机、医疗、消费、教育等。
10. 客户在选择大模型时,会注重基座选择、组织的构建、数据资产的定义以及能力与业务场景的融合。
11. 人类达到AGI的速度在加快,大模型时代Killer App的出现一定会比互联网时代快。
12. 智谱希望在3年后成为AI时代的全新基础设施,通过合作伙伴将大模型转换为业务价值,推动社会科技的发展。
13. 创业者应该拥抱大模型,因为这是一个底层的、范式级变化,会带来更多的发展机会。
长序列(Long Context)大模型笔记
文章概要:
1. 过去一年中,长序列大模型的训练和推理方法在业界取得了显著进展,本文将从模型建模和机器学习系统两个方面进行总结,并讨论一些值得进一步探索的方向
2. 位置编码方面,RoPE更为友好,它有一个数学上的基础,利用绝对位置来获取相对位置,并且可以与flash attention适配
3. 目前业界在长序列建模中比较常用且有效的方法是RoPE Scaling
4. 长序列模型中的attention主要有两个方向:减少attention开销,例如线性attention和SSM等方法;保持attention的熵,尤其是在长序列上的表现,如LogN scaling
5. 在评估上,Perplexity和简单的大海捞针并不能很好地反映模型的实际性能
6. 要想获得较好的长序列效果,依赖外推还不够,许多产品级模型需要训练到实际长度
7. 推理阶段最关注的一个问题是KV压缩,长序列会导致KV cache占用大量显存,如何筛选出有用的KV cache以保持attention效果,同时减少不必要的内存占用是一个重要问题
阅读原文
2. 位置编码方面,RoPE更为友好,它有一个数学上的基础,利用绝对位置来获取相对位置,并且可以与flash attention适配
3. 目前业界在长序列建模中比较常用且有效的方法是RoPE Scaling
4. 长序列模型中的attention主要有两个方向:减少attention开销,例如线性attention和SSM等方法;保持attention的熵,尤其是在长序列上的表现,如LogN scaling
5. 在评估上,Perplexity和简单的大海捞针并不能很好地反映模型的实际性能
6. 要想获得较好的长序列效果,依赖外推还不够,许多产品级模型需要训练到实际长度
7. 推理阶段最关注的一个问题是KV压缩,长序列会导致KV cache占用大量显存,如何筛选出有用的KV cache以保持attention效果,同时减少不必要的内存占用是一个重要问题
银行业AI大模型,从入局到求变
文章概要:
1 银行业AI大模型的:大行占据领先位置,中小行“另辟蹊径”。
2. 银行业AI大模型的应用效果:智能客服回答“呆板”,中小银行在AI技术的筹备和应用相对滞后
3. 银行业AI大模型的未来:随着AI在应用场景的深入,银行业必将被发出更大的,创造更多的价值
阅读原文
2. 银行业AI大模型的应用效果:智能客服回答“呆板”,中小银行在AI技术的筹备和应用相对滞后
3. 银行业AI大模型的未来:随着AI在应用场景的深入,银行业必将被发出更大的,创造更多的价值
银行业AI大模型,从入局到求变
文章概要:
1. 银行业AI大发展现状:银行业成为AI大模型率先探索的重要行业,占据领先位置,场景应用上不断深入,如工行、邮储银行、建行、农行等在金融市场、客户营销等领域实现了多领域落地创新应用。
2. 银行业AI大模型应用效果:通过与智能客服沟通可窥见应用效果的差异如农业银行、招商银行等客服回答显得有些“呆板”,而浦发银行等则给出了较为具体的。
3. 中小银行AI大发展情况:中小银行在AI技术的筹备和应用上相对滞后,且面临着营收、盈利停滞甚至下滑的现实,不过越来越多的银行另辟径”地行动起来,如就大模型进行招标。
阅读原文
2. 银行业AI大模型应用效果:通过与智能客服沟通可窥见应用效果的差异如农业银行、招商银行等客服回答显得有些“呆板”,而浦发银行等则给出了较为具体的。
3. 中小银行AI大发展情况:中小银行在AI技术的筹备和应用上相对滞后,且面临着营收、盈利停滞甚至下滑的现实,不过越来越多的银行另辟径”地行动起来,如就大模型进行招标。
视觉语言大模型综述
文章概要:
1. 视觉语言大模型综述,介绍如何构建一个视觉语言大模型。
2. 视觉语言大模型的应用,包括图片描述、细节描述、实例检测、视觉问答、图像检索、零样本图像分类等。
3. 视觉语言大模型的发展历史,从简单结合到深度融合的过程。
4. VLM架构,包括Two-Tower VLM、Two-Leg VLM、Unified VLM。
5. 浅/早期融合,包括视觉编码器、视觉投影器/适配器。
6. 后期融合,包括CLIP、JINA CLIP、ColPali、ViTamin。
7. 深度融合,包括CLIPPO、Single-tower Transformer、DINO、KOSMOS-2、Chameleon、Fiber、BridgeTower、Flamingo、MoE-LLaVa。
8. VLM训练,包括预训练、微调、指令调优、使用LoRAs、多分辨率。
9. 训练数据集,包括大规模通用数据集、领域特定和任务导向。
10. 评估基准,包括VQA、MMMU、MME、MMStar、Math-Vista、其他视觉基准测试、针对文档的VLM基准测试。
11. 训练你自己的VLM前需要考虑的事,包括了解你的任务、选取现有的SOTA模型、确保损失函数经过了充分的考虑、选择或设计出适合你的基准、提出实际的业务指标、如果你正在微调、如果你是从零开始训练的话、作为资深从业者。
12. 结语,视觉语言大模型不仅拓展了我们与人工智能互动的边界,也为多个领域带来了无限可能。
阅读原文
2. 视觉语言大模型的应用,包括图片描述、细节描述、实例检测、视觉问答、图像检索、零样本图像分类等。
3. 视觉语言大模型的发展历史,从简单结合到深度融合的过程。
4. VLM架构,包括Two-Tower VLM、Two-Leg VLM、Unified VLM。
5. 浅/早期融合,包括视觉编码器、视觉投影器/适配器。
6. 后期融合,包括CLIP、JINA CLIP、ColPali、ViTamin。
7. 深度融合,包括CLIPPO、Single-tower Transformer、DINO、KOSMOS-2、Chameleon、Fiber、BridgeTower、Flamingo、MoE-LLaVa。
8. VLM训练,包括预训练、微调、指令调优、使用LoRAs、多分辨率。
9. 训练数据集,包括大规模通用数据集、领域特定和任务导向。
10. 评估基准,包括VQA、MMMU、MME、MMStar、Math-Vista、其他视觉基准测试、针对文档的VLM基准测试。
11. 训练你自己的VLM前需要考虑的事,包括了解你的任务、选取现有的SOTA模型、确保损失函数经过了充分的考虑、选择或设计出适合你的基准、提出实际的业务指标、如果你正在微调、如果你是从零开始训练的话、作为资深从业者。
12. 结语,视觉语言大模型不仅拓展了我们与人工智能互动的边界,也为多个领域带来了无限可能。
大模型前沿|MLLM篇:苹果多模态模型大升级!首个开源MLLM通用评测器LLaVA-Critic!
文章概要:
1. 苹果公司推出了升级版的多模态AI大模型——MM1.。
2. 港科大团队提出“个性化视觉指令微调”,旨在使MLLMs能够识别图像中的目标个体,并进行个性化和连贯的对话。
3. 苹果、香港科技大学和加州大学洛杉矶分校的研究团队建立了以自我为中心的多模态大模型MM-Ego。
4. 北京大学团队及其合作者提出了一种新方法——MLLM as ReTriever(MART),通过利用交互数据来微调基于偏好学习的MLLM Retriever,使Retriever充分考虑轨迹的有效性,并在未见任务中优先考虑它们,从而提高具身智能体的性能。
5. 字节跳动和马里兰大学的研究团队发布了首个用于多任务评测的开源多模态大模型LLaVA-Critic。
阅读原文
2. 港科大团队提出“个性化视觉指令微调”,旨在使MLLMs能够识别图像中的目标个体,并进行个性化和连贯的对话。
3. 苹果、香港科技大学和加州大学洛杉矶分校的研究团队建立了以自我为中心的多模态大模型MM-Ego。
4. 北京大学团队及其合作者提出了一种新方法——MLLM as ReTriever(MART),通过利用交互数据来微调基于偏好学习的MLLM Retriever,使Retriever充分考虑轨迹的有效性,并在未见任务中优先考虑它们,从而提高具身智能体的性能。
5. 字节跳动和马里兰大学的研究团队发布了首个用于多任务评测的开源多模态大模型LLaVA-Critic。
科技成果丨“仁文伏羲”中文大模型
文章概要:
1. 项目简介:随着计算能力的提升和大规模文本数据的积累,大语言模型展现出强大的语言理解和生成能力,为自然语言处理领域带来了革命性的突破,但也引发了一系列安全问题,需要特定的安全对齐训练。
2. 行业痛点:大语言模型可能带来伦理风险和对人类的潜在威胁,如传播有害信息、泄露私密敏感信息、产生误导性虚假性信息等,需要推动大语言模型技术的研究和突破。
3. 解决方案:仁文伏羲是由研发团队实验室自主的与中国人文伦理价值对齐的中文模型,目前1.0版本拥有67亿参数,进行了海量中文数据的“自监督学习”及大规模指令数据的“模仿学习”,展现了的问答、生成、对话、意图捕获、价值对齐等。
4. 市场应用:随着大语言模型的应用在各迅速扩大,模型的安全性和可信性问题日益成为焦点,市场对具备高度安全性和可信性模型技术需求正在迅速增长,特别是在医疗、金融、法律等信息准确性和隐私要求极高的领域。>5. 合作需求:具备人工智能、大数据、网络安全投资经验的投资方,通过的方式为我们提供资金支持,并在行业资源、市场拓展、交流等方面给予;希望寻找具备市场推广经验的合作伙伴,能够为公司提供协同、市场渠道和技术合作。
阅读原文
2. 行业痛点:大语言模型可能带来伦理风险和对人类的潜在威胁,如传播有害信息、泄露私密敏感信息、产生误导性虚假性信息等,需要推动大语言模型技术的研究和突破。
3. 解决方案:仁文伏羲是由研发团队实验室自主的与中国人文伦理价值对齐的中文模型,目前1.0版本拥有67亿参数,进行了海量中文数据的“自监督学习”及大规模指令数据的“模仿学习”,展现了的问答、生成、对话、意图捕获、价值对齐等。
4. 市场应用:随着大语言模型的应用在各迅速扩大,模型的安全性和可信性问题日益成为焦点,市场对具备高度安全性和可信性模型技术需求正在迅速增长,特别是在医疗、金融、法律等信息准确性和隐私要求极高的领域。>5. 合作需求:具备人工智能、大数据、网络安全投资经验的投资方,通过的方式为我们提供资金支持,并在行业资源、市场拓展、交流等方面给予;希望寻找具备市场推广经验的合作伙伴,能够为公司提供协同、市场渠道和技术合作。
苹果发文质疑:大语言模型根本无法进行逻辑推理
文章概要:
1. 苹果公司发文质疑大语言模型无法进行逻辑推理,并提出了一个名为GSM-Symbolic的新基准,对多个开源模型和闭源模型进行了大规模评估。br>2. 研究团队认为,当前的大语言模型缺乏真正的逻辑推理能力,更多是基于训练数据中的模式进行匹配,而非像人类一样进行和逻辑推导。
3. 研究团队从5个方面说明了为何他们认为大语言不具备形式推理能力:GSM8K的当前准确率并不可靠、对名称和数字变动的敏感性、问题难度的增加导致表现急剧下降、添加无关子对性能巨大影响规模和计算能力并不能解决根本问题。
4. 研究人员表示,总体而言,这项研究没有发现大语言具备正式的逻辑能力,它们的行为更像是复杂的模式匹配,甚至很脆弱,以至于简单改变名字就能导致结果变化约10%。
5. 随着大语言模型在各类应用场景中被广泛采用,如何确保它们能够处理更复杂、更多样化的问题,已成为研究领域面临的一个重大挑战。
阅读原文
3. 研究团队从5个方面说明了为何他们认为大语言不具备形式推理能力:GSM8K的当前准确率并不可靠、对名称和数字变动的敏感性、问题难度的增加导致表现急剧下降、添加无关子对性能巨大影响规模和计算能力并不能解决根本问题。
4. 研究人员表示,总体而言,这项研究没有发现大语言具备正式的逻辑能力,它们的行为更像是复杂的模式匹配,甚至很脆弱,以至于简单改变名字就能导致结果变化约10%。
5. 随着大语言模型在各类应用场景中被广泛采用,如何确保它们能够处理更复杂、更多样化的问题,已成为研究领域面临的一个重大挑战。
白熊智数以创新大模型应用,引领企业智能化转型之路
文章概要:
人工智能技术为行业带来变革,白熊智于大模型应用工具层产品研发引领技术革新潮流。br> 2. 白熊AI提供大模型,包括训练大模型、企业智能体应用开发等工具和产品,满足企业多样化场景需求。
3. 白熊智数的核心产品包括智能体和数字员工开发平台,以及大模型平台显著降低了模型训练门槛,了训练效果。
5. 白熊智数的团队来自哈工大赛尔实验室,还吸引了来自清华大学、东京大学等海内外知名院校的优秀人才加盟。
6. 白熊AI已获评“北京市通用人工智能创新伙伴计划”第三批模型伙伴企业,参与的项目被评为“2024人工智能大模型场景应用典型案例”。br> 7. 白熊智数将继续以AI技术为驱动,解决中小企业的数字化难题,将人们从的劳动中解放共同迎接更加智能、高效的。
阅读原文
3. 白熊智数的核心产品包括智能体和数字员工开发平台,以及大模型平台显著降低了模型训练门槛,了训练效果。
5. 白熊智数的团队来自哈工大赛尔实验室,还吸引了来自清华大学、东京大学等海内外知名院校的优秀人才加盟。
6. 白熊AI已获评“北京市通用人工智能创新伙伴计划”第三批模型伙伴企业,参与的项目被评为“2024人工智能大模型场景应用典型案例”。br> 7. 白熊智数将继续以AI技术为驱动,解决中小企业的数字化难题,将人们从的劳动中解放共同迎接更加智能、高效的。
大模型撬动数据新质生产力,我们重新解构了智能BI
文章概要:
1. 超级人工智能(ASI)能够真正学习任何数据的分布模式,产生任何数据分布底层规则,数据成为ASI这个人类愿景的关键词,而在通往ASI这条路上,越来越多与数据高度相关的工具或应用正在实现快速发展,这其中就包括在企业内深度挖掘数据价值、支撑数据分析的商业智能(BI)。
2. 在中国,根据前瞻产业研究院的数据,预计到2029年,中国商业智能软件市场规模将超过30亿美元,未来5年市场年复合增长率(CAGR)达到20%左右。然而,BI价值被广泛认可,但长期以来面临的“产品力”难题也不容忽视,例如高度的专业性导致企业内部人群覆盖度不足,以及BI输出能力有限,包括报表形式单一、数据分析深度不足等。
3. 从产品视角看,大模型与BI结合带来的“升级”价值体现为多个方面,包括使用门槛不断降低、呈现形式不断丰富、数据分析的客户价值不断强化等。
4. 强化产品力,大模型正在给BI行业带来新的增长曲线,甚至正在成为未来市场的主要增长动力。但是,AI+BI又并非一件“人人可以跟风”的事,存在客观上的门槛。
5. 做好智能BI的几个门槛逐一显露出来,包括“AI”、“BI”、“+”,它们都是智能BI在诞生伊始自带的“壁垒”,那些禀赋全面的厂商,正借此获得新的市场机遇。
6. 从2023年开始,AI、大模型在千行百业改变着时代格局,智能BI正是处在这样的浪潮中,它不仅帮助用户从数据获取价值、实现企业的数字化运营,还能助力业务人员优化流程、为客户提供更好的服务体验等,智能BI从各个维度直接提升企业的竞争力和效率,对企业的改变和价值要更加深远。
阅读原文
2. 在中国,根据前瞻产业研究院的数据,预计到2029年,中国商业智能软件市场规模将超过30亿美元,未来5年市场年复合增长率(CAGR)达到20%左右。然而,BI价值被广泛认可,但长期以来面临的“产品力”难题也不容忽视,例如高度的专业性导致企业内部人群覆盖度不足,以及BI输出能力有限,包括报表形式单一、数据分析深度不足等。
3. 从产品视角看,大模型与BI结合带来的“升级”价值体现为多个方面,包括使用门槛不断降低、呈现形式不断丰富、数据分析的客户价值不断强化等。
4. 强化产品力,大模型正在给BI行业带来新的增长曲线,甚至正在成为未来市场的主要增长动力。但是,AI+BI又并非一件“人人可以跟风”的事,存在客观上的门槛。
5. 做好智能BI的几个门槛逐一显露出来,包括“AI”、“BI”、“+”,它们都是智能BI在诞生伊始自带的“壁垒”,那些禀赋全面的厂商,正借此获得新的市场机遇。
6. 从2023年开始,AI、大模型在千行百业改变着时代格局,智能BI正是处在这样的浪潮中,它不仅帮助用户从数据获取价值、实现企业的数字化运营,还能助力业务人员优化流程、为客户提供更好的服务体验等,智能BI从各个维度直接提升企业的竞争力和效率,对企业的改变和价值要更加深远。
大模型撬动数据新质生产力,我们重新解构了智能BI
文章概要:
1. OpenAI 公司 CEO 山姆·奥特曼预言超级人工智能将在‘几千天内’降临。
2. 在中国,预计到 2029 年,中国商业智能软件市场规模将超过30亿美元,未来 5 年市场年复合增长率(C)20%左右。
3. 智能BI正成为众多厂商追捧的方向,以聊天式BI(ChatBI)为主要外在表现形式,例如思迈特在8月初发布的基于AI Agent的新一代智能BI,Smartbi AIChat 白泽。
4. 智能BI,强化BI“产品力”,从产品视角看,大模型与BI结合带来的“升级”价值体现为使用门槛不断降低、呈现形式不断丰富、数据分析的客户价值不断强化。
5. 做好智能BI的几个门槛逐一显露出来,“AI”、“BI”、“+”,即大模型只是AI运用到BI的一次进阶、AI+BI本质是AI for BI,BI能力积累是核心、场景实践是后进者的“叹息之墙”。
阅读原文
2. 在中国,预计到 2029 年,中国商业智能软件市场规模将超过30亿美元,未来 5 年市场年复合增长率(C)20%左右。
3. 智能BI正成为众多厂商追捧的方向,以聊天式BI(ChatBI)为主要外在表现形式,例如思迈特在8月初发布的基于AI Agent的新一代智能BI,Smartbi AIChat 白泽。
4. 智能BI,强化BI“产品力”,从产品视角看,大模型与BI结合带来的“升级”价值体现为使用门槛不断降低、呈现形式不断丰富、数据分析的客户价值不断强化。
5. 做好智能BI的几个门槛逐一显露出来,“AI”、“BI”、“+”,即大模型只是AI运用到BI的一次进阶、AI+BI本质是AI for BI,BI能力积累是核心、场景实践是后进者的“叹息之墙”。
中国大模型大逃杀开启:熬死对手,不下牌桌 | AI光年
文章概要:
1. OpenAI已成功获得66亿美元融资,估值突破1500亿美元,但财务状况依旧不容乐观,预计到2029年才能实现盈利
2. 国内大模型行业最热闹的是上半年的降价,互联网大厂更强调应用的落地和生态的建设,基础大模型迭代明显弱化
3. 投资圈从去年7月开始把更多精力放在了AI驱动的应用上,对于创业公司而言,面临的内外压力都很大
4. 被称为“AI六小虎”的6家中国大模型独角兽中,已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用
5. 大模型“烧钱”是众所周知的,进入2024年后,一个很明显的变化是,从高谈“烧钱”训练模型开始向“赚钱”能力上倾斜
6. 大模型价格战硝烟四起,这种烧钱打仗的局面,在互联网时代曾多次上演,通常是伤敌一千自损八百
7. 大厂也加入了这一轮价格战,各种免费让大模型六虎更加失去了优势
8. 海外已有AI独角兽被巨头收购,如果融不到钱,大模型六虎或许会走上Character.AI的老路
9. 当技术增长曲线放缓,国外大厂的路径是,开始下场收购中小公司,核心是为了挖走人才。这或许很快会在国内市场上演
10. 中国大模型经过一年的激烈角逐,当下业内基本形成了一个共识,未来不会超过五家,其中三家可能是大厂、两家是创业公司
阅读原文
2. 国内大模型行业最热闹的是上半年的降价,互联网大厂更强调应用的落地和生态的建设,基础大模型迭代明显弱化
3. 投资圈从去年7月开始把更多精力放在了AI驱动的应用上,对于创业公司而言,面临的内外压力都很大
4. 被称为“AI六小虎”的6家中国大模型独角兽中,已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用
5. 大模型“烧钱”是众所周知的,进入2024年后,一个很明显的变化是,从高谈“烧钱”训练模型开始向“赚钱”能力上倾斜
6. 大模型价格战硝烟四起,这种烧钱打仗的局面,在互联网时代曾多次上演,通常是伤敌一千自损八百
7. 大厂也加入了这一轮价格战,各种免费让大模型六虎更加失去了优势
8. 海外已有AI独角兽被巨头收购,如果融不到钱,大模型六虎或许会走上Character.AI的老路
9. 当技术增长曲线放缓,国外大厂的路径是,开始下场收购中小公司,核心是为了挖走人才。这或许很快会在国内市场上演
10. 中国大模型经过一年的激烈角逐,当下业内基本形成了一个共识,未来不会超过五家,其中三家可能是大厂、两家是创业公司
深度|No Priors谈大模型未来市场趋势:小模型,高性能
文章概要:
1. 大语言模型市场存在整合趋势一方面需要资本支撑,另一方面需要集成多种创新功能,企业需考虑差异化。
2. 大语言模型等人工智能产品的发展需要硬件层面上的进一步支持,硬件市场的资本输入是必要的,然而对趋势的预测可能是困难的。
3. 大语言模型市场的发展趋势是功能整合与差异化竞争并存,市场可能正在整合,但参与者未必都在盈利。
4. 一些领域会有通用模型,而其他应用领域则会有专门的模型,这是一个很大的开放性问题。
5. 随着时间推移,模型的体积正在缩小,而性能却不断提升,这可能是通过蒸馏实现的,也可能是其他技术推动的。
6. 大语言模型在被用于处理音像、图像和视频等方面信息时,会给人们非常酷的体验,随着模型变得更小、更好,它们也会变得更加实时化。
7. 芯片层可能会进一步加速某些领域的发展,企业需要从商业风险的角度来考虑,承担多少风险。
8. 半导体性能支撑了当下AI的所有工作,无论是训练还是推理,企业需要考虑如何超越AMD和NVIDIA的经济效益和性能。
阅读原文
2. 大语言模型等人工智能产品的发展需要硬件层面上的进一步支持,硬件市场的资本输入是必要的,然而对趋势的预测可能是困难的。
3. 大语言模型市场的发展趋势是功能整合与差异化竞争并存,市场可能正在整合,但参与者未必都在盈利。
4. 一些领域会有通用模型,而其他应用领域则会有专门的模型,这是一个很大的开放性问题。
5. 随着时间推移,模型的体积正在缩小,而性能却不断提升,这可能是通过蒸馏实现的,也可能是其他技术推动的。
6. 大语言模型在被用于处理音像、图像和视频等方面信息时,会给人们非常酷的体验,随着模型变得更小、更好,它们也会变得更加实时化。
7. 芯片层可能会进一步加速某些领域的发展,企业需要从商业风险的角度来考虑,承担多少风险。
8. 半导体性能支撑了当下AI的所有工作,无论是训练还是推理,企业需要考虑如何超越AMD和NVIDIA的经济效益和性能。
大模型引领搜索引擎模式大变革,新一代互联网入口就要来了!
文章概要:
1. 大模型将超越搜索引擎成为新一代入口:大模型在呈现质量和供给方式上有绝对优势,能更好地理解用户意图,并提供更具个性化和有针对性的互联网内容;大模型入口将成为用户终点,不再实现用户分流,ChatGPT进一步提升了超级App对用户的吸引力;大模型将与操作系统深度融合,当前,大模型可以实现通过自然语言调用操作系统的部分功能。br>2. 大将搜索引擎商业模式变革:搜索引擎升级为答案引擎,将简化用户工作流程,AI搜索的最大价值在于,相较于传统搜索引擎,它将信息的颗粒度从网页细化到信息本身,提升用户信息获取的效率;整合大模型能力后,搜索引擎的商业模式将面临两方面取舍,在收入方面,AI搜索引擎将创造许多新的收入来源,例如用户的订阅服务,然而,AI搜索引擎企业可能会遭遇广告收入问题特别是那些基于竞价排名机制的收入。
3. 大模型入口的产品形态和市场格局将经历3个发展阶段,培育期、混战期、统一期,将不在此展开描述,感兴趣的推荐阅读中国电信天翼智库大模型研究团队的《一本书读懂大模型:技术创新、商业应用与产业变革》,帮你总大模型核心技术基础设施、洞悉大模型行业应用实践、厘清大模型的商业模式和产业体系。
阅读原文
3. 大模型入口的产品形态和市场格局将经历3个发展阶段,培育期、混战期、统一期,将不在此展开描述,感兴趣的推荐阅读中国电信天翼智库大模型研究团队的《一本书读懂大模型:技术创新、商业应用与产业变革》,帮你总大模型核心技术基础设施、洞悉大模型行业应用实践、厘清大模型的商业模式和产业体系。
人工智能 | mixtral大模型
文章概要:
1. Mixtral是一种具有开放权重的高质量稀疏专家混合模型(SMoE),在大多数基准测试中优于Llama 2 70,速度提高了6倍,在大多数标准基准测试中匹配或优于GPT3.5。
2. Mixtral可以优雅地处理32k令牌的上下文,可以处理英语、法语、意大利语、德语和西班牙语,在代码生成方面表现出强大的性能。
3. 基于Hugging Transformers使用mixtral,可以使用pipeline作为高级助手,也可以使用langchain调用mixtral。br> 4. 推荐学习人工智能测试开发训练营,为大家提供全方位人工智能测试知识和技能培训。
阅读原文
2. Mixtral可以优雅地处理32k令牌的上下文,可以处理英语、法语、意大利语、德语和西班牙语,在代码生成方面表现出强大的性能。
3. 基于Hugging Transformers使用mixtral,可以使用pipeline作为高级助手,也可以使用langchain调用mixtral。br> 4. 推荐学习人工智能测试开发训练营,为大家提供全方位人工智能测试知识和技能培训。
2024年前三季度,大模型中标项目都被谁拿走了?
文章概要:
1. 22年前三季度,大模型中标项目数量和金额均实现大幅增长。
2. 从行业分布来看,教科、通信、能源、金融、政务是前五的行业;从地区分布来看北京、上海、广东深圳区域的项目数量占比维持在50%左右。
3 中标厂商以区域市场的科技类企业为主,其中中国电信系公司中标项目数量最多。
. 科大讯飞、百度、智谱AI的中标数量领先,部分企业还中标过金额较大的项目。
5. 科大讯飞中标项目主要分布在通信、金融、能源、教科等行业,以央国企客户为主;百度中标项目主要分布在、能源、通信、政务等,以央国企客户为主;智谱AI中标项目主要分布在通信、金融、能源、教科等行业,以央国企客户为主。
6. 腾讯云、阿里云、火山引擎中标项目数量相对较少,但在技术实力、资金实力、和生态等方面具有较强实力。
阅读原文
2. 从行业分布来看,教科、通信、能源、金融、政务是前五的行业;从地区分布来看北京、上海、广东深圳区域的项目数量占比维持在50%左右。
3 中标厂商以区域市场的科技类企业为主,其中中国电信系公司中标项目数量最多。
. 科大讯飞、百度、智谱AI的中标数量领先,部分企业还中标过金额较大的项目。
5. 科大讯飞中标项目主要分布在通信、金融、能源、教科等行业,以央国企客户为主;百度中标项目主要分布在、能源、通信、政务等,以央国企客户为主;智谱AI中标项目主要分布在通信、金融、能源、教科等行业,以央国企客户为主。
6. 腾讯云、阿里云、火山引擎中标项目数量相对较少,但在技术实力、资金实力、和生态等方面具有较强实力。
火山引擎发布大模型训练视频预处理方案,已应用于豆包视频生成模型
文章概要:
1. 火山引擎发布大模型训练视频预处理方案已应用于豆包视频生成模型
2. 火山引擎总裁谭待表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变
3. 火山引擎视频云正积极AI大模型与视频技术的深度融合,在技术底座、处理链路业务增长层面为企业寻找解法
4. 火山引擎视频云Yongyuan 指出,在视频时代,人和AI交互变得更加动态和生动,这要求处理更加智能交互
5. 火山引擎通过AI生成3D内容和大场景重建方案,为山西高平二郎庙金代戏台和北京正乙祠两座珍贵的历史建筑生成了3D数字资产,并以虚拟直播间的形式应用于抖音的戏曲直播场景
6. 王悦还透露了自研视频编解码芯片的进展,经过抖音集团内部的实践验证,该芯片在同等视频压缩效率下,节省了95%以上,还在202MSU世界编码器大赛中一举夺得最佳ASIC编码器
7.表示,该芯片将于近期正式对外开放测试,招募首批种子用户,共同探索商业价值复制性
阅读原文
2. 火山引擎总裁谭待表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经历着深刻转变
3. 火山引擎视频云正积极AI大模型与视频技术的深度融合,在技术底座、处理链路业务增长层面为企业寻找解法
4. 火山引擎视频云Yongyuan 指出,在视频时代,人和AI交互变得更加动态和生动,这要求处理更加智能交互
5. 火山引擎通过AI生成3D内容和大场景重建方案,为山西高平二郎庙金代戏台和北京正乙祠两座珍贵的历史建筑生成了3D数字资产,并以虚拟直播间的形式应用于抖音的戏曲直播场景
6. 王悦还透露了自研视频编解码芯片的进展,经过抖音集团内部的实践验证,该芯片在同等视频压缩效率下,节省了95%以上,还在202MSU世界编码器大赛中一举夺得最佳ASIC编码器
7.表示,该芯片将于近期正式对外开放测试,招募首批种子用户,共同探索商业价值复制性
会议综述 | 专题研讨三:大模型生成内容的侵权责任问题
文章概要:
1. 2024年9月25日,由北京知识产权法研究会、北京市海淀区律师协会主办的涉大模型著作权法问题研讨会暨人工智能相关案件的司法应对研究课题开题会在京举办,会议以“涉大模型著作权法问题”为主题,共设三个专题研讨环节,本文主要讨论了专题研讨三环节的内容:大模型生成内容的侵权责任问题。
2. 北京大学法学院教授张平认为,人工智能对著作权制度带来的真正挑战,不在于生成内容是否构成作品、以及权利主体及归属,其真正挑战的是“思想——表达二分法还能否成为版权侵权认定的判断标准。
3. 华中科技大学法学院副院长熊琦认为,随着创作和传播成为全民活动,大规模侵权和反复侵权带来的难题并未改变,而人工智能生成内容的可版权、权利归属及新兴平台的侵权认定方面产生了新的问题与挑战。
4. 北京知识产权法研究会信息网络与数据法委员会秘书长张吉豫认为,生成式人工智能根据用户提出的问题或提示语生成内容,一般而言服务提供者无法控制用户后续传播的行为,故应将讨论重点放在生成式人工智能如产生了侵权内容并提供给单一用户侧,怎样确认责任和救济方式。
5. 上海哔哩哔哩科技有限公司高级法务经理朱婷婷认为,人工智能生成内容是指利用人工智能技术,根据用户输入的指令,生成文字、图像、音频和视频等形式的内容,当讨论侵权责任时,主要涉及人工智能服务提供者、人工智能服务使用者两类主体。
6. 北京市海淀区人民检察院第二检察部副主任白云山认为,人工智能的输入数据主要来源途径有公共资源下载、爬虫技术获得和通过第三方购买,此阶段司法案件中需回溯到数据来源合法性问题,这意味着需重点关注数据的权属争议,如何平衡产业发展与权利人合法利益,需进一步探索解决路径。
7. 中国社会科学院法学研究所网络与信息法研究室副主任周辉认为,以“法定许可”规范数据训练行为符合著作权法立法初衷,可以更好为人工智能系统开发者提供支持创新和技术发展的生态环境,为训练数据利用相关作品的著作权人提供自身合法权益保护,兼顾和平衡研发者、利用者、著作权人乃至其他市场主体的利益需求。
8. 华东政法大学法律学院教授王迁认为,人工智能研发者训练者的侵权责任问题,应分情况讨论:一是算法设计存在缺陷,此时开发者应因其未能有效控制相似度而担责;二是不存在明显的算法设计缺陷,此时开发者需因过失担责;三是用户设法绕过“安全机制”,以纽约时报起诉Open AI和微软侵权案为例,此时人工智能开发者如有证据证实系“诱导”侵权,则不应承担责任。
9. 北京大学法学院认为,设置严格过滤义务对于我国来说为时尚早,其在制度涉及上缺乏弹性,不利于促进创新和产业技术发展。而欧盟推行了严格过滤义务,欧盟的数字产业相对落后,也印证了该制度选择的不合理性。避风港规则仍可在一定程度上发挥作用,因为多年来避风港规则对于互联网经济的持续发展具有重要价值。
10. 厦门大学知识产权研究院教授龙小宁认为,对于人工智能生成物应该给予保护,原因在于:对于人工智能(AI)技术的需求是源于对AI生成物的衍生需求,因而只有对后者提供保护,才能令其市场需求产生相应的经济回报,进而促进对AI技术的需求,最终切实促进科技创新、内容创作及人工智能技术的发展。
阅读原文
2. 北京大学法学院教授张平认为,人工智能对著作权制度带来的真正挑战,不在于生成内容是否构成作品、以及权利主体及归属,其真正挑战的是“思想——表达二分法还能否成为版权侵权认定的判断标准。
3. 华中科技大学法学院副院长熊琦认为,随着创作和传播成为全民活动,大规模侵权和反复侵权带来的难题并未改变,而人工智能生成内容的可版权、权利归属及新兴平台的侵权认定方面产生了新的问题与挑战。
4. 北京知识产权法研究会信息网络与数据法委员会秘书长张吉豫认为,生成式人工智能根据用户提出的问题或提示语生成内容,一般而言服务提供者无法控制用户后续传播的行为,故应将讨论重点放在生成式人工智能如产生了侵权内容并提供给单一用户侧,怎样确认责任和救济方式。
5. 上海哔哩哔哩科技有限公司高级法务经理朱婷婷认为,人工智能生成内容是指利用人工智能技术,根据用户输入的指令,生成文字、图像、音频和视频等形式的内容,当讨论侵权责任时,主要涉及人工智能服务提供者、人工智能服务使用者两类主体。
6. 北京市海淀区人民检察院第二检察部副主任白云山认为,人工智能的输入数据主要来源途径有公共资源下载、爬虫技术获得和通过第三方购买,此阶段司法案件中需回溯到数据来源合法性问题,这意味着需重点关注数据的权属争议,如何平衡产业发展与权利人合法利益,需进一步探索解决路径。
7. 中国社会科学院法学研究所网络与信息法研究室副主任周辉认为,以“法定许可”规范数据训练行为符合著作权法立法初衷,可以更好为人工智能系统开发者提供支持创新和技术发展的生态环境,为训练数据利用相关作品的著作权人提供自身合法权益保护,兼顾和平衡研发者、利用者、著作权人乃至其他市场主体的利益需求。
8. 华东政法大学法律学院教授王迁认为,人工智能研发者训练者的侵权责任问题,应分情况讨论:一是算法设计存在缺陷,此时开发者应因其未能有效控制相似度而担责;二是不存在明显的算法设计缺陷,此时开发者需因过失担责;三是用户设法绕过“安全机制”,以纽约时报起诉Open AI和微软侵权案为例,此时人工智能开发者如有证据证实系“诱导”侵权,则不应承担责任。
9. 北京大学法学院认为,设置严格过滤义务对于我国来说为时尚早,其在制度涉及上缺乏弹性,不利于促进创新和产业技术发展。而欧盟推行了严格过滤义务,欧盟的数字产业相对落后,也印证了该制度选择的不合理性。避风港规则仍可在一定程度上发挥作用,因为多年来避风港规则对于互联网经济的持续发展具有重要价值。
10. 厦门大学知识产权研究院教授龙小宁认为,对于人工智能生成物应该给予保护,原因在于:对于人工智能(AI)技术的需求是源于对AI生成物的衍生需求,因而只有对后者提供保护,才能令其市场需求产生相应的经济回报,进而促进对AI技术的需求,最终切实促进科技创新、内容创作及人工智能技术的发展。
一文彻底搞懂大模型 - Prompt Engineering、Function Calling、RAG、Fine-tuning
文章概要:
1. Prompt Engineering是指设计和优化输入给大型语言模型(LLM)的提示(Prompt)的过程,其核心要素在于通过明确的指示、相关的上下文具体的以及准确的输入来精心设计提示,从而引导大语言模型生成符合预期的高质量输出。
2. 在生成式AI的上下文中,函数调用通常指的是LLM在生成响应时,能够并执行特定的函数或API调用,以获取额外的信息或执行特定的任务。
3. RAG(Retrieval Augmented Generation,检索生成)是一种结合检索和生成的技术,旨在提高LLM在生成响应时的准确性和。
4. Fine-Tuning是指使用特定领域的数据集对预训练的大型语言模型进行进一步训练的过程,通过微调,模型可以学习到特定领域的知识和模式,从而在相关任务上表现更好。
阅读原文
2. 在生成式AI的上下文中,函数调用通常指的是LLM在生成响应时,能够并执行特定的函数或API调用,以获取额外的信息或执行特定的任务。
3. RAG(Retrieval Augmented Generation,检索生成)是一种结合检索和生成的技术,旨在提高LLM在生成响应时的准确性和。
4. Fine-Tuning是指使用特定领域的数据集对预训练的大型语言模型进行进一步训练的过程,通过微调,模型可以学习到特定领域的知识和模式,从而在相关任务上表现更好。
前沿导读 | 大模型智能体的行为科学
文章概要:
1. 行为科学是使用科学方法解释和预测个人、群体和人群行为的学科,AI行为科学是分析、理解、模拟和指导人工智能模型行为的交叉研究领域。
2. 大模型行为科学的工作可以分为使用行为科学理论增强大模型能力、评估大模型行为并与人类比较、探索大模型在互动时出现的行为现象三类。
3. 评估大模型行为的研究包括LLM直觉行为与推理表现研究、LLM聊天机器人表现研究、LLM经济合理性研究等。
4. 大模型互动中的行为偏差包括道德决策中的偏差、多模态大语言模型的金融行为偏差、LLM的相似性判断顺序偏差等。
5. 未来展望包括将经典的行为科学的理论转移到大模型领域、研究不同因素对大模型行为表现的影响、控制大模型的行为、研究大模型在群体中的行为等。
阅读原文
2. 大模型行为科学的工作可以分为使用行为科学理论增强大模型能力、评估大模型行为并与人类比较、探索大模型在互动时出现的行为现象三类。
3. 评估大模型行为的研究包括LLM直觉行为与推理表现研究、LLM聊天机器人表现研究、LLM经济合理性研究等。
4. 大模型互动中的行为偏差包括道德决策中的偏差、多模态大语言模型的金融行为偏差、LLM的相似性判断顺序偏差等。
5. 未来展望包括将经典的行为科学的理论转移到大模型领域、研究不同因素对大模型行为表现的影响、控制大模型的行为、研究大模型在群体中的行为等。
一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。
文章概要:
1 文章探讨了大语言模型在数学推理中的局限性,通过具体实验揭示了无关信息对模型推理能力的影响。
2. 论文围绕GSM8K数据集展开诸多实验,发现通过魔改GSM8K向小学数学问题添加无关信息,大模型推理的成功率会大幅下降。
3. 作者通过测试发现,在小学题中加入无关条件,AI会算错,全军覆没。
4. 文章指出大模型的推理能力比想象中脆弱,它们不是在真正推理,而是试图复制在训练数据中观察到的推理步骤。
5. 论文还得出一些重要结论,如随着问题难度提升、改变数值或名词,模型表现会下降,表明大语言模型在推理复杂问题时非常脆弱。
阅读原文
2. 论文围绕GSM8K数据集展开诸多实验,发现通过魔改GSM8K向小学数学问题添加无关信息,大模型推理的成功率会大幅下降。
3. 作者通过测试发现,在小学题中加入无关条件,AI会算错,全军覆没。
4. 文章指出大模型的推理能力比想象中脆弱,它们不是在真正推理,而是试图复制在训练数据中观察到的推理步骤。
5. 论文还得出一些重要结论,如随着问题难度提升、改变数值或名词,模型表现会下降,表明大语言模型在推理复杂问题时非常脆弱。
又一本开源免费的大模型书来了,449页pdf!
文章概要:
1. 《自然语言处理:实践》(预览版)以自然语言语言为主线,了基础理论到高级应用的内容
2. 自然语言处理是人工智能最热门的领域,近年以来,以ChatGPT 为代表的大语言模型取得了令人瞩目的进展
3. 作者已将该资源上传至网盘,长按识别下方二维码,添加微信领取,添加时备注:M(资源编码),即可获得网盘下载
4. 作者联合多位QS前50大佬做了的大模型实战系列课,原价69元,现在0元领取
5. 9月19-21日,华为全联接大会2024在上海举行,沃恩智慧是人工智能科研辅导行业中唯一受邀参会的公司,沃恩也在会上展示了他们的沃研Turbo大模型> 6. 作者给大家申请到特别的福利沃恩研发的研Turbo大模型限时免费使用福利,直接扫码,获取限时免费
阅读原文
2. 自然语言处理是人工智能最热门的领域,近年以来,以ChatGPT 为代表的大语言模型取得了令人瞩目的进展
3. 作者已将该资源上传至网盘,长按识别下方二维码,添加微信领取,添加时备注:M(资源编码),即可获得网盘下载
4. 作者联合多位QS前50大佬做了的大模型实战系列课,原价69元,现在0元领取
5. 9月19-21日,华为全联接大会2024在上海举行,沃恩智慧是人工智能科研辅导行业中唯一受邀参会的公司,沃恩也在会上展示了他们的沃研Turbo大模型> 6. 作者给大家申请到特别的福利沃恩研发的研Turbo大模型限时免费使用福利,直接扫码,获取限时免费