推动产业革新 | 第二届山东省信息技术产业发展大会—大模型技术与产业应用前沿论坛圆满举办
文章概要:
1. 第二届山东省信息技术产业发展大会—大模型技术与产业应用前沿论坛于10月18日在国际会展中心举办,来自全省高等院校、企业的100余位人员参加。
2. 论坛聚焦大模型技术在产品形态重塑、服务模式创新及生产流程优化等方面的推动作用,助力我省产业转型升级。
3. 论坛邀请了华中科技大学计算机学院教授何强、山东大学计算机科学与技术学院副教授张啸等专家就大模型技术科学研究分享,探索发展新方向。
4. 论坛邀请了集团海尔智慧家数字化转型平台总监杜永杰、山东浪潮海若科技有限公司尹萍等专家就大模型与行业深度融合,赋能产业变革。
阅读原文
2. 论坛聚焦大模型技术在产品形态重塑、服务模式创新及生产流程优化等方面的推动作用,助力我省产业转型升级。
3. 论坛邀请了华中科技大学计算机学院教授何强、山东大学计算机科学与技术学院副教授张啸等专家就大模型技术科学研究分享,探索发展新方向。
4. 论坛邀请了集团海尔智慧家数字化转型平台总监杜永杰、山东浪潮海若科技有限公司尹萍等专家就大模型与行业深度融合,赋能产业变革。
现阶段的多模态大模型做不了医疗
文章概要:
1. 在当前的技术和数据储备下,多模态大模型在医疗辅助诊断领域难以取得重大突破
2. 大语言模型在众多自然语言处理任务中表现出色,逐渐统合了许多独立NLP领域
3. 医学作为一个至关重要的垂直领域,也见证了多项关键进展
4. 多模态大模型是指能够同时处理和整合来自多种输入形式的大型机器学习模型
5. 多模态大模型的技术架构通常由一个多模态嵌入模块、跨模态注意力机制和解码器组成
6. 大模型的“看图说话”能力受限于“异常检测”步骤的准确性
7. 医学影像与医生报告似乎是一个天然的图像-文本数据对,但实际情况并非如此
8. 医生的标注不可完全依赖
9. 数据的质量远比数量重要
0. 对于在医学领域如何有效应用scaling law,作者仍然没有完全想明白
11. 多模态大模型最大优势,就是能以统一的任务范式,吃下各种数据集,用大语言模型把未经整理、来源各异的标注消化嚼碎了喂给视觉backbone,让模型有极强的“通用“能力
12. 多模态大模型在医疗辅助诊断领域的应用仍然是前景广阔,但受限于技术和数据储备的瓶颈,当前还难以取得重大突破
13. 后续对于提高模型在微小病灶检测上的能力、统一医生报告的标准、以及提高数据标注的质量,是未来发展的关键方向
14. 未来需要更加注重数据质量的提升和技术的逐步改进,才能更好地推动多模态大模型在医疗领域的应用和发展
阅读原文
2. 大语言模型在众多自然语言处理任务中表现出色,逐渐统合了许多独立NLP领域
3. 医学作为一个至关重要的垂直领域,也见证了多项关键进展
4. 多模态大模型是指能够同时处理和整合来自多种输入形式的大型机器学习模型
5. 多模态大模型的技术架构通常由一个多模态嵌入模块、跨模态注意力机制和解码器组成
6. 大模型的“看图说话”能力受限于“异常检测”步骤的准确性
7. 医学影像与医生报告似乎是一个天然的图像-文本数据对,但实际情况并非如此
8. 医生的标注不可完全依赖
9. 数据的质量远比数量重要
0. 对于在医学领域如何有效应用scaling law,作者仍然没有完全想明白
11. 多模态大模型最大优势,就是能以统一的任务范式,吃下各种数据集,用大语言模型把未经整理、来源各异的标注消化嚼碎了喂给视觉backbone,让模型有极强的“通用“能力
12. 多模态大模型在医疗辅助诊断领域的应用仍然是前景广阔,但受限于技术和数据储备的瓶颈,当前还难以取得重大突破
13. 后续对于提高模型在微小病灶检测上的能力、统一医生报告的标准、以及提高数据标注的质量,是未来发展的关键方向
14. 未来需要更加注重数据质量的提升和技术的逐步改进,才能更好地推动多模态大模型在医疗领域的应用和发展
[ComfyUI]Flux:Molmo基于Qwen2开源视觉大模型,性能媲美GPT4V
文章概要:
1. Molmo大模型是由艾伦人工智能研究所基于国产大模型Qwen2开发的一系列开放的多模态LLM模型。
2. Molmo系列在开放性和数据质量上超越其他模型,性能也与GPT-4o、GPT-4V、Gemini 1.5 Pro、Claude 3.5等闭源模型相媲美。
3. Molmo大模型ComfyUI体验需要在ComfyUI中通过管理器中搜索ComfyUI-Molmo插件并安装。
4. 在Flux文生图工作流中将反推节点切换为Molmo反推节点即可。
阅读原文
2. Molmo系列在开放性和数据质量上超越其他模型,性能也与GPT-4o、GPT-4V、Gemini 1.5 Pro、Claude 3.5等闭源模型相媲美。
3. Molmo大模型ComfyUI体验需要在ComfyUI中通过管理器中搜索ComfyUI-Molmo插件并安装。
4. 在Flux文生图工作流中将反推节点切换为Molmo反推节点即可。
人工智能AI模型介绍(二十一)--Step-1.5V多模态大模型
文章概要:
1. Step-1.5V是阶跃星辰推出的一款千亿参数多模态大模型,能够同时处理图像和视频数据,展现出对复杂的理解能力,尤其在理解方面具有显著优势,识别视频中的物体、人物、环境,并理解整体氛围人物情绪。
2 Step-1.5V的核心能力包括多模态理解、视频理解、高级推理能力、混排训练和多模态融合。
3. Step-1.5V的界面情况介绍包括输入方面的多模态数据输入和高级任务,方面和视频理解、生成和用户友好的
阅读原文
2 Step-1.5V的核心能力包括多模态理解、视频理解、高级推理能力、混排训练和多模态融合。
3. Step-1.5V的界面情况介绍包括输入方面的多模态数据输入和高级任务,方面和视频理解、生成和用户友好的
AI大模型革新蛋白质功能预测:Prot2Text模型开启多模态自由文本生成新范式
文章概要:
1. Prot2Text模型能够以自由文本形式生成详细而准确的蛋白质功能描述,它结合了图神经网络(GNNs)和大型语言模型(LLMs),形成了一个编码器-解码器架构。
2. Prot2Text模型采用了编码器-解码器架构,编码器部分使用关系图卷积网络(RGCN)处理蛋白质的图结构,同时使用ESM蛋白质语言模型编码氨基酸序列。解码器部分利用预训练的GPT-2模型生成蛋白质功能描述。
3. Prot2Text模型在中表现优异随着模型规模的增加,性能普遍有所提升。可视化分析显示,模型生成的蛋白质功能描述与真实标签高度一致,且能提供更丰富的信息。
4. Prot2Text模型的潜在应用领域包括药物、蛋白质工程、系统生物学、个性化医疗、生物信息学、进化生物学、结构生物学、合成生物学等。
阅读原文
2. Prot2Text模型采用了编码器-解码器架构,编码器部分使用关系图卷积网络(RGCN)处理蛋白质的图结构,同时使用ESM蛋白质语言模型编码氨基酸序列。解码器部分利用预训练的GPT-2模型生成蛋白质功能描述。
3. Prot2Text模型在中表现优异随着模型规模的增加,性能普遍有所提升。可视化分析显示,模型生成的蛋白质功能描述与真实标签高度一致,且能提供更丰富的信息。
4. Prot2Text模型的潜在应用领域包括药物、蛋白质工程、系统生物学、个性化医疗、生物信息学、进化生物学、结构生物学、合成生物学等。
大模型应用开发-AI Agent 连接大模型与应用的桥梁
文章概要:
1. 大模型风靡全球,AI Agent是连接大与应用的,它能将大模型的复杂能力转化为可操作的任务结果
2. AI Agent的工作方式是一个流程化任务处理器,它能够接收用户输入,分解复杂任务,调用所需资源,整合返回结果。
3. AI Agent的组成模块包括提示模板、记忆和工具。
4. 实现简单的系统,准备数据,创建一个Agent,并运行发布。
阅读原文
2. AI Agent的工作方式是一个流程化任务处理器,它能够接收用户输入,分解复杂任务,调用所需资源,整合返回结果。
3. AI Agent的组成模块包括提示模板、记忆和工具。
4. 实现简单的系统,准备数据,创建一个Agent,并运行发布。
分析了200+款AI大模型应用,我发现了3个未来趋势
文章概要:
1. 国内大模型发展形成创业玩家和巨头玩家齐头格局,资源向头部聚集,预计2024年应用市场规模将达到200亿,2026年达到千亿级别。
2. 国内大模型玩家全景图:创业玩家格局包括智谱月之暗面、百川智能等;巨头玩家包括百度文心、阿里通义、腾讯混元等。
3. 国内AI应用全景图:截止2024年9月,盘点了国内18个典型赛道的AI应用,包括综合平台、AI Agent、AI助手等。
4. 用户眼中的AI大模型:不仅是提升效率工具,更是全能的最强大脑,但实际生活使用AI产品的用户比例仍相对较低。
5. AI应用的3个发展趋势AI大模型与行业融合打造软、硬件产品成为趋势;探索商业模式闭环,AI应用必经之路;多模态融合正在成为趋势。
阅读原文
2. 国内大模型玩家全景图:创业玩家格局包括智谱月之暗面、百川智能等;巨头玩家包括百度文心、阿里通义、腾讯混元等。
3. 国内AI应用全景图:截止2024年9月,盘点了国内18个典型赛道的AI应用,包括综合平台、AI Agent、AI助手等。
4. 用户眼中的AI大模型:不仅是提升效率工具,更是全能的最强大脑,但实际生活使用AI产品的用户比例仍相对较低。
5. AI应用的3个发展趋势AI大模型与行业融合打造软、硬件产品成为趋势;探索商业模式闭环,AI应用必经之路;多模态融合正在成为趋势。
车圈大模型落地竞速:从好用到易用,从尝鲜到常用
文章概要:
1. 全民AI需求爆发,大模型成为推动产业的重要引擎,特别是在汽车行业,大模型正以前所未有的速度加快融入,但大模型还未实现最广泛地落地,上车效果也和理想状态存在差距
2. 大模型企业要抓住汽车需求场景,满足用户多样化需求,如领克汽车基于现有车型特点,开发更多实用场景,满足用户接近天文的兴趣
3. 火山引擎为车圈提供了强大的豆包大模型系列,以及扣子专业版等完备的应用开发工具,豆包大模型也成为了AI原生应用生长的肥沃土壤
4. 全民AI浪潮袭来,大模型不仅加速汽车行业向智能化迈进,还有望重塑全行业,成为新质生产力的关键支持技术
阅读原文
2. 大模型企业要抓住汽车需求场景,满足用户多样化需求,如领克汽车基于现有车型特点,开发更多实用场景,满足用户接近天文的兴趣
3. 火山引擎为车圈提供了强大的豆包大模型系列,以及扣子专业版等完备的应用开发工具,豆包大模型也成为了AI原生应用生长的肥沃土壤
4. 全民AI浪潮袭来,大模型不仅加速汽车行业向智能化迈进,还有望重塑全行业,成为新质生产力的关键支持技术
字节跳动大模型训练被实习生攻击,涉事者已被辞退
文章概要:
1. 10月18日,多个微信群流传跳动模型训练被实习生的消息,称其注入破坏代码导致训练成果不可靠,可能需要训练,带来的损失可能超过千万美元。
2. 界面新闻从知情人士处获悉,此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
3. 传闻显示,该田姓实习生利用了HF的漏洞,在公司的共享里写入代码模型的训练效果忽高忽低,无法产生的训练效果,AML团队无法原因。
5. 一位技术安全专家告诉界面新闻漏洞产生是单一性集中训练,此事暴露了字节跳动技术训练安全管理问题。
阅读原文
2. 界面新闻从知情人士处获悉,此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团队实习,因对团队资源分配不满,使用攻击代码破坏团队的模型训练任务。
3. 传闻显示,该田姓实习生利用了HF的漏洞,在公司的共享里写入代码模型的训练效果忽高忽低,无法产生的训练效果,AML团队无法原因。
5. 一位技术安全专家告诉界面新闻漏洞产生是单一性集中训练,此事暴露了字节跳动技术训练安全管理问题。
团课预热 | “博致”团校政治理论调研先导课——AI大模型:人工智能迈出的关键一步
文章概要:
1. 习近平总书记指出新一代人工智能为经济社会发展注入了新动能,正在深刻改变人们的生产生活方式,广大青年应意识到作为中国大学生AI领域被赋予的使命
. 本次课程将带领同学们认识AI,旨在给主题为“人工智能与科技创新”的调研实践项目大致方向与>. 课程目标是帮助学员初步了解AI大模型的发展现状、基本原理以及主要的研究方向培养学员的人工智能意识,激发学员的创新意识学员更好地将理论知识与开展的实践调研项目相结合,帮助学员了解中美在AI大上的和世界上主流的AI企业以及相关产品,引领学员理解时代赋予的使命与责任
4. 课程内容简介是由复旦大学微电子学院203级硕士研究生美成主讲,介绍热门的模型相关领域近期发生重要事件,深入讲解AI大模型基本原理和研究方向,并重点介绍通用AI和专用AI的区别以及中美在两个领域之间的优势和差距,列举目前世界上主要的AI以及他们具有代表性的产品最后对AI模型主流发展情况进行,为后续主题为“人工智能与”的小组社会调研实践项目方向与>5. 主讲嘉宾是复旦大学微电子学院2023级硕士研究生廖美成,方向是集成电路环栅纳米晶体管。结合集成电路环栅纳米AI大模型,可以在半导体设计和制造中实现更高效的数据处理和智能优化。AI 大模型能够分析和预测器件的性能和发展趋势,为制造过程的优化提供全新的思路。GAA技术的进步也为AI模型提供更强大支持,两者的结合预示半导体技术与的深度融合,推动智能时代发展
6. 课程安排是时间为2024年1019日上午10:0,地点为邯郸校区第二教学楼20教室
阅读原文
. 本次课程将带领同学们认识AI,旨在给主题为“人工智能与科技创新”的调研实践项目大致方向与>. 课程目标是帮助学员初步了解AI大模型的发展现状、基本原理以及主要的研究方向培养学员的人工智能意识,激发学员的创新意识学员更好地将理论知识与开展的实践调研项目相结合,帮助学员了解中美在AI大上的和世界上主流的AI企业以及相关产品,引领学员理解时代赋予的使命与责任
4. 课程内容简介是由复旦大学微电子学院203级硕士研究生美成主讲,介绍热门的模型相关领域近期发生重要事件,深入讲解AI大模型基本原理和研究方向,并重点介绍通用AI和专用AI的区别以及中美在两个领域之间的优势和差距,列举目前世界上主要的AI以及他们具有代表性的产品最后对AI模型主流发展情况进行,为后续主题为“人工智能与”的小组社会调研实践项目方向与>5. 主讲嘉宾是复旦大学微电子学院2023级硕士研究生廖美成,方向是集成电路环栅纳米晶体管。结合集成电路环栅纳米AI大模型,可以在半导体设计和制造中实现更高效的数据处理和智能优化。AI 大模型能够分析和预测器件的性能和发展趋势,为制造过程的优化提供全新的思路。GAA技术的进步也为AI模型提供更强大支持,两者的结合预示半导体技术与的深度融合,推动智能时代发展
6. 课程安排是时间为2024年1019日上午10:0,地点为邯郸校区第二教学楼20教室
LLM大模型的应用
文章概要:
1. 大型语言模型(LLMs)是推动技术进步和应用创新的重要力量,是具有大规模参数和计算结构的模型应用于语言处理、计算机视觉、语音识别等。br>. 大模型的核心优势在于其涌现能力,未来可能发展方向包括模型基座、多模态、推理与评价、人类偏好、和可控性
大模型在融合产品中的应用主要可以分为嵌入模型、信息检索、整合与生成、高级RAG五个基本步骤。
4. 在大模型的应用中,可以通过多种创新方法,如递归检索、StepBack-prompt、模块化RAG结构等,提高模型生成内容的质量和多样性,并增强了模型的泛化能力和适应性。
5. 大型语言模型的未来发展将依赖于技术创新、跨学科合作以及伦理和法律框架的发展。
阅读原文
大模型在融合产品中的应用主要可以分为嵌入模型、信息检索、整合与生成、高级RAG五个基本步骤。
4. 在大模型的应用中,可以通过多种创新方法,如递归检索、StepBack-prompt、模块化RAG结构等,提高模型生成内容的质量和多样性,并增强了模型的泛化能力和适应性。
5. 大型语言模型的未来发展将依赖于技术创新、跨学科合作以及伦理和法律框架的发展。
【行业洞察】OpenAI服务或关停,国产大模型迎机遇
文章概要:
1. 近期有消息传出由于监管规定 OpenAI服务将于10月21日,国产大模型迎来机会。
2. OpenAI发布1系列模型,O1-preview模型在多项高难基准测试中表现出色。<3. 我国AI大模型产业呈现蓬勃发展的态势,已在多个领域取得了显著的成果。
4. 近期国产大更新迭代,各大模型厂商持续打磨产品,推出了针对不同场景的功能。
5. 今年以来,AI大模型发布目前国内模型公司中,imi、阶跃星辰等尚未发布视频模型,后续有望推出。br>6. 从月活度,ChatGPT月活用户数增长13.05%,包排名提升至全球。
7 国内AI产品方面,款产品月活用户数亿。
8. A股大相关公司,内容产业链布局公司,交所中AI大模型企业大和大模型两种类型。
阅读原文
2. OpenAI发布1系列模型,O1-preview模型在多项高难基准测试中表现出色。<3. 我国AI大模型产业呈现蓬勃发展的态势,已在多个领域取得了显著的成果。
4. 近期国产大更新迭代,各大模型厂商持续打磨产品,推出了针对不同场景的功能。
5. 今年以来,AI大模型发布目前国内模型公司中,imi、阶跃星辰等尚未发布视频模型,后续有望推出。br>6. 从月活度,ChatGPT月活用户数增长13.05%,包排名提升至全球。
7 国内AI产品方面,款产品月活用户数亿。
8. A股大相关公司,内容产业链布局公司,交所中AI大模型企业大和大模型两种类型。
AI大模型从烧钱到赚钱,还有多远?
文章概要:
1 数字化浪潮下,GPT-4为代表生成式技术引领产业变革,但AI大模型盈利模式尚不明确。
2. 223全球AI大模型的投入预计超过0亿美元,但20年AI大模型从火热到趋冷,AI应用成为资本新。
3 OpenAI营收增长迅速,但预计202年仍将亏损50亿美元,云厂商与大模型深度融合后,云服务增长。
4. AI大模型主要收入来源只能是B,端基本不用指望,未来C端可能会出现爆款应用。
阅读原文
2. 223全球AI大模型的投入预计超过0亿美元,但20年AI大模型从火热到趋冷,AI应用成为资本新。
3 OpenAI营收增长迅速,但预计202年仍将亏损50亿美元,云厂商与大模型深度融合后,云服务增长。
4. AI大模型主要收入来源只能是B,端基本不用指望,未来C端可能会出现爆款应用。
【每日精读】从融资烧钱到商业落地:中国AI大模型步入「实战期」
文章概要:
1. 文章讨论了中国AI大模型从融资烧钱到商业落地的发展历程,以及步入「实战期」的现状。
阅读原文
央国企30个大模型来袭
文章概要:
1. 有人认为大模型不接地气,难以落地,而央国企成为推动大模型落地的强劲动力。
2. 列举了3中国海油国家电网、中核八所、国家能源集团、中国中煤集团。
3. 央国企发布和购买大模型是风向标,其背后有整个大让众多ICTAI企业受益。
阅读原文
2. 列举了3中国海油国家电网、中核八所、国家能源集团、中国中煤集团。
3. 央国企发布和购买大模型是风向标,其背后有整个大让众多ICTAI企业受益。
楚秀训练营 | 一文读懂什么是AI大模型
文章概要:
1. 云计算“春晚”云栖大会上,阿里云全球模型wen2.5-72B,性能“跨量级”超越Llama3.1-405B,再登全球开源大模型王座。
2. AI大模型是指具有大量参数和复杂结构的人工智能模型,通常用于处理和生成自然语言、图像、音频等多种类型的数据。
3. 算法是一个系统化的、明确步骤或规则,用于解决特定问题或完成特定任务的过程。
4. 算法在AI大模型中的作用主要体现在学习能力、模型架构、推理能力、优化与调优、评估与验证等方面。
5. AI大模型的复杂网络结构通过不同的层次和机制设计,能够有效处理各种复杂任务。
6. 数据是模型训练和应用的基础,而模型则是对数据进行处理和分析的工具。
7. 国内外主流AI大模型有GPT系列、BERT、T5、Turing-NLG、DALL-E、CLIP、Stable Diffusion、ERNIE、Pangu-Alpha、M6、M、ChatGLM、MindSpore等。
8. AI模型就像一个智慧大载体,承载着人类最前沿科技。
阅读原文
2. AI大模型是指具有大量参数和复杂结构的人工智能模型,通常用于处理和生成自然语言、图像、音频等多种类型的数据。
3. 算法是一个系统化的、明确步骤或规则,用于解决特定问题或完成特定任务的过程。
4. 算法在AI大模型中的作用主要体现在学习能力、模型架构、推理能力、优化与调优、评估与验证等方面。
5. AI大模型的复杂网络结构通过不同的层次和机制设计,能够有效处理各种复杂任务。
6. 数据是模型训练和应用的基础,而模型则是对数据进行处理和分析的工具。
7. 国内外主流AI大模型有GPT系列、BERT、T5、Turing-NLG、DALL-E、CLIP、Stable Diffusion、ERNIE、Pangu-Alpha、M6、M、ChatGLM、MindSpore等。
8. AI模型就像一个智慧大载体,承载着人类最前沿科技。
探索智能纪元:大模型的起源、现状与未来
文章概要:
1. 大模型的起源可以追溯到20世纪的AI研究初期,当时的研究主要集中在逻辑推理和专家系统上。
2. 随着机器学习、深度学习技术的出现和硬件能力的飞速提升,大规模数据集和复杂神经网络模型的训练成为可能,从而催生了大模型的时代。
3. 大模型的演变路径包括OpenAI的GPT系列模型,从GPT-1到GPT-3.5,每一代模型都在规模、复杂性和性能上有了显著提升。
4. 大模型的特性包括参数量、类型、能力和技术,其中参数量通常超过10亿,类型包括大语言模型、视觉大模型、多模态大模型和基础大模型,能力包括泛化能力、深层次学习、上下文理解、知识整合和适应性,技术包括Transformer架构、有监督微调、人类反馈强化学习。
5. 大模型的应用包括NLP领域、图像理解生成领域、语音识别领域,其中NLP领域的应用包括聊天、自动写作、语言翻译、风险评估、交易算法、信用评分、文档审核、合同分析、案例研究、推荐系统、游戏等. 大模型的发展包括技术层面和应用层面,技术层面的发展得益于算法的创新、计算能力的提升、大规模的数据集,应用层面的发展有大语言模型和多模态大模型两个主要方向。
7. 大模型的挑战包括模型大小、网络架构、提示工程、上下文推理、知识更新、可解释性、隐私安全性、数据偏见和误导性信息。
8. 大模型的未来包括模型规模与效率的平衡、知识的深度融合、具身智能的探索、可解释性与可信度。
阅读原文
2. 随着机器学习、深度学习技术的出现和硬件能力的飞速提升,大规模数据集和复杂神经网络模型的训练成为可能,从而催生了大模型的时代。
3. 大模型的演变路径包括OpenAI的GPT系列模型,从GPT-1到GPT-3.5,每一代模型都在规模、复杂性和性能上有了显著提升。
4. 大模型的特性包括参数量、类型、能力和技术,其中参数量通常超过10亿,类型包括大语言模型、视觉大模型、多模态大模型和基础大模型,能力包括泛化能力、深层次学习、上下文理解、知识整合和适应性,技术包括Transformer架构、有监督微调、人类反馈强化学习。
5. 大模型的应用包括NLP领域、图像理解生成领域、语音识别领域,其中NLP领域的应用包括聊天、自动写作、语言翻译、风险评估、交易算法、信用评分、文档审核、合同分析、案例研究、推荐系统、游戏等. 大模型的发展包括技术层面和应用层面,技术层面的发展得益于算法的创新、计算能力的提升、大规模的数据集,应用层面的发展有大语言模型和多模态大模型两个主要方向。
7. 大模型的挑战包括模型大小、网络架构、提示工程、上下文推理、知识更新、可解释性、隐私安全性、数据偏见和误导性信息。
8. 大模型的未来包括模型规模与效率的平衡、知识的深度融合、具身智能的探索、可解释性与可信度。
AI大模型用户破6亿:中国生成式AI服务大模型的飞跃
文章概要:
1. 工信部最新数据显示,我国生成式人工智能服务大模型的注册用户已超过6亿,标志着国内生成式AI产业的迅猛发展也为市场带来了未有的投资机遇。
2. 我国人工智能企业数量已超过45家,其中近200个生成式AI服务模型已完成备案并向公众提供服务。
3. 生成式AI大模型内容创作、图像生成等领域的应用,极大提升了工作效率。
AI绘画工具和文生图功能的出现,不仅丰富了创作的表达方式,也为新的商业模式创造了机遇。
5. 在企业层面,AI大的业务能力可以帮助企业实现知识管理、情报分析、业务决策等,提升决策的准确性和效率。
6. 在社会层面,AI大模型的应用正在推动政务、金融、能源等领域的数字化进程,提高公共服务的效率和质量。
阅读原文
2. 我国人工智能企业数量已超过45家,其中近200个生成式AI服务模型已完成备案并向公众提供服务。
3. 生成式AI大模型内容创作、图像生成等领域的应用,极大提升了工作效率。
AI绘画工具和文生图功能的出现,不仅丰富了创作的表达方式,也为新的商业模式创造了机遇。
5. 在企业层面,AI大的业务能力可以帮助企业实现知识管理、情报分析、业务决策等,提升决策的准确性和效率。
6. 在社会层面,AI大模型的应用正在推动政务、金融、能源等领域的数字化进程,提高公共服务的效率和质量。
沈向洋院士:关于大模型的10个思考
文章概要:
1. 算力是门槛:大模型对算力的要求非常巨大,今天要做人工智能大模型,讲卡伤感情、没卡没感情。
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和生成的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型。这个趋势肯定是这样的,未来通用大模型的占比越来越低。
6. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的。关于人工智能的涌现,大家只是讲讲,并没有讲清楚。
阅读原文
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和生成的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型。这个趋势肯定是这样的,未来通用大模型的占比越来越低。
6. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的。关于人工智能的涌现,大家只是讲讲,并没有讲清楚。
揭秘|头部美妆企业内部大模型应用现状
文章概要:
1. 截至今天,公司已为企业部署了1AI包括
. 美妆大模型的需求集中在市场部产品部、业务部的实际工作场景中。
3. 成功交付部署15AI大模型后,该总结>4. 言美信息科技AI大成功交付案例的软件企业
阅读原文
. 美妆大模型的需求集中在市场部产品部、业务部的实际工作场景中。
3. 成功交付部署15AI大模型后,该总结>4. 言美信息科技AI大成功交付案例的软件企业
人工智能国外大模型使用手册2024
文章概要:
1. 分享东华大学图书馆的《人工智能国外大使用手册》,介绍了多个国外人工智能大,包括GPT系列、Gemini、Claude、LLaMA、Copilot以及其他一些特色模型
2. 目的是一个全面的,帮助用户了解和使用国外的人工智能大型模型(AI大模型),以便在学术研究、教学发展等领域中应用这些技术,提高效率和创新能力
阅读原文
2. 目的是一个全面的,帮助用户了解和使用国外的人工智能大型模型(AI大模型),以便在学术研究、教学发展等领域中应用这些技术,提高效率和创新能力
沈向洋院士:关于大模型的10个思考
文章概要:
1. 算力是门槛:大模型对算力的要求,过去10年非常巨大。今天要做人工智能大模型,讲卡伤感情、没卡没感情。
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和生成的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型。这个趋势肯定是这样的,未来通用大模型的占比会越来越低。
6. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的人工智能的涌现,大家只是讲讲,并没有讲清楚。
阅读原文
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和生成的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型。这个趋势肯定是这样的,未来通用大模型的占比会越来越低。
6. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的人工智能的涌现,大家只是讲讲,并没有讲清楚。
2024年,每一个大模型都躲不过容嬷嬷和紫薇 | 智涌分析
文章概要:
1. 从OpenAI Sora横空出世,再到6月的快手可灵全量上线,视频生成成为2024年最火热的AI话题。
2. 国内视频模型涌现,也让“容嬷嬷和紫薇”的鬼畜形象再次翻红,她俩活在不同的视频模型demo和网友二创中,考验着不同模型的效果。
3. 对于做不做视频模型,国内大模型厂商仍未达成共识,而是分成了截然不同的几派:有厂商迅速跟进,也有旗帜鲜明的反对者,也有在探索后暂缓的
4. 视频生成领域迎来两位重磅玩家:9月24日,字节跳动低调甩出了Seaweed和Pixeldance两款产品。而紧接着的10月5日,Meta放出的系列模型Movie Gen,则又一次炸场。
5. 要做视频生成模型,当前还注定是少数人的游戏。
6. 对拥有短视频相关业务的大厂,如抖音、快手等,视频生成是不能输的方向。但对初创玩家来说,在AI应用方向不明朗的当下,大家都在忐忑摸着石头过河。
7. 视频生成领域的技术路线尚未收敛,市面上的顶级视频生成模型几乎都选择了闭源。这意味着,玩家们需要投入真金白银去试错——选什么技术路线和应用场景,才决定AGI大潮退去后,谁能真正留在岸上。
8AI的ora尚且没有放开使用,为什么视频生成如今成了国内的香饽饽?
9. 视频生成方向则刚好站在中间点:既有足够技术和开发壁垒,但壁垒不会高到玩家摸不着,前景也足够大。
10. 视频生成领域已经看到了GPT-3.5阶段的曙光。这个阶段意味着,让你看到这个赛道的巨大潜力,市场愿意投入。
11. 在国内,这个方向上也有得天独厚的短视频生态,视频生成方向的模型探索,也因此站在全球前沿。
12. 视频生成方向还处在早期,算力成本仍处高位,一旦开始商业化,付费已是必选项。
13. 硅谷视频生成明星初创Pika,就摸到了不少流量密码:一出道,就选择先在开发者聚集的Discord运营,并且用户。
阅读原文
2. 国内视频模型涌现,也让“容嬷嬷和紫薇”的鬼畜形象再次翻红,她俩活在不同的视频模型demo和网友二创中,考验着不同模型的效果。
3. 对于做不做视频模型,国内大模型厂商仍未达成共识,而是分成了截然不同的几派:有厂商迅速跟进,也有旗帜鲜明的反对者,也有在探索后暂缓的
4. 视频生成领域迎来两位重磅玩家:9月24日,字节跳动低调甩出了Seaweed和Pixeldance两款产品。而紧接着的10月5日,Meta放出的系列模型Movie Gen,则又一次炸场。
5. 要做视频生成模型,当前还注定是少数人的游戏。
6. 对拥有短视频相关业务的大厂,如抖音、快手等,视频生成是不能输的方向。但对初创玩家来说,在AI应用方向不明朗的当下,大家都在忐忑摸着石头过河。
7. 视频生成领域的技术路线尚未收敛,市面上的顶级视频生成模型几乎都选择了闭源。这意味着,玩家们需要投入真金白银去试错——选什么技术路线和应用场景,才决定AGI大潮退去后,谁能真正留在岸上。
8AI的ora尚且没有放开使用,为什么视频生成如今成了国内的香饽饽?
9. 视频生成方向则刚好站在中间点:既有足够技术和开发壁垒,但壁垒不会高到玩家摸不着,前景也足够大。
10. 视频生成领域已经看到了GPT-3.5阶段的曙光。这个阶段意味着,让你看到这个赛道的巨大潜力,市场愿意投入。
11. 在国内,这个方向上也有得天独厚的短视频生态,视频生成方向的模型探索,也因此站在全球前沿。
12. 视频生成方向还处在早期,算力成本仍处高位,一旦开始商业化,付费已是必选项。
13. 硅谷视频生成明星初创Pika,就摸到了不少流量密码:一出道,就选择先在开发者聚集的Discord运营,并且用户。
如何“选”大模型?《通用大模型评测标准》隆重发布
文章概要:
1. 中国移动携手工信部中国电子技术标准化研究院、电信、国家电网、科大讯飞等产业各方共同发布了《通用大评测标准。
2. 《通用大模型评测标准》以国家标准《人工智能 大模型 第部分:评测指标与方法》重要参考,内容基于“2-4-6”框架。
4 “4”代表评测,从评测全生命周期中提取出工具、评测数据、评测方式和评测指标四类关键要素,确保评测工作可性。
6 大模型评测是AI应用的一环,《通用大模型标准》综合多方面因素,为AI大模型的评测提供客观依据br 7了《通用模型评测标准,还可以通过参数大小、MMLU、CEval、AGI Eval、8K、MATHH、MT Bench等评测基准来评测AI大模型。br 8基准对于推动大模型发展和具有重要它们可以帮助研究人员开发者了解模型的强项和弱点,从而指导进一步的设计和优化。同时,这些基准也有助于用户选择的来解决特定问题。
阅读原文
2. 《通用大模型评测标准》以国家标准《人工智能 大模型 第部分:评测指标与方法》重要参考,内容基于“2-4-6”框架。
4 “4”代表评测,从评测全生命周期中提取出工具、评测数据、评测方式和评测指标四类关键要素,确保评测工作可性。
6 大模型评测是AI应用的一环,《通用大模型标准》综合多方面因素,为AI大模型的评测提供客观依据br 7了《通用模型评测标准,还可以通过参数大小、MMLU、CEval、AGI Eval、8K、MATHH、MT Bench等评测基准来评测AI大模型。br 8基准对于推动大模型发展和具有重要它们可以帮助研究人员开发者了解模型的强项和弱点,从而指导进一步的设计和优化。同时,这些基准也有助于用户选择的来解决特定问题。
《大模型深度赋能媒体智创融合——中国智能媒体创新发展报告(2023—2024)》发布!无忧智慧公文入选应用案例
文章概要:
1. 2024年105新媒体技术组委会联合中国传媒大学媒体融合与重点实验室新媒体研究院,在2024新媒体大会期间面向全行业发布《大模型深度赋能智融合——中国智能创新发展报告2023—2024)》。
2. 方寸无忧自研产品“无忧智慧公文”《大模型媒体融合——中国智能媒体创新发展0—2024)传媒行业大模型建设应用案例”,充分体现了“无忧智慧公文”在传媒行业应用的推广价值。br>3. 报告聚焦“大模型+媒体融合”新,近一年来智能媒体发展的新动向、新实践与新。
4. 报告提到,对媒体行业而言,大模型可对内促进核心业务流程智能化,促进“策采发馈管”链条提质增效。
阅读原文
2. 方寸无忧自研产品“无忧智慧公文”《大模型媒体融合——中国智能媒体创新发展0—2024)传媒行业大模型建设应用案例”,充分体现了“无忧智慧公文”在传媒行业应用的推广价值。br>3. 报告聚焦“大模型+媒体融合”新,近一年来智能媒体发展的新动向、新实践与新。
4. 报告提到,对媒体行业而言,大模型可对内促进核心业务流程智能化,促进“策采发馈管”链条提质增效。
中科永为“永为政务大模型”重磅发布 ——以“AI大模型+智慧政务”加速政府数智化转型
文章概要:
1 2024政务效能高质量发展大会上,中科“模型br> 2. “永为政务大模型”推出的“大+智慧政务”,对于提升政务、优化推动区域高质量发展而言具有意义。
3. 传统政府服务模式已难以满足公众日益增长的高效、便捷智能服务需求,“永为政务大模型”的诞生,正是对这一的精准回应。
4. 中科永为理解到“政务大模型政府数智化转型的性,以高度的责任感使命感,响应国家数字建设的号召,全力投入到“永为政务大模型”的研发与中。
5. 将“AI大模型+智慧政务”深度融合的“永大”,在政务服务、城市治理及决策办公等领域展现出广泛的应用前景和显著成效。
6. “永为政务大模型”的发布是中科永为响应国家关于加强数字建设意见的实质性行动。
7. 未来,随着技术的不断进步应用的深入拓展,中科永为的“永为政务大模型”将持续进化升级,更加智能、高效、精准方向发展,将成为推动政府与管理迈向更高水平的强大引擎,为政府数智化转型注入源源不断的动力。
8. 中科永为是中科坤程旗下专注智慧政务建设与城市公共服务、并提供本地化可持续运营创新的专业子公司,中科永为整体打造并运营城市智慧应用,通过专业的管理服务、定制的信息化支撑平台、标准的服务规范与培训机制、独特的政务文化体系为政府和现代化城市提供全流程、数字化、考核式、兜底第三方运营服务。
阅读原文
3. 传统政府服务模式已难以满足公众日益增长的高效、便捷智能服务需求,“永为政务大模型”的诞生,正是对这一的精准回应。
4. 中科永为理解到“政务大模型政府数智化转型的性,以高度的责任感使命感,响应国家数字建设的号召,全力投入到“永为政务大模型”的研发与中。
5. 将“AI大模型+智慧政务”深度融合的“永大”,在政务服务、城市治理及决策办公等领域展现出广泛的应用前景和显著成效。
6. “永为政务大模型”的发布是中科永为响应国家关于加强数字建设意见的实质性行动。
7. 未来,随着技术的不断进步应用的深入拓展,中科永为的“永为政务大模型”将持续进化升级,更加智能、高效、精准方向发展,将成为推动政府与管理迈向更高水平的强大引擎,为政府数智化转型注入源源不断的动力。
8. 中科永为是中科坤程旗下专注智慧政务建设与城市公共服务、并提供本地化可持续运营创新的专业子公司,中科永为整体打造并运营城市智慧应用,通过专业的管理服务、定制的信息化支撑平台、标准的服务规范与培训机制、独特的政务文化体系为政府和现代化城市提供全流程、数字化、考核式、兜底第三方运营服务。
【会员动态】引领行业新风向,中达安发布首个工程监理垂直大模型
文章概要:
1. 10月1日,中达安在国家超级计算中心举办工程监理行业垂直大模型发布会暨二十六周年庆典。
2. 中达安发布工程监理首个垂直领域的大模型,集成智理、智析、智书、智核、智巡和智策六大核心工具将极大地提升工程监理行业的效率智能化水平。
3. 中达安投资设立了山东达算数据科技,专注于大数据服务、互联网数据服务、工业互联网数据服务和数据处理及存储支持服务等多个领域。
4. 中达安的控股股东济南历城控股集团有限公司投资超过60建设了国家千万亿次超级计算,达在数字化转型的道路上不断前行,逐步确立了其在监理数字化服务领域的领先地位。<>5. 中达安二十六载,正积极推动“新基建综合服务商”“数字化+新能源服务商”这一新兴的战略转型。
阅读原文
2. 中达安发布工程监理首个垂直领域的大模型,集成智理、智析、智书、智核、智巡和智策六大核心工具将极大地提升工程监理行业的效率智能化水平。
3. 中达安投资设立了山东达算数据科技,专注于大数据服务、互联网数据服务、工业互联网数据服务和数据处理及存储支持服务等多个领域。
4. 中达安的控股股东济南历城控股集团有限公司投资超过60建设了国家千万亿次超级计算,达在数字化转型的道路上不断前行,逐步确立了其在监理数字化服务领域的领先地位。<>5. 中达安二十六载,正积极推动“新基建综合服务商”“数字化+新能源服务商”这一新兴的战略转型。
百模大战落幕,大模型“六小虎”开始分野
文章概要:
. 国内真正自主训练基础大模型的企业不超过二三十家,美国做基础大模型的企业已迅速收缩到五家。
2. 大模型初创企业在今年7月的会议中,都没有再谈AGI,而是谈自己的落地方向和进展。
3. MiniMax在海外很猛,营收中大部分来自聊天机器人社交应用Talkie。
4. 智谱既有ToB又有ToC,后者是智谱清言App。
5. 百川智能将很多资源放在医疗模型和产品上。
6. 月之暗面最近推出具有深度推理的AI搜索功能,类似ChatGPTo1,强调推理。
7. 零一万物发布了新模型Yi-Lightning,明确了To B工作只能在中国做,To C则主要布局海外。
8. 阶跃星辰在2023年创办,今年春季对外正式亮相。
9. MiniMax创始人闫俊杰,此前在ToB市场,这次创业转换了赛道,主要定位在ToC市场。
10. 智谱目前营收重点在ToB市场,ToB市场,最终走向云和标准化服务。
11. 李开复认为,国内并未看到一个普遍被接受的SaaS模式,大模型to B,首要任务就是要寻找少数能够按使用情况收费的方法,而不是项目定制的方法,能得到比较高利润率的订单再去做。
阅读原文
2. 大模型初创企业在今年7月的会议中,都没有再谈AGI,而是谈自己的落地方向和进展。
3. MiniMax在海外很猛,营收中大部分来自聊天机器人社交应用Talkie。
4. 智谱既有ToB又有ToC,后者是智谱清言App。
5. 百川智能将很多资源放在医疗模型和产品上。
6. 月之暗面最近推出具有深度推理的AI搜索功能,类似ChatGPTo1,强调推理。
7. 零一万物发布了新模型Yi-Lightning,明确了To B工作只能在中国做,To C则主要布局海外。
8. 阶跃星辰在2023年创办,今年春季对外正式亮相。
9. MiniMax创始人闫俊杰,此前在ToB市场,这次创业转换了赛道,主要定位在ToC市场。
10. 智谱目前营收重点在ToB市场,ToB市场,最终走向云和标准化服务。
11. 李开复认为,国内并未看到一个普遍被接受的SaaS模式,大模型to B,首要任务就是要寻找少数能够按使用情况收费的方法,而不是项目定制的方法,能得到比较高利润率的订单再去做。
灵智大模型正式入驻工信部大模型公共服务平台
文章概要:
1. 灵智大模型入驻工信部大模型公共服务成为国家人工智能开源开放产业生态的者和护航者。
2. 灵智大模型Lingzhi-7-chat在鲸智社区成功上传。<>3. Lingzhi-7B-chat大模型“灾难性遗忘问题上取得显著进展,应用该模型于研究和决策中,它助力专家深度分析文本资料,精准辅助决策;在影视创作领域,快速生成创意情节与对话,加速创作;企业管理方面高效整合分析运营数据,详尽报告,简化管理决策。
4. 灵智AI作为一家专注于大与数字技术企业将充分发挥平台、资源、技术等方面的优势,与入驻各方形成多方联动协同合作机制,共同以大模型需求为导向,提供化的大模型训练服务,各行业构建专属的智能,为各行业的数字化智能化升级提供有力支撑。
阅读原文
2. 灵智大模型Lingzhi-7-chat在鲸智社区成功上传。<>3. Lingzhi-7B-chat大模型“灾难性遗忘问题上取得显著进展,应用该模型于研究和决策中,它助力专家深度分析文本资料,精准辅助决策;在影视创作领域,快速生成创意情节与对话,加速创作;企业管理方面高效整合分析运营数据,详尽报告,简化管理决策。
4. 灵智AI作为一家专注于大与数字技术企业将充分发挥平台、资源、技术等方面的优势,与入驻各方形成多方联动协同合作机制,共同以大模型需求为导向,提供化的大模型训练服务,各行业构建专属的智能,为各行业的数字化智能化升级提供有力支撑。
从国有大行到中小银行 看AI大模型不同应用现状
文章概要:
1 AI大模型技术以前所未有的方式,改变着各行各业的服务和用户体验。银行业作为数据密集型,以其天然的金融场景需求首当其冲地成为大模型应用落地的重要领域
2. 以国有大行为例,在近期公布的半年报中,银行均提及了大模型研发进展,以及在场景落地应用上的阶段性成果。
3. 除了国有大行,其他股份制银行各中小银行也在大模型场景应用上不断开花。
4. 从上述各大银行大模型应用场景来看,目前主要还是对内应用。这些应用在银行业提升内部效率优化客户服务、增强风险管理等方面了重要
5. 未来,随着技术的成熟应用的拓展,大模型技术将在银行业务中更加关键的有望扩展到对外的客户服务和产品创新,从而推动整个银行业的数字化转型智能化。
阅读原文
2. 以国有大行为例,在近期公布的半年报中,银行均提及了大模型研发进展,以及在场景落地应用上的阶段性成果。
3. 除了国有大行,其他股份制银行各中小银行也在大模型场景应用上不断开花。
4. 从上述各大银行大模型应用场景来看,目前主要还是对内应用。这些应用在银行业提升内部效率优化客户服务、增强风险管理等方面了重要
5. 未来,随着技术的成熟应用的拓展,大模型技术将在银行业务中更加关键的有望扩展到对外的客户服务和产品创新,从而推动整个银行业的数字化转型智能化。
医疗大模型已过百款,谁能最早盈利?
文章概要:
. 2024年涌入医疗领域的大模型已逾百个,众多企业涉猎的区域十分广泛,包括诊疗全流程、医学影像、中医康复等。
2. 智能体是能够感知环境、进行决策并采取行动的系统,在医疗领域,智能体能够“理解”问题,给出准确的、精准的解答,也能同用户交互,像“真实的人”的那样进行多轮对话,层层递进逐一满足用户的多元化需求。
3. 对于众多着力于智能体的互联网企业而言,诊前场景是一个不得不选的场景,因为诊前环节大都存在高频沟通、快速响应等特征,医患高度匹配智能体优势,能够充分发挥生成式AI的能力。
4. 也有不少企业将智能体的价值放在了随访、药品说明书等环节,构建患者社群,最终寻求药企付费。
5. 由于诊前场景落地快、需求强烈、应用易于搭建等诸多特征存在,这里自然成为智能体扎堆的红海。因此,也有不少企业选择跳开竞争押注未来,围绕B端的药企或医院展开布局。
6. 智能体的技术突破使其有能力快速占据过往已成规模的市场,具备“杀手级应用”的潜质,但在实际运行中,其现有的缺陷仍然显而易见的。
阅读原文
云厂商大模型布局策略:多路径开启智能未来
文章概要:
1. 过去十余年云厂商竞争核心围绕基础设施建设,现在转向大模型布局。
2. 腾讯云坚定拥抱开源,推出混元Turbo和腾讯云智算,发布RAG解决方案。
3. 华为云专注面向行业提供大模型服务,与多家公司合作打造应用新场景。
4. 阿里云采取开源和闭源并行策略,促进中国大模型生态繁荣作为目标。
5. 百度智能云坚持闭源策略,全面升级百舸AI异构计算平台和千帆大模型平台。
阅读原文
2. 腾讯云坚定拥抱开源,推出混元Turbo和腾讯云智算,发布RAG解决方案。
3. 华为云专注面向行业提供大模型服务,与多家公司合作打造应用新场景。
4. 阿里云采取开源和闭源并行策略,促进中国大模型生态繁荣作为目标。
5. 百度智能云坚持闭源策略,全面升级百舸AI异构计算平台和千帆大模型平台。
引领行业新风向 中达安发布首个工程监理垂直大模型
文章概要:
1. 204年0月18日,中达安股份有限公司在国家超级计算济南中心成功举办工程监理行业垂直大模型发布会暨二十六周年庆典。
2 中达安工程监理行业内首个垂直领域的模型集成智理、智、智书核、智巡智策六大核心工具,打造出一个涵盖全方位、一站式的解决方案。
3. 中达投资设立了山东中达安算科技有限公司专注于大数据服务、互联网数据服务、互联网数据服务和数据处理及存储支持服务等领域。
4. 中安控股股东济南历城控股集团有限公司投资超过60亿元建设了三大国家千万亿次之一,正是此次会议举办地——国家超级计算。
. 成立二十六载,中达凭借深厚的行业积累与前瞻性的战略眼光,正积极推动从“新基建综合服务商”“+新能源咨询服务商”这一新兴领域转型。
阅读原文
2 中达安工程监理行业内首个垂直领域的模型集成智理、智、智书核、智巡智策六大核心工具,打造出一个涵盖全方位、一站式的解决方案。
3. 中达投资设立了山东中达安算科技有限公司专注于大数据服务、互联网数据服务、互联网数据服务和数据处理及存储支持服务等领域。
4. 中安控股股东济南历城控股集团有限公司投资超过60亿元建设了三大国家千万亿次之一,正是此次会议举办地——国家超级计算。
. 成立二十六载,中达凭借深厚的行业积累与前瞻性的战略眼光,正积极推动从“新基建综合服务商”“+新能源咨询服务商”这一新兴领域转型。
美团内测“外卖版小红书”;京东物流与淘宝天猫达成合作;阿里国际发布翻译大模型Marco;《通用大模型评测标准》发布 | 本周热点
文章概要:
1. 5年来直播带货投诉量暴增超47倍,有关部门应加快制定行业标准和规范。
2. 东北雨姐橱窗已下架所有商品,消费者可要求东北雨姐退一赔三。
3. 微软宣布将终止中国地区Azure OpenAI服务。
4. 《黑神话:悟空》助力游戏科学跻身Steam发行商收入榜前列,总收入超10亿美元。
5. 2024中国民营企业500强报告公布,互联网行业研发投入领先。
6. 永辉超市收到上海国际中心仲裁案受理通知。
7. 长城汽车魏建军称未来还将有车厂倒闭,其二手车等同废铁。
8. 联想芮勇称联想绝对不会造车,只会把汽车看作是下一个巨大的计算场景的机会。
9. 抖音转让图虫网全部股权。
10. 美团内测“外卖版小红书”,推出“本地在吃”服务。
11. 京东与淘宝天猫达成合作,入驻淘宝天猫平台商家将能够选择京东物流作为服务商。
12. 大众品牌中国CEO孟侠称至2030年计划向中国市场再投放22款大众品牌。
13. 小马智行自动驾驶出行服务接入高德App,已向广州用户开放体验。
14. 丰田、本田和日产同意在汽车软件开发方面推进合作。
15. 曹操出行CEO龚昕称两年内推出完全定制化Robotaxi车型。
16. 《通用大模型评测标准》发布,为产业界遴选优质AI大模型提供重要参考依据
17. 中国生成式人工智能服务大模型的注册用户超过6亿。
18. 阿里国际发布翻译大模型Marco,效果超Google、DeepL等。
19. 火山引擎飞连首发大模型IT赋能平台,助力企业办公智能化。
20. 零一万物全新SOTA旗舰模型亮相,中国大中首度超越GPT-4。
21. AI应用持续深化,打破游戏行业“不可能三角”。
22. 微软邀测Excel、PowerPoint新功能,规整化手写线条、形状。
23. 商务部回应中欧电动汽车关税谈判,磋商还存在重大分歧。
24. 欧盟预计将坚持到2035年禁售新燃油车计划。
25. 宝马CEO表示欧盟禁止燃油车“已不再现实”,或将导致汽车行业“大幅萎缩”。
26. 埃尼高管称将加大在中国可再生能源领域投资。
27. 美国考虑限制英伟达、AMD向部分国家销售AI芯片。
28. 被点名“安全漏洞问题频发”,英特尔回应。
29. 谷歌请求法院暂停Epic诉讼判决,称其危及Android安全。
30. 《纽约》要求AI初创公司Perplexity停止访问其内容。
31. TikTok去年欧洲区收入46亿美元,已预支10亿美元应对潜在罚款。
32. 外媒称SHEIN成法国第二大服装时尚品牌。
阅读原文
2. 东北雨姐橱窗已下架所有商品,消费者可要求东北雨姐退一赔三。
3. 微软宣布将终止中国地区Azure OpenAI服务。
4. 《黑神话:悟空》助力游戏科学跻身Steam发行商收入榜前列,总收入超10亿美元。
5. 2024中国民营企业500强报告公布,互联网行业研发投入领先。
6. 永辉超市收到上海国际中心仲裁案受理通知。
7. 长城汽车魏建军称未来还将有车厂倒闭,其二手车等同废铁。
8. 联想芮勇称联想绝对不会造车,只会把汽车看作是下一个巨大的计算场景的机会。
9. 抖音转让图虫网全部股权。
10. 美团内测“外卖版小红书”,推出“本地在吃”服务。
11. 京东与淘宝天猫达成合作,入驻淘宝天猫平台商家将能够选择京东物流作为服务商。
12. 大众品牌中国CEO孟侠称至2030年计划向中国市场再投放22款大众品牌。
13. 小马智行自动驾驶出行服务接入高德App,已向广州用户开放体验。
14. 丰田、本田和日产同意在汽车软件开发方面推进合作。
15. 曹操出行CEO龚昕称两年内推出完全定制化Robotaxi车型。
16. 《通用大模型评测标准》发布,为产业界遴选优质AI大模型提供重要参考依据
17. 中国生成式人工智能服务大模型的注册用户超过6亿。
18. 阿里国际发布翻译大模型Marco,效果超Google、DeepL等。
19. 火山引擎飞连首发大模型IT赋能平台,助力企业办公智能化。
20. 零一万物全新SOTA旗舰模型亮相,中国大中首度超越GPT-4。
21. AI应用持续深化,打破游戏行业“不可能三角”。
22. 微软邀测Excel、PowerPoint新功能,规整化手写线条、形状。
23. 商务部回应中欧电动汽车关税谈判,磋商还存在重大分歧。
24. 欧盟预计将坚持到2035年禁售新燃油车计划。
25. 宝马CEO表示欧盟禁止燃油车“已不再现实”,或将导致汽车行业“大幅萎缩”。
26. 埃尼高管称将加大在中国可再生能源领域投资。
27. 美国考虑限制英伟达、AMD向部分国家销售AI芯片。
28. 被点名“安全漏洞问题频发”,英特尔回应。
29. 谷歌请求法院暂停Epic诉讼判决,称其危及Android安全。
30. 《纽约》要求AI初创公司Perplexity停止访问其内容。
31. TikTok去年欧洲区收入46亿美元,已预支10亿美元应对潜在罚款。
32. 外媒称SHEIN成法国第二大服装时尚品牌。
从融资烧钱到商业落地:中国AI大模型步入「实战期」
文章概要:
1. 文章指出在AI还未达到生产力工具的时候,没人能知道怎样的基础模型会是尽头,对付费客户而言,他们如何才能将这笔投入转化为真实营收。目前国内的任何一家大模型企业都未表明过态,这不是一个当下能放到台面上的问题。
2. 文章指出大模型居高不下的成本,让即使有着全球1.8亿个人用户和100万企业订阅用户的顶级AI公司,也很难在短期谈得上盈利。在国内,大模型市场的“降温”肉眼可见,在“预训练”和“AI应用”两个核心主节奏的背后,对应的是不同AI大模型企业对2025年甚至接下来的Q4路径选择:继续烧钱,还是?
3. 文章指出对于C端,尤其是市场上用户感知最强的AIGC类应用,国内目前普遍采取的是免费商业模式。之所以“免费”的原因是,目前国内还没有出现真正的杀手级应用,没办法给用户提供足够强的产品体验收费策略很难奏效,甚至会适得其反。毕竟对于toC应用而言,有了流量就等于成功了一半。
4. 文章指出对于大模型创业公司来说,能否继续维持训练模型,最考验的就是他们的融资能力。在这种持续烧钱下,即使是对大模型态度更为积极的美元基金也很容易“捉襟见肘”。
5. 文章指出模型的想象力绝不止眼前这些,但在不同厂商内部,大模型目前所扮演的角色有很大区别。对于云厂商而言,大模型“吞金兽”都还只是作为杠杆,以AI来撬动其他业务的收入。而对于大模型创业公司而言,其只能在模型计算和模型商业化的窄赛道内进行变现和市场验证,但众所周知,伴随着国内大模型价格战的打响,包括一系列从tokens到上层的数据治理、RAG等全部大模型解决方案和模式都很难被企业买单,对企业而言,则是更难产生对应的商业回报。
6. 文章指出大模型公司亲自下场做LP,所释放的另一层信号则是,加速构建生态圈的同时,其也正在寻求新的盈利方式。br>7. 文章指出对于像常垒资本管理合伙人冯博这样的早期基金来说,重点会放在AI应用上。AI应用短期内可以产生收入;另一方面,不同于大模型公司,AI应用的估值也不会太高。
8. 文章指出基础大模型研发与AI应用究竟是否冲突?对此,云厂商和大模型创业公司的看法可能也并不相同。
9. 文章指出大模型创业公司还需要做的则是补充toB的服务能力。不同于云厂商对B端客户所积累的大量行业know-how,大模型创业公司在toB的探索则仍处于初期。
10. 文章指出大模型公司面临的除了盈利困境强大的竞争对手。
阅读原文
2. 文章指出大模型居高不下的成本,让即使有着全球1.8亿个人用户和100万企业订阅用户的顶级AI公司,也很难在短期谈得上盈利。在国内,大模型市场的“降温”肉眼可见,在“预训练”和“AI应用”两个核心主节奏的背后,对应的是不同AI大模型企业对2025年甚至接下来的Q4路径选择:继续烧钱,还是?
3. 文章指出对于C端,尤其是市场上用户感知最强的AIGC类应用,国内目前普遍采取的是免费商业模式。之所以“免费”的原因是,目前国内还没有出现真正的杀手级应用,没办法给用户提供足够强的产品体验收费策略很难奏效,甚至会适得其反。毕竟对于toC应用而言,有了流量就等于成功了一半。
4. 文章指出对于大模型创业公司来说,能否继续维持训练模型,最考验的就是他们的融资能力。在这种持续烧钱下,即使是对大模型态度更为积极的美元基金也很容易“捉襟见肘”。
5. 文章指出模型的想象力绝不止眼前这些,但在不同厂商内部,大模型目前所扮演的角色有很大区别。对于云厂商而言,大模型“吞金兽”都还只是作为杠杆,以AI来撬动其他业务的收入。而对于大模型创业公司而言,其只能在模型计算和模型商业化的窄赛道内进行变现和市场验证,但众所周知,伴随着国内大模型价格战的打响,包括一系列从tokens到上层的数据治理、RAG等全部大模型解决方案和模式都很难被企业买单,对企业而言,则是更难产生对应的商业回报。
6. 文章指出大模型公司亲自下场做LP,所释放的另一层信号则是,加速构建生态圈的同时,其也正在寻求新的盈利方式。br>7. 文章指出对于像常垒资本管理合伙人冯博这样的早期基金来说,重点会放在AI应用上。AI应用短期内可以产生收入;另一方面,不同于大模型公司,AI应用的估值也不会太高。
8. 文章指出基础大模型研发与AI应用究竟是否冲突?对此,云厂商和大模型创业公司的看法可能也并不相同。
9. 文章指出大模型创业公司还需要做的则是补充toB的服务能力。不同于云厂商对B端客户所积累的大量行业know-how,大模型创业公司在toB的探索则仍处于初期。
10. 文章指出大模型公司面临的除了盈利困境强大的竞争对手。
OpenAI服务或关停 国产大模型迎机遇
文章概要:
1. 近期有消息传出微软Azure OpenAI服务将于1月21日关停,国产大模型替代刻不容缓。
2. OpenAI发布O1系列模型,新模型复杂推理旨在解决科学、代码和数学等难题的推理和解决。br 3. OpenAI发布两款大语言模型o1-preview和o1-mini,我国AI大模型产业呈现蓬勃发展的态势。
4. 近期国产大模型快速更新迭代,国内厂商相继更新了模型版本或发布新应用产品。
5. 今年以来,AI视频大模型密集发布,目前国内模型公司中,Kimi、阶跃星辰等尚未发布视频模型,后续有望推出。
6. 从月活度看,ChatGPT月活用户数增长13.05%,豆包排名提升至全球第三。
7. 国内AI产品方面,2款产品月活用户数破亿。
8 北交所中AI大模型企业分大模型应用和大模型赋能两种类型。
阅读原文
2. OpenAI发布O1系列模型,新模型复杂推理旨在解决科学、代码和数学等难题的推理和解决。br 3. OpenAI发布两款大语言模型o1-preview和o1-mini,我国AI大模型产业呈现蓬勃发展的态势。
4. 近期国产大模型快速更新迭代,国内厂商相继更新了模型版本或发布新应用产品。
5. 今年以来,AI视频大模型密集发布,目前国内模型公司中,Kimi、阶跃星辰等尚未发布视频模型,后续有望推出。
6. 从月活度看,ChatGPT月活用户数增长13.05%,豆包排名提升至全球第三。
7. 国内AI产品方面,2款产品月活用户数破亿。
8 北交所中AI大模型企业分大模型应用和大模型赋能两种类型。
电子标准院大模型服务能力成熟度第二轮评估验证正式启动
文章概要:
1. 中国技术标准化研究院了《人工智能 大模型 第3:服务能力度评估》的工作,了大服务能力和成熟,规定了评估指标和方法,可用于指导大模型能力建设。
2. 该标准可解决大模型服务模糊、服务能力和业务服务评估困难的,非互联网企业和小微企业更好地,降低使用成本。
4. 评估验证流程包括商务和对接评估验证时间为即日起截至12月中旬报名,204年10月至202年1执行,2024年12月大会(拟)颁发证书。
阅读原文
2. 该标准可解决大模型服务模糊、服务能力和业务服务评估困难的,非互联网企业和小微企业更好地,降低使用成本。
4. 评估验证流程包括商务和对接评估验证时间为即日起截至12月中旬报名,204年10月至202年1执行,2024年12月大会(拟)颁发证书。
逆袭传奇!国产大模型黑马杀出重围,直逼腾讯宝座,73.56高分不得不服!
文章概要:
1 商汤日日新·商量模态大模型在中文多模态模型测评基准SuperCLUE-V发布10月榜单中位列国内大模型第一梯队,智夺金牌。
2 商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑取得第一,体现强大推理能力<> 3. SenseChat 5.5在基础能力-数理逻辑推理任务如图表推理、推理方面具备领先优势。 5.汤科技兼CEO徐立提出三层架构(KRE),即知识、推理、执行,提升基础模型的能力目前人工智能发展的大方向。
67月发布的“日日新5.5大模型体系就创新使用大量使用合成高阶思维链数据,推理思维能力在数理逻辑、英文、指令跟随等方面能力增强明显,2个多月的把基模型的提升了3%。
7. SenseChat55已经应用在商量网页版WEB)——一款擅长高效搜索、整理、输出信息的应用,工作、学习、生活中的任何问题,问问商量,都能解决。
阅读原文
2 商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑取得第一,体现强大推理能力<> 3. SenseChat 5.5在基础能力-数理逻辑推理任务如图表推理、推理方面具备领先优势。
67月发布的“日日新5.5大模型体系就创新使用大量使用合成高阶思维链数据,推理思维能力在数理逻辑、英文、指令跟随等方面能力增强明显,2个多月的把基模型的提升了3%。
7. SenseChat55已经应用在商量网页版WEB)——一款擅长高效搜索、整理、输出信息的应用,工作、学习、生活中的任何问题,问问商量,都能解决。
虚拟座谈:采用大语言模型时应该注意什么
文章概要:
1. 选择基于API的模型还是自托管模型:API解决方案更简单,方便早期快速迭代,但长期来看,自托管模型在成本和隐私方面可能更有优势。
2. 在对模型进行微调之前,请先尝试提示工程和检索增强生成(RAG)。
3. 在任何情况下,比较小的开放模型其性能可能都无法与GPT-4等大型封闭模型相提并论,但对于许多任务来说,它们往往已经足够出色,所以值得尝试。
4. 幻觉是一种常见的LLM风险,但使用依托可信来源的RAG可以很好地缓解这一风险。
5. 在采用LLM时,组织应在员工教育和培训方面进行投资,尤其要关注模型的能力和局限性。
阅读原文
2. 在对模型进行微调之前,请先尝试提示工程和检索增强生成(RAG)。
3. 在任何情况下,比较小的开放模型其性能可能都无法与GPT-4等大型封闭模型相提并论,但对于许多任务来说,它们往往已经足够出色,所以值得尝试。
4. 幻觉是一种常见的LLM风险,但使用依托可信来源的RAG可以很好地缓解这一风险。
5. 在采用LLM时,组织应在员工教育和培训方面进行投资,尤其要关注模型的能力和局限性。
快速了解大模型!
文章概要:
1. 大模型是人工智能领域的机器学习模型,通过学习大量数据类似人类理解语言、图像和声音的能力。
2. 大模型具有巨大规模、多任务学习、大数据训练、强大计算资源、知识蒸馏剪压缩等特征。
3 大可根据处理的数据类型和应用领域分类,包括语言大模型、视觉大模型和多模态大模型。
4. 大评价维度包含整体评估框架、三个评估维度、六个一级指标和十一个二级指标。
5. 构建大模型需要大量数据、先进算法和强大算力。
阅读原文
2. 大模型具有巨大规模、多任务学习、大数据训练、强大计算资源、知识蒸馏剪压缩等特征。
3 大可根据处理的数据类型和应用领域分类,包括语言大模型、视觉大模型和多模态大模型。
4. 大评价维度包含整体评估框架、三个评估维度、六个一级指标和十一个二级指标。
5. 构建大模型需要大量数据、先进算法和强大算力。
MEE专刊:大语言模型(LLM)如何影响生态学研究:机遇与挑战的多维探讨
文章概要:
1. 第一篇论文探讨了大语言模型(LLM)对科研社交与合作的影响,包括LLM在科研中的迅速普及、其对编程和学习过程的辅助作用、对早期职业研究人员的影响、社交互动的减少与社区凝聚力的挑战、对学术文化和支持系统的潜在影响、促进团队互动与协作的建议以及结论。
2 第二篇论文探讨了LLM对编程教学的支持与局限,包括编程在生态学与进化课程中的地位、LLM对编程的影响、学生如何使用LLM进行编程、LLM的局限性、编程教学仍然重要以及结论。
3. 第三篇论文探讨了LLM在科研发表压力下的潜在风险,包括发表压力与LLM的作用、论文“黑客化”风险、研究人员发展的受限、声誉风险、建议与应对措施。
4. 第四篇论文探讨了LLM推动跨学科研究的潜力与挑战,包括LLM在跨学科研究中的潜力、LLM在跨学科研究中的挑战、建议与前进方向以及结论。
阅读原文
2 第二篇论文探讨了LLM对编程教学的支持与局限,包括编程在生态学与进化课程中的地位、LLM对编程的影响、学生如何使用LLM进行编程、LLM的局限性、编程教学仍然重要以及结论。
3. 第三篇论文探讨了LLM在科研发表压力下的潜在风险,包括发表压力与LLM的作用、论文“黑客化”风险、研究人员发展的受限、声誉风险、建议与应对措施。
4. 第四篇论文探讨了LLM推动跨学科研究的潜力与挑战,包括LLM在跨学科研究中的潜力、LLM在跨学科研究中的挑战、建议与前进方向以及结论。
大模型引领6G革命!最新综述探索「未来通信方式」:九大方向,覆盖多模态、RAG等
文章概要:
1. 大语言模型(LLM)在通信行业的应用场景包括专业知识生成、代码生成与优化、网络配置生成等,这些应用场景展示了LLM在提升通信网络管理效率上的强大能力,也为未来6G网络的开发提供了关键支持。
2. LLM在通信分类任务中的应用包括攻击分类与检测、文本分类、图像分类、加密流量分类等,LLM为通信网络的管理和安全提供了全新的智能化手段,还凭借其多模态处理能力,显著提升了分类任务的效率和准确性。
3. LLM在通信网络优化中的应用包括强化学习中的奖励函数设计、黑箱优化、凸优化辅助、启发式算法设计等,LLM使得复杂网络环境中的优化问题得以快速、高效地解决。
4. LLM在电信网络预测中的应用包括预训练基础模型用于零样本预测、冻结预训练模型进行预测、精调大语言模型以提升预测能力、多模态语言模型增强预测精度等,LLM技术正在为电信网络的未来提供强有力的支持。
5. LLM在电信领域的挑战包括电信领域的LLM训练、LLM在电信中的实际部署、电信应用中的提示工程等,未来方向包括多模态LLM在电信中的应用、LLM驱动的电信规划与调度、资源分配与网络优化中的LLM、LLM增强的电信领域机器学习、LLM的实际应用、模型压缩与快速推理、解决LLM中的幻觉问题、基于检索增强的LLM、经济可行的LLM等。
阅读原文
2. LLM在通信分类任务中的应用包括攻击分类与检测、文本分类、图像分类、加密流量分类等,LLM为通信网络的管理和安全提供了全新的智能化手段,还凭借其多模态处理能力,显著提升了分类任务的效率和准确性。
3. LLM在通信网络优化中的应用包括强化学习中的奖励函数设计、黑箱优化、凸优化辅助、启发式算法设计等,LLM使得复杂网络环境中的优化问题得以快速、高效地解决。
4. LLM在电信网络预测中的应用包括预训练基础模型用于零样本预测、冻结预训练模型进行预测、精调大语言模型以提升预测能力、多模态语言模型增强预测精度等,LLM技术正在为电信网络的未来提供强有力的支持。
5. LLM在电信领域的挑战包括电信领域的LLM训练、LLM在电信中的实际部署、电信应用中的提示工程等,未来方向包括多模态LLM在电信中的应用、LLM驱动的电信规划与调度、资源分配与网络优化中的LLM、LLM增强的电信领域机器学习、LLM的实际应用、模型压缩与快速推理、解决LLM中的幻觉问题、基于检索增强的LLM、经济可行的LLM等。
大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?
文章概要:
1. OpenAI o1的发布,再次给AI领域带来了一场地震,它能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家
2. 在性能揭示了大模型进化的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time计算),模型可以获得更强大的性能
3. 从「训练Scaling」到「推理Scaling」的范式转变,也引发了关于计算资源分配和硬件选择的重新思考
4. 在GPU之外,什么是大模型推理的更好选择?现在的AI芯片有各种流派:ASIC、FPGA、DSP、Neuromorphic Chip,以及大量DSA(Domain-specific architectures)芯片。其中,以SambaNova RDU(Reconfigurable Dataflow Unit)为代表的动态可重构数据流(Dataflow)架构的芯片,能够通过并行处理和高效数据移动来优化性能和效率,近年越来越被认为是一个重要的发展方向
5. 近日的芯片盛会Hot Chips上,围绕大模型的议题比以往任何一届都更加活跃。SambaNova的最新一代RDU产品SN40L也在这场上引发持续讨论。大家也充分了解到,Sambanova如何实现大模型的快速推理以及提供GPU之外的更优方案
6. 与GPU本质上不同的是,数据流架构通过数据流动来驱动计算过程,而非常规指令流动。在该架构中,程序被表示为一个Dataflow Graph,其中节点代表计算操作,边代表数据依赖关系。每个节点其所有输入数据准备好后立即执行,并将结果传递给下游节点。这种架构天然支持并行处理,多个独立的计算操作可以同时执行,从而显著提高了计算性能
7. 当前的几家主流AI芯片Startup,都选择了数据流架构。其中来自SambaNova的RDU展现出了独特优势,也被视为GPU的最有力竞争者
8. 在o1发布后不久,SambaNova便在Hugging Face上发布了Llama 3.1 Instruct-O1演示。这个项目由SambaNova的40L RDU提供算力支持,用户可与LLama 3.1 405驰电掣般类o1的推理过程
9. 在AI芯片赛道的诸多初创公司中,SambaNova是目前估值最高的一家独角兽
10. SambaNova成立于2017年,拥有三位资深的联合创始人:Rodrigo Liang、Kunle Olukotun、Christopher Ré。CEO Rodrigo Liang毕业于斯坦福大学,在创立SambaNova之前,Rodrigo领导了甲骨文和Sun Microsystems的工程团队,负责SPARC处理器和ASIC的开发。Kunle Olukotun和Christopher Ré都来自斯坦福大学
11. 被誉为「芯片风险投资教父」的陈立武,自创立之初便作为创始投资人和董事会主席加入Samba,并于2024年5月出任执行主席,以加速和扩大公司的发展。自1987年创立华登国际(Walden International)以来,陈立武投资了许多公司(包括SambaNova),在推动半导体创新和发展方面发挥了重要作用
12. 在深度学习引发的第三次人工智能浪潮中,算力对人工智能发展的决定作用。一系列极具影响力的AI研究,如AlexNet、ResNet和Transformer都是在GPU上实现和评估的,这也让英伟达十年来始终处于AI硬件市场的主导地位
13. 不过,时代可能真要变了。正如Transformer会迎来新的挑战者,比如Mamba;英伟达和GPU也会迎来下一阶段的强劲竞争者,比如SambaNova的RDU
14. o1发布之后AI推理市场正处于爆炸式增长的新起点。从SambaNova的RDU开始,人工智能领域可能正在翻开全新的一页
阅读原文
2. 在性能揭示了大模型进化的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time计算),模型可以获得更强大的性能
3. 从「训练Scaling」到「推理Scaling」的范式转变,也引发了关于计算资源分配和硬件选择的重新思考
4. 在GPU之外,什么是大模型推理的更好选择?现在的AI芯片有各种流派:ASIC、FPGA、DSP、Neuromorphic Chip,以及大量DSA(Domain-specific architectures)芯片。其中,以SambaNova RDU(Reconfigurable Dataflow Unit)为代表的动态可重构数据流(Dataflow)架构的芯片,能够通过并行处理和高效数据移动来优化性能和效率,近年越来越被认为是一个重要的发展方向
5. 近日的芯片盛会Hot Chips上,围绕大模型的议题比以往任何一届都更加活跃。SambaNova的最新一代RDU产品SN40L也在这场上引发持续讨论。大家也充分了解到,Sambanova如何实现大模型的快速推理以及提供GPU之外的更优方案
6. 与GPU本质上不同的是,数据流架构通过数据流动来驱动计算过程,而非常规指令流动。在该架构中,程序被表示为一个Dataflow Graph,其中节点代表计算操作,边代表数据依赖关系。每个节点其所有输入数据准备好后立即执行,并将结果传递给下游节点。这种架构天然支持并行处理,多个独立的计算操作可以同时执行,从而显著提高了计算性能
7. 当前的几家主流AI芯片Startup,都选择了数据流架构。其中来自SambaNova的RDU展现出了独特优势,也被视为GPU的最有力竞争者
8. 在o1发布后不久,SambaNova便在Hugging Face上发布了Llama 3.1 Instruct-O1演示。这个项目由SambaNova的40L RDU提供算力支持,用户可与LLama 3.1 405驰电掣般类o1的推理过程
9. 在AI芯片赛道的诸多初创公司中,SambaNova是目前估值最高的一家独角兽
10. SambaNova成立于2017年,拥有三位资深的联合创始人:Rodrigo Liang、Kunle Olukotun、Christopher Ré。CEO Rodrigo Liang毕业于斯坦福大学,在创立SambaNova之前,Rodrigo领导了甲骨文和Sun Microsystems的工程团队,负责SPARC处理器和ASIC的开发。Kunle Olukotun和Christopher Ré都来自斯坦福大学
11. 被誉为「芯片风险投资教父」的陈立武,自创立之初便作为创始投资人和董事会主席加入Samba,并于2024年5月出任执行主席,以加速和扩大公司的发展。自1987年创立华登国际(Walden International)以来,陈立武投资了许多公司(包括SambaNova),在推动半导体创新和发展方面发挥了重要作用
12. 在深度学习引发的第三次人工智能浪潮中,算力对人工智能发展的决定作用。一系列极具影响力的AI研究,如AlexNet、ResNet和Transformer都是在GPU上实现和评估的,这也让英伟达十年来始终处于AI硬件市场的主导地位
13. 不过,时代可能真要变了。正如Transformer会迎来新的挑战者,比如Mamba;英伟达和GPU也会迎来下一阶段的强劲竞争者,比如SambaNova的RDU
14. o1发布之后AI推理市场正处于爆炸式增长的新起点。从SambaNova的RDU开始,人工智能领域可能正在翻开全新的一页
智工观察|工业大模型如何赋能智能物流?智工·工业大模型给出的答案
文章概要:
1. 工业大模型正成为推动智能制造智能物流发展的力量。近日,中工互联科技集团董事长智振在2024深圳)机器视觉展论坛上指出,企业在发展智能物流时不应跟风,应立足自身需求精准定位大模型的价值点。
2表示:“并非简单地购买几台AGV或建设立库就能提升物流效率,企业在引入新技术时,必须结合具体场景,评估其实际价值和投资回报。”
3. 中工互联提出了一套系统的智能物流解决方案该方案是智能工厂整体解决方案的有机组成,着眼于为客户提供可持续、可升级的未来导向型方案。智振介绍道:“我们为客户全场景规划和设计,物流需求纳入整体方案中”
4.注意的是,中互联的智能方案在其自主研发的工业操作系统和工业互联网平台基础之上。这种全局性、系统性的方法,保证了智能物流与智能制造的深度融合,提升了整体生产效率。
阅读原文
2表示:“并非简单地购买几台AGV或建设立库就能提升物流效率,企业在引入新技术时,必须结合具体场景,评估其实际价值和投资回报。”
3. 中工互联提出了一套系统的智能物流解决方案该方案是智能工厂整体解决方案的有机组成,着眼于为客户提供可持续、可升级的未来导向型方案。智振介绍道:“我们为客户全场景规划和设计,物流需求纳入整体方案中”
4.注意的是,中互联的智能方案在其自主研发的工业操作系统和工业互联网平台基础之上。这种全局性、系统性的方法,保证了智能物流与智能制造的深度融合,提升了整体生产效率。
央国企30个大模型来袭
文章概要:
1. 有人认为大模型不接地气,无法落地,且提出谁在为大模型买单的疑问。
2. 2024年,央国企招采中,大开始变多,一出手就是几百万上千万,成为推动大落地的强劲动力。
3. 列举了30家央国企已成功发布的大模型,中国海油、中国华能、国网湖南电科院、中核八所、国家能源集团数智科技公司、中国中煤能源集团天津设计公司、中航信移动科技有限公司、中国石油、煤炭科学北大荒信息有限公司等。
4. 央国企发布和购买大模型是风向标,其背后必然有整个大模型产业链的支撑,也必将让众多ICT和AI企业受益。
阅读原文
2. 2024年,央国企招采中,大开始变多,一出手就是几百万上千万,成为推动大落地的强劲动力。
3. 列举了30家央国企已成功发布的大模型,中国海油、中国华能、国网湖南电科院、中核八所、国家能源集团数智科技公司、中国中煤能源集团天津设计公司、中航信移动科技有限公司、中国石油、煤炭科学北大荒信息有限公司等。
4. 央国企发布和购买大模型是风向标,其背后必然有整个大模型产业链的支撑,也必将让众多ICT和AI企业受益。
除了ChatGPT,这些大语言模型,你了解几个?
文章概要:
1. 文章介绍了除ChatGPT外的其他大语言模型,包括GPT系列、BERT、T5、Claude、LLaMA、PaLM、Mistral、ERNIE、Bloom和Grok等。
2. 这些模型通常基于Transformer架构,大规模参数和多任务处理能力,广泛应用于语言理解、生成和多模态处理等领域。
阅读原文
2. 这些模型通常基于Transformer架构,大规模参数和多任务处理能力,广泛应用于语言理解、生成和多模态处理等领域。
关于大模型的10个思考
文章概要:
1. 算力是门槛:大模型对算力的要求,过去10年非常巨大。今天要做人工智能大模型,讲卡伤感情没卡没感情。
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的行业大模型。这个趋势肯定是这样的,未来通用大模型的占比会越来越低。
6. AI Agent,落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的。关于人工智能的涌现,大家只是讲讲,并没有讲清楚。
阅读原文
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的行业大模型。这个趋势肯定是这样的,未来通用大模型的占比会越来越低。
6. AI Agent,落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的。关于人工智能的涌现,大家只是讲讲,并没有讲清楚。
15款主流AI大模型大比拼:谁在视频安防工程测算中表现最佳?
文章概要:
1. 作者接触过不少AI大模型对话工具,为评估哪一款效果最好,对15款主流AI大模型进行了评测,包括GPT-4o、Claude 3.5 sonnet、LLama 3.1、阿里通义千问、文心一言讯飞星火、KimiChat、智谱等。
2. 评测以视频安防工程测算任务为例,对比了各模型的表现。
3. 作者列出了各模型的得分,其中GPT-o、GPT-4o mini、Claude 3.5 Sonnet、Llama 3.1 405B、Llama 3.1 70B均为95分,Gemini 1.5 Pro为90,义千问为85分,讯飞星火、百小应为80分,智谱清言为75分,万知为60分,文心一言3.5、豆包、腾讯、秘塔搜索、天工搜索均为55分。
4. 作者认为国内大模型在工程测算方面与国外优秀大模型仍有差距,但差距不大,希望国内大模型越做越好。
阅读原文
2. 评测以视频安防工程测算任务为例,对比了各模型的表现。
3. 作者列出了各模型的得分,其中GPT-o、GPT-4o mini、Claude 3.5 Sonnet、Llama 3.1 405B、Llama 3.1 70B均为95分,Gemini 1.5 Pro为90,义千问为85分,讯飞星火、百小应为80分,智谱清言为75分,万知为60分,文心一言3.5、豆包、腾讯、秘塔搜索、天工搜索均为55分。
4. 作者认为国内大模型在工程测算方面与国外优秀大模型仍有差距,但差距不大,希望国内大模型越做越好。
车圈大模型落地竞速:从好用到易用,从尝鲜到常用
文章概要:
1. 全民AI需求爆发,大模型成为推动产业升级的重要引擎,但大模型上车效果和理想状态存在差距,需要更好性能、更易落地的大模型产品。
2. 以豆包大模型为代表的模型产品正在快速打开市场,火山引擎也在持续开放大模型能力,与车企、AI技术爱好者共创行业解决方案。
3. 大模型将重塑座舱,智能座舱会向智能体方向发展,能够理解场景信息,很自然地了解用户需求,生成场景化的解决方案并完成执行。
4. 抓住汽车需求场景,满足用户多样化需求是大模型企业突围的关键方向。
5. 火山车圈提供了强大的豆包大模型系列,以及扣子专业版等完备的应用开发工具,豆包大模型也成为了AI原生应用生长的肥沃土壤。
阅读原文
2. 以豆包大模型为代表的模型产品正在快速打开市场,火山引擎也在持续开放大模型能力,与车企、AI技术爱好者共创行业解决方案。
3. 大模型将重塑座舱,智能座舱会向智能体方向发展,能够理解场景信息,很自然地了解用户需求,生成场景化的解决方案并完成执行。
4. 抓住汽车需求场景,满足用户多样化需求是大模型企业突围的关键方向。
5. 火山车圈提供了强大的豆包大模型系列,以及扣子专业版等完备的应用开发工具,豆包大模型也成为了AI原生应用生长的肥沃土壤。
多模态大模型有哪些落地场景?贝壳、海尔等4家头部企业实践
文章概要:
1. 多模态成为大模型落地发展的必经之路,已有企业将多模态大模型应用于实际的业务场景,智库通过研究贝壳找房、喜马拉雅、平安、海尔等的模态大实践,为其他企业提供参考。
2. 贝壳找房推出DreamHome大模型,了全链路流程了面向B/C两端的家装AIGC产品“设牛”,提升了用户在家装过程中的体验。
3. 喜马拉雅建设音频大模型,并基于音频大模型打造音频创作AI Agent,可端到端完成音频创作工作,大幅缩短音频内容的创作周期5.GPT是海尔智家开发的家庭首个垂模型,拥有文本、图像、音频、视频、代码等多模态生成能力,已经在海尔的用户端和企业端得到大。
阅读原文
2. 贝壳找房推出DreamHome大模型,了全链路流程了面向B/C两端的家装AIGC产品“设牛”,提升了用户在家装过程中的体验。
3. 喜马拉雅建设音频大模型,并基于音频大模型打造音频创作AI Agent,可端到端完成音频创作工作,大幅缩短音频内容的创作周期
院士说 | 沈向洋院士:关于大模型的10个思考
文章概要:
1. 算力是门槛:大模型对算力的要求,过去10年非常巨大。今天要做人工智能大模型,讲卡伤感情、没卡没感情。
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和生成的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型。这个趋势肯定是这样的,未来通用大模型的占比会越来越低。
6. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的。关于人工智能的涌现,大家只是讲讲,并没有讲清楚。
阅读原文
2. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量。但互联网上没有那么多好的数据,清洗完以后,可能20T就差不多到顶了,所以未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
3. 大模型的下一章:有很多多模态的科研工作要做,我相信一个非常重要的方向是多模态的理解和生成的统一。
4. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程。整个过程非常像人类思考问题、分析问题,也需要非常多的算力才行。
5. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型。这个趋势肯定是这样的,未来通用大模型的占比会越来越低。
6. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent。
7. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作。
8. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对。
9. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。现在讲OpenAI加上微软就代表这个时代还太早,他们是领先了,但是未来还有很多想象的空间。
10. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的。关于人工智能的涌现,大家只是讲讲,并没有讲清楚。
百度谢广军:百模大战和价格战之后,大模型下一个战场在工具平台
文章概要:
1. AI大模型对生产生活的渗透已在方方面面,国内厂商在一年半内经历了百模大战和价格战,大模型的下一个战场在工具平台上。
2. 谢广军将过去一年半多的时间划分为三个阶段:百模大战时期、应用场景探索时期、深入场景和深度融合应用时期。
3. 百度千帆大模型平台顺应阶段性变化不断升级,3.0版本是面向生产力场景的企业级一体化服务平台,主要为企业提供生成式AI生产以及应用全流程开发工具链。
4. 千帆大模型平台3.0在模型开发层、模型服务层、应用开发层均有全面升级,提供最全面的工具链、丰富的模型和企业级RAG和Agent的开发工具。
5. 大模型的落地除了基座大模型能力的提升,还需要深入场景,百度智能云千帆大模型平台在千行百业中细分场景,不断提升场景中的模型能力、数据能力以及应用能力。
6. 随着技术的迭代,模型推理成本的降低,大模型的价格会持续下降,效果和成本是大模型厂商的关键。
阅读原文
2. 谢广军将过去一年半多的时间划分为三个阶段:百模大战时期、应用场景探索时期、深入场景和深度融合应用时期。
3. 百度千帆大模型平台顺应阶段性变化不断升级,3.0版本是面向生产力场景的企业级一体化服务平台,主要为企业提供生成式AI生产以及应用全流程开发工具链。
4. 千帆大模型平台3.0在模型开发层、模型服务层、应用开发层均有全面升级,提供最全面的工具链、丰富的模型和企业级RAG和Agent的开发工具。
5. 大模型的落地除了基座大模型能力的提升,还需要深入场景,百度智能云千帆大模型平台在千行百业中细分场景,不断提升场景中的模型能力、数据能力以及应用能力。
6. 随着技术的迭代,模型推理成本的降低,大模型的价格会持续下降,效果和成本是大模型厂商的关键。
大模型ToG市场攻坚,少数派的游戏
文章概要:
1. 地方国资撑起国内大模型商业化半边天,大模型ToG市场需求激增,商业化困境待解。
2. 大模型ToG市场上,中标企业抢单态度出现分化,百度、科大讯飞、智谱AI中标量领先。
3. 大模型ToG市场上,百度、科大讯飞、智谱AI的财报数据呈现不同结果,百度营收增长,科大讯飞亏损,智谱AI仍处于融资输血阶段。
4. 大模型ToG市场上,ToB赛道的创业者们对ToG市场爱恨交加,ToG项目存在成本困境,大模型企业需面对。
阅读原文
2. 大模型ToG市场上,中标企业抢单态度出现分化,百度、科大讯飞、智谱AI中标量领先。
3. 大模型ToG市场上,百度、科大讯飞、智谱AI的财报数据呈现不同结果,百度营收增长,科大讯飞亏损,智谱AI仍处于融资输血阶段。
4. 大模型ToG市场上,ToB赛道的创业者们对ToG市场爱恨交加,ToG项目存在成本困境,大模型企业需面对。
百模大战落幕,大模型“六小虎”开始分野
文章概要:
1. 文章深入剖析了大模型行业的发展现状与商业逻辑变化,揭示了“六小虎”等企业在算力需求、市场策略及落地方面的最新动态。
2. 国内真正自主训练基础大模型的企业不超过二三十家,美国市场在经历了充分有效的竞争后,做基础大模型的企业已迅速收缩到五家。
3. 文章提到在大模型领域具有代表性的“六小虎”中,也至少有两家已放弃大模型预训练。
4. 六小虎企业中,MiniMax以ToC为主,有较高的用户黏性和规模性收入;智谱既有ToB又有ToC,实际营收主要来自金融、互联网和能源;百川将很多资源放在医疗模型和产品上;月之暗面推出具有深度推理的AI搜索功能,强调推理;零一万物推出新模型Yi-Lightning,明确了To B工作只能在中国做,To C则主要布局海外的落地策略;阶跃星辰在2023年创办,目前推出了个人效率助手和冒泡鸭等产品。
5. 文章认为当下会有几类企业会有更大优势:互联网公司、有政府和高校背景的企业、在全球C端市场发力的企业。
阅读原文
2. 国内真正自主训练基础大模型的企业不超过二三十家,美国市场在经历了充分有效的竞争后,做基础大模型的企业已迅速收缩到五家。
3. 文章提到在大模型领域具有代表性的“六小虎”中,也至少有两家已放弃大模型预训练。
4. 六小虎企业中,MiniMax以ToC为主,有较高的用户黏性和规模性收入;智谱既有ToB又有ToC,实际营收主要来自金融、互联网和能源;百川将很多资源放在医疗模型和产品上;月之暗面推出具有深度推理的AI搜索功能,强调推理;零一万物推出新模型Yi-Lightning,明确了To B工作只能在中国做,To C则主要布局海外的落地策略;阶跃星辰在2023年创办,目前推出了个人效率助手和冒泡鸭等产品。
5. 文章认为当下会有几类企业会有更大优势:互联网公司、有政府和高校背景的企业、在全球C端市场发力的企业。