2024年中国AI大模型大盘点(文心一言、腾讯混元、Kimi、豆包、通义千问、讯飞星火、智谱清言、商汤商量):谁主沉浮?
文章概要:
1. 腾讯混元大模型是腾讯公司自主研发的融合了腾讯在AI的深厚积累,在语言理解和生成上表现,还支持多轮对话、文本创作、知识问答等多种任务,与腾讯生态系统紧密结合,在社交、游戏、内容等多个领域大放异彩
2. 科大讯飞星火大模型以其认知智能的独特魅力跨语言、跨领域的知识理解和能力,支持多模态交互,处理文本、语音、图像等多种输入形式,在逻辑推理和数学能力上有着显著的优势
3 阿里巴巴通义千问大模型是一款超大规模的语言模型,具备多轮对话、文案创作、逻辑推理等多功能,其GPT-4别的核心模型Qwen-Long在价格上的优势,使其在市场上更具吸引力
4. 百度文心一言大模型以其强大的语言理解和生成能力著称,进行自然流畅的对话,提供知识问答、文本创作、逻辑推理等多种服务,还特别注重用户隐私保护和数据安全
6. 智谱AI的GLM3 Turbo大模型在调用价格上进行了大幅度降价,同时保持了高性能的推理和生成能力,适用于对知识量、推理能力、创造力要求较高的场景,如广告文案写作等
7. Kimi智能助手以其长文本处理能力在市场上独树一帜,支持高达20万字的超长文本处理,为用户提供查询、数据分析、语言翻译、日常任务管理等服务
8. 商汤科技的SenseTime-Brain大模型基于自主研发的框架和大规模预训练技术,展现了高精度和高效率的特点,在人脸识别、视频分析、无人驾驶等领域的应用,证明了商汤科技在计算机视觉和深度学习技术方面的领先地位
阅读原文
2. 科大讯飞星火大模型以其认知智能的独特魅力跨语言、跨领域的知识理解和能力,支持多模态交互,处理文本、语音、图像等多种输入形式,在逻辑推理和数学能力上有着显著的优势
3 阿里巴巴通义千问大模型是一款超大规模的语言模型,具备多轮对话、文案创作、逻辑推理等多功能,其GPT-4别的核心模型Qwen-Long在价格上的优势,使其在市场上更具吸引力
4. 百度文心一言大模型以其强大的语言理解和生成能力著称,进行自然流畅的对话,提供知识问答、文本创作、逻辑推理等多种服务,还特别注重用户隐私保护和数据安全
6. 智谱AI的GLM3 Turbo大模型在调用价格上进行了大幅度降价,同时保持了高性能的推理和生成能力,适用于对知识量、推理能力、创造力要求较高的场景,如广告文案写作等
7. Kimi智能助手以其长文本处理能力在市场上独树一帜,支持高达20万字的超长文本处理,为用户提供查询、数据分析、语言翻译、日常任务管理等服务
8. 商汤科技的SenseTime-Brain大模型基于自主研发的框架和大规模预训练技术,展现了高精度和高效率的特点,在人脸识别、视频分析、无人驾驶等领域的应用,证明了商汤科技在计算机视觉和深度学习技术方面的领先地位
AI大模型应用层行业分析(二)迭代版
文章概要:
1. 文章对AI大模型应用层进行分析,包括现状、趋势等方面。
2. 现状方面,从供给和需求两端规模、市场份额、行业集中度、商业化、厂商分类与头部厂商盘点、产品分类等;需求端包括消费者规模、需求场景等。
3. 趋势方面,从供给和需求进行了预测。供给端包括市场趋势、技术&产品趋势、投融资、政策等;需求端包括需求洞察、消费者细分需求&测算等。
阅读原文
2. 现状方面,从供给和需求两端规模、市场份额、行业集中度、商业化、厂商分类与头部厂商盘点、产品分类等;需求端包括消费者规模、需求场景等。
3. 趋势方面,从供给和需求进行了预测。供给端包括市场趋势、技术&产品趋势、投融资、政策等;需求端包括需求洞察、消费者细分需求&测算等。
垂直领域大模型的思考
文章概要:
1. 本文介绍了如何做一个垂直领域的大模型,包括继续预训练、领域微调数据构建、减缓幻觉、知识召回等方面。
2. 通用大模型存在尴尬,需要垂直大模型来解决问题,提高生产效率。
3. 垂直大模型的基本套路包括继续预训练、SFT、RLHF,需要培养模型的三个能力。
4. 继续预训练能给通用的大模型注入领域知识,混合数据能让领域的模型还具备一定的通用能力。
5. 领域微调数据构建的核心是构建高质量大规模的领域微调数据,介绍了Self-Instruct、Self-QA、Self-KG三种方法。
6. 减缓幻觉的方法包括Generate with Citation、Factual Consistency Evaluation。
7. 知识召回的优化方案包括DPR、GTR、Keyword LLM、Context Rewriting、Knowledge Selection。
8. 垂直领域的大模型需要基于检索系统进行构建,还有很多的corner case没有解决。
阅读原文
2. 通用大模型存在尴尬,需要垂直大模型来解决问题,提高生产效率。
3. 垂直大模型的基本套路包括继续预训练、SFT、RLHF,需要培养模型的三个能力。
4. 继续预训练能给通用的大模型注入领域知识,混合数据能让领域的模型还具备一定的通用能力。
5. 领域微调数据构建的核心是构建高质量大规模的领域微调数据,介绍了Self-Instruct、Self-QA、Self-KG三种方法。
6. 减缓幻觉的方法包括Generate with Citation、Factual Consistency Evaluation。
7. 知识召回的优化方案包括DPR、GTR、Keyword LLM、Context Rewriting、Knowledge Selection。
8. 垂直领域的大模型需要基于检索系统进行构建,还有很多的corner case没有解决。
视频生成大模型红毯结束,正戏开锣|窄播Weekly
文章概要:
1. 视频生成大模型领域竞争激烈,巨头与创业公司纷纷入局。
2. 不同企业的探索呈现出四个共性特征,包括迭代速度快、效果提升显著、现货供应、全量开放和限制次数的免费使用、可生成的视频类型丰富等。
3. 内容平台在视频生成大模型上展现出一定优势,如快手的可灵与字节跳动的豆包视频生成大模型。
4. 视频生成大模型的竞争进入寻找规模化落地场景阶段,应用场景包括朋友圈内容、AI短剧、视频广告、口播内容、宣传片、节目制作、电影后期等。
5. 视频生成大模型的应用生态正在出现,将视频生成大模型的能力针对特定场景进行模板化,是这个应用生态的最核心工作。
阅读原文
2. 不同企业的探索呈现出四个共性特征,包括迭代速度快、效果提升显著、现货供应、全量开放和限制次数的免费使用、可生成的视频类型丰富等。
3. 内容平台在视频生成大模型上展现出一定优势,如快手的可灵与字节跳动的豆包视频生成大模型。
4. 视频生成大模型的竞争进入寻找规模化落地场景阶段,应用场景包括朋友圈内容、AI短剧、视频广告、口播内容、宣传片、节目制作、电影后期等。
5. 视频生成大模型的应用生态正在出现,将视频生成大模型的能力针对特定场景进行模板化,是这个应用生态的最核心工作。
大模型对推荐系统有用,但不是终极救星
文章概要:
1. 推荐系统可以理解为匹配,内容用户匹配起来,在匹配时理解双方是什么即理解和用户理解
2. 大模型带来的最大变量是,它有了通用性,这种通用在于,它像一个百科全书,知道人生活的方方面面
3. 用户理解可以拆分成两个层面:一是人的社会经历和性格特质,二是人对经历的反应,这又包含长期偏好短期反应
. 微信聊天记录非常有用,因为只要是生活中的大事一般肯定会在微信里跟朋友提到,而且是发生之后会跟朋友分享>5. 按照「记录经历」的角度推演,有什么能记录这一切吗?之前很多的智能眼镜,提供了一种实时记录看和听的途径,还味觉、触觉,补充完整
6.的语言把这些脑电波凝练表达了,实现了人与人之间基本的我们有时候会不知道自己在想什么,一部分情况是:不知道怎么用表达的
.地理解一个人,应该是去理解它的电波。如何理解脑电波,很重要的方式是用脑机了
阅读原文
2. 大模型带来的最大变量是,它有了通用性,这种通用在于,它像一个百科全书,知道人生活的方方面面
3. 用户理解可以拆分成两个层面:一是人的社会经历和性格特质,二是人对经历的反应,这又包含长期偏好短期反应
. 微信聊天记录非常有用,因为只要是生活中的大事一般肯定会在微信里跟朋友提到,而且是发生之后会跟朋友分享>5. 按照「记录经历」的角度推演,有什么能记录这一切吗?之前很多的智能眼镜,提供了一种实时记录看和听的途径,还味觉、触觉,补充完整
6.的语言把这些脑电波凝练表达了,实现了人与人之间基本的我们有时候会不知道自己在想什么,一部分情况是:不知道怎么用表达的
.地理解一个人,应该是去理解它的电波。如何理解脑电波,很重要的方式是用脑机了
吴晓波:大模型卷到头了,AI赛道新机会在哪
文章概要:
1. 2023年,中国人工智能领域发生了“百模大战”,各大科技公司纷纷发布了自己的大模型,其中OpenAI被公认为掌握了大模型核心秘密的公司,其领先地位尚未动摇。
2. 大模型的竞争还远未结束,从“卷技术”到“卷价格”,它已经注定成为了少数人的游戏。在《云上的中国3:剧变中的AI时代》中,吴晓波带领作者团队经过实地调研与深入采访,烧钱之后,AI赛道还有哪些新机会?
3. 大模型的研发需要大量的资金和数据,目前头部消费级App第一个月的用户留存率能达到60%~65%,甚至能达到85%。生成式AI应用的用户留存率,中位数只有14%。这意味着,用户还没有在生成式AI产品中找到足够价值,不能够每天都使用。如果开发者想要建立起持久的业务,就需要解决用户留存问题。
4. 数据标注是为模型提供训练样本,数据向量化就是将数据进一步转化为大模型可以理解的语言。随着2022年底大模型的爆发,向量数据库也迎来了自己的“iPhone时刻”。目前大模型应用落地的主要难点有两个,一是数据的实时性,二是私有数据的保护问题。
5. 经过一年多的模型大战,关于生成式AI的讨论正在从“比参数、跑得分、拼排名”转向“谁的模型更开放、推理成本更低、算力更便宜。业界的共识是,随着大模型赛道的竞争格局尘埃落定,更多的创新和价值创造正在向应用层汇聚。
阅读原文
2. 大模型的竞争还远未结束,从“卷技术”到“卷价格”,它已经注定成为了少数人的游戏。在《云上的中国3:剧变中的AI时代》中,吴晓波带领作者团队经过实地调研与深入采访,烧钱之后,AI赛道还有哪些新机会?
3. 大模型的研发需要大量的资金和数据,目前头部消费级App第一个月的用户留存率能达到60%~65%,甚至能达到85%。生成式AI应用的用户留存率,中位数只有14%。这意味着,用户还没有在生成式AI产品中找到足够价值,不能够每天都使用。如果开发者想要建立起持久的业务,就需要解决用户留存问题。
4. 数据标注是为模型提供训练样本,数据向量化就是将数据进一步转化为大模型可以理解的语言。随着2022年底大模型的爆发,向量数据库也迎来了自己的“iPhone时刻”。目前大模型应用落地的主要难点有两个,一是数据的实时性,二是私有数据的保护问题。
5. 经过一年多的模型大战,关于生成式AI的讨论正在从“比参数、跑得分、拼排名”转向“谁的模型更开放、推理成本更低、算力更便宜。业界的共识是,随着大模型赛道的竞争格局尘埃落定,更多的创新和价值创造正在向应用层汇聚。
大模型驱动的产品范式创新研究与思考
文章概要:
1. 本文是作者在2024全球产品经理大会上的主题演讲,因篇幅有限有所删减,主要探讨大模型对计算产业的影响。
2. 大模型带来了计算范式、开发范式、交互范式的转换,同时也带来了三大范式的转换,这是IT行业感到“热辣滚烫”的原因。
3. 交互范式的变革对产品影响最大,多模态和Agent等创新技术将极大地丰富自然语言交互的内涵,有望拆掉孤立应用间的壁垒,实现应用间的无缝集成。
4. 苹果在交互革新方面展现了深思熟虑的设计,的Apple Intelligence展示了个人场景、本地和云端的协同模型、跨应用程序的任务处理三个关键点。
5. 大模型对需求轴的颠覆力度不同,在生产力、搜索和信息等领域颠覆速度很快,在娱乐、社交等领域颠覆力相对较慢。
6. 大模型提供的是“内酚酞”式的愉悦,而“多巴胺”带来的愉悦,目前大模型还相对乏力。
7. 计算和连接的“钟摆效应”呈现指数级的加速,连接和计算互相成就,互联网时代的产品逻辑和模式终将在AGI时代被颠覆。
8. 今年以来,大模型在多模态、智能体、和强化学习带来的推理提升三个方向上取得了飞跃式的发展。
9. 多模态实现了视频领域的Scaling Law,Agent是“行动和规划”,推理的发展使得大模型完成了从“文科生”到“理科生”的能力转变。
10. 计算任务模式正在从检索模式向生成模式和推理模式演变,人机共生数据将为大模型提供下一波发展的关键“燃料”。
11. 大模型将驱动互联网从“信息网络”演变为“行动网络”,产品形态也将发生变化,未来的产品经理可能需要从面向人类的需求设计产品,转变为面向智能体的需求来设计产品。
阅读原文
2. 大模型带来了计算范式、开发范式、交互范式的转换,同时也带来了三大范式的转换,这是IT行业感到“热辣滚烫”的原因。
3. 交互范式的变革对产品影响最大,多模态和Agent等创新技术将极大地丰富自然语言交互的内涵,有望拆掉孤立应用间的壁垒,实现应用间的无缝集成。
4. 苹果在交互革新方面展现了深思熟虑的设计,的Apple Intelligence展示了个人场景、本地和云端的协同模型、跨应用程序的任务处理三个关键点。
5. 大模型对需求轴的颠覆力度不同,在生产力、搜索和信息等领域颠覆速度很快,在娱乐、社交等领域颠覆力相对较慢。
6. 大模型提供的是“内酚酞”式的愉悦,而“多巴胺”带来的愉悦,目前大模型还相对乏力。
7. 计算和连接的“钟摆效应”呈现指数级的加速,连接和计算互相成就,互联网时代的产品逻辑和模式终将在AGI时代被颠覆。
8. 今年以来,大模型在多模态、智能体、和强化学习带来的推理提升三个方向上取得了飞跃式的发展。
9. 多模态实现了视频领域的Scaling Law,Agent是“行动和规划”,推理的发展使得大模型完成了从“文科生”到“理科生”的能力转变。
10. 计算任务模式正在从检索模式向生成模式和推理模式演变,人机共生数据将为大模型提供下一波发展的关键“燃料”。
11. 大模型将驱动互联网从“信息网络”演变为“行动网络”,产品形态也将发生变化,未来的产品经理可能需要从面向人类的需求设计产品,转变为面向智能体的需求来设计产品。
只需 1 分钟|拥有本地运行的大型模型|调用大模型的浏览器插件
文章概要:
1运行模型,ollama是一个开源的语言模型服务工具,帮助用户快速在本地大模型;
2. ollama提供了简洁易用的命令行界面和服务器,可以轻松下载、运行和管理开源M;
3. ollama支持包括Llama3.Gemma2、Q2在内的热门开源LLM用户可以轻松一键下载和切换;
4 ollama支持使用Llama 3.1模型进行工具调用,模型能够执行更复杂的;
5.ama优化了设置和配置细节,GPU使用情况,从而提高了模型运行的效率;<>数据处理都本地机器上完成保护用户的隐私;
7.ama拥有一个庞大且活跃的社区,用户可以轻松帮助、分享经验,并积极参与到模型的开发和中;
8. 进入https://ollama.com/download直接下载客户端即可,也可以通过自带的teminal进行简单的调用模型;
9. 用web插件只需要 Web Store搜索Page assist,然后添加插件即可;
10. 插件会自动API,然后调用,下面我们来体验。
阅读原文
2. ollama提供了简洁易用的命令行界面和服务器,可以轻松下载、运行和管理开源M;
3. ollama支持包括Llama3.Gemma2、Q2在内的热门开源LLM用户可以轻松一键下载和切换;
4 ollama支持使用Llama 3.1模型进行工具调用,模型能够执行更复杂的;
5.ama优化了设置和配置细节,GPU使用情况,从而提高了模型运行的效率;<>数据处理都本地机器上完成保护用户的隐私;
7.ama拥有一个庞大且活跃的社区,用户可以轻松帮助、分享经验,并积极参与到模型的开发和中;
8. 进入https://ollama.com/download直接下载客户端即可,也可以通过自带的teminal进行简单的调用模型;
9. 用web插件只需要 Web Store搜索Page assist,然后添加插件即可;
10. 插件会自动API,然后调用,下面我们来体验。
最近两个爆红的AI大模型应用:Cursor和NotebookLM,创新很重要,但归根结底还是模型强大了
文章概要:
1. 最近两个爆红的AI大模型应用:Cursor和NotebookLM。
2. Cursor是一个AI辅助代码生成工具,NotebookLM是一个AI辅助播客内容生成工具。
3. Cursor团队对AI在编程中的角色定位是让程序员长期保持地位,注重提高速度、增强程序员的和控制力,使他们能够快速迭代修改任何需要改变的内容。
4. 对于notebookLM爆火,少不了大神Karpathy亲自下场使用的推波助澜。
阅读原文
2. Cursor是一个AI辅助代码生成工具,NotebookLM是一个AI辅助播客内容生成工具。
3. Cursor团队对AI在编程中的角色定位是让程序员长期保持地位,注重提高速度、增强程序员的和控制力,使他们能够快速迭代修改任何需要改变的内容。
4. 对于notebookLM爆火,少不了大神Karpathy亲自下场使用的推波助澜。
两万字实录:大语言模型、提示学习与未来科技研发的交汇点
文章概要:
1. 当大模型尚未成为AI的主流方向时,一批科学家已开始探索其在科研工作中的潜力。br> 2. 大模型技术已从理论研究走向实践应用,在生物信息学、材料科学、药物发现等领域发挥重要作用。
3. 许东教授的论文聚焦于大语言模型在生物信息学领域的应用,提出了一种迭代提示优化技术。
4. 雷峰网举办的线上圆桌论坛,汇集了行业专家,他们的见解覆盖了从基础理论研究到产业应用实践。
5. 许东教授强调了大语言模型在机器学习历史的发展的四个阶段,即从特征工程、构架工程、再到目标工程,最后到提示工程。
6. 胡钢清教授讨论了大模型在科研方面特别是在生物信息学和医学信息学领域的应用,分享了大模型跨领域应用中的潜力。
7. 夏淳老师从投资角度分析了大模型的商业价值,包括在提高效率和创造新商业机会方面的潜力。
8. 于利华老师分享了大模型在生物制药领域特别是在药物发现和单细胞数据分析方面的应用,强调了大模型在数据安全和隐私保护方面的重要性。
9. 许东教授介绍了大模型和提示学习的优劣势,胡钢清教授讨论了大模型和提示学习中的数据安全和隐私保护问题。
10. 夏淳老师和于利华老师讨论了大模型的商业价值社会职场影响。
11. 许东教授回答了听众的问题,包括大模型的应用、推理引擎、生物信息学、金融科技、药物研发等方面的问题。
阅读原文
3. 许东教授的论文聚焦于大语言模型在生物信息学领域的应用,提出了一种迭代提示优化技术。
4. 雷峰网举办的线上圆桌论坛,汇集了行业专家,他们的见解覆盖了从基础理论研究到产业应用实践。
5. 许东教授强调了大语言模型在机器学习历史的发展的四个阶段,即从特征工程、构架工程、再到目标工程,最后到提示工程。
6. 胡钢清教授讨论了大模型在科研方面特别是在生物信息学和医学信息学领域的应用,分享了大模型跨领域应用中的潜力。
7. 夏淳老师从投资角度分析了大模型的商业价值,包括在提高效率和创造新商业机会方面的潜力。
8. 于利华老师分享了大模型在生物制药领域特别是在药物发现和单细胞数据分析方面的应用,强调了大模型在数据安全和隐私保护方面的重要性。
9. 许东教授介绍了大模型和提示学习的优劣势,胡钢清教授讨论了大模型和提示学习中的数据安全和隐私保护问题。
10. 夏淳老师和于利华老师讨论了大模型的商业价值社会职场影响。
11. 许东教授回答了听众的问题,包括大模型的应用、推理引擎、生物信息学、金融科技、药物研发等方面的问题。
人工智能大模型在教学中的万向应用
文章概要:
1. 高教国培微信公众号时间202年1月0717:00> 2. 发文内容为人工智能大模型在教学应用> 3. 公众号提供了阅读原文和“微信扫一扫”
阅读原文
460亿,今年最大融资诞生
文章概要:
1. OpenAI在一轮融资中筹集了66亿美元,估值达到1570亿美元,成为全球第三大独角兽
2. 本轮融资由Thrive Capital领投,微软、英伟达、软银等跟投,是全球创业公司近年来规模最大的融资
3. OpenAI将在2年内完全重组为一家营利性企业,融资以可转债形式提供,若公司转型成功,融资将转化为股权,否则将转为债务
4. OpenAI希望达成独家融资协议,本轮投资者不能向另外5家AI初创企业提供资金,这一行为惹怒了马斯克
5. OpenAI今年8月份的月收入已经达到3亿美元,预计今年的年销售额约为37亿美元,明年营收将增至116亿美元
6. OpenAI将允许员工通过要约收购的方式出售他们在公司的部分股份
7. OpenAI表示新资金将用于加倍巩固在前沿AI研究方面的领导地位,提高计算能力,并继续构建帮助人们解决难题的工具
8. 大模型融资热潮衍生出许多新赛道,包括芯片半导体、数据中心、具身智能机器人、自动驾驶、生命科技等
9. 国内外关于大模型的争议也随之而来,有人质疑其盈利模式的可持续性
10. OpenAI正经历一波高管离职潮,有人担忧,当前的融资热潮可能掩盖了OpenAI面临的深层次问题
阅读原文
2. 本轮融资由Thrive Capital领投,微软、英伟达、软银等跟投,是全球创业公司近年来规模最大的融资
3. OpenAI将在2年内完全重组为一家营利性企业,融资以可转债形式提供,若公司转型成功,融资将转化为股权,否则将转为债务
4. OpenAI希望达成独家融资协议,本轮投资者不能向另外5家AI初创企业提供资金,这一行为惹怒了马斯克
5. OpenAI今年8月份的月收入已经达到3亿美元,预计今年的年销售额约为37亿美元,明年营收将增至116亿美元
6. OpenAI将允许员工通过要约收购的方式出售他们在公司的部分股份
7. OpenAI表示新资金将用于加倍巩固在前沿AI研究方面的领导地位,提高计算能力,并继续构建帮助人们解决难题的工具
8. 大模型融资热潮衍生出许多新赛道,包括芯片半导体、数据中心、具身智能机器人、自动驾驶、生命科技等
9. 国内外关于大模型的争议也随之而来,有人质疑其盈利模式的可持续性
10. OpenAI正经历一波高管离职潮,有人担忧,当前的融资热潮可能掩盖了OpenAI面临的深层次问题
两万字实录:大语言模型、提示学习与未来科技研发的交汇点
文章概要:
这篇文章是关于大语言模型、提示学习与未来科技研发的交汇点的讨论记录。文章介绍了大模型在机器学习历史上的发展阶段,包括特征工程、构架工程、目标工程和提示工程。大模型在生物信息学、材料科学、药物发现等领域的应用,以及在数据安全和隐私保护方面的挑战。文章还讨论了大模型在教育领域的潜力,以及如何帮助学生和研究人员更有效地学习和研究。
阅读原文
智能金融稳步前行:构建负责任的可信大模型
文章概要:
1. 金融智能进入大模型时代,大模型在金融行业的应用正不断拓展,领域大模型分为基础大模型、行业大模型和场景模型,垂直领域模型很有存在意义。
2. 大模型在金融落地场景与解决思路,包括行业痛点、金融智能服务可信增强框架、算力层、数据层、模型层和应用层。
3. 可信金融大模型落地应用成果,包括金融行业痛点、智能提效、金融业智能化生态赋能投研场景、AI搜索与问答、AI文档助手、AI研报助手、AI债券资讯、AI智能选股诊股、产品形态。
4. 问答环节,包括金融领域中大模型落地最有效的场景到底是什么,以及这个模型是如何实现识别投研报告中的差异化信息的。
阅读原文
2. 大模型在金融落地场景与解决思路,包括行业痛点、金融智能服务可信增强框架、算力层、数据层、模型层和应用层。
3. 可信金融大模型落地应用成果,包括金融行业痛点、智能提效、金融业智能化生态赋能投研场景、AI搜索与问答、AI文档助手、AI研报助手、AI债券资讯、AI智能选股诊股、产品形态。
4. 问答环节,包括金融领域中大模型落地最有效的场景到底是什么,以及这个模型是如何实现识别投研报告中的差异化信息的。
号称击败Claude 3.5 Sonnet,媲美GPT-4o,开源多模态模型Molmo挑战Scaling law
文章概要:
阅读原文大模型月度回顾 · 2024年9月
文章概要:
1. 支付宝发布AI生活管家“支小宝”和AI健康管家
2. 腾讯发布新一代” infra“腾讯云智算”
3. 苹果官宣10月正式推出
4. Google NotebookLM 新增 Audio Overview 功能
5. 夸克发布自主研发的智能对话助手 CueMe
6. Google 开源 DataGemma 以解决“幻觉”问题提升模型数据可靠性
7. 字节跳动发布自研音乐大模型 Seed-Music
8. 快手可灵AI重磅升级至可灵1.5模型
9. 阿里通义千问开源最强大模型Qwen2.5系列
10. 阿里云”通义灵码“全面升级并正式发布AI程序员
11. 阿里云通义万相上线AI视频生成
12. 腾讯元器重大更新:AI智能体打通公众号
13. 字节跳动发布两款视频生成模型PixelDance和Seaweed
14. Meta 发布 Llama 3.2 系列大模型
15. MiniMax 发布视频模型abab-video-1和音乐模型abab-music-1
16. 月之暗面 Kimi API 开启支持联网搜索增强
17. Claude 推出Enterprise企业计划
18. 面壁开源”小钢炮“系列旗舰端侧模型MiniCPM 3.0
19. 零一万物开源编程小能手Yi-Coder系列模型
20. DeepSeek-V2.5:融合通用与代码能力的全新开源模型
21. 智谱AI全面放开清言视频通话功能
22. OpenAI 发布o1大模型和o1-mini
23. 元象XVERSE发布国产最大MoE开源模型 XVERSE-MoE-A36B
24. 上海AI Lab推出新一代视频生成大模型“书生・筑梦 2.0”
25. Mistral 开源其首个多模态模型 Pixtral 12B
26. 中国科学院发布全球首个多模态地理科学大模型“坤元”
27. Anthropic 发布上下文检索技术(Contextual Retrieval)
28. 智源推出全球首个中文大模型辩论平台 FlagEval Debate
29. 2024腾讯全球数字生态大会
30. 苹果秋季发布会
31. 2024云栖大会
32. 华为全联接大会2024
33. 2024百度云智大会
34. 华为秋季全场景大会
35. Meta Connect 2024
阅读原文
2. 腾讯发布新一代” infra“腾讯云智算”
3. 苹果官宣10月正式推出
4. Google NotebookLM 新增 Audio Overview 功能
5. 夸克发布自主研发的智能对话助手 CueMe
6. Google 开源 DataGemma 以解决“幻觉”问题提升模型数据可靠性
7. 字节跳动发布自研音乐大模型 Seed-Music
8. 快手可灵AI重磅升级至可灵1.5模型
9. 阿里通义千问开源最强大模型Qwen2.5系列
10. 阿里云”通义灵码“全面升级并正式发布AI程序员
11. 阿里云通义万相上线AI视频生成
12. 腾讯元器重大更新:AI智能体打通公众号
13. 字节跳动发布两款视频生成模型PixelDance和Seaweed
14. Meta 发布 Llama 3.2 系列大模型
15. MiniMax 发布视频模型abab-video-1和音乐模型abab-music-1
16. 月之暗面 Kimi API 开启支持联网搜索增强
17. Claude 推出Enterprise企业计划
18. 面壁开源”小钢炮“系列旗舰端侧模型MiniCPM 3.0
19. 零一万物开源编程小能手Yi-Coder系列模型
20. DeepSeek-V2.5:融合通用与代码能力的全新开源模型
21. 智谱AI全面放开清言视频通话功能
22. OpenAI 发布o1大模型和o1-mini
23. 元象XVERSE发布国产最大MoE开源模型 XVERSE-MoE-A36B
24. 上海AI Lab推出新一代视频生成大模型“书生・筑梦 2.0”
25. Mistral 开源其首个多模态模型 Pixtral 12B
26. 中国科学院发布全球首个多模态地理科学大模型“坤元”
27. Anthropic 发布上下文检索技术(Contextual Retrieval)
28. 智源推出全球首个中文大模型辩论平台 FlagEval Debate
29. 2024腾讯全球数字生态大会
30. 苹果秋季发布会
31. 2024云栖大会
32. 华为全联接大会2024
33. 2024百度云智大会
34. 华为秋季全场景大会
35. Meta Connect 2024
2025年大部分大模型企业会出问题
文章概要:
1. 多模态通用大模型并不是人工智能的主要方向。
2. 专用大模型才是更大市场机会。
. 中国市场不可能支持百个通用大模型
阅读原文
2. 专用大模型才是更大市场机会。
. 中国市场不可能支持百个通用大模型
打完“价格战”,大模型还要比什么?
文章概要:
1. 阿里在2024年云栖大会上宣布旗下通义千问三款主力模型再次大幅降价,最高降幅达85%。
2. 国内大模型已从“以分计价”的定价模式走向“以厘计价”的新时代,大模型企业宁愿牺牲利润也要降价,所求的正是“预期”,即牺牲短期利益来换取长期回报。
3. 阿里提出了“AI大基建”的概念,除了在2024年云栖大会上提出大模型再次降价之外,还发布了新一代的开源大模型,一口气上架了100多个模型,涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,创造了大模型开源的“数量之最”。
4. 大模型企业在打价格战的同时,也深知产品、技术、现金流的重要性,既要抗住降价压力,又要和对手拉开技术差距,持续提升模型性能和产品落地,才能形成良性的商业闭环。
阅读原文
2. 国内大模型已从“以分计价”的定价模式走向“以厘计价”的新时代,大模型企业宁愿牺牲利润也要降价,所求的正是“预期”,即牺牲短期利益来换取长期回报。
3. 阿里提出了“AI大基建”的概念,除了在2024年云栖大会上提出大模型再次降价之外,还发布了新一代的开源大模型,一口气上架了100多个模型,涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,创造了大模型开源的“数量之最”。
4. 大模型企业在打价格战的同时,也深知产品、技术、现金流的重要性,既要抗住降价压力,又要和对手拉开技术差距,持续提升模型性能和产品落地,才能形成良性的商业闭环。
大模型能给大数据开发领域带来什么?
文章概要:
1. 大模型在大数据平台开发的应用场景:大模型可以解决数据开发、运维和使用中的难题,提高数据资产的可发现性,优化开发流程,并增强系统的稳定性和可靠性。
2. 大模型在大数据开发场景落地情况:大模型在大数据开发和应用场景中的落地实践,往往以智能助手的形式出现,以提高效率、简化操作并增强用户体验。目前只有阿里云和京东主要在大数据开发场景进行大模型的应用,而其它的企业主要是在数据应用比如分析等场景进行大模型的应用或者通用的软件开发领域进行落地。
阅读原文
2. 大模型在大数据开发场景落地情况:大模型在大数据开发和应用场景中的落地实践,往往以智能助手的形式出现,以提高效率、简化操作并增强用户体验。目前只有阿里云和京东主要在大数据开发场景进行大模型的应用,而其它的企业主要是在数据应用比如分析等场景进行大模型的应用或者通用的软件开发领域进行落地。
金融新基建:银行业「激战」AI大模型
文章概要:
1. AI大模型的场景化落地将会是银行业的重要命题,考验银行的战略规划、落地执行等能力。
2. 大部分银行正从AI大模型的研发,向场景落地应用进阶。
3. 银行大模型主要应用于智能问答、智能客服、智能撰写研报、智能风控、智能营销、数智财富管理等,标准化程度较高的业务模块。
4. 银行成为AI大模型落地的“排头兵”,并走出了两条不同的技术发展路线。
5. 以大模型为代表的生成AI技术本身还不成熟,AI大模型经常出现“AI幻觉”。
6. 技术安全和法律监管是关键问题,国内银行落地AI大模型都是小步实验,稳步推进的节奏。
阅读原文
2. 大部分银行正从AI大模型的研发,向场景落地应用进阶。
3. 银行大模型主要应用于智能问答、智能客服、智能撰写研报、智能风控、智能营销、数智财富管理等,标准化程度较高的业务模块。
4. 银行成为AI大模型落地的“排头兵”,并走出了两条不同的技术发展路线。
5. 以大模型为代表的生成AI技术本身还不成熟,AI大模型经常出现“AI幻觉”。
6. 技术安全和法律监管是关键问题,国内银行落地AI大模型都是小步实验,稳步推进的节奏。
多模态大模型技术点总结
文章概要:
1. 文章对多模态大模型技术点进行了总结,包括BLIP2、InstructBLIP、Qwen-VL、Qwen2-VL、LLaVA、LLaVA-1.5、MiniGPT-4和MiniGPT-v2等模型的论文地址、发布时间、模型结构、训练过程和训练数据等内容。
2. 文章还提到了一些模型的改进点和特点,如BLIP2的Q-Former用于连接模态之间的gap,InstructBLIP的Q-Former抽取指令感知的视觉特征,Qwen-VL的VL Adapter创建一组可训练的queries向量和image features一起做cross-attention等。
3. 文章提供了一个大模型技术群的二维码,欢迎读者加入。
阅读原文
2. 文章还提到了一些模型的改进点和特点,如BLIP2的Q-Former用于连接模态之间的gap,InstructBLIP的Q-Former抽取指令感知的视觉特征,Qwen-VL的VL Adapter创建一组可训练的queries向量和image features一起做cross-attention等。
3. 文章提供了一个大模型技术群的二维码,欢迎读者加入。
大模型应用设计的10个思考
文章概要:
1. 模型优先,持续迭代:利用LLM的规划和理解意图的能力,构建高效的项目,让模型成为解决问题的利器。
2. 权衡精准性,采用交互进行消歧:利用权衡杠杆换取精准,使用交互来缓解模糊,构建通用模式,提高工作效率。
3. 代码用于语法和过程,模型用于语义和意图:代码主要负责语法和过程的实现,而模型则专注于语义和意图的生成与解读。br>4. 避免脆弱性,摒弃硬编码:在代码和算法中加入更多的推理和灵活性,减少硬编码的使用,更好地利用LLM的能力。
5. 数据质量至上,LLM的应用与高质量数据息息相关:确保输入的数据是准确、详尽且上下文丰富的,才能期望从这些先进的模型中获得真正有价值、有深度的信息。
6. 把不确定性视为异常:依赖于与用户的互动意图来澄清这种不确定性,将这种不确定性传递到堆栈中的更高级别,直到到达一个可以与用户交互或澄清不确定性的层级。
7. 文本作为通用协议:文本已然成为了一种通用协议,这主要归功于LLM对于自然语言、意图和语义的出色解析能力。
8. 复杂问题,分解操作:将复杂的问题或任务分解为更简单的步骤,降低处理的难度,提高答案的稳定性和准确性。
9. 凡有控制,皆有模型:模型不仅是一种工具,它也可以成为我们对抗自身错误的利器,对模型进行适当的控制和引导,它就能成为我们工作中得力的“助手”。
10. 识别边界,不要认为大模型无所不能:大模型仍然存在着许多局限性和边界,我们在使用大模型时,应该保持理性和谨慎的态度。
阅读原文
2. 权衡精准性,采用交互进行消歧:利用权衡杠杆换取精准,使用交互来缓解模糊,构建通用模式,提高工作效率。
3. 代码用于语法和过程,模型用于语义和意图:代码主要负责语法和过程的实现,而模型则专注于语义和意图的生成与解读。br>4. 避免脆弱性,摒弃硬编码:在代码和算法中加入更多的推理和灵活性,减少硬编码的使用,更好地利用LLM的能力。
5. 数据质量至上,LLM的应用与高质量数据息息相关:确保输入的数据是准确、详尽且上下文丰富的,才能期望从这些先进的模型中获得真正有价值、有深度的信息。
6. 把不确定性视为异常:依赖于与用户的互动意图来澄清这种不确定性,将这种不确定性传递到堆栈中的更高级别,直到到达一个可以与用户交互或澄清不确定性的层级。
7. 文本作为通用协议:文本已然成为了一种通用协议,这主要归功于LLM对于自然语言、意图和语义的出色解析能力。
8. 复杂问题,分解操作:将复杂的问题或任务分解为更简单的步骤,降低处理的难度,提高答案的稳定性和准确性。
9. 凡有控制,皆有模型:模型不仅是一种工具,它也可以成为我们对抗自身错误的利器,对模型进行适当的控制和引导,它就能成为我们工作中得力的“助手”。
10. 识别边界,不要认为大模型无所不能:大模型仍然存在着许多局限性和边界,我们在使用大模型时,应该保持理性和谨慎的态度。