今日AI-大模型-2024年10月2日

发现全网最新的AI内容

大语言模型教程

文章概要:

1. 介绍了大型语言模型(LLM)的工作原理,包括Transformer架构、带监督的微调、零样本转换、上下文学习、模型大小和数据质量等方面。
2. 详细阐述了Transformer架构的工作原理,包括自注意力机制、多层感知器(MLP)、编码器-解码器设置等。
3. 讨论了的微调的优化方法,以及在不同任务上的应用。
4. 探讨了零样本转换的概念和实现方法,包括元学习和蒙塔古语义。
5. 分析了上下文学习的三种方式,即少样本学习、单样本学习和零样本学习,并介绍了GPT3在不同任务上的应用。
6. 强调了模型大小和数据质量对LLM性能的重要性,以及提高数据集质量的方法。
7. 探讨了思维链的概念和作用,以及如何通过思维链提示来解锁LLM的推理和算术能力。
8. 介绍了来自人工反馈的强化学习(RLHF)的原理和应用,以及如何通过RLHF对语言模型进行微调,实现语言模型与用户在通用任务上的意图一致。
9. 讨论了指令微调的概念和应用,以及如何通过指令微调来提高LLM的性能。
10. 介绍了检索增强生成(RAG)的概念和应用,以及如何通过RAG来提高LLM的性能。
阅读原文

大模型六小虎生存现状盘点

文章概要:

1. GTIC 2024中国AI PC创新峰会将于10月11日在2024上海国际消费电子展TechG同期举办,联想集团首席研究员颜毅强、荣耀终端有限公司PC产品研发系统部部长席迎军等7位嘉宾将进行演讲
2. ChatGPT打响生成式AI创业热潮发令枪,国内智谱AI、百川智能、零一万物、月之暗面、Minimax率先领跑,前微软全球副总裁姜大昕创办的阶跃星辰获20亿美元融资,大模型创企“六小虎”格局
3. 模型能力增长放缓,大模型“六小虎”选择不同商业化路线,有的选择To C,有的选择To B,有的两者兼顾
4. 大模型“六小虎”开启用户争夺大战,线上线下营销,效果显著,但距离收支平衡还有很远的路要走
5. 大模型厂商开始布局对AI创企的投资,“六小虎”已有公司在冲刺上市,AGI的实现不可能一蹴而就
阅读原文

NVIDIA大语言模型落地的全流程解析

文章概要:

1. NeMo Framework是NVIDIA大语言模型的全栈解决方案,涵盖了大语言模型的开发、部署以及的全流程。
2. TensorRT-LLM的作用主要在于推理加速,目前已在Github上开源。
3. RAG的主要目标是处理大型语言模型由于专业领域知识不足以及其他一些原因导致的幻觉问题。
阅读原文

AI的冬天不会到来:拿起“补给包”在路上

文章概要:

1. 作者认为AI就是心所在,生成式人工智能将成为的能源”。
2. 作者回顾了人工智能技术的发展历程,并br如模型是大厂游戏创业什么;模型有什么特殊之处;会不会夺取很多人的工作。5. 作者认为神经网络之父Geoff H的生成式AI革命在规模上可以或的发明相提并论指出智能的应用。
阅读原文

用钙钛矿AI大模型对特定研究团队进行时间维度的技术路线画像

文章概要:

1. 国庆假期,钙钛矿技术突破的新闻不断,这让同行们既欣慰又焦虑
2. 钙钛AI大模型结合知识图谱和数据可视化技术,可以对特定研究团队进行时间维度的技术路线画像
3. 在技术路线画像过程中团队知识图谱及其成长模型非常重要
阅读原文

大模型盘点①|MiniMax:做社区产品驱动的大模型公司

文章概要:

1. 本文是新皮层NewNewThing对MiniMax创始人闫俊杰的采访记录,主要探讨了MiniMax的视频生成模型、技术研发、产品策略、商业化等问题。
2. 闫俊杰表示,MiniMax的视频生成模型abab-video-1已经发布,后续还将推出更多功能。
3. 他认为,视频生成是大模型的必然趋势,MiniMax将继续加大技术研发投入,提升产品的用户体验和商业价值。
4. 此外,他还提到了MiniMax的产品策略和商业化路径,以及对行业发展的看法。
阅读原文

沈向洋:大模型时代的机遇与挑战,十个思考

文章概要:

1. 沈向洋在演讲中对大模型时代提出了十个思考,涵盖算力增长、数据需求、模型发展方向、AI治理、人机交互以及对智能本质的探索等方面,并强调了行业大模型和个人大模型的重要性。
2. 沈向洋认为,大模型发展增长,且算力需求增长速度远超摩尔定律。
3. 数据量是训练大模型的关键,未来需要更多多模态数据甚至人工合成数据。
4. 大模型发展方向将从语言模型转向多模态模型,最终走向具身智能和世界模型。
5. 行业大模型是当前大模型应用的主要方向,而个人大模型也具有巨大潜力。
6. 超级Agent将成为大模型最大的超级应用,但其发展面临诸多挑战。大模型与传统开源有所不同,需要深入理解闭源系统的技术细节。
8. 对AI治理和人机关系的重新思考至关重要,而对智能本质的探索仍需深入。
阅读原文

人工智能大模型在教学中的万向应用

文章概要:

1. 人工智能大模型在教学中的万向应用
2. 高教国> 3.024年102日 118 北京
4.扫一扫关注该公众号> 5. 选择留言身份
阅读原文

百模大战和价格战之后,大模型下一个战场在工具平台

文章概要:

1. AI大模型对生产生活的渗透深远,企业和模型厂商共同迭代,国内厂商经历百模大战和价格战后,大模型的下一个战场在工具平台。
2. 百度副总裁谢广军分享一线洞察,过去一年多以来,千帆平台日均调用量超过7亿次,累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。
3. 谢广军将过去一年半多的时间划分为三个阶段,第一阶段是百模大战时期,第二阶段是应用场景探索时期,第三阶段是深入场景和深度融合应用时期。
4. 百度千帆大模型平台不断升级,从模型训练到全栈开发,为企业提供生成式AI生产以及应用全流程开发工具链。
5. 千帆大模型平台3.0提供企业级RAG和企业级Agent的开发工具,从检索效果、检索性能、存储扩展、调配灵活性四方面对企业级检索增强生成(RAG)进行了全面升级。
6. 百度智能云千帆大模型平台在千行百业中细分场景,不断提升场景中的模型能力、数据能力以及应用能力。
7. 谢广军简明勾勒了大模型产业落地的未来线条,随着技术的迭代,模型推理成本的降低,大模型的价格会持续下降。
阅读原文

【技术科普】国产大模型做翻译,你选对模型了吗?

文章概要:

1. 截止2024年8月,我国已备案上线180多个能为公众提供服务的生成式人工智能赋能大模型,语言服务行业也出现了多种重要的语言服务人才岗位。
2. 文章选取国内十款大语言模型,借助Python语言及国外大模型ChatGPT对的译文结果进行质量评估,以小说《追风筝的人》中的部分段落为例进行测试。
3. 文章通过算法实现了译文文本间的语义相似度计算,主要采用了基于词向量的余弦相似度方法,针对参考译文和待评估译文,引入了基于Sentence-BERT的语义相似度计算。
4. 文章通过ChatGPT-4o-Latest-128k进行评估,从主题意义、美学价值、语篇连贯性、语态与信息结构、语域复杂度五个方面综合评估翻译的文学性和准确性。
5. 文章指出,以上展示的国内大语言模型具备了无需提示词即可对小说文本进行英译汉处理的能力,且翻译效果相当出色。
阅读原文

大模型专题调研纪要

文章概要:

1. 大模型专题调研纪要。
2. 介绍了最新的OpenAI的思维链模型的技术和后续展望,涵盖了国产大模型境遇、多模态方向的情况以及相关研究思考。
3. 分析了AI搜索作为应用方向,在当前市场环境下的发展趋势。
4. 探讨了在和明年,模型的数据兑现和公司自身模型方面的积极预期。
5. 研究了不同应用场景对模型停留时间影响。
6. 说明了OpenAI最新,思维链引入带来。
7. 分析了模型能力的提升模型定价之间的关系。
8. 强调了该模型回答效果上亮点。
9. 解释了模型参数规模与算力供给之间的关系。
10. 探讨了大模型在市场遇到的问题及应对策略。
1. 介绍了混元模型的得分情况。
12. 分析第一梯队、第二和第三梯队模型的和现状br>13. 探讨了国产模型分化是否加速的问题。
14. 分析多模态领域的进展。
介绍了国产模型预计将在哪些领域进行能力提升
16. 分析了腾讯快手等公司在下半年有哪些动态模型更新计划。
. 介绍了腾讯多模态模型的水平
. 分析了人工智能行业及市场关注点。
19 探讨了驾驶方向为何被认为是今年核心兑现点。
20. 分析了AI操作系统和端侧领域有哪些值得关注的发展。
21. 给出了算力方面的投资建议。
阅读原文

沈向洋:我对大模型时代的十个思考

文章概要:

1. 沈向洋以《大模型时代的机遇和挑战》为题做了主旨演讲,本文根据演讲实录整理。
2. 沈向洋讲述了三个例子:从文生成文、从文生成图、从文生成视频。
3. 沈向洋分享了在通用人工智能时代,对大模型的十点思考。
4. 沈向洋认为,在大模型时代,算力、算法和数据是人工智能重要的三个因素。
5. 沈向洋指出,大模型的下一章是具身智能要做机器人。<>6. 沈向洋表示,人工智能的范式转移是从原来的GPT思路,变成了今天的自主学习的道路。
7. 沈向洋强调,大模型横扫千行百业,所有的公司都要面对大模型带来的机会。
8. 沈向洋提出,大模型最大的超级应用是Agent。
9. 沈向洋认为,开源和闭源在大模型时代,和传统的操作系统、数据库的开源还不一样。
10. 沈向洋指出,要重视AI治理,因为AI发展太迅猛了,全世界对AI安全都非常重视。
11. 沈向洋强调,重新思考人机关系,真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者。
12. 沈向洋表示,智能的本质是今天虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习的理解暂时是没有理论的。
阅读原文

AI生成大模型,是拉高天花板?还是消灭创作者?

文章概要:

1. AI视频生成模型发展迅速,国内企业纷纷布局,如智谱AI的「清影」、爱诗科技的「PixVerse V2」、生数科技的「Vidu」等。
2. 视频生成模型领域竞争激烈,各企业不断提升技术水平,如字节跳动的豆包视频生成-PixelDance、豆包视频生成-Seaweed,快手的「可灵」等。
3. 视频生成模型的局限性在于可控性不足,稳定性不够,需要不断尝试。
4. 视频生成大模型的用户分类分为B端和C端两类,B端主要来自与视频内容相关的领域,C端用户一般是独立编剧、视频博主等。
5. AI商业模式主要有SaaS订阅模式和API形式,目前AI视频生成大模型在影视、广告、电商、自媒体等领域已经有了广泛的应用。
阅读原文

一文看遍AI行业大模型

文章概要:

1. 行业大模型弥合技术与需求差距:大模型引发智能革命,行业大模型是AI+落地最后一公里,行业大模型长在通用大模型上
2. 大模型行业应用进展与评估:行业大模型应用阶段划分,行业大模型应用场景分析,行业大模型评估标准。
3. 行业大模型技术多维优化策略:引导-提示工程,外挂-检索增强生成,优化-精调,原生-预训练。
阅读原文

30000亿,地方国资带着“大模型订单”来了

文章概要:

1. 今年以来,中国大模型市场招投标市场非常活跃,央国企相关采购招标数量持续上涨,金额占比约40%,应用类项目数量占比高达70%左右。
2. 2023年招投标市场对大模型技术的需求显著,全年共发起190次采购,总交易额达到5.95亿元。进入2024年,招投标市场的大模型相关招标活动更加活跃,仅上半年已发起498次招标,涉及金额超过13.4亿元,超越了去年全年总和。
3. 从地域分布来看,2024年上半年的大模型技术采购需求主要集中在经济发达地区,如北京、广东、上海、江苏和浙江。其中,贵州东数西算大模型建设工程项目以1.76736亿元的中标金额脱颖而出,成为金额最高的项目。
4. 从公开消息看,科大讯飞成为上半年大模型中标数最多的市场化玩家,而后7-8月份又分别中标项目112个和127个,且8月份单月中标金额突破1.5个亿,行业排名第一。
5. 大模型厂商的中标项目中有超过六成都来自央国企,也就是说,央国企的需求,支撑了大模型企业的商业落地。
阅读原文