今日AI-大模型-2024年9月25日

发现全网最新的AI内容

文心大模型:日均调用量超 7 亿次,旗舰模型一年降价超 90%

文章概要:

1. 2024年9月25日,2024百度云智大会在北京召开,百度智能云针对算力、模型、AI应用,全面升级百舸AI异构计算平台4.0、千帆大模型平台3.0两大AI基础设施,并升级代码助手、智能客服、数字人三大AI原生应用产品。
2. 百度集团执行副总裁、百度智能云事业群总裁沈抖表示,大模型以及配套的算力管理平台、模型和应用开发平台,正在迅速成为新一基础设施。
3. 大算力是大模型落地的基础条件。为满足企业落地大模型从集群创建、开发实验,到模型训练、推理的全旅程算力需求,应对超大规模GPU集群高成本、难运营两大挑战,百度智能云升级发布百舸AI异构计算平台4.0,面向万卡、十万卡集群全面升级算力管理能力。
4. 为了满足企业客户对模型调用、模型开发、应用开发的需求,百度智能云发布千帆大模型平台3.0。
5. 随着大模型产业落地逐渐走向深水区,AI原生应用也将迎来爆发式增长,为了满足企业直接选购成熟AI应用的需求,百度智能云面向数字人、智能客服、代码提效三大领域,升级了三大AI原生应用产品。
阅读原文

走进交互型多模态大模型的世界

文章概要:

1. 交互型多模态大模型正逐渐成为人工智能领域的焦点,它能支持多种模态的任意组合输入输出,以实时的、“类人”的理解和反馈与人们进行无缝
2. OpenAI的GPT-4o是目前最具代表性的交互型多模态大模型,其核心在于极强的多模态理解与生成能力,具备原生多模态、快速响应、情感表达、等突出特点。
3. 原生多模态是指GPT-4o能够跨文本、视频和音频等模态进行端到端训练,所有输入和输出都同一神经网络处理。
4. 快速响应是GPT-4o的另一大优势,它能做到极低,响应速度比肩人类,且可以做到对话随时。
5. 情感表达能力是GPT-4o的重要特点之一,的有“人味”,情绪饱满,会带来极强的交互沉浸感,是增强用户粘性的关键。
6. 记忆能力也是GPT-4o的优势所在,它能回忆并联系“看”到的信息做出回答,而不是仅仅依靠当前输入。
7. 评估交互型多模态大模型的性能需要综合考虑多个方面,包括多模态理解能力、响应速度、情感表达能力、记忆能力、语言生成能力、应用场景表现和性价比等。
8. 目前,许多公司都在投入资源,研究和开发交互型多模态大模型,包括OpenAI、谷歌、Meta、商汤和智谱等。
阅读原文

开源最强AI大模型又来?我会出手(整合包)

文章概要:

1. 文章介绍了AI大模型的发展路径,包括闭源和开源,其中开源的Llama系列大模型受到关注
2. Meta发布了开源最强Llama-3.1大模型,性能卓越,多语言支持,评测结果显示其在各项指标上接近GPT-4o
3. 文章提供了免费整合包,让用户可以在本地轻松体验Llama-3.1
4. 文章展望了Llama 3.1在未来AI领域的应用前景
阅读原文

要让AI伺候人,而不是人伺候AI

文章概要:

1. 大模型和AI硬件的高度分散,使得AI在生活场景中便利性不足,成为一次性玩具。
2 星纪魅族希望成为“AI孤岛”的破局者,通过打造跨端的融合体验,AI从“新奇玩具”转变为“生活必需品”。
3. 星纪发布了一系列为AI生活打造的科技新品,并全面阐释了其在全球化、AI生态等多方面的战略布局。
4. 星纪魅族的AI生态以Flyme AIOS系统为基础,打通旗下多个智能终端,一个“全场景、沉浸式互联”的AI生态系统
5. 星纪魅族将AI技术引入汽车驾驶、娱乐系统等场景中,带来更加智能化的体验>6. 星纪魅族的AI生态尚未达到科幻电影中无所智能助理,但已迈出了坚实的第一步。
7. 星纪魅族宣布“All in AI”,成为第一批全面拥抱AI技术的硬件公司。
8. 星纪魅族以AI的最新范式,重构Flyme系统,推出了FLyme OS的升级版——Flyme AIOS系统。
9. 星纪魅族打造串联人、车、端的AI,背后有深化汽车产业的智能化升级改造、构建全球化竞争力和AI领域弯道超车的机会等几个层面的考虑。
阅读原文

近100场大模型比赛,拆解大模型发展热点

文章概要:

1. 本文总结了近100场大模型比赛,探讨了大模型技术在各个领域的应用和竞赛情况,包括逻辑推理、安全问题、行业应用、硬件落地、人机区分以及多模态大模型等,为大模型的研究和应用提供了丰富的索引和视角。
阅读原文

从0到1搭建本地大模型,最简单的方法!

文章概要:

1. 介绍了Ollama,一款能在本地运行各种大模型的神器,适配多种操作系统,安装简单,运行时需要根据硬件配置选择合适的模型。
2. Open WebUI可以给用户带来更现代化的安装Docker,然后执行Open WebUI的安装命令。
3. Open WebUIRAG能力,可以让大模型网页和文档内容,提升工作效率和效果。
4. 借助Ollama+OpenAI大模型能力加倍放大。
阅读原文

百度沈抖:大模型Scaling Law持续有效,未来十万卡集群会很多

文章概要:

1. 9月25日,2024百度云智大会召开,百度集团执行副总裁、百度智能云事业群总裁沈抖发布智能云的全栈AI技术的最新进展,包括升级百舸AI异构计算平台4.0、千帆大模型平台3.0两大AI,以及升级代码助手、智能客服、数字人三大AI原生应用产品。
2. 沈指出大模型的Scaling Law将在一段时间内持续有效,很快就会有更多的十万卡集群出现,而百度智能云通过升级百舸平台为此做好了准备。
3. 百度智能云升级发布百舸AI异构计算平台4.0面向万卡、十万卡集群全面升级算力管理能力,在集群创建、开发实验、训练、推理等阶段的优化。
4. 百度智能云发布千帆大模型平台3.0,满足企业客户对模型调用、模型开发、应用开发的需求,包括扩大模型种类、降低模型调用成本、提供完善的工具链等。
5. 百度智能云面向数字人、智能客服、代码提效三大领域,了AI原生应用产品,包括客悦、曦灵数字人4.0、文心快码。
阅读原文

智能时代的跨越之路:大模型能力提升与AI未来

文章概要:

1. 随着OpenAI新一代人工智能大模型o1的推出,科学家的脑波兴奋点变得异常活跃。o1是猎户座的缩写,寓意深远,它具备复杂推理能力,但推理时间较长、使用成本更高,并非GPT-4o的替代品,两者将并存。
2. 在大模型的训练过程中,传统的路径是通过增加模型的参数量和数据量来提升模型的性能,但这种方法非常暴力,带来巨大的能源消耗和成本问题。随着OpenAI的o1模型的推出,我们看到另一种新的训练方式——通过增加学习时间和推理时间来提升模型的能力。
3. 深度学习是现代人工智能的基石,也是通往AGI的必由之路。它通过模拟人脑的神经网络结构,使得机器能够从数据中自动学习和提取特征,完成复杂的任务。随着深度学习技术的不断进步,大模型的能力才能得以不断提升。
4. 算力是推动大模型发展的核心动力。随着模型规模的增大和训练复杂度的提高,对算力的需求也在不断增长。为了支持AI的发展,需要建设足够的基础设施,包括数据中心、能源容量和传输、半导体制造等。
5. 在人工智能的世界里,大模型与小模型是两种截然不同的存在。大模型通常指的是参数众多、结构复杂、训练数据庞大的模型,它们在处理复杂任务、进行深度学习和理解时表现出色。而小模型则以其轻量级、快速响应、易于部署的特点,在多种应用场景中展现出独特的优势。
6. 大模型正以其独特的魅力和力量,逐渐渗透到千行百业的每一个角落。它们不仅替代了众多脑力劳动,释放了人类的创新潜力,还催生了巨大的经济价值,推动了各行各业的智能化转型。
7. 随着大模型技术的不断发展和应用,一些头部公司凭借其技术优势和资源积累,正在形成显著的虹吸效应,创造出更大的经济价值。
8. 9月23日,中国移动以“AI领航,智造未来”为主题,发布了“中国移动九天·工业大模型”应用。中国移动九天工业大模型的发布,标志着大模型技术在的深度融合和应用,为各行各业的数字化转型提供了强有力的支持。
阅读原文

软牛“齐天”大模型-人脸融合算法成功通过中央网信办备案

文章概要:

1. 软牛“齐天”大模型-人脸融合算法成功通过中央网信办备案
2. 该算法基于深度学习技术,最新算法架构,支持多种强大功能
3. 软牛使用自采和开源的人脸数据集进行算法训练,总计图片数量超过百万张
4 该算法应用潜力广泛,包括娱乐产业、互动营销和隐私保护等领域
5. 软牛已将该算法成功集成到多款海外产品中,并计划在2024年10月推出国内首款AI生成式产品——幻脸AI
阅读原文

火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」

文章概要:

1. 9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。
2. 豆包视频生成大模型可以根据文字和图片的输入,生成相应的视频,强调其在实际应用中、各种生活和商业场景所需的三个核心功能点。
3. 火山引擎开始从「卷价格」到「卷性能」的转变,将成为其下一阶段的战略重点。
阅读原文

知乎高赞:从0到1做大语言模型Pretrain的经验

文章概要:

1. 知乎高赞文章分享了从零到一进行pretrain工作的经验,包括背景、数据、训练、评估和总结等方面。作者强调了数据清洗和去重的重要性,以及在不同阶段需要注意的问题。同时,文章还介绍了一些实用的技巧和工具,如数据分类器、minhash代码等。最后,作者分享了自己在pretrain过程中的一些经验和教训。
2. 文章指出,pretrain模型是动态加载数据的,因此需要保证数据处理进程始终有最新的数据可用。此外,数据处理进程还需要标记清楚每的document数据被使用了多少次,以便后续降低它再被选中的概率。每个数据块不要太大,以B为单位,正好是1B、2B、4B等。每个数据块在训练代码中,自然会对应着一个save_checkpoint的操作,原因也是为了便于训练回退。
3. 文章介绍了pretrain阶段的一些技巧和注意事项,包括扩词表、模型结构、模型参数、训练框架、训练技巧和训练流程等。文章强调了在pretrain阶段要培养模型切换topic的能力,以及在训练过程中要注意数据的质量和分布。
4. 文章介绍了pretrain阶段的评估方法,包括PPL、Benchmark和概率探针等。文章强调了在评估过程中要灵活善变,找到自己最喜欢的评估方式,并且重点观察指标的变化趋势,而不是指标的绝对大小。
阅读原文

《2024大模型十大趋势》(可下载)

文章概要:

1.2024年世界人工智能大会 • 腾讯上,腾讯研究院联合上海交通大学、腾讯优图实验室、腾讯云智能发布了《2024 大模型十大趋势——走进「机器外脑」时代》报告报告强调了大模型技术在分析、生成、情绪智能等实质性飞跃,预示着外脑,提供智力外挂。
2. 报告中提到了大模型技术的十大趋势,算力底座、推理分析、创意生成、情绪感知、智能制造、游戏环境、革命、具身开源共享和人机对齐。
3.了帮助领域的管理实践者解决发展的需求与问题,同时结合巴黎高科路桥大学商学院在工业工程上建树和坚实基础,智能制造方向的工商管理博士培养项目则应运而生,简称ENPC-DBA(IMM)。
阅读原文

卓然学“术” | AI大模型全景图:带你了解当下主流模型与规范详解

文章概要:

1. 卓然学“术”是浙江大学研究生会学术部品牌栏目“学知天下”的三个子系列之一,本期将介绍市面上主流的AI大模型及使用规范。br>2. AI大模型是当代技术革新的前沿,通过海量数据训练,具备强大的语言理解与生成能力,应用领域广泛而深入。
介绍了ChatGPT、Claude、文心一言、kimi、通义等市面上主流的AI大。
4. 使用AI大模型时应注意将其视为辅助工具,严禁使用AI生成虚假或伪造的研究数据,所有AI生成的内容都需要经过严格的审核,注意避免侵犯他人的知识产权,注意伦理问题,不应过度依赖AI。
阅读原文

一日连发两款视频大模型,火山引擎杀疯了!

文章概要:

1. 9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,并首次对外发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款AI大模型,并公布了多项AI大模型的全新升级。
2. 火山引擎展示了AI Bot,这是一个全新的AI应用开发平台,利用AI大模型的强大理解能力,帮助用户开发专属于自己的AI应用。
3. 火山引擎的视频生成模型更关注用户在实际使用时的创作流程和创作效果,而不仅仅是简单地生成画面和动作。
4. 火山引擎还攻克了视频主体在运动时,经常会出现的服装、头饰、光影、风格突变问题。
5. 火山引擎还解决了多动作指令互动、人物中途插入等痛点。
6. 火山引擎还引入了深度优化的Transformer结构,大幅度提升了豆包视频生成模型的泛化能力。
7. 火山引擎同时还宣布了豆包通用模型、音乐模型等多个模型的全面升级。
8. 火山引擎还在现场展示了全新的数字人生成应用,仅需数分钟即可完成数字人生成,并在数秒内进行音色克隆。
9. 火山引擎一直在升级大模型的承载能力。目前业内多数大模型最高支持300K甚至100K的TPM,而豆包大模型的默认并发流量标准已经提高到800K TPM,是行业普遍标准的2-8倍以上,并且允许用户灵活扩容。
10. 火山引擎CEO谭待提到,火山引擎是业内最早降低算力成本的大模型团队之一,截至目前豆包大模型的算力定价已经低于行业99%,目前定价仅为0.0008元/千Tokens,引领算力成本进入「厘」时代。
阅读原文

国内外AI大模型密集推新迭代,视频赛道再掀热潮

文章概要:

1. 9月24日,字节的视频生成大模型惊艳亮相,该模型生成视频可以实现对复杂指令的理解和遵循,平滑实现镜头的变焦、环绕、缩放,保持多镜头切换的一致性以及多尺寸、多风格生成。
2. 近段时间以来,国内外AI大模型厂商密集推出迭代产品。在当前的视频生成技术竞赛中,互联网大厂很可能将扮演引领者的角色
3. 近几年,随着人工智能技术的飞速发展,内容行业带来了前所未有的变革。然而,技术的革命性进展同时也伴随着多重法律挑战,涉及数据安全、隐私保护、知识产权等多个方面。面对生成式人工智能技术日新月异的进展,亟需相关立法予以回应。
阅读原文

一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

文章概要:

1. AI大模型开发系统Colossal-AI的混合精度训练支持BF16(O2)+FP8(O1)的混合精度训练方案,仅需一行代码,即可对主流LLM模型能够获得平均30%的加速效果,降低相应大模型开发成本,并保证训练收敛性
2. 目前FP8混合精度训练训练结果的就是scaling方案,常见的方案有延迟scaling和实时scaling两种
3. Colossal-AI采用了对训练收敛性影响较小的实时scaling方案,同时实现有着不输其他延迟scaling实现的性能
4. Colossal-AI在主流LLM上进行了实际训练的测试,在H100单卡上进行了测试,在H800多卡并行训练场景下也进行了测试> 5. 根据英伟达的报告和测试经验,对FP8混合精度训练性能调优有一些初步的认识:尽量少使用张量并行,用流水线并行代替张量并行;模型hidden size越大,加速效果越明显;矩阵乘法占比高的模型加速效果大
6. Colossal-AI对FP8的支持较为广泛,各种并行方式都能和FP8混合精度训练兼容,时,仅需在初始化plugin时FP8即可
阅读原文

百度智能云晒大模型落地成绩单:5个第一!

文章概要:

1. 百度智能云在大模型应用落地元年取得多项第一的成绩单,包括中国大模型平台市场份额、产品布局、产业落地规模、中标数量/金额/行业覆盖数/央国企项目数等。
2. 百度云智大会带来5款AI产品升级,包括底层基础设施百舸4.0、中间模型和开发工具层千帆大模型平台3.0、上层开箱即用AI应用客悦、曦灵、文心快码。
3. 百度智能云的百舸构建的异构算力体系,可以为行业提供更多元的算力选择。
4. 百度智能云已在政务/智慧城市、交通、能源、制造、汽车、金融、泛科技、教育领域探索大模型应用落地场景。
5. 百度智能云拿下多个行业第一,凭借的是AI是百度的基因与内核、多年的AI落地经验和自身应用构建经验、百舸构建的异构算力体系。
阅读原文

国内外AI大模型对比,国产AI的优势是什么?

文章概要:

1. AI大模型成为推动各行业技术进步的重要力量,本文将介绍几款目前在国内外广泛应用的AI模型,并讨论它们的优势及其侧重点业务领域。
2 国外主流AI大模型有OpenAI系列、Gemini、LLaMA模型,其中OpenAI系列的GPT-4能够处理复杂的语言任务,Gemini的优势在于其强大的多模态处理能力、与Google生态系统的深度集成,LLaMA模型作为开源模型,吸引了广泛的开发者和学术界关注。
3. 国内主流AI大模型有文心大模型、通义千问大模型、Kimi大模型文心大模型的核心优势在于对中文环境和本土数据的深度理解,通义千问大模型具备强大的自然语言处理能力,Kimi大模型以轻量化和多任务处理为特点。
4. 随着科技的不断进步,AI大模型的研发将会持续迭代优化,未来可能会涌现出更多功能更强大、应用更广泛模型。
阅读原文

BUFT名师讲堂 专业领航(二) | 认识智能大模型技术进展与应用

文章概要:

1. 近日,国际商学院成功举办了主题为“认知大模型技术进展与应用”的专题讲座,吸引了众多师生的积极参与。讲座由国际商学院院长刘杨主持,主讲人为北京讯飞研究院执行院长、讯飞AI研究院副院长伍大勇教授。
2. 伍教授首先概述了认知大模型的概念、发展历程,并深入剖析了其技术架构与运作机制。
3. 伍教授还分享了多个成功案例,包括在教育领域利用大模型提供个性化学习建议,以及在医疗领域通过数据分析辅助疾病诊断等
4. 在互动环节,同学们积极提问,伍教授耐心解答,并提供了宝贵的建议。本次讲座不仅加深了师生们对认知大模型技术的理解,还激发了大家对人工智能领域研究的热情和信心。
阅读原文

【万字纪要】具身智能,为何当下似乎要接棒生成式AI(大模型)

文章概要:

1. 文章从什么是生成式AI、AI动态事件、具身智能、个体在AI趋势下的建设性在哪里四个方面进行了阐述。
2. 生成式AI是模仿自然的法则,而非人的法则,它的能力取决于定义。
3. 大模型不是数学模型,也不是数学物理模型,而是一个深度计算、对抗计算,解决输入输出的转换关系,它完成的是一次又一次转换,而这个转换里的模型是跟着数据的变化而变化的。
4. 目前AI的框架由基础AI认知框架、认知生成、建构生成三大块组成。
5. 生成式AI不够完备,发展到一个高度,后面需要调整方向,具身智能会成为新风口。
6. 多数人觉得对大模型等AI的理解很累、很晦涩,是因为不知道计算机是什么,就不知道AI会长成什么。
7. AI趋势下,人不被替代的方法有回到本体、深挖行业的纵深度、有些行业很容易被取代,该合并合并,传承上千年、几百年的不容易被合并、在AI面前,创作新的IP很容易,纯粹的IP容易被淡化掉,除非IP跟物理位置绑定,不可分割时,AI加强IP才容易保护住。
阅读原文

大模型热潮,会是一场泡沫吗?

文章概要:

1. 牛顿曾因难抵股票市场的狂热情绪而遭受巨大损失。
2. 自ChatGPT推出以来,人工智能的快速发展伴随着无尽的争论。
3. 大模型狂潮在冷却,以OpenAI为例,其文生视频模型Sora仍处于研究阶段。
4. 生成式AI每一次的产品迭代,其资本增密的速度,已经跟不上技术迭代的脚步。
5. 人工智能浪潮的三起两落,从1956年的达特茅斯会议算起,到2016年以来的云计算和算力爆发,一个甲子的两端,分别代表了人工智能第一次浪潮的起点,和第三次浪潮的涌现。
6. 大模型的问题,包括幻觉问题、训练数据不足和版权问题。
7. 正视大模型的长期价值,大模型并非是一个资金进入两三年,便能“万丈高楼平地起”的行业。
阅读原文

【渤士说 星投顾】AI大模型行业介绍

文章概要:

1. 大模型商业模式:大模型收费模式有API、、广告、定制化四种。B端变现模式清晰,C端大多数产品免费。OpenAI确立了ChatGPT订阅、API调用、战略合作三种营收方式。
2. 产业链分析:大技术架构分为基础层、技术层、能力层、应用层和终端层。基础层涉及硬件和三大核心要素,技术层主要涉及模型构建,层、应用层和终端层则提供各种产品和服务。
3. AI大模型应用落地方式:目前比较主流的应用包括聊天机器人、编程工具和生产力工具。
阅读原文

突发,AI马力欧图片遭大规模下架;OpenAI奥特曼:超级AI或在几千天内实现;字节发布豆包视频生成大模型丨AI情报局

文章概要:

1. OpenAI CEO奥特曼谈时代:我们可能在“几千天内”拥有超级AI
2. 字节发布豆包视频生成大模型
3. 国产AI芯片公司破产清算,公开拍卖
4. 第五届中国人工智能大赛正式启动
5. 国产AI出海应用超百款,AI助推IT领域投资金额或达440亿元
6. 中石油勘探开发研究院申请“PetroAI”商标
7. 腾讯最新机器人“小五”亮相,瞄准人居环境
8. 阿里巴巴与英伟达宣布合作,致力于开发先进的自动驾驶解决方案
9. 腾讯音乐与东风汽车深化合作,开启座舱AI音乐新时代
10. 出门问问携“AI数字员工”亮相荷兰国际广播大会
11. 蜂巢科技与星创视界达成战略合作,将于年底推出首款联名AI音频眼镜
12. 百度启动2025届校招:约80%为AI相关技术岗位
13. 文远知行在台州成立智能科技公司
14. 长城汽车与华为在营销数智化领域达成全面合作
15. 通用人工智能初创公司Anthropic PBC正在寻求以高达400亿美元的估值筹集新资金
16. 任天堂出手,AI马力欧图片遭大规模下架
17. OpenAI启动OpenAI Academy计划,为开发者提供100万美元API信用额度
18. OpenAI在社媒平台X的新闻账号遭入侵,发布虚假加密货币信息
19. OpenAI重磅发布多语言AI数据集,解决语言鸿沟问题
20. 分析师称微软在人工智能领域领先优势已经缩小
21. Counterpoint预测2030年AI嵌入式蜂窝模块将占物联网模块出货量的25%
22. Meta计划推出新的聊天机器人音频版本
23. 开源数据编排平台Kestra融资800万美元,用于北美扩张
24. 微软IVAS系统正在整合三方战斗平台,为士兵提供“第六感”
25. 全球首个AI自动水下潜航器开始测试,海上风电场检查时间可缩短50%
阅读原文