今日AI-大模型-2024年10月25日

发现全网最新的AI内容

字节大模型内部赛马,下一个爆款 or 烧钱深坑?

文章概要:

1. 2024年10月25日,字节跳动发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型正式宣告进军AI视频生成赛道。
2. 字节跳动在音乐生成赛道上,推出了Seed-Music音乐生成模型,并于今年7月推出了发布了全新版本的海绵音乐APP,主打“一键创作你的AI音乐”。
3. 字节跳动的AI产品在这两条赛道上的发展并不是独立,而是相互竞争。5. 字节跳动在多个领域都有业务布局,在资源有限的情况下,公司需要在不同业务之间进行资源分配和权衡。
阅读原文

Orthrus RNA大模型:Mamba引领生物自监督学习超越Transformer

文章概要:

1. Orthrus RNA大模型采用对比学习框架,通过最大化相关RNA转录本之间的嵌入相似性,最小化不相关转录本之间的相似性来构建结构化的表示空间。
2. 研究团队构建了一个庞大的对比学习数据集,包含来自10个物种的选择性剪接转录本和来自Zoonomia项目400多个哺乳动物物种的直系同源转录本。
3. Orthrus采用了M编码器作为主干网络,具有可变间隔学习能力、上下文过滤能力和序列长度线性内存扩展的优势。
4. 模型在多个RNA性质预测任务上的线性探测结果显示,Orthrus显著优于其他自监督方法。
5. 模型在仅使用0.5%训练数据的情况下,仍然能达到完整数据集73%的性能,显示了模型强大的少样本学习能力。
6. Orthrus的成功开发为RNA研究带来了多方面突破,包括数据效率提升、功能解析能力和泛化能力。
7. 研究团队指出,Orthrus仍有改进空间,包括探索将对比学习与掩码语言建模目标相结合的可能性、扩大预训练数据规模和模型参数量、研究模型在更多RNA相关任务中的应用。
阅读原文

AI蛋白质突破!微软ProtNote模型:多模态学习实现蛋白质功能预测的新范式

文章概要:

1. 微软研究院提出ProtNote模型,用于蛋白质功能预测。
2. ProtNote是多模态深度学习模型,利用功能注释的自由文本,支持监督学习和零样本学习。
3. ProtNote核心架构包含序列编码器、文本编码器、投影层和预测层,训练中采用焦点损失函数和标签频率的序列采样权重。
4. 在监督学习任务中,ProtNote与ProteInfer模型对比,mAP Macro指标略低,mAP Micro指标基本持平。
5. ProtNote嵌入空间特性分析表明,正样本蛋白质-功能对呈现聚类效应,不同GO本体类别的嵌入具有明显区分性,序列相似性与功能相似性存在显著相关性。
6. ProtNote在零样本学习任务中表现优异,在新GO注释预测、叶节点预测和EC编号预测中优于基线方法。
7. ProtNote具有首创性、灵活性和鲁棒性,为蛋白质功能预测开辟新范式,展示多模态学习在生物信息学领域的潜力。
8. 未来研究方向包括扩展训练文本来源、探索对比学习方法、开发更的样本加权策略和研究专门用于生物医学领域的句子变换器。
阅读原文

6亿用户涌入!生成式AI大模型如何改变中国科技版图?

文章概要:

1. 生成式AI大快速发展,已吸引超过6,推动中国科技版图加速扩展
2. 生成式AI大模型为数字经济升级注入强劲动力,了各行业的智能化水平
3. 生成式AI的崛起带动了内容创作的革命,帮助创作者更轻松捕捉热点、提升内容创意
4. 生成式AI的普及降低了技术门槛,让中小企业实现业务智能化转型,节省人工成本
5.式AI大模型传统教育模式实现因材施教,提高教学针对性,激发学生学习兴趣
6.式AI大模型助力语言和文化增强国际竞争力,推动中国文化走向世界
7. 生成式AI大将向多元化跨和跨方向加速发展,成为经济和社会发展强大助推器
阅读原文

【产业资讯】希姆计算:中国首个基于RISC-V算力的行业大模型生态系统问世

文章概要:

1. 希姆计算是一家致力于研发AI领域专用架构处理器的公司,推出了九州大模型、玄数数据治理平台以及擎天智能体开发平台,为政企客户的数智化转型赋能。>2. 希姆计算基于自研AI计算矩阵扩展指令集了920芯片、推理卡以及配套软件,为智算中心量身定制了希姆智算云平台,提供了落地大创新
3. 希姆计算在创业时就瞄准了基于RISC-V研发AI领域专用架构处理器的切入点,突破了多项技术难关,自主研发并在全球范围内率先开源了AI矩阵扩展指令集,完成了基于RISC-V指令集的标量、向量、张量的一体化指令集架构。
4. 希姆计算以算力即服务为交付理念,通过成熟的软件生态,简化模型部署的链路,降低客户开发AI应用的复杂度,对信创/非信创的软硬件生态均有良好的和支持。
5. 希姆计算充分考虑了国内外的模型生态和落地场景,建设了高度适配自研硬件的模型仓库STC-ModelZoo,为客户提供开箱即用的各类SOTA模型。
阅读原文

讯飞星火大模型何以领跑央国企市场?

文章概要:

1. 抱歉,暂时无法获取文章内容。
2. 你可以更换文章链接后继续提问。
阅读原文

一文搞懂大模型最容易混淆的概念 | 量化、剪枝与蒸馏

文章概要:

1. 大模型的量化剪枝蒸馏三种常见的压缩技术,各自有不同的和实现方法,但都旨在减少模型的计算资源和存储需求
2 量化是模型中的浮点数和值转换为精度的整数表示。实现方法有权重量化激活量化、感知训练(QAT)训练后量化(Q
. 剪是通过删除模型中不重要的权重、神经元层来模型的数量和量。剪枝可以分为剪枝结构化剪枝。
4. 大模型蒸馏是用于模型压缩的技术其核心思想是将一个大型模型(称为教师模型)的知识迁移到一个较小且简单模型(称为学生模型中。
5. 大模型蒸馏的步骤包括训练教师模型、软标签、训练学生、与调整。br>6. 知识蒸馏的优势包括降低计算成本、减少存储需求、提高部署效率、泛化能力
7. 知识在视觉语言领域取得显著成功。
阅读原文

构建AI大模型应用技术栈有哪些?

文章概要:

1. 文章探讨了AI大模型的核心技术栈构建,包括大模型管理、微调的数据仓库、提示词工程管理、湖仓一体等组件的作用。
2. 详细介绍了提示词工程、RGA检索增强生成、微调、AI agent升级业务流程等关键步骤的作用。
3. 分析了基于AI大模型应用和普通应用的区别,包括软件架构、思维方式、协作方式和特征等方面。
阅读原文

讯飞星火4.0 Turbo发布,首发11项技术及应用,引领大模型规模化落地

文章概要:

1. 10月24日,第七届世界声博会暨22科大讯飞全球1024开发者节开幕,科大董事长刘庆峰发布星火.0 Turbo
2. 讯飞星火4.0 Turbo在14项主流测试集中的9项测试实现超越,效率相对提升50%
3. 科大讯飞定义多模AIUI标准,发布超拟人数字人,多模态的交互从语音交互拓展到音视频流的实时多模交互
4. 科大讯飞发布星火多语言大模型,除中英文外,可支持俄、日、阿、法西、葡、德等8个语种
5. 科大讯飞发布汽车端侧星火大模型,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售
6. 科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了的产品应用
7. 科大讯飞发布全谱系全模态医学影像大模型开放合作计划,旨在汇聚全球最的影像AI科研团队,共同推进医学影像大模型的发展
8. 科大讯飞发布搭载政务大模型的“星火智办一体机”,方便群众从“问着办”到“领着办”
9. 科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景> 10. 科大讯飞联合30所科研院校、44家企业与机构顶尖共创赛题,最终评选出十佳团队
11. 科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动
阅读原文

大模型落地,要追求极致的务实主义

文章概要:

1. 10月23日Anthropic推出升级版Claude 3 Sonnet模型,在各项性能指标上取得显著提升,并在多项测评中超过OpenAI的GPT-4o、谷歌的Gem 1.5 Pro,自家的Claude 3 Opus。
2. 目前,升级版ude 3. Sonnet已经在Amazon Bedrock平台可用,与此同时,新模型Cla 3.5 Haiku发布,预计将于本月晚些时候在平台上推出
3. Amazon Bedrock已经成为过去十年中增长最快的云科技服务之一。
4. 没有一个大模型适用于所有场景,需要模型来解决其在实际业务中的。br>5. Amazon Bedrock成为客户使用基础模型构建和生成式AI应用程序最简单方法,降低了所有开发者的使用门槛。
6. 桥水基金构建全新投资逻辑生成系统人工智能投资助手(A),通过Amazon Bedrock中不同模型的分析特性灵活,以适应从基础的推理任务到阶的市场分析等不同场景
7. AI的AI语音客服可以模仿人工客服人员,有助于减少用户等待时间并提高用户满意度保留率,并针对不同企业客户的行业属性和场景需求进行个性化定制。9. Goodnotes将生成式AI服务无缝集成进现有,手写笔记识别、语言与互动、文档分析等。
阅读原文

讯飞星火落地六大车企!端侧大模型年内可用,打响规模落地战

文章概要:

1 大模型上车已开始从“尝鲜”到转变,科大讯飞发布多语言大模型,并展示了多语言大模型在汽车中的应用空间,紧跟中国汽车步伐。
2 科大讯飞发布端侧模型,和云端模型相结合,进一步丰富用户交互体验。
4. 科大讯飞推出多语言大模型新增8种语言,助力中国汽车出海。> 5. 科大讯飞发布端侧大模型,将于今年Q4,率先、广汽的车型中陆续搭载上市开售。
6 科大讯飞首发语音视觉虚拟人交互“三合一”,在多模态视觉能力的加持,超拟人数字带来了更有的人机交互体验,也给未来上车开辟了新的想象空间。
7. 科大着手两方面来构建丰富的智能体一方面自研智能体,另一方面携手生态合作伙伴,开发各种易用好玩有价值的智能体。
8. 202年上半年,科大讯飞先后与中国一汽、睿蓝、中汽数据等企业达成战略合作
9. 目前,讯飞星火大模型落地车企量产车,汽车行业率先开启大模型落地汽车的。
阅读原文

助力能源焕新,羚羊能源大模型2.0发布实录

文章概要:

1. 10月24日,在第七届博会暨22科大讯飞全球124开发者节期间,羚羊举办能源论坛,羚羊总裁徐甲甲发布的羚羊模型
2 徐甲甲认为,公司在大模型能源”上的探索,可以有效优化管理,加速新能源研发能源行业的实践将成为发展的新增长极,AI能源的赋能
3. 6月27日,以讯飞星火大模型的通用能力为核心技术底座,结合能源行业场景实际需求,专门面向能源领域的能源大1.0发布,风、、、火、核、6大行业场景
本次论坛上,羚羊公司总裁徐甲发布了包括语言大模型、视觉大模型大三大子模型的大模型2.0,其中视觉大模型大能力的是本轮升级重点
.标注数据少、定制训练成本高泛化性能弱等一系列小模型痛点问题,公司打造了具备了低成本定义新功能场景能力自适应迁移、语义视觉理解能力的视觉大模型,广泛应用在能源安全生产监测场景传统机器学习方法样本需求量大、强定制、交付长,难复用等问题
.大模型是基于维度的时序训练大语言模型能更好地理解数据中的复杂模式,预测模型
7. 通过高质量数据集、国产化算力适配和模型训练与精调,羚羊能源大模型0用完善的工具链助力行业大全流程> 8. 基于羚羊大模型,羚羊公司还了模型纳管的AI平台,通过标准推,大小模型统一纳和内置多种CV算法大小模型统一训练及纳管算子库、上百算法及数据标注、模型训练推理的等全栈“开箱即用底座
阅读原文

科大讯飞持续深入大模型国产化“无人区”

文章概要:

1. 大激烈禀赋门槛高,技术、影响存续空间关键,国内大市场崛起消弭的趋势。2 华为与科大讯飞合作为大提供昇腾算力,其和过程,讯飞凭借算法优势与硬件适配和优化,打造国产算力底座br>3. 国产大模型缺乏国产化方案和自主可控的迫切需求,华为和科大讯飞作为自主创新派进入主流视野,讯飞星火能力快速提升,应用场景不断拓展。
4. 行业正处在去泡沫阶段,需要更多具备潜力的选手有能力继续发展br>. 大走向更加务实,通用大模型往往并不,需要越来越多可收敛,讯飞在国内一众大模型公司中脱颖而出数、金额成为央模型首选。
6. 科大讯飞将针对行业痛点和场景,打造行业大模型,和多个行业合作伙伴探索大模型在实体产业中的落地,推动各行各业智能化转型。
阅读原文

用大模型优化大模型预训练数据,节省20倍计算量,实现显著性能提升!

文章概要:

1. 背景介绍:业界实践通常抓取互联网上的海量网页数据,由人类专家设计专门的规则进行数据清洗,但这些规则存在局限性,导致语料质量提升空间有限,制约了模型的进一步突破。<>2. 用语言模型提升语言模型「自己」的数据质量:ProX通过利用语言模型自动生成优化程序,能够对每个数据样本进行个性化处理,提升数据的整体质量。
3. 如何兼顾效率和质量?Program-Every-Example:ProX通过使用较小的语言模型来执行数据优化任务,并且将数据优化的过程转变为调用特定的python函数,对每个都生成特定的函数调用。
4. 如何构造数据优化模型:ProX采用了一种统一的构造思路,无需对特定领域进行额外设计就可以广泛适用。
5. 在广泛数据集上得以验证:ProX在小于1B规模的模型训练中超越了此前多个人工设计的规则过滤方法,并且在多数的标准化测试数据集中稳定达到更高的表现。
6. 未来展望:设计出更灵活的接口,以覆盖多样化的数据优化需求,进一步提升数据质量。将ProX发展到更多专用domain:例如代码领域、多语言语料上,促进领域大的发展。通过进一步减小模型尺寸、和其他加速手段,减小推理代价,使清洗TB级别文档不再遥远。
阅读原文

大模型+数据智能分析应用发展趋势及标准化工作介绍

文章概要:

1. 大模型+数据智能分析应用发展趋势:介绍了人工智能的演进历程,包括图灵测试、机器学习、深度学习等阶段。探讨了大模型落地的关键技术,如提示词工程、微调、检索增强生成等。还提到了数据智能体和数据智能应用新范式,如chat BI、智能问答、智能生成等。最后分析了大模型应用落地面临的问题,如数据治理、实施门槛和软硬件技术能力等。
2. 大模型+数据智能分析应用标准化工作介绍:介绍了中国信通院在数据智能领域的标准化工作,包括《大模型驱动的智能数据分析工具技术要求》、《大模型驱动的智能知识图谱技术要求》、《检索增强生成技术能力要求》、《大模型驱动的智能知识问答系统技术要求》、《数据智能体技术总体要求》等标准。这些标准涵盖了数据准备、模型场景化适配、智能交互应用、知识图谱存储与管理等方面,为大模型在数据智能领域的应用提供了规范和指导。
阅读原文

【技术发展】大模型落地,要追求极致的务实主义

文章概要:

文章强调大追求极致主义
2.自钛媒体> 3 关注公众号可查看更多内容
阅读原文

医疗、通信专家齐聚 研讨医疗健康行业大模型成熟度标准

文章概要:

1. 近日,《医疗健康行业大模型成熟度评估》标准研讨会召开。本次研讨会由中国信通院举办多家医院的多位嘉宾共同参与,医联集团作为模型应用企业参加了本次研讨会。
2. 20230月,中国信息通信研究院与研究所、医联集团联合启动了《大模型成熟度》标准研制工作,目的是推动医疗健康行业大模型规范化标准化,提升模型的质量和应用价值。
3. 《医疗健康模型总体技术要求》医院侧医疗服务、患者侧医疗、智慧医保公共卫生临床科研、健康管理、传统提出了要求。
4.医疗健康行业模型合成服务治理》数据处理模型安全。br>5. 《医疗健康行业模型度评估》包括健康咨询诊断两个领域的大模型。br>6.会议中,信息研究院的专家介绍行业大建设的总体情况、工作及后续计划
7. 目前与诊断相关的测试标准已于CCSA(中国通信协会)立项通过拟定完成,相关单位、机构及和企业参与。医联集团作为《医疗行业模型成熟度评估模型》标准研制工作的联合推动方之一,同时也积极参与推动与诊断相关的大模型成熟度测试标准工作。br>8. 医联集团作为医疗健康行业领军企业一直致力于将人工智能技术应用于医疗健康领域,已经完成了首个AI医生与医生一致性研究实验,联GPT与三甲主治医生一致性达到96%,同时也联合多家三甲医院二级医院、医院进行全球最大的AI临床项目。
阅读原文

黄立平在第二届智能社会治理论坛演讲:建立企业大模型的经验与思考

文章概要:

1. 10月25日,204第二届智能社会在武汉举办,中电光谷总裁黄立平受邀发表题为《建立企业模型的经验思考》的演讲。
2. 黄立指出,中电光非常重视人工智能技术的应用,并希望通过这些技术提升行业效率、重塑产业。<>3 他提到,如果没有来自实践的理论创新,仅靠别人的数据是无法建立起自己的模型的。
4. 黄立平阐述了产业园区的理论创新基础研究的主要方向。
阅读原文

内蒙古数据交易中心第一百七十九期算力产品推介——人工智能大模型实验箱

文章概要:

1. 内蒙古数据交易聚焦权威的数据流通交易登记、市场广泛认可的数据流通交易自动化的数据交易产品撮合的数据流通交易技术、的资源交易服务、全面运营管理功能,打造立足内蒙古、辐射周边、面向全国的市场化数据流通 2 华迈数字推出的人工智能大模型实验箱是国内首款教育大模型综合实验平台,国产软硬件一体化的专属大模型解决方案,即可使用,从底层算力、AI、训练算法、能力、应用成效等全AI能力凡达模型综合实验平台有着基础模型能力赋能学科训练掌握垂直领域的模型,进而覆盖新一代信息技术专业群,建立各学科专业持续生命力的大,科研课题、教学教研、课程培养的智能化
4. 华迈数字的人工智能模型实验箱应用场景包括架构、语言大模型、图文模型、人大模型、大模型、机器人控制大模型、大赋能、法律大
5. 华迈数字的人工智能大模型箱更新频次为年更新支付方式面议
6. 产品供应商为华内蒙古)技术有限公司,联系电话为176148767、155827281、1814826297
阅读原文

在昇腾 910B 上部署轻量级和跨平台大模型 Agent

文章概要:

1. 昇腾910B是中国市场上Nvidia H100的热门替代,华为捐赠了5台裸机服务器支持GOSIM Super Agent黑客马拉松活动,文章将讨论使用昇腾910B的经验,并提供在此硬件上设置和运行LLM的详细教程。
2. 开源LLM的主要应用场景是在异构边缘设备上,WasmEdge Runtime为GPU抽象提供性能,使开发者能够将应用程序编译为Wasm,在所有GPU和NPU上运行。4. 在容器内,可以下载LLM模型文件和LlamaEdge API server的跨平台Wasm二进制文件,并启动API server进行测试。
5. Agent黑客马拉松要求展示LLM如何使用工具并进行函数调用来访问外部资源并执行复杂任务,LlamaEdge支持在昇腾PU上调用与OpenAI兼容的工具。
6. 昇腾910B每秒为8B类LLM生成约15个token,为70B类LLM生成约5个token,与Apple的M3芯片相当,llama.cpp的CANN后端仍有很大优化空间。
阅读原文

讯飞星火大模型何以领跑央国企市场?

文章概要:

1. 10月24日,科大讯飞全球104开发者节,董事长刘庆发布讯飞星火4.0 Turbo,并首发一系列基于讯飞星火底座能力的产品创新应用了大模型来的。
截至2240,科大与头部20多个行业大覆盖300+应用场景。
3 2024三季度,科大讯飞的中标项目达到38个,中标数量领跑国内一众模型厂商。> 4. 科大讯飞领跑央国企市场的包括工具领先和在应用场景中已经形成了可以相互借鉴和复用的效应。
日前,科大发布第三季度业绩,在加大星火大模型研发投入和布局的同时,了季度利润转正。
6. 过去一年,科大央国企市场取得了一定成绩,打造出了数个具有行业标杆意义的垂直大模型项目。
7. 星火军团副总裁张致江介绍根据代码生成HumanEval测试的对比,星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o差距微弱,在C++能力上超过GPT-4o。
8. 作为基于全国产算力平台“星一号”上训练出的全民开放大模型,讯飞星火具备自主可控的高安全性,这也让讯飞推进大模型在央国企等客户群体落户中占据了先发优势 9. 2024年前三个季度,6家知名的通用大模型厂商中,科大讯飞中标项目数量和项目披露金额已经攀升至第一名。
10. 在今年的科大024开发者节上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合的超大规模智算平台“飞星”正式启动。
阅读原文

AI、工业大模型——听数字化如何赋能企业

文章概要:

1. 10月2日上午,广州“三会”1月会员日活动——数字化技术应用培训在广州浙江大厦举办共有各单位相关人员近120人参加活动。
佛山艾思未来公司董事长涂文军作“Ai赋能企业”主题重点介绍了AI技术在场景下应用案例,探讨了AI解决行业痛点,企业降低成本提高效率
3. 广州云科技副总裁陈天博士作“工业模型的应用与探索”主题,国家政策背景、行业背景、市场背景分析,说明工业大正当时,还结合实际案例,详细介绍了工业大模型在设计、研发、生产、管理、运营等多个环节的。
4. 在提问环节,参会代表纷纷就数字化相关方面提问,主讲嘉宾逐一进行详细解答
阅读原文

首都在线AIGC大模型场景应用与产业生态融合论坛圆满收官!

文章概要:

1 近日,AIG模型应用与产业融合论坛在深圳市顺利举办。此次论坛由深圳市人工智能产业协会主办,首都在线科技股份有限公司协办。
2. 首都在线解决方案总经理刘峰并进行演讲分享首都生成式AI领域与实践。
.谱解决方案高旭旭以《智模型实践及思考》为主题,分享谱大模型的最新进展在实际场景中的落地应用5. 清程极智AIGC技术负责人刘景轩以《国产高性能AIGC算力系统为主题进行分享
6. 论坛最后,深圳市人工智能产业协会会长范丛明了以《大应用落地》为主题的圆桌会谈。
阅读原文

为钢铁注入人工智能新动力!河钢全国首发垂直领域钢铁行业大模型

文章概要:

1 1月4日,河钢研发的垂直领域钢铁行业人工智能大模型——“威赛大模型”,在20国际经济会上发布
2. 该模型是全国的垂直领域钢铁大模型,河北省首家通过国家生成人工智能备案的模型
3威赛博钢铁大模型”河钢场景优势,通过强大的语言理解能力、高效的算法和模型,能够准确理解生成和处理钢铁行业海量信息与用户的互动为钢铁行业提供高效的信息、数据分析和决策支持等全方位服务
4. 能够实现算力、、算法深度融合,适用于企业研发设计、中试验证生产制造、服务、运营管理等应用场景
5. 凭借在自然语言处理(NLP)计算机(CV)的表现钢铁生产过程的流程实现辅助技术人员进行研发提出高炉炼铁炉温控制建议,转炉炼钢工艺过程钢材表面缺陷,提供设备状态运维建议等丰富功能全栈自主可控的人工智能模型技术体系,提升钢铁企业运营效率和市场竞争力的同时,也将推动整个行业化、、绿色化发展
阅读原文

用扣子模板,走AI捷径,这个双11,大模型要发威了?

文章概要:

1. 有人靠AI把抖音的爆款短视频转换成小红书爆款文案并变现,还有企业用AI做智能客服提高转化率。
2. 智能体是在基础大模型上进一步开发,通过添加插件做成的有专属能力的机器人程序。
3. 扣子是字节旗下应用开发平台,普通人可以在一到七天想要的智能体。
4. 扣子在大模型的基础上,通过插件来解决企业需求,还可以接入搜索插件,帮助专业人士做一个新闻信息采集器。
5. 在扣子平台上开发智能体,还可以调用豆包、通义、kimi等国内最强大模型,大大节约研发和人力成本。
6. 扣子还有一个文字转音频的模板,可以把图文一件生成对话的音频。<7. 扣子的内容创作助手模板,可以快速生成基础内容,自动做好,自动发布到公众号的草稿箱。
8. 卖点提炼模板,对商家非常有用,能避免商家自嗨式的卖点,真真切切的从用户痛点、痒点出发。
9. 智能体可以满足非常细致的需求,跟个人创作相比,智能体的创作,内容结构更全面,角度更丰富,使用熟练以后,能大幅度提高效率。
10. 扣子开发者已经不少进行了变现或者正在做变现探索,扣子官方还有一个模板商店,提供了上万个模板,满足用户的多种创作和经营需要。
阅读原文

【他山之石】NeurIPS 2024|解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉

文章概要:

1. 本文探讨了大模型终身知识编辑问题,提出了一种基于双重记忆机制的大模型知识编辑方法WISE,旨在持续更新大语言模型的世界知识和纠正其幻觉性输出。
2. 本文介绍了WISE方法,包括背景与挑战、理论基础、WISE方法介绍、实验结果、实验分析、总结与展望。
3. 本文通过实验证明WISE在多个任务上表现出色,尤其是在LLaMA、GPT等架构中,WISE大幅超越现有编辑方法。
4. 本文总结了大模型知识编辑技术的突破,不仅能够促进大模型对新知识和新技能的永久习得,还可以实现神经与符号知识之间的高效转换与处理。
阅读原文

同程旅行大模型项目荣获2024年“数据要素X”大赛全国总决赛技术创新奖

文章概要:

1 10月252024年数据要素X”大赛全国仪式在北京举行,同程旅行“大模型赋能文旅行业”荣获文化旅游技术创新。
2 “大模型赋能文旅数字化发展”主要是基于同旅行的“程心”大模型赋能旅游行业的数字化发展。
3. “程心模型是同程旅行的旅游行业大模型,具备强大的推理,游客提供行程规划、预订、票务预订、景点推荐问答。br> 4. 在颁奖仪式上,程旅行还参与发起了《生态共建》,倡议将本次大赛出的大模型示范项目成果为数字蓬勃的新质,积极响应中国战略共同打造“低、广、高安全”的数据开发利用。
5. 在行业智能生态共建方面旅行一直保持开放姿态,相关企业的生态体系。
阅读原文

国产大模型比落地速度 科大讯飞交出一年答卷

文章概要:

1. 10月24日,科大讯飞宣布讯飞星火4.0 Turbo的七大核心全面超越GPT-4 Turbo,数学和代码能力上超过GPT-4o,并在国内外中英文14项主流测试集中实现9项第一
2. 科大讯飞还首发10项应用,包括超拟人数字人,一张照片生成数字人、一句话复刻声音
3. 科大讯飞首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种> 4. 科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造国产超大规模智算平台“飞星二号”正式启动
5. 科大讯飞已与各头部企业共建20多个行业大模型,300多个应用场景,所覆盖行业和场景数都是第一
6. 科大讯飞用11项首发秀了一把肌肉,除拟人数字人、八语种大语言模型外,还有多项教育、、医学领域的应用首发
7. 科大讯飞在发布会上表示,将开放全场景资源,从技术能力到应用落地,用最短路径帮开发者实现产品迈向市场,还牵头成立5亿元AI基金,并与地方政府联合为AI创业团队提供产业落地支撑
8. 今年的诺贝尔奖、化学奖、经济学奖都颁发给了AI领域的科学家。刘庆峰表示,AI for Science带来科研范式的根本变革,正在成为科技发展的新引擎
阅读原文

打开扣子营销创造大模型,一看全是生产力

文章概要:

1. 2024年AI应用爆发,场景将迈入新阶段,具备更好的语义理解、的推荐和定制化能力等。br> 2. 字节跳动旗下的平台上线了“营销创作主题模板”功能,覆盖多个实用场景模块,为用户的多元化营销场景提供强有力的支持<> 3. 企业和个人创作者都面临着诸多营销难题,扣子应用的出现,在一定程度解决了用户的痛点和需求。br> 4. 扣子为用户赋能,在场景下新的体验更低门槛「创作」更多信息、更便捷完成「创」作、身边的一个伙伴,提供更且人性化
5. 扣子已经集成了近百款各类型的插件,可以直接将这些插件添加到Bot中,拓展Bot能力。
6. 扣子专业版则专为企业级应用打造,具备更稳定、更、发布更轻松等,能将AI应用开发周期缩短95%以上
7. 不管是C端B端客户,都核心关注能否通过平台快速的构建一个自己需要的应用出来,并且能有效的解决实际面临的问题
阅读原文

行业动态 | 算力即服务,首个基于RISC-V算力的行业大模型生态系统问世

文章概要:

1. 我国始终将“数字化”“智能化”加快数字。
202年OpenAI发布ChatGPT引领了从判别式小模型转向生成式大模型的发展热潮。
3. 广州希姆半导体科技有限公司是一家致力于研发AI领域专用架构处理器的公司,始终深耕RISC路线并以商业落地为导向。
阅读原文

合作促发展,共赢谋新篇丨江苏小云智能科技有限公司与中天钢铁集团合作实施“AI+工业设备无线智检大模型”的应用

文章概要:

1. 2024年15日,江苏小云智能科技有限公司董事长刘建刚带领团队赴中天钢铁集团,就“AI+设备无线智检大模型”达成合作共识。
2. 江苏小云智能科技有限公司董事长建刚、技术总监方挺博士、技术负责人张辰啸博士到场进行“AI+工业无线智”软硬件的介绍。
. 中天钢铁技术负责人带领小云智能团队进入轧钢厂,挺博士、张辰博现场进行故障设备的测试与诊断。
4. 本次合作,主要针对于轧机振动数据监测机作为钢铁厂重要生产设备,使用频率高,振动数据监测困难且对效率产品巨大而通过“AI+工业设备无线智检模型“以及无线智能振动传感器,能够实时监控轧机的运行状态,及时的和异常情况。利用人工智能算法对数据进行深度分析,可以预测设备的周期从而突发性故障的发生,设备的稳定性和使用寿命。br>. 江苏小云智能科技自主研发的“AI+设备智检大”一个一体,人工智能(AI、大数据(Big Date)、(IOT)等前沿技术于一身,专门针对设备开展智能化监测与的系统。无线智能,针对设备的振动、转速等状态进行监测,介入分析,提前设备异常,同时拥有办公审批、智能维保、能耗统计功能,支持移动平台,随时随地处理事务,全面助力企业进入智能化时代,降低企业运维成本
. 江苏科技有限公司的在合作中展现了的技术实力和专业服务,中天钢铁集团提供了定制化的解决方案。双方的合作将中天钢铁集团在智能化改造方面的,也将为整个钢铁行业树立标杆。,计划进一步深化合作,共同探索更多工业设备智能化升级的可能性。
阅读原文

未来已来:大模型市场的前瞻性思考

文章概要:

1. 大模型市场正处于高速增长阶段,技术不断进步,市场进一步发展。br> 2. 203年,全球范围内掀起了式AI技术研发国内AI领域亦风起云涌。
3. 大模型市场已经初步形成多元化的竞争格局,科技巨头占据主导地位,型中小企业异军突起。
4.大模型的部署方式主要分为云端大模型、端侧大模型以及混合多元化模式。
5. AI大成为推动C端应用生态升级的重要力量新生态的构建将AIPC在更多的应用和拓展。
阅读原文

医疗大模型:智能诊疗,精准医疗的未来之路 头豹词条报告系列

文章概要:

1. 介绍头豹医药投资并购俱乐部的healthib俱乐部
2. 说明文章转载的免责声明
3. 推荐相关内容
阅读原文

大模型走到AI战略分岔口,字节们面临偏航危机

文章概要:

1. 不少AI企业追求“大而全”,面临商业上的挑战和市场规模的限制,字节在AI方面实习生投毒事件反映其对文本模型训练重视度不够,资源倾斜视频方向,与百度等大厂在LLM发展方向上存在分歧。
2. AI视频生成存在成本高质量难以兼顾和“AI”味明显等问题,用户不买账,市场冷眼,多家AI视频生成厂商同质化,内卷严重。
3. 数据枯竭下,LLM的scaling law的神话需要强化学习来延续,文本模型决定了多模态的上限,而深度推理又决定了当前文本模型的上限,国内厂商在“深度推理”上已显示出差距。
4. 部分国内大厂如字节、智谱清言追求“大而全”,缺乏核心竞争力,陷入战略困境,而深度推理这类既难啃又不性感的技术,可能是C端带来突破的关键。
阅读原文

西湖大学提出 「 AI 科学家」 Nova,效果相比 SOTA 提升 2.5 倍

文章概要:

1. 西湖大学提出 「 AI 科学家」 Nova,能够生成大量突破性的科学Idea,在创新性、性、可行性媲美人类科学家> 2 为了评估Nova模型的综合性能,团队从质量、、性三个方面对其进行了评估
3 Nova模型之所以能让科学家都“恍惚因为了一种增强的规划搜索方法,提升大语言的能力
4. 西湖大学领导人蓝忠,是Google轻量级模型ALBERT”的第一为西湖大学博士生导师,深度学习实验室及,西湖心辰创始人
阅读原文

工信部:我国生成式人工智能服务大模型的注册用户超6亿

文章概要:

1. 工信部透露我国现有完成备案并为公众服务的生成式人工智能服务大模型近200,注册用户超过6。
2. 我国已建成全球规模最大、技术领先的基础网络,包括千兆城市、5G网络、移动物联网等。
3. 算力基础设施规模和位列全球,我国算力总规模246EFLOPS枢纽间0时延保障能力全面实现。
4. 工业和部同相关部门着力推动新型信息基础设施协调发展,统筹规划骨干设施、优化布局算力、深化区域间协调普惠发展、推进信息与传统设施融合发展。
阅读原文

大模型重塑媒体内容生产与传播

文章概要:

1. 生成式人工智能和大语言模型的应用成为热议话题,AI在传媒行业的让其在新闻信息采集、生产和分发的全链条参与度越来越高
2. 在内容生产方面,AI已深度融入并成为创作的重要助手,模型内容生产不仅仅是一种工具更是一种的引擎
3. 大模型在传媒行业的应用还创新性地结合了先进的图像编辑和视频生成技术,可以对检索到的素材进行高质量的二次和开发,为内容的多元化应用和创新呈现提供了更多可能
4. 国家网信办等七部门发布的《生成式人工智能服务管理办法》为大模型技术在内容产业中的应用发展划定了“红线”和“底线
5. 国内媒体智能化进程快速推进,智能媒体生态日益完善。新型和头部互联网平台智能媒体的两大关键引领者,当前也是大模型落地的先导者
. 大模型应用已经超越传统的内容生产,在“策采发评馈管”全提质增效,为传媒行业全面赋能
. 智能媒体信息传播的引擎,正以前所未有的和规模世界,连接人类与、知识与的
8. 在传媒行业中,模型将经历从大模型到行业大模型构建,再到智能体的广泛应用三个阶段,未来大智能体应用创新有望进一步赋能媒体全的内容生产与传播
9.模型智能体是基于大型预语言模型或多模态模型构建智能系统,作为一种新质生产力由专家知识、模型、数据与算力四种生产要素组成,能够模拟专家完成任务,实现类似人类专家的和决策
0. 未来,媒体机构可通过战略规划、技术赋能与应用创新,开拓智能体蓝海市场,探索与用户连接形式。智能体应用在交互、重复性、专业性和自由性的媒体工作场景中均可展现出优势
阅读原文

达成合作!人力资源也用上商汤大模型

文章概要:

1. 商汤科技董事长兼CEO徐立在202中国人力资本发展大会上介绍了AI 2.0时代,商汤日日新模型加持人力资源行业的三大能力:全能、逼真、洞察
2 商重要技术支持者参与发起的“HR+AI 智慧人才港”,正式宣布启动建设
3. 商汤科技与智达成合作,将在HR智能数字员工、人才发展大模型以及相关算力服务领域展开深入合作
4. 商汤日日新模型的“招聘助手”,可通过自然语言对话,实现从候选人信息总结、生成面试问题或建议、协助安排面试、AI面试到生成报告的自动化闭环
5. “AI面试官”可完成音视频一体化的面试任务,能够以真人般的形象和声音,以及低延时的良好交互体验,千人千面的提问和适时有效的追问
6.盘点助手Agent,融合了商汤模型的慢思考推理能力, 可分析和挖掘每个员工内容,描绘综合能力图谱,助力管理者实现精准的人岗匹配> 7 商汤秉承“装置-大模型应用”三位一体的战略,以应用驱动模型,以模型带动算力优化,为产业释放源源不断的质
阅读原文

特运数字化专家带你秒懂数字化|初识大语言模型

文章概要:

1. 介绍大语言(LLM)概念和作用。
2 解释人工智能(AI)大语言模型M)的关系。
4. 强调提示工程 Engineering)对于优化大语言模型(LLM)性能的重要性。
阅读原文

趣丸科技联合港中大(深圳)开源首个语音大模型,效果全球领先跻身第一梯队

文章概要:

1. 趣丸联合港中大(深圳)开源首个语音大模型GCT,在声音克隆、语种合成、语音控制等任务中展现卓越效果。
2.GCT在三个TTS基准数据集上都达到了SOTA效果,超过当前最先进的同类模型。
3. MaskGCT研发团队在语音领域拥有的积累和原创性成果,该工作由港中大(深圳)-趣丸科技人工智能联合成员完成。<> 4. MaskGCT短剧出海、数字人、智能助手、有声读物、教育等领域丰富的应用场景。
5. 趣丸打造了多语种速译智能视听平台趣丸音”,可实现字幕修复与翻译翻译、唇音同步等功能。br> 6.GCT是一个大规模的零样本TTS模型,采用非自回归掩码生成Transformer,文本与的对齐监督和音素级持续时间预测。
阅读原文

大模型之RAG:LLM性能的提升,RAG与Fine-Tune该如何选择?

文章概要:

1. 文章讨论了大模型在应用中出现的问题及解决途径,包括RAG和微调。
2. 介绍了微调的概念和作用,以及RAG和微调的对比,包括架构流程、数据需求、计算复杂性等方面。
3. 提出了在特定任务场景中,由于模型性能,导致输出结果与理想结果相去甚远等问题。
4. 分析了RAG和微调的选择参考,包括用例需要访问外部数据源、需要修改模型的行为、写作风格或领域特定知识等。
5. 总结了在RAG和微调之间进行选择需要对LLM申请的独特需求和优先级进行细致的评估,在某些情况下,同时利用RAG和微调的混合方法可能最佳选择。
阅读原文

黄伟:“大模型混战”幸存者说|中国经营者

文章概要:

1. ChatGPT的发布对人工智能的发展范式带来了划时代的变革,2024年的诺贝尔物理学奖首次颁给了在人工智能领域有杰出贡献的科学家
2.到企业知声,创立于2012年,起步于语音识别技术,是中国第四大的AI解决方案提供商,于2023年发布了山海大模型
3. 本期《中国经营者》专访云知声创始人黄伟,探讨在上一个发展范式当中处在第一梯队的企业该如何迎接大模型的2.0时代
4. 人工智能三问:AI里面究竟发生了什么AI可以自己修改代码,逃脱人类的掌控;AI将非常擅长操纵人类,你关不掉它
5. 通用大模型与垂直大模型无需对立,云知声希望在医疗领域做到世界第一
6. 垂类大模型选择行业赛道时,希望选择一个坡长雪厚的赛道,天花板不能太低,一定是一个长周期的赛道
7. 垂类大模型做好商业落地,在医院是通过软件售卖的方式来实现的,在物联网领域,云知声希望能够把一种通用的AI能力能够服务千行百业
8. 云知声即将成为一家上市公司,上市对云知声来说意味着新的出发
9. 任鑫认为中国的年轻人可以用新科技代表中国去打全球市场,用好AI新科技,帮助祖国打江山
10. 黄伟认为有泡沫很正常,投资力度不够,并不代表投资是得到了合理的使用,要把弹药投在最该投入的方向
阅读原文

中国卫星应用大会2024:AI大模型应用于卫星在轨管理

文章概要:

1. 中国卫星大会24进入第二天,主题为“卫星应用产业中的新质生产力”,举办了三场圆桌讨论会,学者就卫星在轨管理、卫星互联网消费以及低空经济展开深入探讨。
2. 西安中科天塔科技股份O董卫华发布了中科天自主研发的航天私模型——华山,该模型以在轨卫星管理专业知识库为基础,搭建航天器操控平台,通过语音、文本互动,完成航天器在轨管理航天器管理人员培训。
3. 董卫华展示了“华山的多项功能,包括数据智能分析助手、信息智能管理助手、轨道智能分析助手、卫星管理助手、轨道分析助手、智能任务规划助手等,该模型具备知识整理能力和推理能力随着训练的推移将会持续增强效果。br>4. 董卫华介绍,中科私域大模型卫星管理专业卫星基础知识、卫星故障预案、遥测知识、卫星遥控知识等,通过海量知识库,结合多轮问答和训练,具备实现智能精准交互的能力,将最大化覆盖航天领域中经验化场景。
. 未来,通过地训练AI大模型,中科天塔将有机会大幅提高卫星管理效率实现大规模卫星星座智能管理。
阅读原文

刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的

文章概要:

1. 10月25日,智谱清言宣布全量上线「情感语音通话」功能,该功能在响应和打断速度、情绪感知情感共鸣、语音可控表达、多语言多方言等方面实现了突破,不久后还将上线视频通话功能。
2. 智谱清言情感语音通话功能背后的情感语音模型GLM-4-Voice同步正式开源,与传统+LLM+TTS的级联方案相比,GLM4-Voice以离散Token的方式表示音频,实现了音频输入和的端到端建模
3. 智谱宣布另一项前沿成果AutoGLM,用户可以凭借一句指令让AI自动完成许多任务,目前AutoGLM已开启内测(暂时仅支持Android系统)。
4. 智谱AI未来希望各种模态混合训练统一多模态模型,不仅认知能力要比肩人类,还要与人类价值观保持一致,做到能力出众的同时要安全可控。
阅读原文

科大讯飞三季度净利润转正,大模型战事行至途中

文章概要:

1. 科大讯飞发布新一代星火大模型,多项能力超越GPT-4 Turbo,首发10项产品与创新应用,重新定义多模AIUI标准。
2. 科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”启动。
3. 科大讯飞2024年第三季度财报,营收和归母净利润均实现增长,研发投入费用占据开支大头,各项财务数据有向好趋势。
4. 科大讯飞的各项指标与主动优化营收结构和聚焦“B+C”业务发展有关。
5. 讯飞星火大模型应用落地交出亮眼成绩单,中标数量和金额业内领先,合作客户包括行业龙头企业,在产业生态化方面也在逐步加强。
6. 讯飞星火大模型的商业化落地路径得到初步验证,重在践行三点:在已有场景中加快规模化落地,在重点行业做深做透,面向企业打造标准化产品。
阅读原文

趣丸科技联合港中大(深圳)开源首个语音大模型

文章概要:

1. 趣丸科技宣布与香港中文大学(深圳)联合研发的大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用
2. MaskGCT在三个TTS基准数据集上达到了S效果,超过当前最先进的同类模型,某些指标甚至超过人类水平
3. 相较于现有的TTS大模型,MaskGCT在语音的相似度、和稳定性上进一步,尤其在语音相似度方面处于绝对地位
4. MaskGCT研发团队在语音领域拥有深厚的研究积累和原创性成果
5. 目前,MaskGCT在短剧出海、人、助手、有声读物、辅助教育等领域拥有丰富的应用场景
6.GCT是一个大规模的零样本TTS模型,采用非自回归掩码Transformer,文本与的对齐监督和音素级持续时间
7. MaskGCT由语义表示编解码器、语音声学编解码器、文本到语义模型、语义到声学模型四个主要组件组成
阅读原文

大模型之网络安全分析

文章概要:

1. 大模型与经济社会深度融合,带来非预期安全影响,本文优先对各类基础大模型系统的安全风险进行系统梳理。
2. 参考国际标准,将基础大模型系统抽象为四个重要组成部分,并通过描绘这组成部分面临的重要和一般安全风险,形成大模型安全风险地图。
3. 大模型在风险识别环节拥有显著应用潜力,重点介绍大模型在智能威胁情报生成整合、自动化漏洞挖掘、自动化代码审计、智能网络攻击溯源等场景的商业化应用情况。
阅读原文

圆满落幕!大模型应用实践培训带你解锁AI新世界

文章概要:

1. 兴业数金应用创新中心联合人力资源部举办了以模型应用实践”为主题的技术培训
2. 培训主要围绕大模型、Agent构建、Agent实操教学、AI案例解析等
邀请ing AI咨询公司的三位大模型领域的专家讲师,给大家带来了一场理论与实践完美结合的技术盛宴。br> 4. 学员们通过三天的培训与了ing AI的初级智能体架构师认证。
5. 兴业数将持续关注大模型技术的发展动态,不断探索大模型在金融科技的创新应用为“数字兴业”和“未来银行”添加瓦。
阅读原文

智能体一体机,大模型时代一叶见菩提

文章概要:

1. 企业智能化进程中面临决策成本大、投入成本大、效果不确定性大等问题,希望能在大模型时代实现“小见大见微知著”。
2. 大模型虽好,但落地并不容易,企业在引入大模型时兼容性、可靠性、投资回报率等不确定性。
3. 智能体一体机为企业提供了与大的捷径,它集成了软硬件方面的优势,最大限度地降低应用体的门槛。
4. 联想推出的智能体一体机,包含面向企业用户的智能体一体机和面向教育用户的智能体实训一体机。
5. 联想智能体开发一体机通过深度整合与软件资源提供了大模型应用最小单元,具有软件成熟、硬件灵活、用户等优势。br>. 企业在落地智能体的大势所趋下,可以更快捷、灵敏、无负担地完成智能化升级。
阅读原文

人工智能时代,大模型学习机如何为孩子科学减负?

文章概要:

1. 家长在辅导孩子功课时感到力不从心,身心俱疲。
2. AI学习机正在成为解决家长辅导难题的方案。
3. 科大讯飞AI学习机之所以能够有效缓解家长的辅学焦虑,关键在于其三大核心功能和强大的技术优势。
4. 科大讯飞用AI技术赋能教育,不仅让个性化学习成为现实,更重要的是重塑了整个教育生态。
阅读原文

大模型时代的软件智能化开发:我们在哪里?该往何处走?

文章概要:

1. 大模型热潮:自ChatGPT问世以来,大模型成为热门话题,软件工程领域也不例外。一些企业和研究者开始关注代码生成问题,同时也有一些言论甚嚣尘上,如编程的终结、自然语言编程以及软件开发的变革。作者认为大模型的到来为软件智能化开发带来了巨大想象空间,但也指出当前的发展局面可能带来一些负面影响,如行业浮躁、企业期望过高、大众对软件工程认知产生偏差等。
2. 作者对大模型在企业软件开发实践中的实际应用效果和现状的理解和感受:基于大模型的局部智能化支持成为常态,但这种支持很大程度上仍然是局部性的;大模型的应用加剧了开发人员的分化大模型对于软件维护类任务支持有限;大模型的滥用可能带来潜在和长期的质量隐患
3. 作者的一些思考:软件的多样性、软件的系统复杂性、软件开发的探索性。
4. 有希望的探索方向:人机协作演进式应用生成、DSL与大模型相结合的应用生成、基于大模型代码数字孪生。
5. 总结:大模型技术发展助推软件开发进入智能化时代,但当前大模型主要是在一些局部任务上发挥作用,而无法在更大范围内和更高层次上提供智能化支持。对于应用开发而言,人机协作的智能化开发应当成为企业追求的主流方向,对于复杂软件的维护任务而言,通过大模型增强的代码数字孪生实现软件开发知识的有效积累和利用。
阅读原文

【热点】工业AI大模型收益初步成效,如何突破数据隐私与透明性的高墙?

文章概要:

1.大模型的出现为工业提供了驱动的决策支持,引领了预测性维护、智能生产应用领域的。
2.大模型在数据处理方面的能力为智能决策提供了强有力的支持。
3. 预测性维护AI大模型在工业应用中的重要领域。
4. 在智能生产领域,AI大模型同样展现出巨大的应用潜力。
5. 中控技术在智能制造方面也有显著布局。
. 在工业环境中,数据安全与隐私问题不容忽视。
7. 尽管AI大模型在工业决策中展现出强大的能力,但其黑箱特性使得许多企业在使用时仍持谨慎态度。
阅读原文

讯飞星火首发汽车端侧大模型,Q4有望在奇瑞、广汽、长城等车企落地

文章概要:

1. 讯飞星火首发汽车端侧大模型,Q4有望在奇瑞、广汽、长城等车企落地
2. 讯飞星火首发多模态视觉和超拟人数字人,在多模态上又往前迈出一大步>. 讯飞星火升级了多语言能力,行业首发了星火语言大模型,9种外语
4. 讯飞星火落地六大车企量产车,首发汽车侧模型,有望加速大模型在汽车落地
阅读原文

Function Calling为何能让2024年成为大模型应用元年?

文章概要:

1. 大模型产业应用爆发的关键在于Function Calling机制,它使大模型能与外部API结合,加速技术落地。
2. 预训练大模型的知识基于训练数据的时间范围,要获取实时数据需接入外部信息源。
3. 开发AI应用通常需要依赖特定框架或平台,设计提示词是关键,但无法标准化,准确率低。
4. 插件功能因设计缺陷,如缺乏Agent调度机制、无法提供完整端到端解决方案、响应延迟高等,被废弃。
5. Function Calling机制使AI应用开发更简单,提高了API标准化和准确率,推动了Agent框架的流行。
6. Agent Foundry是一个AI应用开发通用平台,采用前后端分离设计,核心是Agent,负责功能调用。
7. 智用研究院与深圳市工业设计行业协会合作,开发了AI工业设计平台灵鹿未来,用户可通过聊天对话设计工业产品。
8. 智用研究院规划了面向制造业全流程的创新产品AI BOM,包括生产、制造、服务、市场等模块。
9. 目前市场上很多大模型的Function Calling准确率低,难以用于生产,OpenAI的准确率达100%。
10. 张善友在Agent Foundry平台上制定了新的API标准,将所有模型整合到统一标准下,以提高平台能力
阅读原文

助力能源焕新,羚羊能源大模型2.0重磅发布

文章概要:

1. 10月24日,在第七届世界声博会2024科大讯飞全球104开发者节期间,羚羊能源大模型论坛在安徽合肥举办,羚羊公司发布全新升级的羚羊能源大模型2.0及应用。
2. 中国能源研究会理事长史玉,安徽省工业和信息化厅二级巡视员潘峰等相关领导、行业专家、高校教授、企业家齐聚一堂,话能源创新发展新机遇和数字化低碳转型新未来br>. 论坛上,在中国能源研究会理事长史玉安徽省工业信息化二级巡视员潘峰等的见证下,羚羊能源大模型生态共建计划正式启动,通过构建开放、共享、协同的能源生态系统,推动能源产业的转型升级。
4. 论坛上,中国石油大学(北京)学院院长林伯韬、羚羊公司副总裁王瑞代表双方签订战略合作协议。双方将在人工智能+能源领域进一步开展深入合作,共同推动核心技术,为产业和社会创造更多价值。
5. 羚羊公司总裁徐甲甲发布了包括语言大模型、视觉大模型、时序大子模型在内的羚羊能源大模型2.0其中视觉大模型、大模型能力的跃升是本轮升级的重点。
6. 发布会上,羚羊副总裁王瑞羚羊公司石油行业高级咨询专家刘奇峰就电力和石油石化场景分别作了。同时,了“AI+能源”的更多场景模式,在能源大模型伙伴合作签约仪式,羚羊副总裁盛马宝与多家生态伙伴代表共同签约一同打造更多能源行业产品和解决方案,释放更大的社会价值。
阅读原文

悟了!大模型的数学原理!

文章概要:

1. 文章指出OpenAIGPT系列成功的秘诀在于next token prediction,其数学基础为所罗门诺夫归纳法。该法是大语言模型的理论基石,用于揭示GPT的核心机制。文章探讨了该理论的最新发展、在AI领域的应用及哲学内涵。
2. 文章介绍了所罗门诺夫归纳法的定义、发展历程、应用以及相关学者的贡献。该方法可用于预测下一个词,是大模型的基础。
3. 文章还探讨了柯尔莫哥洛夫复杂性、蔡廷的工作、列文的工作、本内特的工作、李明夫妇的工作以及Hutter的工作。这些工作都对所罗门诺夫-柯尔莫哥洛夫-蔡廷复杂性的研究做出了重要贡献。
4. 文章认为,OpenAI的ChatGPT的成功,虽常被归因于底层神经网络架构Transformer,但GPT的next token prediction可能是其成功的关键。目前大模型研究中,理论暂时落后于工程实践。
阅读原文

人工智能AI模型介绍(二十二)--式说大模型

文章概要:

1. “式说”大模型是由第四范式的企业级多模态大模型产品,它基于多模态大模型的新型开发平台,致力于用生成式AI重构企业软件,提升软件的用户体验及开发效率,已经与金融、零售、制造、医疗、物流、、等多个行业的上百家企业开展了深度合作br>2 核心能力介绍:多模态输入与输出、Copilot与思维链CoT(Chain of)、企业级软件重构、多模态理解能力、企业级Copilot能力。
3. 界面使用情况介绍:输入方面,“式说”支持多输入,具备Copilot能力和思维链CoT输出方面式说”支持多输出,以“对话框的界面呈现,功能升级快速
阅读原文

战略调整引领未来:商汤要做最懂算力的大模型服务商,和最懂大模型的算力服务商

文章概要:

1. 10月18日在商汤科技十周年之际,2024商汤十周年国际论坛在香港科学园举办,商汤科技董事长兼首席执行官徐立表示当下正处在AGI的,在人工智能2.0时代,商汤的核心战略是无缝集成数字基础设施、人工智能模型和应用
2. 10月22日,徐立向全体员工发布了题为《商汤周年再出发:专注聚焦、知行合一》的内部信,中确立了“大-模型-应用”三位一体战略,同时将构建更加集中和高效的组织架构,加快组织和管理的轻盈化、效率化进程等对商汤未来发展规划进行了详细的阐述
3. 在生成式大模型AI领域,商汤科技的核心战略是实现算力大装置大模型和应用的无缝集成。这一战略旨在通过数量级级别的优化,提升算力资源的使用效率,同时降低模型的生产和使用成本
4. 在生成式AI领域之外,商汤科技亦保持着活跃的业务聚焦,例如在传统AI商汤科技则充分利用其在视觉感知和多模态方面的核心能力,集中资源,方向
5. 在组织层面科技也在进行深刻的变革。围绕战略和核心资源,商汤科技正在构建更加集中和高效的组织架构,以快速变化的环境和技术趋势
阅读原文

最新70篇代码大模型论文精选

文章概要:

1. 本文整理了2024年9月至10月中旬全球各大高校与科研机构发布的70篇代码大模型相关论文,并将其分为、代码微调、测试基准、代码Agent、代码与大模型推理、代码生成、SQL生成、代码embedding、漏洞检测与修复等主题。
2. 论文包括OLMoE、Arctic-SnowCoder、Qwen2.5-Coder、aiXcoder-7B等基座模型,GALLa、XCoder、Policy Filtration for Proximal Policy Optimization (PF-PPO)等代码微调方法,ComplexCodeEval、CodeMU、BabelBench等测试基准,MarsCode Agent、HyperAgent、REDO等代码Agent,USCD、Multi-Programming Language Ensemble、RethinkMCTS等代码生成方法,CodePlan、Steering Large Language Models between Code Execution and Textual Reasoning、CodePMP等代码与大模型推理方法,Automatic Detection of LLM-generated Code、HexaCoder、Can OpenSource beat ChatGPT?等AI代码分析与安全方法,zsLLMCode、Instructive Code Retriever等代码Embedding方法,BEAVER、PTD-SQL、DataGpt-SQL-7B等SQL生成方法,SecRepair、CLNXVulnLLMEval等漏洞检测与修复方法,LUK、 Comparative Study on Large Language Models for Log Parsing、Multi-language Unit Test Generation using LLMs等其他应用。
阅读原文

AI大模型(LLMs)五大热点研究方向分享!

文章概要:

1. 图灵是A股上市公司创业黑马旗下的独立事业部,提供、CCF论文保录辅导,RA实习、名校博。
2. 文章梳理了顶会上的五大热门研究方向,检索增强生成(RAG大模型Agent、Mamba、参数高效微调(RA)混合专家模型(E)。<> 3. 图灵学术的科学家团队1多名人工智能领域的大牛导师组成,科研工作者提供生命周期的科研服务。
4. 文章介绍了灵服务,论文保录辅导、实习、名校申博服务等。
阅读原文

科大讯飞星火多语言大模型:国产大模型全球化新引擎

文章概要:

1. 202讯飞102开发者节首次发布的星火多语言大模型具有重大意义,科大讯飞作为中国唯一的认知智能全国重点实验室承建单位,此次发布多,是对其技术实力的又一次有力证明。
2. 科大讯飞星火多语言大模型在国内外中英文14项主流测试集中实现9项第一,多语言十分强大,首次实现全国地级市方言全覆盖,在汽车、家电、办公、翻译等行业的任务场景中,应用效果超过GPT-4o。br>3. 科大讯飞星火多语言大模型作为中国唯一的认知智能全国重点实验室的成果,代表中国给世界提供了第二种选择,加速了国产大模型在全球各行业的应用,推动了全球智能化发展的进程,吸引了全球开发者的关注,促进了产业生态的建设。
4. 星火多语言大模型在未来有着巨大的发展潜力,尽管面临挑战,但前景依然广阔,科大讯飞作为中国人工智能领域的领军企业,将继续加大对星火多语言的研发投入,拓展国际市场,与全球合作伙伴共同推动人工智能技术的发展。
阅读原文

讯飞星火4.0 Turbo、超拟人数字人等11个首发,科大讯飞如何深入大模型国产化“无人区”

文章概要:

1 10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布最新的讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此同时,国产超大规模智算平台“飞星二号”正式启动。
2. 科大讯飞还首发了10项基于讯飞星火底座能力的硬核产品与创新应用:定义多模AIUI标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器等;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种AI翻译透明屏。
3. 讯飞星火4.0 Turbo在数学能力、代码能力上超过了GPT-4o。由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实现超越,效率相对提升50%。
4. 发布会上,科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。
5. 科大讯飞首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
6. 科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
7. 科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。
8. 今年的诺贝尔物理学奖、化学奖、经济学奖都颁发给了AI领域的科学家。刘庆峰表示,AI for Science带来科研范式的根本变革,正在成为科技发展的新引擎。
阅读原文

放弃算法,ALL in 大模型

文章概要:

1. 作者最近半年在工作中用AI做业务,用大模型直接做业务的优势是可以快速跑通整个流程,可行性
2. 作者的产品是类似抖音、小红书的内容APP,难点在于聚合相似内容,现在直接将优质内容丢给大模型,让大模型聚类、总结
3. 作者使用的大模型是Qwen2旗舰模型Qwen2.52原因包括开源、性能超越Llama3.1-405B、节省显存成本、在世界顶级大模型的竞技场LMSYS排名第十支持高达128K的上下文长度、强指令遵循
4. 作者还需要用视觉大模型判定搜来的图片是否可用,Qwen2.5也开源了视觉大模型Qwen2-VL-72-Instruct,在LMSYS Vision榜单排第九
5. 放弃算法并不是在业务中完全不用算法,而是在第一版快速验证可行时,直接用大模型做业务,效率更高,效果也不差
6. Qwen2.5全系列模型都在18T tokens数据上进行预训练,整体性能提升18%以上,拥有更多的知识、更强编程和数学能力
7. Qwen2.全系列涵盖7个尺寸的大语言模型,你可以根据场景需求,选择不同尺寸模型本地部署微调
阅读原文

2024年中国AI大模型产业发展报告

文章概要:

1. 报告显示,中国AI大模型已形成以云和端侧为主的两大部署方式,包括通用大模型、行业模型PC大在、医疗、等领域取得显著成果。
2. 中国AI大模型产业科大讯飞的讯飞星火认知大模型、公司的文心一言大模型以及阿里巴巴的通千问大模型。行业大模型则主要由度、容联云用友等公司。端云的大模型,vivo的蓝心大模型成为典型案例。
3 目前面临、主流大模型架构的局限性、高质量训练数据集不足等挑战。
4. 报告认为,中国AI大模型有侧与端侧需求C端用户将成为侧的主要群;大模型通用化与专用化,垂直行业将成为主战场;大模型将广泛开源,促进小型开发者的参与;AI芯片升级,产业生态体系将更加完善。
阅读原文

讯飞星火4.0 Turbo发布,首发11项技术及应用,引领大模型规模化落地

文章概要:

1. 10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕,科大讯飞董事长刘庆峰发布讯飞星火4.0 Turbo。
2. 讯飞星火4.0 Turbo在七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4,国内外中英文14项主流测试集中实现了9项第一。
3. 1024期间,科大讯飞还首发了10项基于讯飞星火底座能力的产品与创新应用。
4. 讯飞星火4.0 Turbo在数学能力、代码能力上超过了GPT-4,在其中9项测试集中实现超越,效率相对提升50%。
5. 科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力基础上,升级了多模态能力,新增了超拟人和个性化能力。
6语言大模型,除中英文外,可支持俄、日、阿、法、西、葡、德等8个语种。
7星火大模型。今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。
8. 科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。
9. 讯飞星火已成为央国企大模型的第一选择。截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景。
10. 讯飞星火持续为高校提供基础科研提效服务。
阅读原文

开源模型突破原生多模态大模型性能瓶颈,上海AI Lab代季峰团队出品

文章概要:

1. 上海AI Lab代季老师团队提出全新的原生多模型M-InternVL,该模型首个单词延迟最多降低67%,在多个评测数据集上均达到了SOTA水准
2. Mono-InternVL将视觉感知和多模态理解均集成到大语言模型中,具有开源原生多模态架构最优解和兼具视觉灵活性和部署高效性的技术亮点
3. Mono-InternVL提出了采用增量预训练的,解决此前原生MLLM中的灾难性遗忘
4. Mono-InternVL由视觉文本嵌入和多模态E结构两部分组成,作者提出内生视觉预训练EViP)方法,旨在通过在大规模噪声数据和合成数据上进行预训练最大化ono-InternVL的视觉能力
5. 作者基于InternLM2-18B开发了MonoIntern-2B模型,6个多模态基准上进行了广泛的实验,实验结果表明,1.8B参数的Mono-InternVL可以大幅超越此前的7B参数多模态模型EVE,平均提升15.5%
6. 与最先进的MLL InternVL-1.5,Mono-InternVL在6个多模态基准上表现更优
7.LMDeploy的部署实验表明,Mono-InternVL模块化模型InternVL-.5相比,首个token延迟减少了6%,整体吞吐量提高39. 下游任务与训练数据规模的曲线图表明,在三阶段的EViP的帮助下Mono-VL 的能力随着数据规模增加而不断提升
10 作者了不同的注意力图,了浅层部分所存在视觉局部性视觉文本交互较少等,为未来MLL 的设计启发
阅读原文

大模型在无人驾驶中的应用现状、发展趋势与技术挑战

文章概要:

1. 大模型在无人驾驶中的应用现状包括提升感知能力、优化决策与规划、促进多传感器融合和实际应用案例。
2. 发展趋势包括模型性能的持续提升、端到端学习的、与其他深度融合和商业化应用的。
3. 技术挑战包括数据质量和安全性、模型的解释性和透明度、实时性和计算资源需求以及法律法规和伦理问题。
阅读原文

高效弹性的大模型推理,事半功倍!

文章概要:

1. 文章介绍了如何在Amazon SageMaker上部署和推理大模型,以Amazon Llama 3模型为例,展示了从配置推理参数到部署Endpoint的全过程。
2. 文章还介绍了Amazon SageMaker Endpoint的自动伸缩能力,可以根据实际情况灵活调整推理资源,达到成本和效益的
阅读原文

这场大模型私享会上,长沙产业与北京企业擦出火花

文章概要:

1. 为了推动产业与大模型深度融合与发展,0月24日,由长沙市工信局、长沙信息产业园主办的长沙产业与北京大模型生态CX0私享会在湖南举行,来自北京的大模型生态企业与长沙企业进行了交流。
2. CSDN创始人&董事长、开放原子开源基金会理事蒋涛在会上表示,CSDN一直致力于帮助长沙市打造开发者中心全球研发中心城市,拉手活动,希望作为一个新起点,帮助长沙产业、北京大模型生态双赢。
3. 北电数智首席科学家、复旦大学计算机科学技术特聘教授、清华大学电子工程系兼职教授窦德景在主题演讲中表示,模型技术的每一次突破都可能行业格局的重塑。
4. 百川联合创始人焦可在主题演讲中指出,大模型的下阶段范式转换是从知识引擎到推理引擎的升级,是从aaS到aaS的转变,是从通用场景到垂直场景的。<>5. 智谱副总裁吴玮杰在演讲中提到,智谱突破了全自主、多模态高可用等关键技术,建立了千亿级多模态大模型的完整技术体系。7. 拓信息董事长李新宇表示,拓维信息作为长沙本土科技企业代表希望通过“1024”程序员节这样的技术生态大会,吸引全球、国内知名的大模型生态企业来湖南长沙、发展绿色算力经济,各行各业。
8. 音视频产业作为长沙优势产业之一,历来是创新的聚集地,技术在创新过程中发挥了举足轻重的作用。
9. 工业制造作为长沙产业的一张靓丽名片,诞生了众多全国甚至全球知名企业。如何借助AI大模型东风,实现再一次发展跃迁,是长沙工业制造产业的共同诉求。
阅读原文

创造了中国开源大模型的历史!

文章概要:

1. 9月19日通义相全面升级,并发布全新视频生成模型,应用于影视创作等领域,所有用户可免费体验
2 阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,性能超越Llama 45再登全球开源大模型王座。
3wen2.5全系列涵盖多个尺寸的模型,总计上架100多个模型,刷新业界纪录。
4. 在MMLU等十多个基准测评中,Qwen2.-72B表现超越Llama3.1-405
5. 截至2024年9月,通义千开源模型下载突破4000万,Qwen系列衍生模型总数超过7.43万个,成为世界上规模最大的模型家族。
7. Artificial Analysis表示,Qwen2.5-72B在他们的测评基准上表现优异,整体超越Llama 3.145B,是得分最高的开源大模型,而且Qwen2.-72B的代码和数学能力挑战GPT-4o。< 8.wen25-72B在同样的硬件条件下可以更快也比GPT-4o和Llama 3.1-405B约10倍。
9. Qwen2.5在海内外社交媒体上掀起,全球开发者纷纷加入试用队伍
阅读原文

侃大模型(8):企业知识管理范式革命:如何在大模型时代领先身位?

文章概要:

1. 大数据时代,企业重视数据资产的管理与利用,构建了一系列数字化平台。而大模型时代,企业需要将内部知识资产加以管理和利用。
2. 知识是一种经过系统化整理和验证的信息或事实的集合,具有可验证性、可传递性和在一定条件下的可重复性等特征。
3. 知识存在于书籍、互联网网页等媒介中,但目前的知识存储介质难以被计算机识别和共享消费。
4. 大模型时代的知识应该是知识要素和知识元数据的结合,知识要素是传递信息的纯文字与纯图片等纯粹的知识要素,知识元数据是描述知识的知识。
5. 传统做CMS的厂商应该朝着以企业知识资产沉淀为驱动的真正的知识管理平台而努力。
6. 知识管理的粒度主体应该由知识加工后产物变成知识元素与知识元数据本身,以数据管理的思维进行知识存储、管理与分发。
7. 企业需要收敛出高复用的知识场景训练对应知识处理模型,方可对历史知识进行一劳永逸的提取与管理。
8. 知识管理需要被结构化管理,便于共享与使用,建立知识领域的数据模型,将知识要素与知识元数据以企业级的范式标准进行存储管理建模。
阅读原文

聊一聊大模型六小虎生存现状

文章概要:

1. ChatGPT打响生成式AI创业热潮的发令枪,国内智谱AI、百川智能、零一万物、月之暗面、Minimax率先领跑,今年6月,阶跃星辰获20亿美元融资,进入第一梯队,自此大模型创企“六小虎”格局形成。
2. 模型能力增长放缓,大模型“六小虎”纷纷“追平”GPT-4,产品差异化不够明显,AI应用在大众层面的渗透率还不够高,大模型厂商在线上线下纷纷铺开营销,争夺用户和流量。
3. 大模型“六小虎”融资情况乐观,但距离收支平衡还有很远、很难的路要走,资本对AI创企的热情依然高涨,投资者对那些已有成熟技术生态系统的企业情有独钟。
4. 大模型厂商开始布局对AI创企的投资,大模型“六小虎”的路绝不是一帆风顺,模型能力增长与商业化探索,这两条路皆阻碍重重,IPO或将成为OpenAI的出路。
阅读原文

国产大模型,首次在榜单上干翻GPT-4o

文章概要:

1. 零一万物在新品发布推出新旗舰大模型“Yi-Lightning”在国际权威盲测榜单MSYS上超越OpenAI的GPT4o等模型,排名世界第六,国产大模型细分下暂列第一>2. 零一万物通过引入混合注意力机制和优化KV缓存,显著提高了模型的效率,同时分析用户需求的复杂程度,动态调用MoE,节省计算资源和时间
3. 李开目前公司的数据标注分类等都做到了业界顶尖,预训练较高,目前六家的融资额度足够支撑训练成本
4. 零一万物宣布API降价方案,价格降至百万token仅收费0.99元极低,直最低价
阅读原文

中信建投 | 国产大模型迭代加速

文章概要:

1. 文章主要探讨了国产大模型的迭代加速以及相关产业的发展情况。
2. 零一万物发布新旗舰模型Yi-Lightning,其在大模型竞技场表现出色,超越了多个顶流。
3. 文章还分析了化工、公用、环保、交运、钢铁等行业的市场动态和发展趋势。
阅读原文

2024须知丨中国人工智能大模型产业目前发展如何?

文章概要:

1. 自2020年1日OpenAI发布ChatGPT3,全球人工智能大模型产业的发展激情被彻底点燃
2. 中国在人工智能大模型领域的发展尤为迅速,企业数量也已超过 4500家,生成式 AI 用户已突破6亿
3. 国内大模型产业市场规模从2020年的15亿元增长至20年的70亿元复合增长率达116.02%,023 年约147 亿元
4. 预计2024年中国大模型产业规模将达216亿元
5. 国家网信办联合国家发展改革委、教育部、科技部等七部门公布生成式人工智能服务管理暂行办法》2023 年8 月15日起施行
6. 目前已有超过20 个大模型获得审批,大模型有望快速进入到拼原生应用、拼产业落地的
7. 目前国内已经涌现出一批具有国际竞争力的创业公司,“大六小强”等
8.了创业公司,中国的也在大模型领域积极布局,如百度、、华为、阿里等,竞相布局大模型产业,并推出“文心一言” 、“ 混元 AI大模型 ” 、“ 盘古 Chat”、“ 通义千问”等一系列通用化大模型加速了我国AI大产业化发展
阅读原文

大模型走到AI战略分岔口,字节们面临偏航危机

文章概要:

1. 字节跳动实习生恶意代码事件引发对文本模型训练重视度的质疑,同时也反映出国内大厂在LLM发展岔路上的关键分歧,即在算力资源有限的情况下,未来的大模型到底是要往视频方向冲,还是继续在文本上发力。
2. 百度CEO李彦宏表示百度不碰Sora类的视频生成,原因是视频大模型还不成气候,离能真正进行商用还早。
3. 目前所有的视频模型都存在两个难以掩盖的短板,一是难以做到成本、质量二者兼具,二是那股始终挥之不去的“AI”味。
4. 在各种训练数据行将耗尽的当下,LLM的scaling law的神话该怎样继续?答案是强化学习。br>5. 文本模型决定了多模态的上限,而深度推理又决定了当前文本模型的上限。
6. 目前在“深度推理”这一颇为考验LLM“内功”的分水岭上,国内厂商已经显示出了显著的差距。
7. 国内部分大厂如字节,由于自身布局于短视频业务的巨大惯性,并未在深度推理方向进行深耕,只是靠着低价竞争,以及“多而不精”的庞杂功能,才硬挤上国内大模型排行榜的头部。
阅读原文

他们掰开神经元,终于让大模型9.8大于9.11了:神秘创业公司,开源AI「洗脑」工具

文章概要:

1. 很多模型输出的结果都是「9.8<9.11」。
2. Monitor可以帮助人类观察、理解和引导语言模型的内部计算。
3. Monitor分析模型出错的可能原因。
4. 修复AI模型的行为。
5. Monitor的基本构成
6. Transluce这家公司的目标是创建世界一流的工具来理解AI系统,并使用这些工具来推动可AI的行业标准。
阅读原文

AI大模型需要什么样的数据

文章概要:

1. AI大模型需要什么样的数据
阅读原文