今日AI-大模型-2024年11月6日

发现全网最新的AI内容

AI大模型突破:微软新研究用扩散模型直接生成蛋白质序列,从序列到功能的革命性突破

文章概要:

1. 近日,微软研究院发表了一篇重磅论文,提出了一个名为EvoDiff的新型扩散模型框架,实现了直接在蛋白质序列空间进行生成和设计。
2. EvoDiff将进化尺度的数据集与扩散模型的独特条件约束能力相结合,用于蛋白质序列空间中的可控生成。
3. 研究团队进行了全面的实验验证,包括序列有效性验证、序列多样性评估、条件生成能力等方面。
4. EvoDiff具有通用性、可扩展性、高效性、可控性等显著优势,应用前景十分广阔。
5. EvoDiff开创了一个全新的蛋白质设计范式,将设计空间从结构拓展到序列。
阅读原文

双语言模型新突破:AI大模型助力解码蛋白质相分离新机制

文章概要:

1. 研究背景:蛋白质相分离是细胞内重要的生物学过程,但由于其机制复杂,预测面临挑战
2. 创新方法:采用双语言模型嵌入策略、轻量级注意力模型和数学模型设计,显著提升了预测准确性。
3. 突破性成果:在预测准确性、广泛适用性和疾病相关性研究方面取得了显著突破。
4. 技术创新点详解:对IDR构象特性、模型架构和预测能力进行了验证。
5前景:可用于疾病研究、蛋白质工程和药物开发。
6. 工具可用性:提供本地版本和在线服务器,具有用户友好界面和快速序列预测功能。
7. 总结与展望:PSTP的成功开发标志着PS预测领域的重要突破,未来研究方向包括进一步提升预测准确性、扩展应用范围和深入研究PS与疾病的关系。
阅读原文

AI多模态深度学习新突破:DeepEST模型实现细菌蛋白质功能精准预测

文章概要:

1. 研究背景:蛋白质功能对于揭示细胞生物学机制至关重要,但大量基因编码的功能仍未知。
2. 创新方法:开发了一个突破性的深度学习框架——DeepEST,通过整合蛋白质结构、基因表达和位置数据,能够准确预测细菌蛋白质的功能。
3. 实验设计与结果:在2种人类细菌病原体上进行了全面验证,包括性能优势、预测精度、功能预测深度和应用验证。
4. 技术创新点:多模态整合、迁移学习应用、掩码损失函数、GO层次结构利用。
5. 应用价值与展望:DeepEST的开发蛋白质功能预测这一关键问题提供了强有力的工具,其应用价值主要体现在功能注释、实验设计指导、药物开发等方面。
6. Q&A环节:深入解析DeepEST模型的关键技术细节,包括为什么选择使用多模态方法、如何处理和整合不同类型的输入数据、在处理GO术语预测时有什么特别、为什么强调数据分割策略的重要、在处理假设蛋白质预测时采取了什么策略、迁移学习策略具体是如何实现的、掩码损失函数具体是如何工作、如何处理不同细菌物种的特异性问题、在实际应用中的局限性是什么以及如何改进、预测结果如何验证以及其可靠性如何保证。
7. 使用方法:模型训练命令示例。
8. 技术支持:如有实现和数据相关问题,可联系giuliauzio@bsse.ethz.ch和leyden.fernandez@umu.se。
9. 项目资助:项目得到了欧盟Horizon 2020研究创新计划、瑞典研究委员会、Kempes-tiftelserna和Ume˚a大学医学院的资助。
10. 代码仓库:代码和数据可在GitHub获取: https://github.com/BorgwardtLab/DeepEST。
阅读原文

图解大模型背后的向量运算的原理

文章概要:

1. 传统数据库只能用关键字进行匹配查询,而模型实际上是可以模糊查询,实现模糊查询的答案在于神奇的运算
2. 从宠物狗说起,可以从不同角度观察他们的特征,比如体型大小、毛发的长短鼻子的、腿的、毛发的卷曲,甚至一些抽象的角度,比如服从性,攻击性等等
3. 不同的事物有不同的特征,都可以通过高维的空间的坐标值进行表达,发现这种事物的方式有美妙的特性,那些在概念上更为接近的点,在上非常聚集,在概念上不同的点在空间上更远
4.查询就是给定一个向量,然后从众多向量中找到最为相似的那一些,这就是的最近邻问题,而能实现这一点的就是最近邻搜索算法>5. 一种最容易想到的方法“暴力搜索”,一路平推过去,逐一比较和每个向量的相似度,比较两个向量的方法有许多,比如两个向量的越小越相似,可以通过计算向量夹角的余弦值来计算再比如直接计算两个向量的欧式距离,距离越近越相似
6. 有一种朴素的用寻人的例子来说明如果你在一个城市里一个,爆搜就是城市的每人,逐一比较,一定能够找到,但是花很长时间
7. 但是我们通过他胸前的红领巾就能知道,是小学生,就可以把搜索范围缩小到的所有小学,可以将千万级别的查找次数,只有几十万级别
8. 有一种称之为聚类的算法可以实现这一点在搜索的时候,只要和查询向量的聚类,搜索这个分类中的向量即可,也就实现了搜索范围的目的。但是方法的搜索质量会降低,具体就不分析了
. 本文旨在用1时间给大家一个关于向量运算的,没有什么高深的知识,帮到你
阅读原文

AI大模型助力2025年课题基金写作与申报全程指南

文章概要:

1. AI大模型影响和改变科研领域,为课题带来便捷与高效
2. 邀请郭老师讲授《AI大模型驱动课题基金写作:从选题到申报全程》专题课程
3. 课程涵盖AI大模型在课题选题及申报书撰写等环节的深度应用
4. 课程时间为202年1115日-11月26日,讲座形式为小鹅通线上直播+长期
5. 课程内容包括选题课、AI大模型辅助课题申报书撰写(一)(二)(三)、AI大模型辅助课题基金—其它部分写作
6. 专家简介:郭老师国高教育金牌讲师,吉林大学博士,南京大学博士后,,博士生导师
7. 收费标准:全套998,课前3拼团立享0元,节售价19元,团报价格:9980元(不限人数)
8. 缴费方式:个人缴费、对公转账
9. 发票事宜:交费成功并研修结束后10个工作日内,由国高信息技术产业研究院(山东)集团有限公司开具“培训费”项目的电子发票,通过邮件发送至联系人预留邮箱中
10 学习学员按照规定完成研修课时,在研修结束后10个工作日内将获得电子版“学习证书”
11. 联系方式:代:13256686570 ;0531-82977756(团报事宜)
12. 报销通知:扫码下载盖章版通知
阅读原文

他山之石丨AI大模型工具包(附研究生使用说明书).zip

文章概要:

1. 介绍了复旦国务团委学生会的官方账号
阅读原文

新课 | AI大模型驱动课题基金写作:从选题到申报全程指南

文章概要:

1. 介绍AIGC技术对科研领域的影响,大模型在课题申报中的。
2. 课程主题为AI大模型驱动课题基金写作:从选题到申报全程指南。
课程包括知名专家引领、内容全面、实战操作导向。br>4. 适用群体为对AI大模型辅助科研感兴趣的高校教师及其他人员。
5. 课程时间为2024年1月15日-1月26日,讲座形式为小鹅通线上直播+长期回放。
6. 课程包括选题课、AI大模型辅助课题申报书撰写(一)(二)()、AI大模型辅助课题基金申报—其它部分写作。
7. 专家简介:郭老师,高教育金牌讲师,吉林大学博士,南京大学博士后,,博士生导师。
8. 收费标准:全套998,课前3人团,单节售价199元,团报价格:9980元(不限人数)。
9. 缴费方式:个人缴费扫描二维码支付,对公转账账户名称为国高信息技术产业研究院(山东)集团有限公司,银行为17161000000200,开户银行为齐鲁银行济南山大北路支行。
10. 发票事宜:交费成功并在研修结束后10个工作日内,由国高信息技术产业研究院(山东)集团有限公司开具“培训费”项目的电子发票,邮件发送至联系人预留邮箱中。
11. 学习:按照规定完成研修课时,在研修结束后10个工作日内将获得电子版“学习证书”。
12. 联系方式代群:13256686570;0531-2977756(团报事宜
阅读原文

【10月月报】大模型领域动态速览

文章概要:

1. 全球科技公司纷纷入局AI大模型领域,推动版本快速迭代
2. 10月有30多个新版本的大模型推出,如Meta的Movie Gen、苹果的Depth Pro、字节跳动的GR-2机器人大模型等
3. 这些大模型在视频生成、图像生成、自然语言处理等方面具有优异的性能
4. 由于篇幅有限,本文仅展开例举了部分内容,获取更多内容,欢迎加入深蓝学院全域交流星球
阅读原文

腾讯混元模型大动作!腾讯混元大语言模型和3D模型双开源!

文章概要:

1. 腾讯混元发布了最新两款开源大模型:MoE模型“混元“以及混元3D生成大模型“ Hunyuan开发者精部署等的使用在HuggingFace、Github等技术社区下载,可商用
2. 腾讯混元Large是开源领域参数规模最大、效果最强的MoE模型之一,其参数量达到38B,参数量55上下文在多学科中地位
3 腾讯混元Large在CMMLU、MMLU、CEval、ATH等多学科综合评测以及中英文LP任务、代码和数学9Lal的开源大
4unyuan3.是业界首个能够同时支持文字与图像生成3D的开源大模型极大提升3D创作效率,3D生成技术的发展阶段
. Hun-1.量版需10即可生成高质量的3D,已在技术社区,,能够,yuan-生成和重建30无的输出,为3D创作者提供极大的> 8 腾讯基于混元3D模型标功能,的3D车,D标重建提升了91% 阅读原文

中国信通院“跨越·升级——AI Cloud MSP大模型工程化交付服务主题活动暨以标准提升交付质量推进会” 成功举办!

文章概要:

1. 2024年11月5日下午,中国信通院主办的“跨越·升级——AI Cloud MSP大模型工程交付服务主题活动暨以标准提升交付质量推进会”成功在京召开。本次会议聚焦云计算、大模型、AI云管理服务等热点话题,发布了《人工智能云管理服务能力要求 大模型工程化交付》系列标准,并启动了《大模型工程化落地的典型范式:人工智能云管理服务交付案例汇编》报告。
2. 会议举行了《大模型工程化落地的典型范式:人工智能云交付案例汇编》报告仪式,正式发布了《人工智能云管理服务能力要求 大模型化交付》系列标准,并举行了《人工智能云管理服务能力要求 大模型工程化交付》系列标准核心参编专家授牌仪式。
3. 会议还举行了产业洞察分享环节中国信通院云计算与大数据研究所云计算部主任马飞发表了《人工智能云管理服务产业洞察演讲,中国信通院云计算与大数据研究所云计算部业务主管董晓慧发表了《AI Cloud MSP之模型交付云管理服务商能力要求标准解读及评估观察》演讲,中国信通院云计算与大数据研究所云计算部业务主管王雨宣发表了《AI Cloud MSP之智算云管理服务商能力要求标准解读及评估观察》演讲。
4. 主题分享环节,中国电信股份有限公司重庆分公司 AI大模型高级开发工程师邓方进电信在AI Cloud MSP领域的应用与实践案例》主题分享,翼华科技联合创始人&首席市场官CMO雷葆华发表了《 Cloud MSP在智算中心建设中的实践探索》主题分享,深信服科技股份有限公司智能计算产品线总经理郜振锋发表了《AI大模型实践和云管理服务MSP布局介绍》主题分享。
5. 本次会议特设圆桌研讨环节,圆桌以“人工智能时代下云管理服务商面临的挑战与机遇”为主题,来自华为云计算技术有限公司混合云首席产品专家徐俊、天翼云科技有限公司重庆分公司副总经理于敉、上海理想信息产业(集团)有限公司智能云网事业部总经理徐玉清、中国移动通信集团浙江有限公司CCF高专委执委金天骄、翼华科技联合创始人及首席市场官CMO雷葆华、广州市品高软件股份有限公司副总裁程勇共同探讨了大模型工程化交付与落地过程中AI Cloud MSP厂商面临的关键实施难题、客户需求及行业交付经验,并就云厂商选择生态伙伴的重点布局及进行深入交流。
阅读原文

AI大模型全览:国内244个大AI模型及国外汇总

文章概要:

1. 文章介绍了国内44个大AI模型和国外大模型盘点
2. 文章分享了东华图书馆的《人工智能国外大模型使用手册,介绍了多个国外人工智能大模型包括GPT系列、Gemini系列、Claude系列、a、ilot以及其他一些特色模型
3. 文章介绍了系列模型(OpenAI)、Gemini系列模型(Google)、Claude模型(Anthropic)、LLaMA(Meta AI)、Copilot(GitHub、Microsoft、OpenAI)功能特点、使用方法、技巧及注意事项等内容
4. 文章介绍行业协会信息主管(CIO)分会联合数字产业创新研究中心锦囊专家以及0余家各地CIO协会、联盟等将共同起草和发布《024中国CIO&CD研究报告》,并面向全社会公开征集《2024中国CIO&CDO调查问卷》的反馈意见
5 文章介绍了凡完整者均可获得数字产业创新中心遴选的2年内国内外数字、数字化转型优质报告10!(以网盘链接形式直接发送至填写者预留的邮箱)
阅读原文

王耀南院士:AI大模型驱动的人形机器人与展望

文章概要:

1. 近日,王耀院士了题为《AI大模型驱动的人形机器人与展望》的主旨报告大模型赋能人形机器人的意义,国内外近五年研究现状,关键技术赋能具身智能人形机器人,以及未来的趋势与展望四个方面进行汇报
2. 王认为人工智能大推动人形机器人感知、认知、思考、分析、判断、推理、的智能自主作业方向发展
3. 王院士以多个案例介绍了用AI大模型赋能具身智能人形机器人和方法,提出未来在具身智能人形机器人方向上需要认知情感机理多情模型、个性化感知计算三个关键科学问题
阅读原文

沈向洋在青年科学家50²论坛的演讲:关于大模型的10个思考

文章概要:

1. 沈向洋在青年科学家50²论坛的演讲:关于大模型的10个思考
2. 算力是门槛:大模型对算力的要求,过去10年非常巨大
3. 关于数据的数据:如果有GPT-5出来,可能会上到200T的数据量
4. 大模型的下一章:有很多多模态的科研工作要做
5. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路
6. 大模型横扫千行百业:在中国的大模型建设浪潮当中,多的是行业大模型
7. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent
8. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据
9. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对
10. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者
11. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的
阅读原文

【会员动态】首发!大华星汉大模型技术全行业实战!

文章概要:

1. 介绍深圳市行业协会是由深圳市民政局正式核准的非营利性社会团体,作为全国首家人工智能行业协会,被深圳市民政局评为5A级社会组织,被深圳市人社局评为深圳市高技能人才培训基地,并建立知识产权保护工作站。
2. 协会致力于增进政企学资间互信合作,已成功举办四届深圳国际人工智能、八届中国人工智能领袖峰会、六届全球人工智能创业者大会、60余场走进标杆企业系列活动,开展60行业研究,每年编撰人工智能白皮书,发表多篇专业行业报告,出版多期行业期刊《AI时代》。
阅读原文

【会员动态】大华星汉大模型技术全行业实战!

文章概要:

1. 【会员动态】星汉大行业实战
2.人工智能行业协会是由政局的非营利性社会团体组织,被评为5A级社会组织,高技能人才培训基地,并建立知识产权保护工作站。> 3. 协会致力于增进政企学资间互信合作,已成功举办多场活动开展多项研究,编撰人工智能白皮书,发表多篇专业行业报告,出版多期行业期刊AI时代》
阅读原文

直击进博会现场,百度吴华分享文心大模型最新应用成果

文章概要:

1. 第七届中国国际进口博览会虹桥国际经济论坛“人工智能赋能新型工业化”分上海开幕,技术委员会吴华出席并发表演讲。
2 吴华,大模型学习方式与人类相似,有“先天学习”机制,也要“后天学习
3. 吴表示,大模型具有效果好、泛化性强、研发流程标准化程度高等特点引领人工智能发展,赋能新质。<> 4. 吴华以文心大模型为例,介绍了百度文心知识增强大模型技术特点和应用成果。
5. 吴华阐述了人类经历的三次工业以及第四次工业革命的特点和发展趋势。
6. 吴华介绍了大模型技术在智能交通智能创作、智慧财务等领域的应用成果。
7. 吴华,大模型技术正在为各行业注入新动能,大模型潜力正在不断释放,赋能新质生产力,为经济社会发展贡献力量。
阅读原文

【政策扶持】广州市天河区促进人工智能行业大模型产业高质量发展的若干政策措施的通知

文章概要:

1 广州市天河区科技工业和信息化局印发通知,公布《广州市天河区促进人工智能行业大产业高质量发展的政策措施》,旨在推动人工智能行业大模型产业高质量发展,打造有全国影响力的人工智能融合创新先行示范区。
2 该政策措施共包括7条,涉及支持创新联合体建设、推进开源发展、打造公共智能算力中心、强化算力要素供给、激励智能算法研发、完善数据要素体系等方面。
3. 政策措施还对软件和信息技术服务业的分类标准、纳统标准、人工智能行业大模型+企业的定义等进行了明确。
4. 政策措施涉及的扶持资金来源为天河区财政资金,实行最高限额原则,对同一支持对象同一事项或同一项目同时符合本措施其他条款或天河区其他扶持政策措施的,按照“就高不重复”的原则br> 5 政策措施自公布起30日后施行,有效期三年。
阅读原文

“AI赋能 智企未来”大模型创新应用沙龙活动顺利举办

文章概要:

115“ 智”模型沙龙举办,自贸管中德生态园委,中小企业公共服务中心支持,企服集团协办。
2. 本次沙龙活动企业数智发展需求,了华为云、浩京科技、飞书、科大讯飞等国内大模型研发与应用机构,设置了四大议题。
3 活动了专家的前沿见解和企业的实际应用案例,企业家们就大模型技术在所在行业发展应用场景、未来发展趋势等方面展开了深入交流。
下一步,才企综服集团将持续发挥自贸360度才企平台的企业和人才服务总入口优势,以片区企业实际需求为核心打造全生命周期服务体系。
阅读原文

技术观察|从大模型到AI Agent,“新工种”持续释放人工智能发展潜力

文章概要:

1. 近年来,大模型拓展,基于大模型的新、新服务、了坚实的 智能体(AI Agent)重要应用模式,可以将大模型转化为实际问题的解决能力是打通业务场景和人类交互桥梁。截至目前国内外智能体赛道已相继取得进展
3. 美国加州大学伯克利分校今年提出了BFCL测试排行榜,从多个维度模型函数调用能力,包括Single Turn和Multi Turn、Non-Live和Live、AST总结和Exec总结、幻觉评估、模型成本和延迟等
5. 早在2023年中国院便已启动智能体标准编制工作,今年4月底发布智能体技术要求与评估》系列标准
6 AI Agent是以大语言模型为大脑驱动,可以自主理解、感知、规划和使用工具,能够自动化执行完成复杂任务的智能系统。不同于传统的人工智能,它具备独立思考、调用工具去逐步完成给定目标的能力,分为单智能体和多智能体两大类
7. Agent核心具备的四个核心与模块,分别、Memory、Planning、Tools
80月18日,中国信通院全球首份《终端智能化分级研究报告》提出了终端智能体的“进化”路线
9有关机构测算202年国内智能体市场规模将82,其间年均复合增长率为72.7%。在可预见未来,AI智能体将帮助多个行业起以“+AI数字员工”为的智能化运营新常态
10. 在医疗领域,AI智能体医生进行诊断、治疗和健康在交通智能体可以通过分析数据和实时路况,交通管理和规划提供科学依据;在教育领域,AI智能体可以提供智能辅导和自适应系统,帮助学生掌握知识
阅读原文

想转行进入AI大模型领域,可以通过哪些途径来实现?

文章概要:

1. 打牢理论基础:学习数学知识、编程技能和机器学习原理。
2. 专业技能提升:参加专业培训课程,阅读学术论文,获取实战经验。
3. 建立行业联系:加入行业社群,参加行业活动,建立个人品牌。
4. 求职准备:制作简历,选择求职渠道,准备面试。
6. 学习大模型:提供了一份全面的AI大模型学习资源,包括成长路线图、学习规划、经典PDF书籍、视频教程、行业报告、项目实战和面试题。
阅读原文

李沐《大语言模型的实践经验和未来预测》

文章概要:

1. 李沐分享了他对大语言模型的实践经验和未来预测。他认为,语言模型本质上仍是一个机器学习模型,只不过换上了新的架构,并且规模更为庞大。
2. 硬件限制方面,带宽是最关键也是最难提升的环节。内存的重要性甚至超越算力,很可能在未来几年内,单个芯片内的内存容量会停滞在200GB左右,意味着模型规模一定程度上将受限于内存大小。购置GPU自建服务器的成本不会比租用GPU便宜太多,主要原因是利润大部分被NVIDIA攫取。
3. 模型规模与未来趋势方面,受限于内存和数据规模,100B到500B的模型可能会成为主流。智能手机的"杀手级应用"是短视频,然而,大模型的"杀手级应用"尚难预测,因为只有随着用户习惯的逐渐改变,新的应用形态才会涌现。音乐模型方面,未来很多会通过音乐这种形式来表达自己的思想和情感,这可能会产生巨大影响。但这不仅仅是技术问题,更是一个商业难题。
4. 模型训练与优化方面,摩尔定律依然适用,训练的成本会在线性时间内以指数级速度降低。,训练好的模型一年之后价值可能会折半。预训练和后训练同等。两年前,预训练是技术问题,如今却演变为工程问题。而后训练才是当前的技术问题。评估模型是解决任何关于模型问题的50%。
5. 数据与算法方面,只要能够收集到充足的数据,就可以实现自动化。反之,如果期望模型完成某项任务,首先需要考虑的是如何收集足够的数据。算法了的下限,数据决定模型的上限。垂直模型的通用能力至关重要。极度偏科的模型几乎不存在。
阅读原文

生成理解大一统:多模态大模型最新研究进展【附最新论文】

文章概要:

1. GPT-4o四月发布会视频理解热潮,开源领军者Q2在视频评测基准上表现出色。
2. 多模态学习领域在大一统框架和垂直场景专家模型方面取得显著进展,旨在构建统一模型架构处理多种数据模态。
3. 当前研究集中在融合不同模态信息提高模型理解和生成能力,如LLaVA模型通过线性层将图像特征到词嵌入实现视觉编码器和语言模型对齐,BLIP(Q-form)通过查询归纳模型实现更复杂的模态间交互,mPLUG-Owl3、Qwen2-VL和Emu3等模型在处理长序列、多分辨率和生成方面展现强大能力。br>4. 这些模型特定上表现出色通过案例分析展示在实际中的潜力。
5. 特邀顶会人off讲解多模态模型最新进展:大一统框架和场景专家模型解析。
6. 课程包括LLM的出现和模态领域初探、aVA与BLIP、mPLUG-Owl3、Qwen2-VLEmu3、视频理解垂类模型和进展、机器人类模型进展。
阅读原文

智绘未来,洞隐科技携手智谱共建供应链AI大模型

文章概要:

1. 204年11月06日,智谱模型合作伙伴联盟发布会在京举办,洞隐科技作为联盟首发成员企业受邀
2. 洞隐科技CEO董志刚表示,洞隐科技致力于通过创新技术,推动供应链管理的自动化、数字化与智能化。
3. 接下来,洞隐科技将结合在供应链管理的经验积累和智谱的AI技术,利用洞隐快速价值回报方法论,为客户选择高价值场景,及时见效、快速迭代,打造行业标杆。
4. 加入智谱大模型生态合作伙伴联盟对洞隐来说,是一个加速技术创新和行业应用融合的新起点。
阅读原文

腾讯混元开源最大 MoE大模型

文章概要:

1. 腾讯混元开源最大MoE大模型,拥有389B总参数和52B激活参数,共计开源三款模型,可支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。 2. 腾讯混元Large在CMMLU、MMLU、CEval、M等学科综合评测集以及中英文NLP任务、代码和数学等9大维度全面领先,超过Llama3.1、Mixtral等一流的开源大模型。 3. 腾讯混元Large混合专家(MoE)模型架构,具有路由和训练策略、长文能力优化、推理加速优化、Postrain优化、训练和精调等技术创新。
阅读原文

大模型推理的加速技术和硬件适配

文章概要:

1. 文章介绍了DataFunSummit2024:AI基础软件架构峰会,峰会含有四大重量级论坛,将聚集行业专家、学者及企业领袖,分享他们的研究成果和实践经验,探索AI基础软件架构的最新趋势与挑战
2. 文章介绍了峰会的推荐议题,包括大模型时代的挑战与机遇、N维并行和高效系统chmark和使用案例Colossal-A晨云> 3 文章介绍了的分享赢好礼活动
阅读原文

希沃助力深圳市宝安区第二期人工智能教育大模型应用体验活动

文章概要:

1 10月930日,沃深圳市宝安区教育局,在宝安中学集团)实验学校第二期“人工智能教育大模型体验活动”
2 活动现场,众多AI教育产品解决方案在宝安中学()实验学校教育体验中心展厅惊艳亮相多方关注
3. 希沃课堂智能反馈便新增PTA教学行为,课堂分析将精确希沃白板以AI一键备课为提效减负支持
4. 希沃与宝安中学集团)实验学校不久前举行校企战略合作签约,从多个层面开展深入合作,共谋打造全国智慧教育应用示范学校,探索基于数字基座平台以及智能反馈系统AI+教学、教研、数据管理新模式
5. 接下来,沃将持续创新AI应用,聚焦数字化教学教研管理输出更多之有效的AI技术工具与解决方案,深圳市宝迈向质量的发展台阶,为更加全面智能教育生态贡献自身力量
阅读原文

AI大模型赋能制造业创新发展

文章概要:

1. AI大模型作为新一代人工智能技术的集大成者以前所未有的方式重塑制造业。这种新质生产力的,主要体现在知识创新、全流程优化和人机协同三个方面br>2. AI大模型推动生产效率提升的同时,为制造业的转型提供了强大工具。通过对生产过程的建模和预测,大模型实现能源使用的实时,显著减少能源浪费
3. 随着AI大和应用不断演进,AI大模型已经逐步融入制造业的设计、生产、产品服务、人员培训、运营管理等各环节这种技术融合显著提升了制造过程智能化水平,具体实践中展示了巨大的应用潜力。
4. 虽然AI大模型制造业中显示出巨大应用潜力,但其广泛应用仍面临挑战。
阅读原文

精度1小时1公里级!湖畔实验室发布八观气象大模型

文章概要:

1. 11月6日,实验室(阿里巴巴达摩院),精度最高可达1*1公里*1小时。
2. 八观气象大通过提升对温度、照、等气象指标的性能率先落地新能源占比高的电力国网山东电力调控中心成功预测多次极端天气。<> 3. 传统气象预报耗费大量算力,受到物理模型的瓶颈制约,快速、高效地满足各行业不同准确率、分辨率的天气预需求
4. 湖畔实验室智能实验室基于在数学、时序预测、可解释AI等领域多年的技术积累,以自研的全球气象大模型为底座模型,构建区域高精度天气预报模型。> 5. 八观气象大模型通过训练和MAE掩蔽编码器结构,提供更好的初始化参数,隐藏高波动的天气下的鲁棒特征表示对天气精准。
6. 随着近年来新能源装机与并网不断攀升,高频更新的气象预报在电力行业意义凸显。
7. 今年夏季,全国平均气温为196年以来历史同期偏多,华北等地更是出现“旱急转”。在电力系统平稳应对剧烈天气变化的背后,就有AI军师”的一份贡献。br> 8. 八观气象大模型在提供通用模型能力的基础上,还针对云量、降水等关键不断提升,有望为预警、农业生产、体育等场景提供依据。
阅读原文

首个!《大模型混合云工程化交付》标准发布

文章概要:

1. 204年1月5日下午,由中国信通院主办的“跨越·升级——AI Cloud MSP大模型工程化交付服务主题活动暨以标准提升交付质量推进会”成功在京召开会上中国信通院联合华为云的多家产业单位发布了《人工智能云管理服务能力要求 大模型化交付》系列标准> 2. 该标准由中国编制,旨在提升行业标准化水平,通过标准提升带动大模型工程化质量提升,加快人工智能云计算标准体系向各行业渗透赋能
3. 华为云在大模型交付领域率先提出“大模型工程”概念即以“工程化对抗大模型交付的> 4 本次发布的《人工智能云管理服务能力要求 大模型混合云工程化交付标准,充分覆盖了政企智能化从前期需求分析、方案规划、到工程、模型工程、应用的部署与交付落地实施,后续模型的流程
5. 会议举行了《人工智能云管理能力要求 大模型工程化交付》系列核心参编专家授牌仪式。由中国信通院为华为云的企业核心参编专家授牌
6.未来,华为云将以坚定的战略耐心,深耕根技术,打造更优的模型底座和基础能力;并深入行业场景,通过工具和专业服务使能懂行的生态伙伴,与客户合作伙伴共同探索更多模型与行业结合的创新路径,共迎AI的黄金时代
阅读原文

腾讯放大招,超Meta!史上参数最大,开源专家混合模型

文章概要:

1. 腾讯开源Hun-Large,目前市面上最大基于Transformer架构的专家混合(MoE),参数达380亿。
2 Hunyuan-Large采用高效的MoE结构,共享专家和专用专家两种模式,还开发了新的回收路由策略和KV缓存压缩技术。
3. Hunyuanarge采用AdamW作为优化器,并根据批量大小调整学习率,不同专家分配不同率。
4. Hunyuan-Large使用了token数据进行预训练包括近1和多样化合成数据
. Hunyuan-Large在训练过程采用三阶段学习率调度,在退火阶段后长预训练,采用RoPE构建位置嵌入。
6. 腾讯Hunyuanarge与市面上其他超大开源模型进行综合评测,结果显示Hunyuan-Large在测试中表现超强。
阅读原文

大模型军事应用周报(第41期)

文章概要:

1. 美国防信息系统局即将测试“礼宾人工智能”平台,该平台从受控非机密信息资源中获取数据,将数据导入数据库,然后由大语言模型与该数据库进行交互后回答用户提出的问题用户获取和分析数据提供便利。
2. 美陆军测试人工智能工作平台,该平台可处理非机密信息,相关测试包括在该平台上为军事合同设置参数、上传范例、创建评判标准和审批文件等。
3. 俄罗斯研究团队提出基于GenAI的工业6.0概念,该概念是指利用生成式人工智能和大量异构机器人,实现制造流程的完全自主化。
4. 日本三菱集团推出人工智能太空再训练系统AIRIS,该系统是一款结合了地球观测相机与AI数据处理器的卫星监控系统,能够通过AI算法智能识别和跟踪目标物体。
5. ChatGPT高级语音登陆Windows和Mac平台,该功能基于GPT-4o模型开发,用户可以通过语音与ChatGPT进行更加自然的实时对话。
6. 苹果发布M4系列新型芯片,这两款芯片与今年5月发布的M4芯片一起,均采用业界领先的第二代3纳米技术制造,配备了增强的神经网络处理器和机器学习加速器,可以轻松应对包括Apple Intelligence在内的AI工作负载,还提供了长达24小时的电池续航时间。
7. OpenAI计划于2026年推出首款自研人工智能芯片,OpenAI已组建了一支约20人的芯片开发团队,其中包括曾参与谷歌Tensor处理器项目的高级工程师。
8. 谷歌发布日语版Gemma人工智能模型,该模型参数量仅有20亿,却能同时驾驭日语和英语,展现出与GPT-3.5相媲美的性能,非常适合在移动设备上运行。
9. 谷歌计划推出网页自动操作模型Project Jarvis,Jarvis将由未来版本的谷歌Gemini驱动,专门针对Chrome浏览器进行优化,可通过截屏、解析屏幕内容并自动点击按钮或输入文本,帮助用户自动化完成网页日常操作任务。
10 AI公司推出Stable Diffusion 3.5文生图模型,相比3.0版,新模型主要提升了图像质量,优化了运行速度,对本地部署和硬件需求更具弹性。
11. AI初创公司Zyphra发布Zamba2-7B模型,该模型是一款小型语言模型,在保持输出质量的同时,通过新型共享注意力架构实现了比同类模型更快的推理速度和更低的内存占用,在图像描述等任务上表现出色,能在各种边缘设备和消费级GPU上高效运行。
12. 加拿大Cohere公司推出搜索模型Embed 3,Embed 3采用统一存储架构,解决了企业需要维护多个独立数据库的困扰。
13. 智源推出多模态图像生成模型OmniGen,该模型支持多种图像生成任务,包括文本生成图像、图像编辑、主题驱动生成和视觉条件生成等,并能将经典计算机视觉任务转化为图像生成任务。
14. OpenAI开源全新基准工具SimpleQA,专门用于检测大模型回答简短事实性问题的准确性,应对语言模型经常出现的“幻觉”问题。
15. 研究发现新编码技术可绕过ChatGPT-4o安全防护,该技术将恶意指令以十六进制格式编码,ChatGPT-4o 在解码时无法识别其中的危险意图,从而绕过了安全防护机制。
16. State of AI发布2024人工智能报告,从研究进展、行业局势、现有政策、安全问题、未来预测等角度出发对人工智能行业的现状和预期进行了深度分析。
17. 开放源代码促进会发布开源人工智能定义OSAID 1.0,标志着全球首个开源人工智能标准的诞生。
阅读原文

深度丨调研180多篇论文,这篇综述终于把大模型做算法设计理清了

文章概要:

1. 本文对LLM4AD的研究进行了系统性,沿着四个维度提出了系统性分类和现有研究的回顾,讨论了使用LLMs的潜力和成就。最后探讨了当前的挑战,并提出了几个未解问题和未来研究的方向。
2. 本文对新兴领域“大语言模型用于算法设计”(LLM4AD)中现有研究工作进行系统的梳理和分类了论文收集和扫描的详细流程。
3. LLM4AD论文按照大模型的结合方法可以分为四个范式:LLMaO、LLMaP、LLMaE、LLMaD。
4. 本文综述了目前在LLM4AD中采用的搜索方法,并将其大致分为四类:基于采样方法、单点迭代的搜索方法、基于种群的搜索方法和基于不确定性的搜索方法。
5. 本文讨论了LLM4AD论文中使用的主要提示工程方法的应用情况,包括零样本、少样本、思维链、一致性和反思。
6. 本文整理了四个主要的应用领域:优化、机器学习、科学发现、工业。
7. 本文讨论了算法设计大模型、多模态LLM、人类-大模型交互、基于LLM的算法评估、理解LLM的行为、全自动算法设计、LLM4AD的标准测试集和平台等未来发展方向。
8. 本文提供了一份最新的关于大语言模型在算法设计中应用(LLM4AD)的系统性综述。
阅读原文

小红花大语言模型排行榜(2024年11月):国产第一是豆包

文章概要:

1. 文章发布了2024年11月的大语言模型,前三名是、Llama和Claude
2. 本榜单仅是对各种大语言模型当下的流行度进行排名,与它们本身特性
3. 国产第一是豆包,字节跳动是国内唯一大力投入的互联网厂商
4. 小红花大语言排行榜的全景图,往后排列的大语言模型Pixtral、Molmo、Cohere等
5. 小红花大语言模型排行榜采用的数据是1年维度内的中内容为基数,1个月维度内内容为参照,快速反映大语言模型的流行度变化
6. 小红花语言模型统计内容时间窗口短,选择受到厂商影响更少、噪音更少的博客内容,和真实的“体感”更为接近
7. 一个中文内容占比较大的大语言模型排行榜,对项目的方案选型是有参考意义的
阅读原文

大模型与搜索引擎结合:智能体、思维链和智谱AI搜索代码案例

文章概要:

1. 随着大模型的发展,它在应用场景中逐渐改变了我们的使用习惯。本文将介绍搜索引擎与大模型的集成方法,并演示如何调用智谱AI智能搜索功能。
2. 生成式AI的出现,搜索引擎开始生成、索引和分发由GenAI创建的内容。大型语言模型(LLMs)是生成式搜索系统的核心,它们可能会产生“幻觉”。
3. MindSearch(思索),模仿人类在网络信息寻求和整合中的思维,可以通过一个简单但有效的基于LLM的多代理框架实例,包括WebPlanner和WebSearcher。
4. WebPlanner模拟人类多步信息寻求的心智,作为一个动态图构建过程:它将用户查询分解为图中的原子子问题节点,并基于WebSearcher的搜索结果逐步扩展图。
5. WebSearcher负责每个子问题,执行层次化的信息检索,并为WebPlanner收集有价值的信息。
6. WebPlanner充当高级规划者,协调推理步骤和其他代理。
7. WebSearcher充当复杂的RAG(检索和生成)代理,根据搜索结果总结有价值的响应。
8. MindSearch提供了一个简单的多代理解决方案,用于处理搜索引擎的复杂信息寻求和整合任务。
9. 在搜索链中提出的SearChain框架通过LLM生成一个名为“Chain-of-QueryCoQ)”的推理链,其中每个节点由面向IR的查询-答案对组成。
10. IR验证CoQ中每个节点的答案,并在IR有高信心时纠正与检索信息不一致的答案,提高了可信度。
11. LLM可以在CoQ中指示其缺失知识,并依赖IR提供这些知识给LLM,提高了推理和知识的准确性。
12. 研究发现,在直接、基于事实的查询中,用户更倾向于使用搜索引擎,而在需要细致理解和语言处理的任务中,LLMs更受青睐。
13. 搜索引擎在事实信息检索中的主导地位:用户在需要事实数据检索的场景中更倾向于使用搜索引擎。
14. LLMs在主观和语言相关任务中的偏好:LLMs在涉及语言学习和通俗解释的场景中更受青睐。
15. 导航便捷性与对话深度:用户偏好搜索引擎的导航便捷性和LLMs的对话深度
16. LLMs在复杂查询中的增长角色:LLMs在处理复杂查询方面正在缩小与的差距。
17. 信息检索工具未来发展的影响:研究结果强调了开发结合搜索引擎和LLMs优势的工具的潜力。
18. 智谱AI专业联网搜索工具限时免费中!专业版联网搜索在传统搜索引擎网页抓取、排序的能力基础上,增强了意图识别,支持搜索结果的流式输出。
阅读原文

湖畔实验室发布八观气象大模型:精度达1小时1公里,率先落地新能源场景

文章概要:

1 1达摩院决策智能产品发布会,正式发布八观气象大,在全球气象模型基础上引入区域多源数据,时空精度最高公里*1*1小时<> 2 八观气象大模型率先落地新能源占比的电力系统,助力国网山东电力调控中心成功预测了多次极端天气,新能源发电、电力预测准确率分别提升至9%和98%以上。
3. 八观气象大模型通过预训练和孪生MAE掩蔽自编码器结构,更好的参数,隐藏高波动的鲁棒特征表示对天气的精准把握。
4.观气象大模型在提供通用模型能力的基础上还将云量降水关键指标不断提升,有望为航空预警、生产、体育赛事筹备等更多场景提供依据。
阅读原文

产业科普 | 什么是人工智能和大模型?

文章概要:

1. 人工智能通过程序或机器来、扩展和增强人类的,其核心要素包括数据、算法算力。<> 2. 大模型通常指的是大型深度学习,特别是那些在大量数据进行训练,数十亿到数千亿参数的模型,国外的知名LLM有GPT-3.5、GPT-4、PaLMClaude和LLaMA等,国内的有心一言、讯飞星火、通义千问、ChatGLM、百川等。< 3. 大模型技术架构大多采用了Transformer模型,它采用了自注意力来捕捉输入序列中的长距离依赖关系,避免了传统(NN)中存在的梯度消失。
4. 大模型典型应用场景包括AI+教育AI+医疗、AI+金融、AI+制造等。
阅读原文

产业科普 | 什么是人工智能和大模型?

文章概要:

1 随着科技发展,已成为中不可或缺的,它通过计算机程序或模拟、扩展和增强人类智能行为,模型则是庞大、参数众多的机器学习模型,处理任务
2 人工智能是广义概念,核心要素包括数据、算法和算力技术核心是和等算法,广泛。
3. 大模型指大型深度学习模型,其技术架构大多采用Transformer,目标是准确学习和理解人类语言,典型应用场景包括AI+教育、+、AI+金融、AI制造等。
阅读原文

数字化与智能化驱动制造业变革:AI大模型的力量

文章概要:

1 数字化和智能化是推动制造业变革的关键力量,AI大模型与制造环节结合,提升了生产效率,促进了转型升级。
2. 大模型赋能的核心方式包括直接赋能行业、场景化定制和任务化定制,形态包括大模型API调用或软件解决方案、成熟工业产品基础模型能力、工具作为外部插件和用于私有部署的解决方案。
3. AI大模型具有强大的能力也存在适用边界和,适用于宏观场景、具有丰富语料库和明确界定,具备深度语言创意生成、综合分析与预测以及多模态数据处理等能力。br> 4. AI大模型在制造业的应用已经取得了显著的成果,金风科技的风机故障智能诊断系统、隆基绿能基地的缺陷检测、美的厨热洗碗机工厂的合规视频检测技术等。
阅读原文

拥抱开源,腾讯构建大模型创新生态

文章概要:

1. 25年前,Eric S·Raymond提出开放源代码概念,提倡软件源代码被任何人查看、修改分发。源自此深刻影响了行业的一个。br> 2. 11月5,腾讯宣布最新的MoE模型“混元Large”混元3大模型开源,助力企业及开发者部署生成式AI应用。
3 今年5月腾讯混元DiT架构大模型并对外开源,,腾讯推出新一代大模型“混元Turbo”,从4月架构升级为混合专家模型(MOE),到11月官宣开源,腾讯混元大模型正在加速开源步伐,致力于建设行业标准,构建人工智能产业生态。
5. 腾讯混元宣布将推出全新的长文评测集企鹅卷轴(PenguinScrolls)行业各类大模型长文处理能力。<> 6. 腾讯混元开源的3D生成大模型技术方面也有后浪赶超之势,开源模型包含轻量版和,轻量仅需10即可生成高质量3D,具有强大的泛化和可控性,各类尺度物体,,花草。
7. 腾讯混元3D大权重、推理代码、模型全面开源,可供个人开发者免费使用,了现有的D生成在生成速度和泛化能力上存在不足的帮助3D和艺术家自动化生产D,是业界首个支持通过文字、图像生成3的开源模型
阅读原文

人工智能大模型多场景应用解析

文章概要:

1. 人工智能大模型多场景应用解析,包括元宇宙和生成式人工智能的思考,以及如何促进元宇宙的实现。
2. 未来战略技术,包括机器学习方法、生成式人工智能的发展趋势等。
3. 现有技术,包括学习概率分布、神经网络渲染等。
4. 技术趋势,包括从生成到推断、从平面到立体、数字人与世界模型交互等。br>5. 图像文档复杂结构建模,基于编码器模型的结构化建模、基于部首建模等。
6. 识别与生成任务中的注意力可视化,包括集外汉字生成对识别性能的影响、联合优化策略的性能分析等。
7. 错字检测与错误定位的可视化分析,包括树型解码器原理、解码依赖关系等。
8. 基于SEM表格,包括split、提取网格级别的多模态特征、merge等。
9. 处理跨行跨列表格单元,包括处理多行文本的表格单元、SOTA比对等。
10. 基于文档预训练模型,包括文档结构、PDF解析系统+图表检测模型等。
11. 模型设置,包括将整体任务拆解、训练设置等。
12. 结果包括文档图像处理中底层视觉技术,如智能文档扫描、ROI提取、形变矫正等。
13. 图像恢复-阴影去除、质量增强、智能高清、去除摩尔纹框架、手写擦除架构等。
14. 图像篡改检测,包括PS篡改检测、传统基于Exif检测PS等。
15. 总结,包括生成式人工智能的应用和发展趋势,以及如何把握这次技术变革的浪潮。
阅读原文

大模型在国产工业软件中的应用场景探索

文章概要:

1. 大模型是当前全球数字经济发展的热点和,也是人工智能重要的核心技术。本文以武汉开目信息技术股份有限公司自研的基于大模型的工艺自动生成系统为例,阐述了AI大模型在相关工业软件中的应用场景、技术难点及其解决方案。
2. 随着人工智能技术的兴起,大成为从信息化走向数智化的重要驱动力。工业软件是工业企业数智化转型升级的重要工具,也是我国智能制造的重要基础和核心支撑。
3. 国产工业软件起步较晚,核心技术掌握不足,在性能上相比国外主流产品仍有较大差距,主流软件市场仍由国外软件主导。在国家政策的推动与市场的重视下,工业软件迎来了转型升级的发展机遇。
4. 工业大模型概念应运而生,它依托基础大模型的结构和知识,融合工业行业的数据和专家经验,化、场景化、专业化的应用模型。
5. 工业大模型在工业软件中的应用场景包括研发与设计、生产与制造、售后与运维等。
6. 以武汉开目信息技术案例,分析了大在工业软件中的应用场景、技术难点及解决方案。
阅读原文

【要闻】2024年前三季度山东省人工智能大模型产业运行监测情况

文章概要:

1 山东省人工智能协会发布202年前三季度山东省人工智能大产业运行情况
2. 济南市发布新一代人工智能高质量发展(02202年)
3. 山东省人工智能协会公布科学技术
4. 中方宣布《人工智能能力建设普惠计划》
5. 海纳云智慧燃气算法,筑牢燃气安全“数字屏障”
6. 人工智能首次被写入政府工作报告,“人工智能+”各行各业
阅读原文

大模型在呼叫中心人员成长方面的作用

文章概要:

1. 名单管理在电话销售中占据核心地位,但流程中的不透明性限制了业绩增长。员工技能的提升至关重要,但管理者难以准确识别坐席的问题所在。商机挖掘是电话销售的关键,但如何将客户无缝衔接到其他项目中是一个难题。
2. 利用科技,特别是大模型技术,可以有效解决这些问题。通过打标签管理客户名单,帮助坐席建立拨打节奏,同步意向池给管理者,使其更清楚坐席的问题所在。
3. 通过细致分析名单管理数据,能够精准识别坐席的能力短板,并制定有效的提升策略。
4. 基于当前项目的会话分析,能够发掘出更多潜在的商机,为客户匹配更合适的产品和服务,提升客户的整体价值。
阅读原文

思路解析 | 大模型RAG智能问答挑战赛

文章概要:

1. 选手虢叔分享了其参与的【大模型RAG智能问答挑战赛】的Baseline代码解读,分析了RAG的技术概念,阐释了RAG技术的作用,详细解析了赛题Baseline代码构成。
2. RAG是一种结合了检索模型和生成模型的技术,它通过检索大量外部知识来辅助文本生成,从而提高大型语言模型的准确度和可靠性。
3. RAG特别适合于需要不断更新知识的知识密集型特定领域应用,它通过引入外部信息源,有效缓解了大语言模型在领域知识缺乏、信息准确性问题以及生成虚假内容等方面的挑战。
4. 代码详解包括:导入第三方包、数据处理、将语义文本转为向量、使用glm-flash定义模型、计算相似度检索支撑材料、生成txt文件。
5. 该Baseline的竞赛评分为0.3左右,基本达到了赛题预期目标。
阅读原文

圆心惠保大模型通过国家算法备案:开启智慧服务新篇章

文章概要:

1. 圆心惠保研发的惠保大模型算法通过国家审核,标志着其在算法有效性、安全性合规性等方面得到国家权威认可<> 2. 保险业数字化、智能化应用是推动行业创新发展的关键动力,传统保险“人工智能”存在智能水平不足等问题。<> 3. 圆心惠保构建了深度理解保险行业的专属通用大模型为底座、面向垂直业务领域的自研场景大模型主体的“惠保大模型”。
4. 惠保大模型技术层面具有众多优势,包括深度学习架构、自我监督和迁移学习、模型调优和高效训练、数据增强、强大的算力等。
5. “惠小”和“健康问问”等相关业务AI产品,是圆心惠保基于“模型”为智能底座推出的先进智能体工具
9. 未来圆心惠保持续以科技创新为动力,以价值创造为导向,继续加强AI大模型等数智化服务探索。
阅读原文

AI大模型行业专题报告:大模型发展迈入爆发期,开启AI新纪元

文章概要:

1. 大模型发展呈现“规模定律”,Transformer技术基座
2. ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据
3. 全球大模型竞争白热化,国产大模型能力对标GPT-3.5Turbo
4. API同质化、订阅实现难,Agent与MaaS探索破局之路
5. 大模型技术与应用发展催生海量算力需求,预计带来千亿美元市场规模
阅读原文

大模型在大数据架构、数据库管理、运维保障中的落地实践丨DAMS峰会

文章概要:

1. 介绍了第九届DAMS中国数据智能管理峰会的主题、时间、地点、指导单位和主办单位。
2 峰会设置了三个主题,分别是数据智能与数据资产管理、数据库、智能运维,每个主题都有相应的演讲和议题要点。> 3. 峰会的门票和商务合作请联系钟女士,电话为13605356邮箱为zhongminhui@dbaplus.cn。
4. 报名方式为扫描二维码,早鸟限时特惠29.9元每张。
阅读原文

大模型在ToB市场的潜力:解决方案超越技术的价值

文章概要:

1. AI大模型在ToB市场的现状:潜能尚未全面释放,企业需要一套完整的,而非单一的模型。
2. 零一万物“三体布局”应对ToB市场核心需求:通过“Infra+模型+应用三体布局,展示其在AI基础设施、核心大模型和行业应用的全栈能力
3. 从单一技术到行业定制,企业需求正趋于真正落地的“综合”解决方案,大模型可以支持跨行业的泛用性,但每个行业的需求千差万别,尤其是ToB客户更需要能深度业务流程的解决方案。
4. ToB客户的关键需求:从AI工具到优化的演进,ToB关注模型的“过程集成性——即如何将AI嵌入业务流程中<> 5 大模型ToB落地的关键在于“服务化”与“场景化”,以产品为的模式逐渐让位于以客户需求为导向的“服务化。
阅读原文

腾讯混元宣布大语言模型和3D模型正式开源!

文章概要:

1. 腾讯混元宣布最新的MoE模型“混元Large“以及混元3D大模型“ Hunyuan3D-1.0”正式开源。<>2. 腾讯混元Large是目前开源领域参数规模最大效果最好的E模型。
3. 腾讯混元3D生成大模型则是首个同时支持文字、图像生成3D的开源大模型。br>. 腾讯云TI平台和应用服务HAI也开放接入这两个模型,为模型的精调、调用及私有化部署提供一站式服务。
5. 腾讯Large模型总参数量389B,激活参数量52B ,上下文长度高达256K。7. 腾讯混元Large在Post-Train方面做了大量创新优化。
8. 腾讯Large模型专项提升的长文已经应用到腾讯AI助手腾讯元宝上。
9. 腾讯混元Large 模型已同步上架腾讯云TI平台。
10. 腾讯混元大模型PaaS平台开放支持包含混元Large 模型在内的十余种混元API 服务调用。
11. 腾讯混元3生成大模型首批开源模型包含轻量版和标准版,轻量版仅需10s即可生成高质量3D资产。
腾讯混元Hunyuan3D-1.0模型也已上架到腾讯云HAI。
13. 腾讯混元3D生成大模型的生成质量已达到开源模型的先进水平。
14. 3D生成相关技术已经开始应用于UGC 3D创作、商品素材合成、游戏3D资产生成等腾讯业务中。
15. 随着自研大模型技术强大的和应用实践经验的丰富,开源已经成为腾讯混元大模型的一个战略
阅读原文

《大模型落地路线图研究报告》系列解读(16/18):探索大模型架构优化方案,带动技术应用双重涌现

文章概要:

1. 探索大优化方案,技术应用双重涌现。
2. 底层架构迭代创新,全力突破模型发展瓶颈
3. 智能推出新,带动原生应用涌现。
4 模型技术持续更迭演进,强力助推大模型落地应用。
阅读原文

【行业分析】AI大模型行业专题报告:大模型发展迈入爆发期,开启AI新纪元

文章概要:

1. 大模型发展呈现“规模定律”,Transformer为技术基座。
2. Transformer是LLM基座,核心优势在于Self-attention机制。
3. GPT系列模型技术发展历程回顾。
4. ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据。
5. 变现:API同质化、订阅实现难,Agent与MaaS探索破局之路。
6. 算力:大模型发展催生海量算力需求,预计带来千亿美元市场规模。
阅读原文

直击进博会现场,百度吴华分享文心大模型最新应用成果

文章概要:

1. 1月5,第七届中国国际进口博览会虹桥国际经济论坛“人工智能赋能新型工业化”分论坛在开幕,百度技术委员会主席吴华出席并发表演讲。br>. 吴华介绍,大模型的方式与人类相似,有“先天学习”机制,也要“后天学习。
3. 随着技术的,大模型了人工智能的发展,具有效果好、泛化强、研发流程标准化程度高等特点。
4 以文心大模型为例,百度文心知识增强大模型从万亿数据和千亿知识中融合学习,提出了知识内化与知识外用技术,模型效果和效率显著提升。<>5. 百度在2019年3月发布了文心大模型1.,已经升级到文心大4. Turbo 版。截至目前,文心一言用户规模已破3,文心大日均调用次数超亿,处理文本ens 超1万亿。
6. 大模型技术正在为注入新动能,吴华也从人类经历的技术革命为示例阐述,人类经历的三次工业分别以机械技术、电气技术和信息技术为核心驱动力。
7. 智能交通方面,基于文心大模型事件检测准确率超9%,处置效率和信息效率提升90,帮助京雄高速管理实现跨越式变革;智能创作方面文心大模型支持百度文库100多模态 能力,累计使用次数突破22亿;智慧财务方面,跨多平台繁琐操作整合为报销智能体自动实现,操作秒级完成,报销效率提升83%,7×24h 智能服务。
. 人工智能带来科学研究范式变革,为科研创新带来更多。例如,在蛋白质结构预测中通过深度学习算法能够快速地推测蛋白质的三维结构加速了药物研发和生物学研究的进程。
9. 吴华表示,大模型技术正在为各行业注入新模型潜力正在不断释放赋能质生产力,为经济与社会发展贡献力量。
阅读原文

大模型重构生命科学!最大基础模型面世,解锁DNA超长序列,参数规模达2100亿

文章概要:

1. 生命科学领域已进入基础模型时代,今年化学诺贝尔奖授予了AlphaFold,AI+Science受到空前关注。
2. 百图生科发布全球规模最大的生命科学基础模型xTrimo V3,参数规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。4. 百图生科还建设了一站式模型平台,包括生物多模态的训练框架、生物与AI融合的计算引擎和系列工具链。
5. 百图生科的目标行业包括生物医药、生物制造、科研教育等,已积累超过300家全球,总订单超20亿美元。
6. 生命科学领域大模型正在加速落地应用,但挑战艰巨,需要生态伙伴携手来解决。
阅读原文

调研180多篇论文,这篇综述终于把大模型做算法设计理清了

文章概要:

1. 本文对4AD的研究进行了系统性回顾,包括现有研究概述、提出系统性分类和回顾、讨论使用LLMs的潜力和成就、探讨当前挑战并提出未来研究。
2. 本文引入了一个多维度分类法,将LLM4AD的作品和功能分为四个不同的维度:LLMs在算法设计中使用的四种范式、搜索方法、提示策略和应用领域。
3. 本文对LLM4AD的未来发展方向进行了探讨,包括开发领域的LLMs多模态LLMs、促进人与LLM的互动、使用LLMs进行算法评估和理解LLM行为、推进全自动算法设计,以及为系统评估LLM在算法设计中的表现基准测试。
阅读原文

大模型赋能工业智能化的机遇与挑战

文章概要:

1. 大模型为工业智能化带来了重大机遇,有望解决长期困扰工业领域的复杂性和不确定性问题。
2. 大模型在认知能力方面,专家级的复杂决策能力。在数据方面,大模型对专业性强结构复杂的工业数据理解不足,且数据要素市场不健全、隐私保护要求等因素限制了高价值工业数据的使用。
3. 未来,大模型工业领域的应用需要在提升认知能力、完善数据生态、确保安全合规等方面持续努力。同时,应注重人机协作,充分发挥大模型与人类专家各自的优势,共同推动工业智能化发展。
阅读原文

腾讯混元大模型迎来再次开源!

文章概要:

1. 腾讯开源了两个最新模型——Mo模型「混元Large」和混元3D生成大模型「Hunyuan3D-1.0」。3. 混元Large模型的能力主要体现在多语言支持、多学科综合评测、代码和数学处理等方面。
4. 混元Large模型已经在腾讯内部业务中得到了广泛的和应用,覆盖了腾讯元宝、微信公众号、小程序、微信读书、腾讯广告、腾讯游戏、腾讯会议等近70个业务和场景。
5. Hunyuan3-1.0腾讯推出的3D大模型,它D创作者和艺术家自动化生产D资产。
6. Hunyuan3D-1.0的开源内容包括模型权重、推理代码、模型算法等,为开发者和研究者提供了一个完整的工具集,可以免费。
7. HunyuanD1.0模型的性能特点包括快速生成、高保真度、泛化能力。
8. 目前,Hunyuan3D-1.0已在GitHub和Hugging Face上发布,包含模型权重、推理代码、模型算法等完整模型,可供开发者、研究者等各类用户免费使用。
阅读原文

刚刚,腾讯混元开源两大核心模型!

文章概要:

1. 腾讯混元一天内开源了2大核心模型:MoE模型“混元Large”3模型。
2. 腾讯混元Large是当前业界参数规模最大、效果最好的MoE模型在多学科综合评测集、中英文NLP、代码和数学大维度全面领先。
3. 腾讯混元Large在传统Top-K路由的上提出了随机补偿的方式,设置一个共享专家来捕获所有token所需的共同知识,还设置16需要路由的专家。
4. 腾讯混元Large使用高质量的合成数据,显著提升了模型通用效果。
.混元Large使用Grouped-Query Attention (GQA)和-Layer Attention (CLA)两种KV Cache压缩策略,大幅提升推理性能。br> 6. 腾讯3D大模型是业界首个同时支持文字、图像生成3D的大模型,强大泛能力和可控性,可重建各类尺度物体。
7. 腾讯混元3D生成大两个公开的3D数据集GSO与Omni3上效果优于主流开源模型,整体能力属于领先水平。
阅读原文

AI大模型工具包(附研究生使用说明书).zip

文章概要:

1. 文章介绍了国内多个知名AI大模型,包括文心一言、通义问、讯飞星火、Kimi、豆包和天工阐述了它们的开发者、功能、特点和推荐指数。
2. 文章提供大模型使用说明书,包括详细说明、分解复杂任务、通过提示进行推断和提供范本以供模仿等。
3. 文章还介绍了大模型在辅助文献阅读和PPT制作等方面的实用场景。
阅读原文

今年真是大模型的天下

文章概要:

1. 《大语言模型基础与前沿》由美国明尼苏达大学双城分校电子与计算机工程博士熊涛所著,本书深入涵盖大模型的广泛主题,从基础到前沿从方法到应用,从方法论到应用场景的内容。
2. 本书内容全面、系统性,适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。
3. 作者关注的不仅仅是过去和现在,里面也想激励读者展望未来,探索大语言模型前沿领域br>4. 联合多位QS前5大佬做了最新的大实战系列课,原价9元现在0元。
. 整理了前50大佬的部分现成,很多现有大模型可冲一区,大佬直接带飞!拼手!手慢!
6. 沃恩人工智能科研辅导行业中唯一一家受邀参会的公司,沃恩也在会上展示了的沃研Turbo大模型申请到特别的福利——沃恩智慧研发的沃研Turbo大模型免费使用,直接,获取限时免费福利!
阅读原文

AI大模型工具包(附研究生使用说明书).zip

文章概要:

1. 文章标题为AI大模型工具包(附研究生使用说明书).zip
2. 文章发布者为复旦研究生
3. 文章发布时间为204年11月06 11:0
阅读原文

真免费!10 款必备的语言类 AI 大模型

文章概要:

1. 文章推荐了10款好用且免费的语言类AI大模型,包括文心一言、豆包、360智脑、通义千问、讯飞星火、腾讯混元、百川大模型、天工AI、紫东太初。
2. 文章对这些AI大模型的功能和特点进行了简单介绍。
3. 文章提到ChatGPT大部分人都用不了,9款免费的AI大模型能够满足日常所需。
阅读原文

混元大模型技术报告-目前最大参数的开源大模型

文章概要:

1. 腾讯推出混元大模型Hunyuan-Large,是目前最大的开源Transformer-based大型专家模型,共有3890亿参数和520亿激活参数,能够处理高达256K的标记
2 Hunyuan-Large在各种基准测试中表现出色,其关键技术包括高质量合成数据、混合专家路由策略、键-值缓存压缩技术以及专家特定的学习率策略等
3. Hunyuan-Large的代码和检查点已发布,以促进未来的创新和应用
4. 腾讯还提供了为Hunyuan-Large模型量身定制的推理后端,基于TRT-LLM-backend和vLLM开源框架vLLM-backend,并针对增强性能进行了优化
5. Hunyuan-Large开源模型完全兼容Hugging Face格式,使研究人员和开发人员能够使用hf-deepspeed框架进行模型微调
阅读原文

大模型综合能力评测报告(附下载)

文章概要:

1. 2023年的“百模大战”中,实践者推出各类模型,如何合理评价这些模型的能力成为关键问题> 2. 清华大学基础模型研究中心联合中关村实验室研制了SuperBench大模型综合能力评测框架,旨在推动大模型技术、和生态的健康发展
3. SuperBench团队发布了2024年3月的《SuperBench大模型综合能力评测报告,选定了14个海内外具有代表性的模型进行测试
4. 报告主要结论:GPT-4系列模型和Claude-3等模型在多个能力上依然处于领先地位,国内头部大模型GLM-4和文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小
5. 自大语言模型诞生之初,评测便成为模型研究中不可或缺的一部分。随着大模型研究的发展,对其性能重点的研究也在不断迁移
阅读原文

AI模型瘦身记:从400B到40B,性能究竟掉了多少? | GPT也要"群策群力"!这个提示词方法让AI答案更可靠

文章概要:

1 大模型领域发展迅速,每天都许多有趣的论文值得深入品读。
2 涵盖超过50万次评估的研究给出了模型压缩的清晰答案,使用8位浮点数(FP8)进行压缩,模型性能完全没有损失,使用精度更低的8位整数(INT8)压缩,性能损失也1-3%,使用4位整数(INT4)仅压缩模型权重的方案,其性能竟然可以与8位整数压缩方案相媲美。
3. 研究给出了实用的部署建议:对于中小型模型,可以放心使用4位压缩;而对于在高端GPU运行的大模型,8位压缩方案则更合适。br> 4. 研究人员提出了一个叫多专家提示"(Multi-expert Prompting)方法,巧妙地解决了ChatGPT回答太片面、不够准确、有偏见的问题。
5. 采用这种"集思广益的方式后,AI的回答在真实性、等都有显著提升。
6. 这个方法效率很高,使用起来也很灵活。它不需要复杂的提示词模板,也不需要反复迭代优化答案。
阅读原文

大语言模型在法律领域:颠覆性应用探索

文章概要:

1. 大语言模型在法律领域的应用始于对其技术背景的深入理解。语言模型的发展经历了多个阶段,从最初的语言模型神经网络驱动的现代大规模语言模型
2 训练和评估是法律大语言模型的关键。在训练过程中多源异构知识数据,包括法条类、类模板类六种类型,法条和案件为中心节点构建关系图谱数据
3. 法律大语言模型的应用框架设计旨在实现多场景适配与业务协同。系统架构包括群众端和端两大模块,AI律师、AI调解员等角色,通过意图识别与调度编排实现业务全流程智慧赋能
4.应用中,大展现出强大的潜力。例如,在社会治理中,赋能提升行政效率,实现法治政府目标。在智慧审判方面,快速生成准确法律文书,提高工作效率
5 大语言模型在法律领域应用,确实有着翻天覆地的变化。它们不仅能够快速解答用户的问题,还能够协助律师进行案例分析、合同起草等工作,显著提升法律服务的效率与准确性
阅读原文

小红花大语言模型排行榜(2024年11月):国产第一是豆包

文章概要:

1. 小红花技术领袖俱乐部内容平台「小红·文摘」发布024年11月的大语言模型,前三名是GPT、Llama和Claude。
2. 本榜单仅是对各种大语言模型在当下的流行度进行排名,与它们本身的特性无关。
3. 排行榜前20名中,GPT王者地位非常稳固,豆包成为国产第一,半年后将能够确立国内绝对第一的位置br>4. 小红花大语言排行榜采用的数据是1年维度内的中短期内容为基数,1个月维度内的内容为参照,快速反映语言模型的流行度变化。
. 小红花语言模型排行榜大约有一半数据源是中文的会和基于英文的排行榜有比较大的。<>6. 小红花大语言模型排行榜统计内容时间窗口短,选择受到厂商影响更少、噪音的博客内容,真实的「体感」更为接近。
阅读原文

大模型应用:新时代的多模态交互

文章概要:

1. 大模型应用于终端设备将带来新一代交互方式,包括智能对话和多模态功能。
2. 上一代交互以文本框为主,部分产品支持语音输入,但存在信息丢失和NLU偏差的问题。<>3. 大模型时代的信息传播方式不再局限于文本框输入,还包括真正的语音交互、图片、视频和各种传感器,对话载体的多样化。
4. 语音模态方面,智谱推出了自主智能体AutoGLM及情感语音模型GLM-4-Voice,实现了与真人般的对话体验。
5. 多模态交互是大势所趋,除了语音模态,输入形式还可以到图片、视频、传感器信号、动作等。br>6. 载体终端化方面,未来的交互设备将,包括电脑、手机、电视、玩具、音箱、、手环、项链、别针等,甚至会往“无形”发展,如脑机接口。
7. 嵌入式设备交互方面,将大模型植入小型设备、家具、玩具上将改变我们的生活。
8. 玩具交互方面,FoloToy用AI改造传统行业,推出了一款儿童或老人陪伴玩具Fofo,Living AI公司研发了口袋宠物机器人Aibi,跃然创新把大模型做到毛绒玩具上,推出了BubblePal。
9. 准备AI开发套件,包含主板、音箱、摄像头、屏幕以及SD卡等设备,可以搭建简易多模态交互设备。
阅读原文

大语言模型 | 国内244个大模型及国外主要大模型汇总(收藏必备)

文章概要:

1. 国内大模型盘点(244个)
2. 国外大模型盘点。
3. 介绍GPT系列模型(OpenAI)包括其功能特点、使用方法、技巧注意事项等。br> 4. 介绍Gemini系列),包括其功能、使用方法、及事项等内容。
5. 介绍Claude系列模型(ropic),包括其功能、使用方法、技巧及注意事项等内容。
6. 介绍LLaMA(Meta AI),包括其功能、方法< 7. 介绍Copilot(GitHub、、Open其基本功能、方法等内容。
阅读原文

生成式人工智能行业专题研究:国内大模型篇:生成式AI加速创新,国内厂商聚力突破

文章概要:

1. 文章讨论了生成式人工智能行业专题研究,聚焦国内大模型篇
2.生成式AI创新,厂商聚力突破
阅读原文

大模型(LLMs)学习笔记(1)——基础知识

文章概要:

1. 介绍了目前主流的开源模型体系,包括Causal Decoder、Prefix Decoder和Encoder-Decoder,并比较了它们的区别和优缺点。
2. 解释了大模型LLM的训练目标,包括语言模型和去噪自,并探讨了涌现能力的原因。
3. 分析了大模型的优缺点,包括优点如利用无标注数据训练、生成新颖内容和具有涌现能力,以及缺点如计算资源消耗大、数据质量和安全性问题等。
4. 详细介绍 Normalization的几种变体,包括Layer Norm、RMS Norm、Deep Norm和它们的计算公式、位置以及对比。
5. 给出了FFN块的计算公式,以及GeLU、Swish等激活函数的计算公式和特点。
6. 介绍了Attention的几种变体,包括Multi-Query Attention、Grouped-query Attention和FlashAttention,并比较了它们的优缺点。
7. 解释了如何利用transformers加载Bert模型,以及如何输出Bert指定的hidden_state。
8 介绍了损失函数的几种类型,包括KL散度、交叉熵、信息增益和多分类的分类损失函数(Softmax),并比较了它们的区别和应用场景。 阅读原文

大模型(LLMs)学习笔记(1)——基础知识

文章概要:

1. 介绍了大模型的基础知识,包括主流开源模型体系、训练目标、涌现能力、优缺点等。
2. 解释了Layer Normalization的概念,包括Layer Norm、RMS Norm、Deep Norm等。
3. 介绍了激活函数的概念,包括FFN块计算公式、GeLU计算公式、Swish计算公式等。
4. 介绍了Attention的概念,包括传统Attention存在的问题、优化方向、Attention变体等。
5. 介绍了transformers函数的概念,包括如何利用transformers加载Bert模型、如何输出Bert指定hidden_state、BERT获取最后一层或每一层网络的向量输出等。
6. 介绍了损失函数的概念,包括KL散度简介、交叉熵函数、KL散度和交叉熵区别、多任务学习各loss差异过大怎么办、分类问题为什么用交叉熵损失函数不用均方误差(MSE)、什么是信息增益、多分类的分类损失函数(Softmax)、softmax和交叉熵损失怎么计算,二值交叉呢、如果softmax的e次方超过float的值了怎么办。
7. 介绍了相似度函数的概念,包括除了cosin还有哪些算相似度的方法、对比学习、对比学习负样本是否重要?负样本构造成本过高应该怎么解决?
阅读原文

2024年国内人工智能大模型汇总

文章概要:

1. 文心一言是百度基于文心大模型技术推出的生成式对话产品,将于2023年3月完成内测并面向公众开放。
2. 通义千问是阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。
3. 混元模型是腾讯自主研发的大模型,具备高性能和低能耗特点,其基础模型可支持8k-text输入长度,同时模型本身也兼具一定的推理总结能力。
4. 豆包模型是字节跳动公司开发的一种AI模型,它具有强大的自然语言处理能力,可以理解和生成人类语言。
5. 盘古大模型是华为旗下的重要人工智能模型,包括NLP模型、CV大模型、科学计算大模型等。
6. 360智脑模型是由360集团研发的人工智能模型。作为360鸿图大模型的重要组成,智脑模型拥有多项核心功能,包括多模态理解、多语言处理、知识问答、逻辑推理、多轮对话等。
7. 商量大模型是商汤科技研发的大模型,其名称取自于《周易》中的“商汤革命,顺天应人,既济之道”,寓意着这一大模型具有超凡的智慧与广泛的应用潜力。
8. 星火认知大模型是科大讯飞研发的一款重要的人工智能模型。它以中文为核心,具备跨语言理解和知识库覆盖能力,旨在解决社会重大命题,并推动产业数字化、智能化升级。
9. ChatGLMS模型是智谱AI和清华大学KEG实验室联合发布的一款前沿的大语言模型。它采用了独创的多阶段增强预训练方法,使训练更为充分。ChatGLMS不仅提升了模型性能,还大幅提高了模型的训练效率。
10. 百川大模型是百川智能推出的大模型产品,融合了意图理解、信息检索以及强化学习技术,结合有微调与人类意图对齐,在知识问答、文本创作领域表现突出。
11. “天工”模型是昆仑万维发布的基座大模型,被官方称为“大模型时代的超级应用”。
12 孟子生成式大模型(孟子 GPT)是由澜舟科技研发的一款功能强大的生成式可控大语言模型。
13. 雅意大模型是由闻弦歌推出的一款大模型,具有国产自主可控、生态开源开放、垂直领域知识增强等三大特色。
14. 九天人工智能平台提供人工智能算力、算法、数据,汇聚优秀AI能力,打造从智算基础设施、核心算法能力到智能化应用的全栈人工智能服务,全面支持自智网络等多样化运营商智慧运营需求工业、医疗、政务、教育、金融等行业客户构建创新解决方案。
15. 紫东太初是中国科学院自动化研究所和武汉人工智能研究院推出新一代多模态大模型,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。
16. 知海图AI是知海图Chat推出的新一代智能大语言模型,能与你互动对话,帮你了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感;利用海量知识数据,帮助你更好地获取信息、做出规划、解决问题。
17. “言犀”是京东智能人机交互平台,助力企业服务数智化转型,以AI技术驱动,从文字、语音到多模态交互,从对话智能到情感智能,聚焦体验、效率与转化,旨在打造新一代智能人机交互平台,面向不同行业和客户场景助力企业服务和营销实现数智化转型升级。
18. 网易AI是网易公司推出的人工智能品牌,旨在通过先进的技术和解决方案,为用户带来更加智能化的服务和体验。
阅读原文

AI大模型行业专题报告:大模型发展迈入爆发期,开启AI新纪元

文章概要:

1. 大模型发展呈现“规模定律”,Transformer为技术基座。
2. GPT系列模型技术发展历程回顾。
3. ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据。
4. 海外大模型:通用大模型竞争白热化,闭源LLM三足鼎立。
5. OpenAI:上半年重磅发布Sora,GPT-4o取得性能与实用性双突破。
6. 国产大模型:迈入爆发期,模型能力追赶GPT-4 Turbo。
. 大模型商业形态多元,B端变现模式更清晰。
8. 全球API定价呈现下降趋势。
9. 破局之路:企业级需求快速增长,MaaS助力降低模型使用门槛。
10. 大模型技术与应用发展催生海量算力需求。
11. 算力需求测算逻辑。
12. 大模型服务器成本测算。
阅读原文

一篇大模型个性化技术最新综述

文章概要:

1. 大语言模型个性化一个最近特别值得关注的话题,但是LLM个性化研究存在一个明显的割裂
2. 首次系统地连接了这两个方向,提出了一个分类体系,总结了个性化LLMs使用的关键差异和挑战,并提出了系统化的分类体系
3. 个性化大型语言(LLMs)的三层框架是指根据个性化粒度对LLMs进行分类的三个层次,每个层次针对不同的个性化目标和应用场景
4. 个性化大型语言模型(LLMs)的技术方法可以根据用户信息使用方式进行分类
阅读原文