今日AI-大模型-2024年11月17日

发现全网最新的AI内容

为什么软件开发领域的大模型可能是一条死胡同

文章概要:

1. 文章指出软件开发领域的大模型可能是一条死胡同,因为当前的人工智能系统没有与其功能有意义关联的内部结构,无法作为组件进行开发或重复使用,关注点或分段开发。
2 文章认为,使用LLM执行特定的软件开发生命周期活动存在问题,因为LLM的提供方式与汽车非常相似,缺乏可分解了计算的通用概念。
3. 文章指出,M的运行与其训练数据无法分开,安全和隐私最终成为问题,法律所有权仍然存在着问题,那些努力控制碳足迹的公司正朝着与LLM创造者相反的前进。
4. 文章认为,将大语言模型作为产品内的服务引入,除了作为产品本身之外,没有太大的未来,软件开发人员应该设计一个流程,为企业提供所需的功能,然后开发一个平台,让开发人员能够可持续地构建它。
阅读原文

2024年中国AI大模型产业发展报告解读

文章概要:

1. 2024年中国AI大模型产业发展报告解读
2. 产业发展背景:AI大模型成为推动科技创新的关键力量,政策支持和市场需求增长使其在办公、制造等领域广泛应用> 3. 产业发展现状:技术进步显著,云侧与端侧大模型发展,科大讯飞、百度、阿里巴巴等企业大模型案例展示了中国在该领域的实力和创新能力;广泛应用领域,AI大模型技术渗透到多个行业和领域,为数字化转型提供技术支持
4发展挑战:算力瓶颈,随着模型规模扩大,算力成为制约AI大模型发展的关键资源消耗,AI大模型的训练和运行需要大量能源和资源,对环境和经济造成压力;训练数据不足,高质量的数据是AI大模型性能的关键,当前训练数据不足和质量参差不齐
5. 未来发展趋势:云侧与端侧模型的分化,各自发挥不同优势,满足不同应用需求;通用与专用模型并存,根据不同行业和场景需求,提供更精准高效的服务;大模型开源,促进技术交流和合作,AI大模型技术和发展;芯片技术升级,满足大对算力的需求
6. 结论:2024年中国AI大模型产业正处于快速发展阶段,技术进步、广泛应用和政策支持为其发展提供了良好环境,同时算力瓶颈、资源消耗和训练数据不足问题亟待解决展望未来,云侧与端侧模型的分化、通用与专用的并存大模型开源和芯片技术将成为AI大模型产业的主要发展
阅读原文

800万元,大模型开发服务大单:深圳市水务集团

文章概要:

1. 202年11月15日,深圳市水务(集团)深水云脑多模态大模型开发服务项目公开招标采购,采购控制800万元
2. 该项目利用大模型技术推动人工智能与生产经营融合,提升办公效率服务水平和运营效率,保持行业领先地位
3. 招标人希望通过该项目打造国内领先的大模型水务技术体系,助力数字化架构智能化升级
阅读原文

LLM每周速递!学术最前沿:大模型应用/微调、RAG应用/优化、CoT优化、多模态等

文章概要:

1. 文章主要介绍了有关大模型(LLMs)的研究进展,包括工作流实现大模型在游戏博弈中的应用、CoT任务推理优化、大模型多任务微调、扩展LLM上下文实现图像中的应用、RAG系统能力提升、大模型在金融领域应用等热门研究
2. 文章提出了一种新型MTL:CoBa,可动态调整任务权重,各任务收敛平衡,降低计算资源,使LLMs的性能最高提升13%br>3. 文章提出了一种名为Audiobox TTAAG的新型检索增强TTA方法,通过检索音频样本作为额外条件,提供更多声学信息,生成更高质量的音频
4. 文章探讨了大型语言模型Ms)在金融领域的适应性,并发现“组合增强语言模型(CALM)能有效提升LLMs在金融中的表现
5.探讨了AG时间序列预测(TSFM)中的应用,并提出了增强预测(RAF)的新框架,通过检索相关的序列数据来提高预测准确性
. 文章提出了一个推理边界(RB)框架,系统量化并优化大语言模型(LLMs)在思维链(CoT)中的推理能力边界
7. 文章提出了一种新的混合Transformer-MAMBA模型,能有效处理长上下文,且在多模态应用中表现优于现有模型
8. 文章了“提取-精炼-检索-读取”框架:ERRR,旨在缩小LLM的预检索信息差距,通过query优化更好地满足模型的需求进而生成准确的
9 文章了VQAS评估指标及GenAI-Bench,评估图像、视频3模型在提示下的表现
. 文章提出了一种新率路径切换训练范式,包括一个主路径和多个分支路径,分别用于LLMs的最大学习率预训练和数据更新
阅读原文

揭秘大模型内部机制:蛋白质语言模型中可解释特征的发现之旅

文章概要:

1. 斯坦福大学研究团队发表论文,通过稀疏自编码器技术揭示了蛋白质语言模型内部的可解释特征,为蛋白质工程和生物发现开辟新途径。
2. 研究背景:蛋白质语言模型通过自监督学习预测蛋白质结构和功能,但其内部机制一直是黑盒。
3. 技术创新:应用稀疏自编码器从ESM-2模型中提取可解释特征,并建立分析方法。
4. 重要发现:SAE特征展现出更强的可解释性,可捕捉更多的生物学概念;特征聚类分析了特征之间的功能关系;开发了基于大语模型的自动化特征描述系统。
5. 实际应用价值:SAE特征可识别数据库中缺失的注释,预测新的结合位点,验证现有注释的准确性;可通过特征激活控制蛋白质序列生成。
局限性与未来展望目前仅限于序列预测模型的分析,复杂生物概念的操控仍具挑战性,特征解释的自动化程度需要提升。
7 工具与资源:研究团队开发并开源了InterPLM平台和代码仓库。
阅读原文

AI大模型联手ESM2,蛋白质功能预测再突破!

文章概要:

1. 上海药物研究所等机构提出一种基于多模态模型的蛋白质功能注释方法FAPM
2. FAPM在蛋白质功能方面取得了显著进展,在四个任务上与其他方法的rouge-L指标比较结果最好
3. FAPM在Swiss-Prot测试集上各个方法的详细性能对比结果最好
4. FAPM在噬菌体蛋白质预测中的应用表现出色
5. FAPM的局限性包括序列长度限制和计算资源需求,未来发展方向包括扩展预测范围和提升性能
6. FAPM在处理无同源蛋白时表现出色,其优势来源于多模态表示学习和大语言模型的泛化能力
7. FAPM的计算效率涉及模型规模和推理优化,建议使用Text Generationference和vLLM框架
8. FAPM在表示学习方面的特点是特征聚类效果和语义信息整合
9. FAPM在准确性和可解释性方面做出了创新性的平衡
10. FAPM的局限性和改进方向包括序列长度限制、计算资源需求大、推理速度相对较慢等
11. FAPM项目提供了完整的训练和推理代码,以及预训练模型
阅读原文

Protera Bio发布蛋白质大模型用于预测蛋白质-肽段结合强度排序

文章概要:

1. Protera Bio发布蛋白质大模型用于预测蛋白质强度排序
2. 研究背景:识别蛋白质-蛋白质相互作用和蛋白质-肽段相互作用的最佳结合伙伴至关重要,但现有方法依赖实验确定的相互作用数据集,误差较大 创新方法:提出基于蛋白质语言模型的无监督方法,用于对蛋白质-肽段结合强度进行排序
4. 实验验证:在5的数据集上验证了该方法的有效性
5. 性能:使用三个关键指标来评估模型性能,结果显示该方法在大多数情况下表现优异
6. 方法优势与局限性:优势包括无需标记特征工程、计算速度快、可用于筛选和过滤大量肽段突变体;局限性包括无法区分在相同位置发生突变的肽段、对某些非活性肽段的识别存在困难
7. 扩展应用:探索了该方法在蛋白质-蛋白质相互作用和对接场景中的应用9. Q&A了关于模型选择、MLM损失函数、方法表现差异、掩码重建损失计算、蛋白质-蛋白质相互作用预测局限性、参考肽段选择策略、临床应用潜力、模型处理不同长度肽段表现差异、泛化能力评估、与传统分子模拟比较等问题
10. ESM2蛋白质-肽段结合亲和力排序工具使用指南:介绍了工具的特点、环境配置、案例研究详解、使用流程、注意事项、性能优化、扩展应用、项目支持、引用格式和未来展望
11. 图片:包含了论文中的图片
阅读原文

AI大模型助力细菌蛋白质亚细胞定位预测:DeepLocPro模型准确率高达92%

文章概要:

1. 研究背景:蛋白质在细胞内的定位对于理解其功能至关重要,DeepLocPro是一个专门针对原核生物蛋白质的深度学习预测工具。
2. 模型架构与创新:DeepLocPro模型的核心创新在于利用蛋白质语言模型(pLMs)来捕捉蛋白质序列中的复杂模式。
3. 数据集构建:研究团队从两个主要来源收集数据。
4. 模型评估与结果:DeepLocPro的性能评估采用了5折嵌套交叉验证方法。
5. 与现有方法的对比:研究团队将DeepLocPro与目前广泛使用的PSORTb 3.0进行了对比。
6. 工具可用性与代码开源:DeepLocPro已经开放在线使用,训练数据集和基准测试数据集可在以下网址获取,完整的模型训练代码已在GitHub开源。
7. 研究意义与展望:本研究的重要性体现在首次将蛋白质语言模型应用于原核生物蛋白质亚细胞定位预测,建立了迄今最大的原核生物蛋白质亚细胞定位实验验证数据集,开发的工具完全开源且可在线使用。
8. Q&A环节:Q1:为什么蛋白质的亚细胞定位预测如此重要?对生物技术有什么意义?
Q2:DeepLocPro相比传统方法有什么创新之处?为什么选择使用蛋白质语言模型?
Q3:模型在预测不同位置的蛋白质时,性能为什么会有差异?
Q4:为什么古菌中的预测性能普遍低于细菌?有什么解决方案?
5模型是如何处理多重问题的?这种处理方式有什么局限性?
Q6:DeepLocPro的部署和使用有什么特殊要求?如何确保预测结果的可靠性?
Q7:如何理解模型架构中注意力机制的作用?它捕捉了什么样的生物学信息?
Q8:对于新发现的蛋白质或非模型生物中的蛋白质,DeepLocPro的预测可靠性如何?
9:模型的性能评估方法为什么选择5折嵌套交叉验证?这种方法有什么优势?
Q10:未来该研究领域可能的发展方向是什么?DeepLocPro还有哪些改进空间?
阅读原文

U35 创富密码:AI 大模型三杰如何撬动百亿估值

文章概要:

1. 南通创新区是南通市委、市政府精心雕琢的创新高地,承载着城市发展的新希望,已成为区域科技创新引领者和沪通创新资源合作的承载地。
2. 杨植麟的北京月之暗科技有限公司其打造的Kimi对话式AI助手,于223年8月一经推出,便以支持200万字无损上下文输入这一惊艳功能,迅速在竞争的大模型赛道中脱颖而出,成为用户眼中的 “明星产品”。br>3. 稀宇科技(MiniMax)在AI社交领域表现出色,其推出的ie应用打开了用户通往全新社交体验的大门。
4. 刘枢作为思谋科技的关键人物,在计算机视觉算法方面拥有丰富经验,他与贾佳亚教授等联合创办谋科技,将目光瞄准智能制造赛道。
阅读原文

大模型时代下的私有数据安全与利用

文章概要:

1. 大模型时代下的数据安全与利用问题:大模型时代下,数据安全和利用问题成为焦点。数据要素的价值在于流通,但数据滥用和安全问题需得到保障。联邦学习作为机器学习范式,适用于大模型时代。
2. 隐私计算与联邦知识迁移技术:联邦学习是一种独特的技术,允许在不泄露本地数据的情况下进行联合建模。目前存在多种保护数据隐私的方法,包括同态加密、多方安全计算和差分隐私技术。联邦学习也可以根据参与方间本地数据的切分方式进行分类。
3. 联邦知识计算平台 FLAIR:联邦知识计算平台 FLAIR 是一个面向科研的轻量级纵向联邦学习平台,支持 11 种攻击方法和 8 种防御方法。
阅读原文

中国式大模型,产业实用主义

文章概要:

1. 文章指出中国大模型行业正从技术追跑转向产业做事,注重实践和结果的实用主义成为生存之道。2. 2023年中国大模型技术经历了兴奋期的跑马圈地,包括巨头创业也存在风口炒作、模型迭代和应用场景等问题。3. 2024年大模型行业进入冷静期的落地验证,产业应用成为共识,企业在磨合中探索大模型赋能千行百业路线。4. 大模型企业需要解决新命题,升级、与产业对接、找到点。5. 大模型在产业的应用场景包括B端、G端、C端,其中B端是主战场,G端市场应用场景有政务服务、城市治理和内部办公,C端市场则以原生AI应用 大模型企业的营收来源包括B端和C端,B端市场变现方式多样但成本较高,C端市场则以免费为底,提供会员订阅与资源购买。7. 国内大模型企业在产业落地的较量中,根据自身业务选择了不同的发展路线,如百度云基建和AI原生应用,华为云大模型生于产业、服务产业,字节跳动实用就是硬道理,科大讯飞强调服务B端政企客户,蚂蚁集团专注金融大模型,AI初创企业Kimi聚集生产力场景。8. 文章认为大模型产业落地的道路充满荆棘,但产业实用主义为中国大模型带来了新空间和新机遇。
阅读原文

【东兴科技】深度:如何看待华为盘古大模型5.0?(24页PPT)

文章概要:

1 华为盘古大模型在AI领域异军突起的原因包括技术创新显著、基于华为自研架构拥有强大计算能力华为云全面建设盘古大模型全域协同生态、华为持续加大AI研发投入。
2 华为推出盘古大模型的背景是人工智能兴起、转型、市场需求多元化、自身战略部署以及竞争格局多元化的挑战
3 盘古大模型5.0的优势包括全系列、多模态升级和强思维升级。
4. 盘古大模型5.0的看点是2024年10月,中国信通院人工智能研究所联合40余家业界单位共同编制《面向行业预训练模型和应用评估方法 第6:政务大模型》华为云盘古大模型2024年首批参与对应测评,完成政务大模型标准符合性验证,当前业界最高级5)评分。br> 5. 华为盘古大模型5.0的发布将推动AI产业,包括硬件、、应用及产业链相关企业将会受益
阅读原文

大模型公司们创业未半,技术主心骨们却先弃船回大厂了?

文章概要:

1 204年下半年,AI行业的人才流动呈现出戏剧性的转折:从科技巨头出走创业后,如今又选择回流大厂
. 大厂凭借深厚的技术积累、充沛的资源和的研发投入,正在AI赛道上展现出越发明显的。而创业公司即便估值傲人,在模型研发商业落地的考验中独善>. 技术、资本与人才进行重组,创业又低调离场的,正在静默的>. 对于人才的争抢就从未过,不同的是,“卷基模”阶段,算法人才形成了一个高度封闭的圈层,的流动更像是一场“精英轮转”基本只能靠抢
5. 创业公司由于更加贴近用户,拿到更多真实的数据反馈,从而形成了市场敏感性和认知>6. 大厂有需求,创业公司走到了一个关键的淘汰期
7.创新的马太效应在AI领域表现得尤为明显
. 按照以往的经验,在这个过程中,大厂既是竞争对手,也是潜在的合作伙伴,甚至是的收购方
9 AI创业领域的“大逃亡”,揭开了一个尴尬的现实:前期创业热潮中的正在市场挤压出清,人才流动更多是创业初心与考验之间的结果
10. 有人将创业视为规避大厂竞业限制的"中转站"。还有将其视为镀金的捷径,梦想着通过运作AI项目收获一纸通往大厂的“入场券
1. 从技术创新来看,接下来一段时间的动荡中,市场正经历点状突破”“创新”的转变>1 大厂平台基础设施创业公司平台上创新。的时代的更高技术和程度要求更高
13 大厂在新的产业分工中则承担和商业化的角色。它们不仅提供基础设施支持,更重要的着教育和商业化落地的重任
阅读原文

大模型褪去野蛮生长后,百度的新思考

文章概要:

1. 百度CEO李彦宏在百度世界大会上未提及AGI和Scaling Law,引发外界对百度技术信仰的关注。
2. 李彦宏认为大模型技术的进步速度取决于视角从应用角度看,技术速度不仅放慢,趋势。
3.模型从“走出”到“货柜”,中间还有工程问题解决其中关键是幻觉”,交出的答卷是RAG。
4. 百度的技术信仰有着务实的一面,强调用新技术来解决各种现实问题。
5. 百度在利用技术解决现实问题的同时,并没有执着于闭门造车,而是倾向于和外界开发者一同探索。
6. 李彦宏提出,更合适的节奏是两年一个大版本,百度已经形成了一套范式,开发者的生态正日益壮大。
7. 百度是少数能够周期的AI企业,核心是其技术信仰,即“仰望星空,脚踏实地”。
8. 百度在发力AI时,一直都是“两条腿走路”,既探索科学技术的边界,对其充满敬畏;同时也善于利用工程能力,并积极尝试使用新技术改变世界。
阅读原文

深度学习大模型,可以这么学!

文章概要:

1. 大模型是指拥有超过10亿个参数的深度神经网络能够处理海量数据、完成各种复杂的任务,如语言处理、计算机视觉、语音识别等
2. 推荐10个原创公众号机器学习算法与Python实战、机器学习算法那些事、aggle竞赛宝典、Pythonic生物人、深度图学习与大模型LLM、机器学习实战、深度学习基础与进阶、数据STUDIO、初学者等
3 这些公众号定期会发高质量原创,涵盖统计学、数据分析、机器学习、深度学习、Python实战等
阅读原文

AI应用落地:大模型如何实现商业化路径、推动新质生产力发展?

文章概要:

产业规模预测:2年AI产业规模约2100,预计到2028年将达到8110亿元,复合年增长率为24%。短期内,API调用的增加和大模型的广泛应用将推动市场扩张,尤其在计算机视觉和语言处理领域。
2. 商业化路径展望:模型的商业化路径在企业市场主要通过基础费用、模型精调、部署和云服务等实现。目前C端市场仍缺乏代表性应用,大部分产品功能性尝试阶段。
3. 智能体在B端与C端的应用:AI体被誉为AI时代的重要规划、记忆、工具、行动和的能力。在B端,AI智能体企业的数字员工或智能助手,帮助企业实现自动化运营和生产。在C端,AI智能体主要被用于生活助手、教育助手和助手等角色,帮助提升个性化服务体验。
4. 大模型与垂直结合:模型技术在多个垂直行业中的应用正在迅速扩展。办公、零售、客服、、等领域将在未来几年内实现大模型的场景化应用,并带来转型。
5. 金融行业:AI赋能多模态数据处理,提升业务效率。AI通过分析客户数据,保险公司优化核保流程,降低成本并扩大客户群体。
6. 营销行业驱动精准化用户体验。AI自动生成广告内容,降低生产门槛,提升创意质量。
7. 文娱行业:AIGC辅助创作,产业智能化升级。AI生成创意内容,帮助影视、文学等领域创作者提高创作效率
8. 政务领域:AI助力智能化,公共服务质量。AI自动撰写报告、生成会议纪要,提升办公效率。
9. 制造行业:AI推动制造业数字化升级。AI优化生产设备运行,故障率,效率。
阅读原文

李开复:大模型toB要有新打法|非凡思考力

文章概要:

1 李带队的零一万物商业化策略,在国内优先发展B领域,“高层路线”,高管经验和人脉Boss”。
2. 李认为toB方面要深入了解客户,只做对客户极大且愿意付费、能助力其盈利的业务。br>3. 李开零一万物现在明确要,业务单一无竞争,靠信任一对一谈成,没有比价。
4. 李认为创业公司要有计划地融资和花钱,盲目将60%-80%的融资金额用于GPU,要考虑GPU是普通开销还是重点投入。
5. 李开复表示现阶段看营收规模,行业与1.0,早期看人才、论文、比赛成绩后来看产品落地速度、收入及规模化、盈利情况,这是必修课。
阅读原文

大模型的智能:提问的艺术与水平

文章概要:

1. 大的智能反馈机制类似于一面镜子,它反映出者的意图和
2. 大与的层次密切相关
3. 大模型不断自我适应用的习惯,意味着并没有一些人想象那么神奇
. 要利用模型的,需要的提问水平> 5. 大模型的智能一成不变,提问水平的直接影响
阅读原文

大模型时代下的私有数据安全与利用

文章概要:

1. 大模型时代下的数据安全与利用问题:大模型时代下,数据安全与利用面临挑战,如数据孤岛、滥用、数据泄露等。
2. 隐私计算与联邦知识迁移技术:隐私计算与联邦知识迁移技术是解决数据安全与利用问题的有效方法,如同态加密、多方安全计算、差分隐私技术等。
3. 联邦知识计算平台 FLAIR:联邦知识计算平台 FLAIR是一个基于模型中间计算结果进行知识迁移的方式,它是从VFLAIR平台演化而来的,VFLAIR即纵向联邦学习平台。
阅读原文

视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS

文章概要:

1. 卡内基梅隆大学提出视频大模型加速方法Run-Lengthization(RLT),被NeurIPS 2024选为Spotlight论文,在精度几乎没有损失的前提下,RLT可以让模型训练和推理速度提升。br>.LT的核心原理是利用视频中存在大量时间上重复的图像块这一特点,重复的图像块合并为一个token表示,总体上减少了输入的数量
3. 为了让合并后的token仍然能够反映完整的视频信息,需要给每个token长度编码
4. 由于每个视频样本计算出的token数量不尽相同,之间可能有较大差异,RLT采用了一种称为“example”方法,这一批中所有视频样本的token序列首尾相连,拼成一个超长的序列,作为Transformer的。br>. 在训练阶段,RLT对ViT-B和ViT-L两种规模的模型都有很好的加速效果,在推理阶段,也不需要额外的训练,就可以将RLT现成的tokenizer,达到很好的效果。 阅读原文

“Kimi月活超3600万”,月之暗面杨植麟透露

文章概要:

1. OpenAI发布GPT5之前,大模型公司的下一步怎么走?通用人工智能公司月之暗面创始人杨植麟分享了他的观点与思考
2. 月之暗面旗下Kimi发布新一代数学推理模型 k0-math,是Kimi 推出的首款推理能力强化
3. k0-math 模型采用强化学习和思维链推理技术,通过模拟人脑的思考和过程提升解决数学难题的
4. k0-math 模型虽然可以解答大部分有难度的数学题,但当前版本暂时无法解答 LaTeX 格式难以描述的几何图形类问题
5. 月之暗面选择的试验场景是数学,在杨植麟看来,数学是最适合AI锻炼思考能力的
6. 月之暗经历过调整,公司一开始尝试过几个产品一起做,最终发现还是要聚焦将一款产品做到最好之暗面最重要的事
. 至于目前行业密集发布的多模态产品,植麟表示公司有几个多模态能力已在内阶段,多模态最重要的与交互,而思考的重要性远大于交互
阅读原文

从模型到应用,大模型产业落地进入加速期

文章概要:

1. 百度与兰德合资成立百兰智能,作为百度智能云“AI+工业互联网”苏州产业基地,将依托“云智一体”技术优势,发掘“AI+工业互联网”新势能,打造产业升级与区域经济高质量发展新引擎。
2. 企业落地大模型的路径有三种:直接调用模型、模型应用效果优化、大模型应用开发。百度智能云千帆大模型平台3.0从模型开发、模型服务、应用开发三大维度,为企业提供全流程服务,打通模型到应用“最后一公里”。
3. 百度智能云客悦智能客服可以帮助企业更聪明地理解意图、探询用户需求和通过更高效的简单配置操作,提升客户自助解决效率与运营效率;百度智能云曦灵数字人帮助企业通过数字分身、IP塑造等2D3D数字人快速生成和便捷应用加速创新;百度GBI作为国内首个生成式商业智能产品,可以为企业BI搭建和分析的全链路提效,并支持智能报表消费和低门槛的使用,帮助企业决策者和业务人员高效开展决策支持。
4. 好未来集团CTO田密在现场提到,“利用AI老师能真正做到个性化和大规模,大模型的出现,让我们看到了一丝曙光。”作为行业知名的科技教育公司,好未来不仅运用百度百舸AI异构计算平台,为自研“九章大模型”提供关键支持,还调用文心大模型API打造中英文作文批改等能力,加速推动模型深入教育场景。
5. 在金融行业,高华证券正在尝试通过大模型模拟人类专业投资者的思维方式,进行信息处理和推理,最终为投资者形成投资组合建议。在论坛现场,华证指数、百度智能云和高华证券发布了基于大语言模型的股票指数系列——“高度指数”。
6. 智联招聘正在通过大模型帮助企业更加快速、准确、高效得完成过去冗长的招聘流程。借助百度智能云千帆大模型平台,智联招聘开发了AI招聘助手,提供全流程的招聘服务,可以凭借多轮对话能力与求职者沟通,协助HR推进招聘流程。并且,AI招聘助手7天24小时全程在线,随时满足应聘者的需求。
7. 全景医学通过百度智能云千帆大模型平台打造智能问答系统和健康管家,借助企业级RAG能力,不仅可以减少专业人工,增加效率,还能提供个性化解答和服务,提供的提醒、术后问题解答等服务。
阅读原文

Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具

文章概要:

1. 研究者提供证据表明目前LLM基本没有类似人类的符合理解和推理能力。
2. 研究者对目前最先进的7个模型进行评估,发现LLM准确性有偶然性,但答案却有很大波动。
3. 研究者测试了ChatGPT-3.5的一系列低频结构、探索语法,ChatGPT表现非常差劲。
4. 研究者强调说在语言相关任务和基准测试中的出色表现,绝不应该被用来推断LLM不仅成功完成了特定任务,还掌握了完成该任务所需的一般知识。
5. 研究者认为LLM在很多很多任务中都很有用,但它们并不能以与人类相匹配的方式理解语言。
6. 研究者认为LLM在回答医疗或法律问题时,可能依赖于一系列完全不同于人类语言认知架构的计算步骤。
7. 研究者设计了一份别致的考题,来考验LLM对语言真正的掌握程度。
8. 研究者调查了7个最先进的LLM在理解任务中的能力,发现大多数LLM在开放长度设置中,均表现较差。
9. 研究者对7个最先进的LLM进行了测试,使用的理解问题针对包含高频结构和词汇的句子,同时将语言复杂性控制在最低水平。
10. 研究者认为LLM在简单理解任务中无法提供准确且稳定答案,是因为这些模型缺乏对语言的真正理解。
阅读原文

LLM大模型在金融行业入口实践

文章概要:

1. 大模型在金融行业入口实践的主要方面包括金融风险管理、量化交易、个性化投资建议、金融欺诈检测和预防、智能客户服务、智能投顾个性化理财、智能核保和理赔、智能支付和交易、后台管理等br>2. 建设统一的AIGC应用研发框架,上层应用场景提供统一的大模型研发基础能力。
3. 利用LLM对新闻的自动处理基本面投资者进行定量分析。
4. 金融行业充满了敏感信息和潜在的风险,保护用户隐私成为了至关重要的考虑因素。
5. 金融领域Agent的应用场景包括信货、财富管理、信贷、投研、个性化教研、个性化财富管理服务、催收、数据分析等。
6. 优秀开源大模型训练微调框架,支持全参,部分参数和Lora等调优。
阅读原文

多模态大模型来了!视觉、语言、音频全覆盖

文章概要:

1. 多模态大模型是人工智能研究的热点,它可以集成和处理多种数据形式。<> 2 现有的多模态预训练模型主要集中在视觉和语言的结合上。
3. 本研究旨在通过介绍和演示多模态大模型的最新进展调优,为研究人员和从业者提供知识和技能。
4. 多模态大的核心设计包括预训练模型、大模型和指令调优。
5. 多模态大模型的创新点包括多模态数据集成和高效的调优策略。
6. 多模态大模型的设计涉及多个方面的细节,包括数据预处理、模型架构和训练方法。
7的实验部分涵盖了多模态预训练模型和大模型的任务,包括视觉语言任务。
8. 本文介绍了多模态大模型在视觉、语言音频等不同模态数据上的应用
阅读原文

自动驾驶大模型正在重塑量产格局!

文章概要:

1. 自动驾驶大模型正在重塑量产格局,长安、理想、等车企已相继上车,相关工作机会增多。
2. 大语言模型结合自动驾驶展现巨大潜力,之心推出多模态大模型实战教程,课程内容涵盖多模态大模型介绍、基础模块、通用多模态大模型、微调与强化学习、在自动驾驶中的应用以及求职专题。
3.课程适合高校研究人员与学生企业技术团队、企业技术专家和骨干以及想要转行从事大模型的同学,讲师为业内一线大厂高级算法工程师Sora
4. 课程将于2024年12月9日正式开课,购买后1年内有效,由于是在线课程,购买后不支持退款。
阅读原文

自动驾驶大模型正在重塑量产格局!

文章概要:

1. 大模型正在重塑自动驾驶量产格局,理想、长安、小鹏等车企已上车或推送相关系统。br> 2. 长安讲解了名为天枢大模型的『大脑小脑』端到端架构,与理想汽车的快慢双系统本质不谋合。br> 3. 今年以来,学术界在端到端自动驾驶领域上的大模型工作突然爆发,工业界相关融资的案例也雨后春笋快速崛起其它行业。
4 某Boss招聘上,各大公司更是开出高薪挖人。
5. 大语言模型自动驾驶作为新兴技术领域,展现着巨大的潜力和影响。
6. 自动驾驶之心进一步打造了自动驾驶多模态大模型实战教程,旨在为大家提供一个系统化的学习平台
7. 该课程的目的是帮助学习者更好地适应实际工作需要,为其进一步发展和应用打下扎实的基础。
8. 课程内容包括多模态大模型介绍、基础模块、通用多模态大模型、微调与强化学习、在自动驾驶中的应用、求职专题等
9.人群包括高校人员与学生、初创企业团队技术专家、骨干、想要转行从事大模型的同学。
1. Sora老师,业内一线大厂高级工程师,具有丰富的经验。
11. 课程收获包括掌握通用大模型的核心理论与微调技术、自动驾驶大模型在学术界&工业界的前沿算法、具备大模型微调&部署的实际能力、应用大模型解决实际问题的能力、提升科研&工作竞争力。
12. 课程所需基础包括一定的深度学习与大模型基础、Transformer模型结构、Python和PyTorch基础,具备代码读写的能力、需要自备GPU,显存不低于12G。<> 1. 开课时间为224年12月9号,购买后不支持退款,购买后1年内有效。
阅读原文