今日AI-大模型-2024年11月5日

发现全网最新的AI内容

ChatGPT4o、o1 谁才是最佳大模型?

文章概要:

1. ChatGPT模型概述:OpenAI的GPT系列目前有多个版本,如GPT-3.、GPT-4、GPT-4 Turbo、Mini、O1 Mini等,每个模型在速度、性能、价格等方面各具特色
2. 如何选择的ChatGPT模型:根据任务复杂度、响应速度控制等因素选择合适的模型。
3.AI更新细节:OpenAI不断更新和优化其模型,以提升用户体验。
PTs:定制的ChatGPT:GPTs是OpenAI新的功能,允许用户自定义ChatGPT的任务和。
5. 总结:OpenAI提供的多种ChatGPT模型都可以满足需求,选择适合的模型取决于任务复杂度、对速度成本的要求。
阅读原文

【大模型】深度解析:智能体如何突破 RAG 的三大技术瓶颈

文章概要:

1. 传统RAG的局限性:传统RAG架构依赖简单的top-k检索,在处理复杂时出明显不足,包括复杂问题处理有限信息的局限性和多步骤推理。
2. 解决RAG局限性的三类关键问题及方案:针对问题,应增加检索的范围,整个文档提供给大语言模型(LLM)进行生成;针对对比性引入查询规划,LLM对比问题分解为多个子任务,并为每个子合适的工具进行处理;多步骤推理,引入智能体层智能体的计划状态管理能力处理多步骤问题。
3. 为什么增加智能体层可以解决传统RAG的局限性:将智能体层(agentic layer)传统RAG系统中,可以极大地增强其灵活性和问题处理能力,包括更高级的推理和决策能力、工具集成与拓展能力、保持与上下文管理、迭代优化与自适应能力。
阅读原文

AI大模型新技术革命正在发生,他们将成为最成功的这一波人!

文章概要:

1. AI人工智能已经成为下一个改变世界的新技术革命,这的,它是一个可以和工业革命互联网革命媲美的革命。
2. 现阶段AI大模型的补充技术有了,但是还有上升空间,大模型在等的补充性技术Agent&AIGS<>3.的AI模型创业方向,半年或者一年内就死掉的企业,有些甚至是独角兽企业都是在卷AIGC,将AI嵌入到系统服务去,依靠底层AIG的能力与原有系统融合重塑流程和服务去完成AIG,才是正道。br>. 向量空间AI实验室全身心投入到AI大模型落地商业探索中,已经了AIGS解决方案领域国内的头部,并且完成很多落地项目
阅读原文

盘点国产十大最实用的AI大模型!(深度解析)

文章概要:

1. 百度文心大模型:包含NLP、CV和跨模态大模型,在自然语言处理、计算机视觉和跨模态领域表现出色。
2. 腾讯混元大模型:全链路自研的通用大语言模型,具备强大的中文创作能力,支持多种视频生成能力。
3. 阿里云通义千问:拥有问答、知识检索、文案创作等场景,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等核心能力。
4. 科大讯飞星火大模型:支持对话、写作、编程功能,还能提供语音交互方式,具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力等核心能力。
5. 字节跳动豆包大模型:可能集成了自然语言处理、计算机视觉和语音识别等多种AI技术,能够处理文本、图像语音等多种类型的数据。
6. 智谱华章智谱清言:专注于语言理解和生成,能够提供高质量的文本内容。
7. 华为云盘古:在多模态数据处理方面表现出色,能够处理图像、文本等多种数据类型。
8. 百川智能百小应:在智能客服领域表现出色,能够快速准确响应。
9. 月之暗面Kimi:支持200万字的无损上下文输入,能够处理复杂的对话和文档处理。
10. 360安全大模型:专注于网络安全领域,提供安全防护和威胁检测等功能。
阅读原文

国内首发!腾讯混元两大核心模型在 Gitee 正式开源

文章概要:

1. 腾讯混元大模型家族发布了两款新模型,分别是混合专家(MoE)模型Hun-Large(Hunyuan-MoE-A523D生成模型Hunyuan3D-.0,现均已在Gitee正式开源>2. Hunyuan-Large模型拥有3890亿总参数和20亿激活参数,上下文长度达256k,是当前业界参数规模最大、效果最好的Transformer架构的开源MoE模型,更适配开源框架精调和部署
. Hunyuan3-1.0业界首个同时支持文字、图像生成D的大模型,首批开源模型包含轻量版和标准版,轻量版仅需10秒即可生成高质量3D资产
4.yuan3D-1.0模型生成的第一阶段采用了一种多扩散在4秒内高效生成多视角;第二引入了一种前馈重建模型,能够在大约3秒内快速而准确地重建3D资产
. 腾讯地图已经基于腾讯混元3D大模型,发布了自定义3D导航车功能,支持用户创作个性化的3D导航车标;腾讯元宝APP也上线了3D角色梦工厂」玩法个性化的UGC 3D人物生成
阅读原文

AI大模型(LLMs)五大热点研究方向分享!

文章概要:

1. 近年来,大模型不断深入,出了多个热门方向文章为大家梳理一下AI会上五大热门研究方向,包括检索增强生成、大模型、Mamba、参数高效微调、专家模型。br>. 检索增强生成结合信息检索,大模型实时从外部获取精确的信息,使生成的内容更加准确可靠。
3 大模型Agent不仅能够自主推理,还能动态适应复杂环境,被视为智能助手的下一代形态。
4. Mamba这种选择性结构状态空间模型通过结构化信息处理,实现了,专为长序列数据设计。
5. 参数高效微调通过引入低秩矩阵来参数微调,降低了资源消耗,同时保持性能,成为资源受限环境下应用大模型的优选方法。br6. 混合专家模型通过专家网络实现大模型的按需激活”,在开销的前提下提升性能,非常适合多任务应用。
阅读原文

从谷歌、微软、百度,到Perplexity、Kimi、秘塔,大模型真的“搭”上了搜索的快车吗?

文章概要:

1. 谷歌和OpenAI发布新的AI搜索功能,Meta也被报道要来搜索领域“分蛋糕”。
3. 原生AI搜索想要取谷歌而代之的野心,装都不装了。
4. 谷歌最大的竞争优势来源于持续完善的数据积累和绝对领先的用户规模。
5. 谷歌的真面目更贴近“创新的先行者”,而非“懒惰的垄断者”
6. 谷歌在研发也丝毫不敢懈怠。
7. 谷歌、百度的AI搜索近况:概念上高歌猛进,行动中缓缓图之。
8. 谷歌搜索的AI Overviews自推出时就风波。
9. AI搜索是否会对谷歌的内容生态产生更大的负面影响,我们尚未可知。
10. 谷歌的搜索广告收入,占到公司总收入的一半以上,是妥妥的现金牛。
11. AI搜索从挑战巨头的那天起,直接颠覆了广告模式,主打起“没有广告”的概念。
12. 谷歌战胜Excite的故事,深深鼓舞了一位印度籍年轻人,他把“用户永远不犯错”视为人机交互的最基本原则。
13. AI搜索拥抱广告只是时间的问题。
14. 李彦宏说,生成式AI与搜索是天合。
15. 无论是谷歌顺利“兼容”了AI,还是AI时代的公司乘上了商业化的快车,都有待时间的检验。
阅读原文

郑纬民院士:分布式技术在大模型训练和推理中的应用

文章概要:

1. 人工智能被广泛应用于多个领域,模型的“预训练-微调”人工智能的范式。分布式技术存在于大生命周期的每,为大模型的助力。
2.数据获取环节,了文件系统SuperFS,能够同时满足低延迟和可扩展的要求。
3. 在数据预处理环节,研发了大数据处理引擎“诸葛弩”。
4. 在模型训练环节,提出了分布式检查点策略,加快了检查点文件的速度。
5. 在模型推理环节,研发了高吞吐推理方案FastDecode以及大模型推理架构Mooncake技术的应用使大模型充分利用资源训练速度,有利于人工智能领域。
阅读原文

芯朋友|无问芯穹大模型训练引擎助力壁仞科技千卡训练集群效能提升近1倍

文章概要:

1. 本周,无芯联合壁仞科技在千卡训练集群领域取得技术新突破,将大语言模型训练效能提升近1倍。
2. 无穹大模型训练引擎,面向国产集群大规模并行训练性能优化的场景,以公有云平台训练镜像的方式或私有化部署的模式提供服务,可大幅缩短训练时长、提升集群利用率。
3 壁仞科技的千卡规模训练集群已成功在无问芯穹Infini-AI异构云平台上纳管和调度,并完整验证了弹性容错、异常节点探测、检查点保存与加载、断点续训四大br> 4. 壁仞科技的“壁砺106系列”和“壁砺110系列”产品已完成与无问芯穹Infini-AI异构云平台的全面接入。
5. 无问芯穹大模型服务平台基于异构推理加速,为大模型开发者数据处理、微调、推理等便捷的模型调用API,现已上架包括CogVideoX 2B、Llama 3.1 70B、Qwen2 72B、GLM4 9B、Stable Diffusion在内的多种大语言模型、文图及文生视频模型。
6. 无问打造了连接“M种模型”和“N种”的“MxN”AI新范式,已实现多种大模型算法在多元芯片上的高效协同部署,在国产算力集群效能提升技术上积累了显著优势。br> 7. 此次无问芯壁仞科技在壁仞千卡训练集群上联合攻关,了近1倍的效能提升,是国产算力生态共建进程中的一座重要里程碑。< 8. 未来,无问芯穹将与壁仞科技继续携手,在大规模自主可控智能算力集群优化与运营深化合作,进一步提升面向商业化算力客户场景的联合服务能力。
阅读原文

芯朋友|无问芯穹大模型训练引擎助力壁仞科技千卡训练集群效能提升近1倍

文章概要:

1 无问芯穹联合壁仞千卡训练集群领域取得技术新突破,将大语言模型训练效能提升近1
2. 无问芯穹大模型训练引擎主流模型结构多元硬件集群,具备迁移便利、优化快速等优势>3. 壁仞科技的千卡规模训练已成功在无问芯穹Infini-AI异构云平台上纳管调度,实现并完整验证了四大功能
4. 壁仞科技的“壁砺106系列”和“壁110”GPU产品已完成与无问芯穹Infini-AI异构云平台的全面接入
5. 无问穹大模型平台基于异构推理加速,大模型应用开发者提供数据处理、微调、推理等快速便捷的模型调用API
6. 无问芯穹打造了连接“M种模型”“N种芯片”的“MxN”AI基础设施新范式,已实现多种大模型算法在多元芯片上的高效协同部署
7. 无问芯穹与壁仞壁仞千卡训练攻关,取得了近1倍的效能提升,国产算力生态共建进程中的一座重要里程碑
8. 未来,无问芯穹将与壁仞科技继续携手在大规模自主可控智能算力集群优化与运营等方面深化合作,进一步提升面向商业化算力客户场景服务
阅读原文

AGI|探索跨模态大模型:桥接视觉与语言的前沿技术

文章概要:

1. 随着AI技术的不断进步,纯文本语言大模型取得了显著的突破。在此基础上,一个重要的技术发展趋势是理解和生成语音、图像、图形等其他模态数据的跨模态语言大模型转变。
2. 本文将带领大家了解并实践一下跨模态大模型。包括跨模态大模型的工作原理、基础VLM模型(如CLIP和BLIP)、先进VLM模型以及动手实践(使用Qwen-VL模型进行图片描述和目标检测框输出)等内容。
3. 跨模态大模型,尤其是视觉-语言大模型,是一种结合了多维信息处理能力的技术,能够生成丰富的多模态输出。通过图像编码器和语言编码器协同工作,再加上先进的跨模态融合技术,这些模型能够实现从视觉到语言的高效转换
阅读原文

大模型落地一年后,这十个方向先跑起来

文章概要:

1. 大模型落地一年后,虽带来翻天覆地的变革,但已到了业务场景中,如营销生成、电商直播、研报生成、知识检索、互动问答、合同审查、面试招聘、代码编写等。
2. 京东云言犀大模型为代表打造的AI Agent,持续深入业务流程,走出了一条独具特色的道路。
3. 京东云言犀体平台应运而生作为一站式AI Agent开发平台,言犀智能体平台目前已接入数十个大模型,用户是否有编程基础,都可以在言犀智能体平台上低成本快速搭建基于AI模型的各类快捷应用。
4. 京东云还打造一套完善的大模型工具链,显著降低大模型训练和使用门槛。
5. 大模型正以不可阻挡之势改造一切,AI应用生态爆发式AI Agent时代加速来临。
阅读原文

​揭开大模型泡沫真相,Smartbi AIChat白泽提供精准洞察技术落地方案

文章概要:

1. 大模型在生成式AI领域发展迅猛,但在一些专业度高、应用复杂的行业,人们觉得它的价格和价值之间差距太大,形成了泡沫。
2. 很多引入智能问答式BI的企业就很失望,因为投入的成本和实际落地效果并不匹配。
3. 智能问答式BI产品通常依赖NL2SQL技术,用户能够快速地构建系统并回答简单问题,也确实降低了分析门槛。不过,人们发现,在面对复杂的业务需求时,它根本无法灵活和准确地提供洞察。
4. 要打破泡沫,实现智能BI的精准洞察,关键在于降低训练成本的同时,提高对各种复杂业务场景的准确性。而要解决准确性问题,智能BI厂商需要脚踏实地,把卓越的BI能力和先进的AI能力结合,这就是白泽技术方案的核心理念。
5. 白泽AI基于指标模型获得统一可信的全域数据,结合全面的RAG增强LLM在业务理解、映射、SQL生成的准确性,同时借助AI Agent灵活扩展分析能力。通过不断的反思优化,白泽越用越聪明,越用越准确。
6. 数据模型能够整合多种,包括线上和线下的数据,甚至可以跨数据库整合。这使得所有查询结果都能统一,形成一致的数据。
7. 数据模型还具备强大的计算能力,支持SQL计算、ETL分布式计算和MDX计算,能快速处理各种复杂计算,如同比、环比分析、时间智能分析和TopN分析。
8. 基于数据模型,还能轻松地配置数据权限,实现金融级别数据管控,确保数据绝对安全。
9. 白泽AI不仅能精准实现诸如多轮对话、图形展示等常见场景,还能驾驭时间智能计算、多事实表查询、归因预测等多种复杂的业务场景。目前,初次使用即可达到 80-90% 的准确度,且不会产生数据错误或权限漏洞。稍微进行 RAG 微调,准确率进一步提升,在特定场景下可达 99%。
阅读原文

喜报|“柯基KG大模型算法”在国家网信办成功备案

文章概要:

1. 南京基大获得深度合成服务备案。
柯基KG大基于知识图谱增强技术的大模型,具有解释br3. 柯基KG属于生成合成类算法,经过预训练和微调的语言模型对医药领域文本进行自动化信息抽取信息总结和问答
4 柯近期推出了自研的PharmCopilotGenAI的合规CP科研新产品。. 柯基自研的模型算法已在医药、工业制造、文献情报教育科研等业务场景实现以下:系统、自动摘要、信息抽取、写作助手、翻译系统、推广素材生成。 阅读原文

一图了解 | 2024年度人工智能大模型金融领域示范场景及创新应用案例征集宣传展示活动

文章概要:

1 标题:一图了解 24年度人工智能大模型金融领域示范场景及创新应用案例征集宣传展示活动> 2. 内容:关于开展202人工智能大模型金融领域示范场景和创新应用案例宣传活动的.pdf 4. 附件2上海人工智能金融领域创新应用案例申报表.docx
. 供稿:金融科技联盟秘书处
阅读原文

共建行业生态,智谱大模型生态合作伙伴联盟成立

文章概要:

1. 11月5日,智谱在北京举办“智谱大生态合作伙伴联盟发布会”,联合11家行业合作伙伴,共同成立智谱大模型生态合作伙伴联盟」,覆盖从协同办公、营销、客服、数据分析、人力资源、知识管理、供应链管理,到硬件产品及行业整体解决方案等多个领域,旨在携手合作伙伴,通过资源整合、技术共享及市场协同,共同构建行业生态,真正推动大模型的产业落地。
2. 智谱副总裁吴玮杰以“智绘未来,共谱华章”为,向大家分享了智谱的AGI之路与未来愿景。
3. 蒙牛集团、微盛、沃丰科技作为智谱合作伙伴,以智谱GLM系列模型为基座,结合企业个性化业务需求,打造并落地了多项大模型应用成果。br> 4. 圆桌对话环节,智谱副总裁吴玮杰与北森云计算创始人、董事长王朝晖、泛微网络执行总裁王晨志、思迈特Smartbi CEO姚诗成及联想中国方案服务业务群高级总监顾旭光,围绕“模型应用的昨天、今天和”为主题深入探讨。
5. 在本次发布会中,智谱重磅发布《“智能新物种”未来企业蓝图—智谱GLM白皮书》。该白皮书系统阐述GLM系列大模型在各行各业中的应用场景和赋能方向,并佐以AI大模型商业化案例为支撑,为实施企业AI数智化转型的管理者提供务实指引,为业界贡献AI融合企业发展的解决框架。
6 智谱模型生态合作伙伴联盟将依托强大的GLM系列大模型和模态模型技术,联合打造“企业AI工具箱”,先进的模型技术融入生态合作伙伴产品,实现AI到场景的落地。
7. 智谱携手联想集团、飞书、泛、北森、蒙牛集团、沃丰科技、思迈特Smartbi、盛鸿翼、瀛之杰和洞隐等十一家合作伙伴,登台启动智谱大模型生态发布仪式,正式揭开智能互联的全新篇章
阅读原文

关于通义千问、讯飞星火、豆包、Kimi、文心一言、智谱清言等国内外主流AI大模型的使用对比分析

文章概要:

1. 大型预训练模型已成为推动科技进步的重要力量,应用于自然语言、计算机视觉、语音识别等领域。br>2. 文章对比分析了通义千问、星火豆包、K、心一言、智谱清言等国内外AI大模型的数据来源、技术细节、特点和应用前景。
3. 大模型的发展趋势包括多模态能力的、可解释性和安全性的提高以及行业定制化。
阅读原文

基于AX650N/AX630C部署多模态大模型InternVL2-1B

文章概要:

1. 本文介绍了多模态大模型InternVL1B的技术特点
2. 分享了基于爱芯元智AX650、AX630C两款端侧AI芯片适配InternVL1B的基本操作方法
3 介绍了InternVL2-1B的技术特性,包括多能力、轻量化设计、式对齐训练策略、的架构设计、支持多种下游任务、开放源代码与模型权重等
4 给出了InternVL2-1的GitHub地址、官方博客、在线DEMO等信息
5. 介绍了VL2-1B性能指标
阅读原文

喜讯 | 博汇大模型再次上榜国家网信办备案名单 !

文章概要:

1. 博汇科技自主研发的「博汇慧视模态通过国家网信合成备案算法的有效性、安全性和合规性再次权威。
2. 「博慧视多大算法是音视频分析生成算法。通过算法对文本、、、图像的精准检索和关联分析,面向海量资源、敏感内容发现能力有效提高了模态检索的能力。
3.作为模型领域践行者,卓越的技术实力人工智能大通过AI核心技术的迭代,进一步的,为行业用户提供更加精准、高效、全方位的技术解决方案。
阅读原文

AI安全赛道 | 真正的技术考验,大模型安全问题如何破?(文末抽奖)

文章概要:

1. 由奇安信集团、清华大学、蚂蚁集团的DataCon2024大数据安全分析竞赛报名即将进入倒计时阶段1月11日报名结束
2. 本届比赛设置五大赛道,包括AI安全赛道、软件供应链安全赛道、网络基础设施安全赛道、网络黑产分析赛道和漏洞分析赛道。本期为大家详细介绍AI安全赛道相关内容,AI安全赛道包括大模型幻觉触发与缓解和大语言模型多轮对话越狱挑战两项挑战
3. 大模型幻觉触发与缓解挑战要求参赛者设计一个幻觉诱导方法和一个完整的检索增强方法RAG,通过设计多层次的任务,既考验参赛者的理论基础和实践能力,又强调技术在实际应用中的可行性和有效性
4. 大语言模型多轮对话越狱挑战要求参赛者在黑盒场景下,设计出一个有效的多轮对话越狱诱导方法,旨在帮助选手识别LLM在多轮对话中的安全漏洞,并提升自动化越狱诱导的设计,促进LLM在实际应用中的安全性
5. 出题大家带来《大模型的安全》相关内容,并推荐9篇必读论文
6. 关注DataCon公众号+分享本篇文章至朋友圈或网络安全相关社群,可获得抽奖资格,即可赢取DataCon2024定制服饰
阅读原文

【要闻】2024年前三季度山东省人工智能大模型产业运行监测情况

文章概要:

该内容已被发布者删除
阅读原文

报告分享 | 2024交互型多模态大模型研究进展、应用前景以及商业模式分析报告(内附下载)

文章概要:

1. 该文章是关于2024型多模态大模型研究进展、应用前景以及商业模式分析报告分享
2. 文章提供了报告内容的节选,并表示可下载完整版PDF查看更多内容
3. 文末附下载方式
阅读原文

手搓AI大模型应用获25万用户,果断辞职创业,结果收入不如摆摊

文章概要:

1. 一位Reddit用户mmoustafa去年开始开发通用AI个人助理olly.bot,该应用OpenAI的大模型,有25万用户,但在收费后,每周活跃从7万瞬间下降到9千,每月4美元的用户400人左右
2. 网友建议永远不要让免费产品付费,一开始就应该推出付费产品,或者进行试用,人们知道试用期结束付费
3. 一位网友指出,对于免费增值业务模式来说,.7%的付费用户百分比非常低意味着人们使用该产品是因为它是免费的
4. 去年3月,OpenAI推出了ChatGPT,并按照使用量收费调用价格比一代90%,让很多个人开发者发现了新技术商业化的途径
. 到目前为止,虽然各家大模型公司提供的API已经降价了还鲜有出现靠大模型应用来致富的出现
6. 上周四OpenAIChatGPT search已正式发布,未来免费版用户也会获得使用权限
阅读原文

让知识流通起来,天工AI大模型高级搜索功能上线,很强!

文章概要:

1 11月日,OpenAI宣布为ChatGPT推出了最新的人工智能搜索体验。11月日国内大模型厂商昆仑万维官宣发布天工高级搜索功能,上线即人人可用,使用次数。
2. 天工搜索的亮点内容包括:全面升级多层次分析推理能力、升级的金融投资专业AI搜索、升级的学术专业AI搜索、针对文档AI阅读分析的智能优化。
3. 浮点运算公司是一家专注人工智能算力网络服务的公司,致力于成为中国领先人工智能算。
阅读原文

【虚拟专题】医学大语言模型

文章概要:

1. 本文是《医学信息学杂志》公众号的文章,主要介绍了该刊基本信息、最新动态、联系方式等,同时提供国内外最新医学信息研究动态、发展前沿等,搭建编者、作者、读者之间沟通、交流的平台。
2. 文章甄选了《医学信息学的医学大语言模型方面的相关优质文章,包括《医疗健康大语言模型的发展、挑战与对齐》《大语言模型在医疗领域的前沿研究与创新应用》《大语言模型临床实践应用范围综述》等,欢迎广大学者下载阅读。
阅读原文

玩转AI~超好用的AIGC工具推荐及实用技巧!

文章概要:

1. 介绍了AIG人工智能生成它是利用AI技术,通过对大量数据的训练,自动生成各种类型的内容,包括文本、、音频、视频等。
2. 列举了常用的AIGC工具,如ChatGPT、Claude、ichat、智谱清言心一言、豆包雀大、义问、腾讯等br> 讲解了筛选AIGC,首先要明确自己需求,然后再去寻找和了解AIG,评测自己选择的产品使用使用成本如何。
4. 以Kimi为例,讲解了玩转AIGC工具,包括信息搜索整合高效阅读辅助、文件处理、辅助创作编程助手等功能。
阅读原文

AI大模型(LLMs)五大热点研究方向分享!

文章概要:

1. 图灵是A股上市公司创业黑马旗下的事业部,专业为机算机/人工智能领域以及与其他学科的交叉研究的中国在校本科生、研究生、博士生,海外留学生等提供SCI、CCF论文保录辅导,RA实习、名校申博服务
2. 近年来,人工智能大模型LLMs)的研究不断深入,衍生出了多个热门方向,聚焦提升模型的性能、适应性与应用场景,推动了技术的突破与革新
3. 文章为大家梳理了AI顶会上的五大热门研究方向,包括检索增强生成(RAG)模型、Mamba、参数高效微调(LoRA)、混合专家模型(MoE)
4.灵学术的科学家团队可以为中国科研工作者提供全生命周期的科研服务,助力中国AI综合实力实现飞跃式提升
5. 如果想发表SCI/CCF论文,可以向Best Paper得主等大牛直接请教
阅读原文

AI大模型(LLMs)五大热点研究方向分享!

文章概要:

1. 图灵学术是A股上市公司创业黑马旗下的独立事业部,为机算机/人工智能领域以及人工智能与其他学科的交叉研究方向的在校本科生、研究生、博士生海外留学生等提供、CCF论文录辅导,RA实习、名校申博服务
2. 近年来,人工智能大模型LLMs)研究不断深入,衍生出了多个热门方向,聚焦提升模型的性能、适应性与应用场景推动了技术突破与革新
3.增强生成(RAG)结合信息检索,帮助大模型实时从外部知识库获取的信息,生成的更加准确可靠
4. 基于大模型构建多功能、能自我决策的模型正成为趋势。大模型不仅能够自主推理,还能适应复杂环境,被视为智能助手的下一代形态
5. Mamba这种选择性结构状态空间模型(SSM结构化信息处理实现了高效并行训练,长序列数据设计
7 MoE(混合专家模型)专家网络实现大模型参数的“按需激活”,在减少计算开销的前提下提升性能,非常适合多任务应用
8. 如果你正在为发表SCI/CCF论文,发愁没选题、没idea的一定抓紧申请,扫我下方的微信联系我目前每位导师仅剩-3个名额,先到先得,把握住每一次和导师沟通的机会!
阅读原文

喜报|“柯基KG大模型算法”在国家网信办成功备案

文章概要:

1. 南京柯基数据科技有限公司自主研发的“柯基KG大算法”获境内深度合成服务算法备案。
2. 柯基KG大模型是基于知识图谱增强技术的新一代大模型,有更强的推理能力和更好的解释性。
4. 柯基大模型医学领域的落地实践中进行了推广及应用,柯基数据近期推出了自研的PharmCopilot基于GenAI的合规医学营销及CP科研人工智能新产品。
5. PharmCopilot医学场景,多模态医学、医学内容自动生成与合规审核、内容多渠道传递等方面。<> 6 目前,柯基数据的模型算法已在医药、工业制造、文献情报、教育科研等业务场景实现问答系统、自动摘要、信息抽取、写作助手、翻译系统、推广素材生成等应用目标。
7. 成功备案一个起点,柯基数据将加大对“基KG大模型”研发投入,提升其性能表现,积极与各界合作,探索知识图谱增强大模型在更多领域的应用。
阅读原文

ModelEngine使能医疗大模型创新,加速医疗智能化

文章概要:

1. 2024年11月05日,202四川大学华西医院管理大会在成都召开,华为数据管理产品部部长陈默受邀出席并发表主题演讲。
2. 陈默博士表示企业应用的AI改造是继分布式、原生之后第三潮华为ModelEngine构建了数据和应用飞轮能力,是企业应用AI改造的利器
3. ModelEngine数据飞轮为“华西黉医”医学大模型病历助手提供高精准数据保障,使模型“越用越聪明”。
4. ModelEngine应用飞轮作为临床医生与AI交互的主入口,实现了医生及患者语音、检查检验用药信息、大模型病历内容、医生引用及反馈等全流程覆盖,了“非入侵式”的HIS系统AI改造。
5. ModelEngine包含了化调度、以存强、虚拟化等黑科技,最大化AI资源利用。
6. 未来,ModelEngine也将不断改进和创新,将技术与场景应用深度融合,为更多行业应用AI改造提供一站式AI工具链,推动人工智能高质量发展。
阅读原文

大模型之于网络运维的“双城记”:该以怎样的姿态面对AI新技术?

文章概要:

1. 运维引入AI比大多数人想象的早,在大模型出现之前,IOps主要依赖预置指令,设计好的任务完成一些运维工作
2. 大模型可以让运维领域“说人话,但也存在缺乏特定知识、无法深入分析告警关联性、问答过程有长度限制回答等问题
3. 大代表着新生产力,其引入网络运维领域是必然,先行者不犹豫,华为在运维领域的实践,正对应业界所需>4. 网络是接数据算力智能应用的纽带,也是产业更新、经济的组成自动驾驶网络正在驶向属于自己的奇点时刻
阅读原文

精选文章||大模型及其在材料科学中的应用与展望

文章概要:

. 大模型概述:介绍大模型的基本概念、发展过程、技术分类与特点等内容,包括深度无监督表征学习、自注意力模型、大模型的特点和分类。
2. 大模型的应用:从通用领域大模型和垂直领域大模型两个角度,总结了大模型的应用,列举分析了应用场景和功能。
3. 大模型在材料学中的应用现状与机遇:大模型在材料科学中的应用关键点包括材料信息的自动提取与挖掘、材料性能预测与优化、新材料的发现和材料知识图谱的构建。
4. 总结与展望:总结了大模型在材料科学领域的挑战并对未来工作进行了展望,包括材料科学语言大模型、视觉大模型和通用大模型的发展方向。
阅读原文

东华&清华联合开发!国内首个纤维知识大模型正式发布

文章概要:

1. 2024年11月05日东华大学联合清华大学开发的国内纤维知识大模型中国纤贝(Alphaiber 1.0)正式
2 中国纤贝(AlphaFiber 1.0)能够帮助解释的纤维科学概念,拓展教学方式,为教师和精准个性化指导,将推动教育模式的变革
3. 中国纤贝(AlphaFiber.0)诞生主要来自大学和清华大学跨领域合作,结合了东华大学材料学院、纤维材料改性国家重点实验室的数据资源和集先进纤维研究所有限公司的支持
阅读原文

腾讯悄悄开源了两款大模型,他们快成中国的Meta了。

文章概要:

1. 腾讯混元召开闭门发布会,宣布开源两款大模型:MoE模型“混元Large”和混元3D大模型“Hunyuan3-1.0”,即将开源长文本评测数据集“企鹅卷轴”。
2. 混元Large是目前开源的最大、效果最好的E模型,总参数量38B,激活参数量52B上下文长度高达25K。
3. Hunyuan3D-1.0开源的 3D大模型,文3D和图生D,开源版本有标准版和轻量,量版10s就能生成一个D模型。
4.卷轴是一个关于长的集,评测长文本的衰减,即将开源。
阅读原文

首批 | 联通智网完成中国信通院“交通大模型通用技术与应用支撑能力要求”评估!

文章概要:

1. 党的二十大报告强调要加快建设交通强国、数字中国,数字交通是云计算等新一代信息技术交通运输深度融合的新业态。
2. 中国信通院联合业内企业编制完成《交通大模型通用技术与应用支撑能力要求》标准,该包括交通大模型生产能力等五大能力域,推动交通大模型的和标准化落地。
联通智网语言交通大模型完成《交通大模型通用技术与应用支撑能力要求》标准中场景层能力要求评估,在交通大模型及交通数字方向技术与实践优势。
4. 联通智股份有限公司成立于2015年是中国联通集团控股子公司,“联网通信、算网数智”,为汽车行业客户以及广大车主数字化、智能化、一体化的产品及服务。
5. 联通智网联合优势资源打造基于视觉语言大模型应用系统该系统应用在中,既能精准识别动静态交通参与者的属性和位姿信息,能对复杂的交通事件进行有效识别。
阅读原文

大模型入门

文章概要:

1. 《大语言模型与前沿》美国明尼达大学双城分校电子与工程博士熊涛所著
2. 本书深入涵盖大语言模型的广泛,从基础到前沿,从方法到应用,涉及从方法论到应用场景方方面面的内容
3. 本书内容全面、系统性强,适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考
4. 本书作者关注的不仅仅是过去和现在,里面也想激励未来,探索大语言模型的前沿领域
5. 大语言模型的迅猛发展引起了世界各国学术界高度重视,掌握大模型发展俨然是人工智能未来的趋势
6. 沃恩智慧是人工智能科研辅导行业中唯一一家受邀参会的公司,恩也在会上展示了他们的沃研Turbo模型
7 这次申请到特别的福利——沃恩智慧研发的沃研Turbo大模型限时免费使用福利
阅读原文

腾讯3D大模型全面开源,文本图像10秒转3D资产,模型权重、推理代码全开放

文章概要:

1. 腾讯推出Hunyuan3D-1.0,开源轻量版和标准版两个模型,最快10秒就能端到端生成3D资产
2. Hunyuan3D-0采用多视图生成、多视图重建两阶段生成方法,在两个公开3D数据集上定量评估3D生成质量表现总体最优
3. 腾讯3D大模型正在落地应用中,腾讯发布了自定义3D导航车标功能,腾讯元宝APP上线了“3D角色梦工厂”
4. 3D生成技术今年已进入快速发展阶段,3D AIGC作为新的生产力工具,能为复杂的传统3D制作流程提效,可应用于游戏、工业制造、社交娱乐等领域,未来可能与机器人等领域结合,赋能空间智能
5. 「2024年度评选」已开启报名通道,评选从企业、人物、产品三大维度设立了5类奖项
阅读原文

ReST-MCTS*!强化自训练,让大模型持续「升级」

文章概要:

1. ReST-MCT*是一种强化自训练方法,通过树搜索MCTS*指导过程奖励,规避了用于训练过程奖励的每步人工标注能够自动获取可靠的推理路径,也能有效地信号进行验证和LLM自训练. 研究从三方面验证了ST-MCT*有效性:在迭代优于现有方法,通过自身生成的数据自我;学习到了很好的过程奖励模型,模型实现了更高的准确率尽管预算不足,仍明显优于基线
4. 这项研究也存在一定局限性:需要证明ReSTCTS可以到数学以外的任务没有ground-truth的;需要扩展所提出的价值,并进一步改进过滤技术
阅读原文

苹果掉队,国产手机拿大模型向AI Agent要未来

文章概要:

1. 最近两天,AI手机圈“八仙过海,各显神通”,华为、荣耀、苹果、小米接连放出自家最近AI手机大招,各种AI Agent和AI操作系统密集轰炸。
2. 国产AI手机无论是AI功能的多样性,还是落地速度上,明显要比苹果的反应更加敏捷和迅速。
3. 国内手机厂商在AI领域颇有赶超苹果之意,AI Agent已经开启了智能手机新一轮的创新竞赛。
4. AI Agent在手机侧的落地,有望拉动手机市场新一轮的增长,AI Agent正在成为智能手机新的交互入口,这不仅极大地提升了用户体验,还可能催生全新的商业模式。
5. 大模型的算力需求导致功耗和内存占用问题,使得普通手机难以承受,因此,如何在有限的硬件条件与成本下让大模型“落地”手机,成为业界关注的。
阅读原文

科大讯飞大模型竞速2年多,答卷不只是语音

文章概要:

1. 科大讯飞在大模型领域探索两年多,围绕业务“选择性答题”,取得了不错的成绩。<. 科大讯飞关注大模型推理,认为o1路线有可能改善推理过程,对解决复杂问题大有裨益。
3. 科大讯飞在推理方面主要关注两类问题:以数学为代表的学科类问题,二是学科类中具有一定严格逻辑的大概率事件。
4. 科大讯飞关注数字人赛道,认为数字人首先必须具备实时交互能力,尤其在复杂和高精度的情境下非常关键。
5. 科大讯飞已在“大模型+科研”领域做了许多探索,如联合中国科学技术大学刘海燕教授团队,AI助力成功设计了48个自然界不存在的全新蛋白质。
阅读原文

值得开发者好好看一看的AI大模型入门教程(内含300道AI面试真题)|极客时间

文章概要:

1. 人工智能市场迎来爆发期,企业纷纷官宣“AI+”战略,人才需求增大,AI大模型新发岗位平均月薪上升。
. 初学者学习AI大模型常遇到理论知识缺乏、资源和工具限制、模型理解和调试复杂等问题,找到高质量学习资源很重要。
. 推荐由LangChain开发者、谷歌开发者专家彭靖田为开发者量身打造的『从0到入门AI大模型』大模型入门集训班,课程从市场现状和趋势出发,分析人才需求带你了解自身情况,规划学习路线。
4.详细介绍了AI大模型技能图谱知识树,规划你自己的模型学习路线并且专门提前收集了大家大模型课程,还准备了非常全面的「AI大模型面试题」,包括字节、腾讯等一线大厂的AI岗面经分享、LLMs、Transformer、AG面试真题,帮面试模型中更快一步。
阅读原文

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

文章概要:

1. 卡内基梅隆大学的研究团队提出一种“黑盒优化”策略,通过大语言模型自动调整自然语言提示词,使视觉语言模型在文生图视觉识别等多个下游任务中获得。
. 该方法将正负反馈交给ChatGPT,以更高效地调整提示词,经过多轮迭代,最终返回得分最高的提示词作为优化结果。
3. CMU团队在无需人类提示工程师参与的,在多个小样本视觉识别上取得了最佳准确性,甚至超越了传统的白盒词优化方法。br>4. 该方法在无需了解数据集内容的前提下,自动捕捉到了下游任务的视觉特性并将其融入提示词中,取得了更好的效果。
5. 大语言模型能够从提示词的性能中提取出隐含梯度”方向,从而实现无需反向传播的模型优化。
6.团队进一步探索了该方法在生成任务中的应用潜力,在文本到图像生成(T2)任务,ChatGPT能够自动优化提示词,从而生成更符合用户需求的高质量图像。
7. 提示反演是现有图像反推生成模型输入提示词的技术,团队在复杂的文本到图像任务上进行了测试,表明这一方法仅需提示词优化,就能显著提高的满意度。
8. CMU团队表示,提出的盒优化范式突破了传统模型调优的限制,不仅在图像分类和生成任务中表现出色,还展示的应用潜力。
阅读原文

用大模型准备大模型面试

文章概要:

1. 负责为大模型提供数学竞赛级的数据工作,包括标准/方法的设计、数据生产检验
2. 评价模型效果,并调整优化数学竞赛问题的整体解答思路,判断解答的> 3. 通过模型&人工结合的方式,设计适用于大模型复杂数学/逻辑的数据生产方法
4 与研发协作,讨论确定现状和,明确下一步提升推理等能力的方案
5. 具备逻辑思维条理性,能够清晰、准确地传达信息和想法
6 如何评价大模型解答复杂逻辑推理问题的效果
7.优化大模型在数学竞赛问题的整体解答思路
8. 如何判断大模型在复杂数学/推理问题中解答的优缺点
9.复杂数学逻辑推理的数据生产方法有哪些> 10. 大模型的复杂/推理的现状和
阅读原文

关于大模型微调与训练的问题,大模型训练的难点在哪里?

文章概要:

1. 大大模型本身而在于训练数据。
2 对大部分学习大的人来说,大模型训练和微调可能都是一个无法绕过的问题,很多人弄明白的问题,总认为由于没有足够的算力,无法进行模型训练。br>3 对采用开源模型使用重新训练的方式得到一个具有特定模型的企业来说,大模型本身对他们来说并没有特别大的难度,如果说有那么唯一的难度就是基于当前模型做的二次开发,其功能更完善与强大。
4. 对基于开源训练的来说模型本身已经做的很好了,你已经不需要再对大模型进行调整,就可以直接进行训练;或者如果你能力很强,当然也可以根据自己的需求对大的整个架构或算法进行重写。
. 对训练来说,大模型训练的难点不在于,也不在于大模型的复杂度,而在于训练数据的与处理。
. 大模型训练的流程现在基本上已经很详细了,网络上能找到各种大模型训练和微调的文章以及案例;但训练和微调的过程你知道了,算力也可以去买算力服务,但的数据哪里来?
7. 使用开源模型做训练实现一个新的,最难的一点就是收集和整理训练数据。
8. 这玩意就类似于造原子弹,原子弹的图纸都是公开的,技术也是公开的;但制造原子弹的原料哪里来?<>.,现在的企业服务,甚至一些灰色地带公开叫卖一些数据;但问题是这些数据可能并不能完全符合,因此打造一个好的模型,模型的或选择虽然很重要;但数据的收集和整理也很重要
阅读原文

DistilQwen2:通义千问大模型的知识蒸馏实践

文章概要:

1. 背景:大语言模型成为人工智能研究热点,通义千问大模型系列备受关注,如何提高其运算效率和降低部署成本是重要课题,知识蒸馏技术可有效解决这一问题。
2. 大模型知识蒸馏技术:搜集知名开源数据集和私有合成数据集,进行难度打分和任务相关的重采样,使用Prompt模板扩展数据,采用SFT和DPO算法训练学生模型。
3. 效果评测:在多个权威指令遵循评测基准上测试DistilQwen2蒸馏小模型的能力,验证大模型知识蒸馏技术的有效性。
4. 模型下载和使用:在阿里云人工智能平台PAI上实践,以HuggingFace transformers库为例,介绍如何在PAI-DSW上使用ilQwen2模型。
5. 小结与未来工作:计划进一步完善Distwen2的功能,探索更多适用于不同应用场景的知识蒸馏算法,优化模型的微调策略,持续更新在阿里云人工智能平台PAI上的最佳实践案例,加强与开源社区的合作。
阅读原文

尚参一分钟洞察:大模型的核心突破是什么?

文章概要:

1. 大模型的参数从数亿跃升至千亿级别,这一飞跃显著增强了模型的学习和推理能力。
模型通过在海量数据上预训练,学习到的语义和知识表示,具备的多任务学习迁移学习能力。
. 在自然语言处理领域大模型达到了前所高度,尤其在问答、对话和自动写作等任务中突出br4. 新一代大模型具备同时处理文本、图像和视频等多种媒体数据的能力,推动了跨模态与生成的。br>. 大模型逻辑推理因果分析和常识推理等高层次认知任务上的进展,展示了其对问题的理解能力。
阅读原文

一篇大模型个性化技术最新综述

文章概要:

1. 大语言模型个性化是一个最近特别值得关注的话题,LL个性化研究存在一个明显的割裂:部分产品专注让模型生成个性化的文本 ,另一则在用它做推荐系统等下游任务 。
2. 首次系统地了两个方向,提出了一个分类体系,总结了LLMs使用的关键差异和挑战,并提出了系统化的分类体系:用户级个性化(User-level Personalization)、级个性化(Persona-level Personalization)、全局偏好个性化(Global Preference Personalization)。br> 3LLM的技术方法可以根据用户信息的使用方式进行分类:通过检索增强生成(Personalization via Retrieval-Augmented Generation, RAG)、通过提示工程(Personalization via Prompting)、通过表示学习(Personalization via Representation Learning)、通过人类反馈的强化学习(Personalization via Reinforcement Learning from Human Feedback,HF)。
阅读原文

汽车厂商“批量生产”大模型|AI光年

文章概要:

1. 汽车电动化时代,造车曾被质疑门槛低,智能化时代,大模型成了车企的新挑战。
2. 大模型上车面临两个困局:通用大模型上车难找场景,端到端大模型上车门槛太高。
3. 端到端大模型热潮下,车企已然成为算力“吞金兽”,大多数车企选择和市面上主流云服务厂商合作共建。
4. 大模型上车后,智驾进入数据驱动阶段,竞争的关键壁垒在于高质量的数据与训练算力,而这也将进一步降低智驾的成本。<> 5. 新车研发周期长,AI技术发展快,车企不惜重金砸入智能化从全行业来看,汽车并非对AI人才需求量最大或前几的行业。
6. 大模型对算力、算法以及人才密度的高要求,注定大部分车企难以单打独斗,大部分传统车企选择“两条腿”走路,一边组建自研团队,一边与成熟的供应商合作。
7. 智能化有望复现电动对直接影响的技术,但对车企而言,跟进大模型技术不是一道选择题,而是一道必答题。
阅读原文

大模型趋势分析(11月初版)

文章概要:

1. 文本生成:Llama系列在榜单上占据显著位置,Nvidia和Coh的大模型也大型语言模型在生成高质量文本时的重要性。
.生成和多模态模型:稳定扩散3.5系列显示成式图像模型的持续流行模态生成模型支持图像和文本的结合处理。
. 音频生成与转换:Text-to-Sech模型正在快速发展Audio-to-Audio模型则表明音频处理的。<>4. 任意模态转换:gpt-omni/mini-omni2提供了一种支持“任意转换”模型。
5. 轻量化与移动端优化:Facebook推出的轻量化模型显示了移动端和受限环境下大模型的趋势。 阅读原文

大模型发展未来展望

文章概要:

1. 大模型的发展虽处于初期阶段,但风险问题使大模型治理成为社会关注焦点,业界呼吁采用包容审慎、敏捷治理的态度,通过技术、管理相互协同的治理手段,共同构建安全、可靠、可信的大模型产业生态。
2. 大模型的可信赖目标需要产业各界人士达成共识,技术、管理相互协同的治理手段,共同构建安全、可靠、可信的大模型产业生态<>3. 构建评测标准生态,推动大模型测评体系建立。
4. 构建可信产业共识,细化行业大模型信赖能力建设。
遵循“包容审慎、分类分级”监管原则,探索大模型分类分级治理模式。
. 麦田数字科技集团可以依托其强大的云计算能力,大模型提供安全、的运算环境,确保模型训练的稳定性和数据的安全性。
阅读原文

AI大模型的崛起:从历史的脚步到未来的图景(国内244个AI大模型盘点)

文章概要:

1. AI大模型的发展是技术进步的见证,更是智能时代到来的标志。
2. AI大模型的起源可追溯至20世纪的人工智能研究初期那时科学家们主要聚焦于推理与专家系统的。br> 3 机器学习尤其是深度学习技术的横空出世,为AI领域带来了革命性的突破。
4. 在当下的科技中,AI大模型以惊人的速度渗透至我们生活的方方面面,其应用之广泛、影响之深远,正逐步重塑着人类的运行轨迹。
5. 展望未来,AI大模型将继续通用化和专用的方向发展。
阅读原文

人工智能(AI)大模型给媒体带来的机遇与挑战

文章概要:

1. AI大模型在媒体行业的应用越来越广泛,它能够处理、分析和生成多种类型的数据,推动内容创作的革命,优化运营效率,增强新闻采集和报道能力,带来个性化体验的提升。
2. AI大模型对媒体行业的重要性体现在内容创作、数据驱动的个性化体验、优化运营效率和增强新闻采集和报道能力等方面。研究的必要性则包括伦理和道德挑战、职业影响、监管和政策制定以及技术的不断进步等。
3. AI大模型在媒体行业的应用现状包括自动化内容生成、挖掘和个性化内容推荐以及增强现实与虚拟现实等方面。
4. AI大模型给媒体带来的机遇包括提高生产效率、内容创新和扩大报道深度和广度等方面
5. AI大模型给媒体带来的挑战包括伦理与道德问题、职业安全、信息茧房和技术监管与法律挑战等方面。
6. 媒体行业利用AI大模型的建议包括培养跨学科人才、加强伦理审查和透明度、促进开放对话和多样性、遵循法律法规并保护隐私以及加强跨行业合作等方面。
阅读原文

大模型公司,就要凉凉了

文章概要:

1. K哥提出的“AI微笑曲线”模型引起广泛关注,本文将继续分享相关观察和思考。
2. 介绍AI微笑曲线”的概念,包括上游的GPU设计/制造与云计算服务、中游的基础大模型研发和下游的AI大模型应用。
3. 分析国产大模型公司的生态图谱,包括“六小虎”、AI新势力传统科技巨头和其他初创公司。
4. 预测未来3年,80%的大模型公司会死掉,原因包括生存率低、资金链断裂、竞争激烈等。br>5. 探讨“AI微笑曲线”的演进及重要推论,包括新科技巨头诞生、基础大模型崛起、AI泡沫破裂估值回归理性等。
阅读原文

大模型-BLIP 详细介绍

文章概要:

1. BLIP是由Salesforce在2022年提出的多模态框架,旨在统一视觉语言理解和生成任务。
2. BLIP的核心思想是通过自举(bootstrapping)的方式,有效地利用从网络上收集的带有噪声的图像-文本对数据。
3. BLIP的主要贡献包括:模型角度提出了一种新的VLP框架,可以灵活地应用于视觉语言理解和生成任务;数据角度通过自举标注的方式,减少了监督文本的噪声,提高了预训练数据的质量。
4. BLIP在多项视觉语言任务上取得了显著的性能提升,例如在图像-文本检索任务上,平均recall@1提高了2.7%;在图像标注任务上,CIDEr提高了2.8%;在VQA(Visual Question Answering,视觉问答)任务上,VQA分数提高了1.6%。
5. BLIP的代码和模型已经在GitHub上公开,供研究者和开发者使用和参考。
阅读原文

来了!国内首门自动驾驶多模态大模型教程,直击落地

文章概要:

1. 长安自研智驾交卷,天枢大模型采用端到端架构,其核心是感知系统、大脑和小脑。
2. 国内端到端的技术路线已明确为端到端+大模型,学术界在该领域的大模型工作爆发,工业界相关融资案例增多,工作机会也越来越多。
3. 自动驾驶之心推出了多模态大模型实战教程,旨在提供系统化学习平台,帮助学习者适应实际工作需要。 5. 课程适合高校研究人员与学生、初创企业技术团队、企业技术专家和骨干、想要转行从事大模型的同学。
6 讲师Sora是业内一线大厂高级算法工程师具有丰富的经验。
7. 课程收获包括掌握通用大模型的核心理论与微调技术、自动驾驶大模型的前沿算法、具备大模型微调与部署的实际能力等。
8. 课程所需基础包括一定的深度学习与大模型基础、了解Transformer模型结构、和PyTorch基础,以及自备GPU。
9. 开课时间为2024年12月9日,课程购买后不支持,购买后1年内有效。
阅读原文

新加坡国立&香港大学最新成果!EMOS:基于大模型多智能体的异构多机器人操作系统

文章概要:

1. 新加坡大学、香港大学、上海人工智能实验室、大学、EL-AI社区等多家机构的联合研究团队提出了一种创新的异构多机器人EMOS。br> 2. EMOS框架基于大语言模型的多体系统,以机器人物理定义文件和环境信息为输入,了对机器人空间物理能力和需求的理解,实现了更有效的任务规划,并利用大模型工具调用能力,进行多机系统分布式动作的执行。
3. 该工作提出了Habitat-MAS评测基准,包含多种任务,例如跨楼层物体导航、协作、家庭排列和多机器人、多、跨楼层重新排列。实验结果表明,EMOS框架在Habitat-MAS基准上取得了优异的性能,证明了其有效性。
阅读原文

OpenAl o1大模型原理、突破、前景及影响

文章概要:

1. OpenAI发布新的人工智能模型o1,具备复杂推理能力,解决比目前专业的科学、代码和数学模型所能解决的更难的问题
2. OpenAI发布o1模型的背景是继续融资,给投资人“画饼”
3. o1模型采用大规模自我对弈强化学习、内置思维链、引入推理标记和使用专门的训练数据集的方法,使其在复杂推理能力、数学、编码和科学领域应用方面有巨大提升
4. o1模型预示着AI将在多个专业化领域展现出新的更优秀的应用潜力,例如科学研究、软件编程、教育等领域
5. o1模型的推出对大模型发展的影响和趋势:是向AGI迈进的重要一步、开启大模型能力提升的新范式、算力需求增大、大模型头部公司虹吸效应凸显
6. o1模型在数学、代码等方面推理能力显著提升,在写作、文字编辑等一些简单的自然语言处理任务上并没有显著提升
阅读原文

大模型在自动化测试的突破:蚂蚁、华为等头部企业应用实践

文章概要:

1. 软件测试的重要性日益提高大模型出现后进入“智能测试”新时代。
2. 自动化测试脚本是重要场景,大模型为其生成带来新方案。
3. 沙丘智库通过研究4家企业实践为其他企业提供参考。br>4. 案例1:支付宝小程序利用AI大模型实现自动化测试,提高检测效率和用户体验。
5. 案例2:邮储银行引入大模型技术,提供脚本智能生成功能,降低人力成本。
. 案例3:科大讯飞将接口测试平台融合大模型能力,生成接口自动化用例和UI自动化脚本。
7. 案例4:华为选择大模型辅助测试自动化代码生成,人数近3k人,覆盖60+产品。
阅读原文

【AI】AI大模型行业专题报告:大模型发展迈入爆发期,开启AI新纪元

文章概要:

1. 大模型发展呈现“规模定律”,Transformer为技术基座
2. GPT系列模型技术发展历程回顾
3. ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据
4. 全球大模型竞争白热化,国产大模型能力对标GPT-3.5Turbo
5. OpenAI:上半年重磅发布Sora,GPT-4o取得性能与实用性双突破
6. 国产大模型:迈入爆发期,模型能力追赶GPT-4
7. 变现:API同质化、订阅实现难,Agent与MaaS探索破局之路
8. 大模型商业形态多元,B端变现模式更清晰
9. 全球API定价呈现下降趋势
10. 破局之路:企业级需求快速增长,MaaS助力降低模型使用门槛
11. 算力:大模型发展催生海量算力需求,预计带来千亿美元市场规模
12. 大模型技术与应用发展催生海量算力需求
13. 算力需求测算逻辑
14. 大模型服务器成本测算
阅读原文

大模型周报(10.28-11.03)

文章概要:

1. 企业动态:英伟达创始人黄仁勋携手丹麦国王启动AI超级计算机Gefion;众擎机器人推出人形机器人SE01Ideogram推出Ideogram Canvas创意画板;苹果宣布iPhone、iPad和Mac进行软件升级全方位支持Apple Intelligence个人智能系统;智谱清言上线“情感通话”功能。
2. 技术风向:华为诺亚方舟实验室等的研究者提出“轻量型多模态应用控制”架构;浙江大学和字节跳动的研究者面向“人脸视频生成MimicTalk;Hamburg-Eppendorf医学中心等的研究者对GPT-4观察人脸、解读精神状态的能力进行研究;斯坦福大学和耶鲁大学研究者推出Collaborative STORM;复旦大学和上海人工智能实验室的推出身因果智能体ADAM;英伟达等的研究者面向“人形机器人的全身控制”推出多模式策略蒸馏框架HOVER;极佳科技等的研究者面向自动驾驶推出DriveDreamer4D;UC Berkeley的研究者面向“机器人自主习得复杂的操控技能”推出有人类参与的基于视觉的增强学习框架HIL-SERL。br>3. 投资融资:自动驾驶公司Waymo完成56亿美元超额认购融资;《金融时报》报道,on Musk正在同中东的投资者商议为xAI融资;AI智能体初创公司Sierra完成1.5亿美元新一轮融资;Hipp AI宣布获得NVentures的投资;专注视觉模型的初创公司Moondream完成450万美元预种子轮融资。
阅读原文