今日AI-大模型-2024年11月7日

发现全网最新的AI内容

小红花大语言模型排行榜(2024年11月):国产第一是豆包

文章概要:

1. 文章发布了2024年11月大语言模型排行榜,前三名是GPT、Llama和Claude
2. 豆包成为国产第一,字节跳动国内唯一仍在大力投入的互联网厂商
3. 排行依据是小红花技术领袖俱乐部旗下内容平台「小红花·文摘」聚合全球开发者博客的准实时内容>4.说明包括整体统计方法、算法和系数暂不公开、对大语言模型别名进行归一化处理
5. 与其他排行榜的不同之处在于数据量、数据源和统计口径
. 文章对项目的技术方案选型参考意义,接下来将在「小红花文摘」开辟排行榜栏目发布相关信息
阅读原文

中国大模型在迪拜卷起来了

文章概要:

1. 在全球最著名的科技峰会之一GITEX上,中国的大模型如华为、腾讯、智谱AI、科大讯飞以及Soul App等已经率先掀起了中东淘金热。
2. 中东国家如阿联酋、沙特等对AI展现出了极大的兴趣,希望通过发展AI产业摆脱对石油经济的依赖。
3. 阿联酋在人工智能战略上的定位是应用,希望吸纳更多AI人才到迪拜去。
4. 迪拜的繁华与平静,让前来参展逛展探寻商机、旅游的人们络绎不绝。
5. 中东地区的云计算市场规模预计将从2021年的142亿美元增长到2026年的314亿美元,复合年增长率(CAGR)为17.2%。
6. 对于当下陷入迷茫的大模型创业公司而言,这或许是个新机会。
阅读原文

大模型赋能传统文化传承发展:十大核心议题、10个关键词洞察

文章概要:

1. 本研究报告深入探讨了大模型赋能传统文化现在和未来的十大核心关键议题,总结了10个关键词洞察,以点窥面尝试勾勒出大模型与传统文化的融合创新蓝图。以期凝聚行业共识,激发各方合作,推动大模型技术在传统文化领域的广泛落地,实现传统文化创造性转化与创新性发展。
2. 传统文化是一个国家和民族的精神命脉,是文化自信的重要源泉。2024年,党的二十届三中全会明确强调“必须增强文化自信,传承中华优秀传统文化,加快适应信息技术迅猛发展新形势,激发全民族文化创新创造活力。”在全球化和现代化进程中,如何保护、传承和发展中华传统文化成为亟待关注的重要课题。
3. 近期由腾讯研究院与北京邮电大学交互技术与体验系统文化和旅游部重点实验室联合举办“大模型赋能传统文化传承发展研究报告发布暨专家研讨会”,会上由北京邮电大学副校长苏森,腾讯研究院总顾问杨健联合发布报告成果,文化和旅游部科技教育司以及腾讯研究院、中国社会科学院、国家图书馆基金会、文化和旅游部信息中心、北京大学、北京邮电大学等来自文化与科技领域的专家学者进行了主题分享和深入交流研讨。
阅读原文

AI 科普丨调研180多篇论文,这篇综述终于把大模型做算法设计理清了

文章概要:

1. 本文对大语言模型用于算法设计(LLM4AD)的研究进行了系统性回顾,包括现有研究的概述、系统性分类和回顾、当前挑战的探讨以及未来研究方向的提出。
2. 文章介绍了LLM4AD的发展和应用现状,包括其在算法设计中的作用、搜索技术、提示策略和应用领域等方面。
. 文章还讨论了LLM4AD的挑战和未来方向,包括开发领域特定的LLMs、探索多模态LLMs、促进人与LLM的互动、使用LLMs进行算法评估和理解LLM行为、推进全自动算法设计,以及为系统评估LLM在算法设计中的表现进行基准测试。
阅读原文

第一批被大模型气死的人…

文章概要:

1. 大模型在B端严肃场景容易出现幻觉,现原形,气死个人儿。
2. 让大模型在企业级严肃场景、垂直场景能够快速落地、把活干好,最有效的方法就是对大模型进行精调(Fine-tuning)。
3. 大模型精调有诸多难点,包括模型选择、数据清洗和标注、算力消耗、模型部署等。
4. 腾讯云TI平台可以帮助企业快速搞定大模型精调,解决模型选择、数据清洗和标注、精调过程、模型效果评估与部署等难题。
5. 混元-Large × TI的强强联合服务已经在腾讯云上开放,用户可以通过直接问答、构造自定义评测集横评、将API接入到自有大模型应用、基于自有数据集精调等方式,体验Hunyuan-Large的最新能力。
阅读原文

用人工智能重新定义钢铁!宝武自主研发的钢铁行业大模型首发

文章概要:

1. 10月23日宝武自主研发的钢铁行业模型产品——宝联登钢铁大模型”,在2024年全球低碳冶金创新论坛暨届钢学术会上首发。
2. 宝武钢铁行业包括基础大垂类大模型、场景领域模型三层架构,总体达到国内领先水平,是宝武推动钢铁行业绿色低碳发展的举措。4. 宝武构建的钢铁大模型通过“通专融合”、“业技融合”、“数实融合”三融合,首创、数据、、、场景五位一体,企业智慧制造、智慧治理、智慧服务场景,以及高炉大模型、炉模型、配煤配矿大模型云表检大模型、研发设计大模型等领域模型,为钢铁企业提供一体化、集成化的“人工智能+钢铁解决方案。
. 大模型钢铁企业中具有非常重要,应用范围涵盖研发、生产、运营、服务的多个关键环节。
阅读原文

从技术到应用:大模型未来三大演进方向

文章概要:

1. 大模型未来三大演进方向为个性化、多功能以及多模态。
大。
3. 多功能手脚”赋予模型使用工具的能力。
4. 多模态交互:大模型需要跨越音频、视频等多种格式,为用户提供更加丰富的互动体验。
阅读原文

王耀南院士:AI大模型驱动的人形机器人与展望

文章概要:

1. 近日,耀南院士作了题为《AI大模型驱动的人形机器人与展望》的报告>2. 他从大模型赋能人形机器人的意义,国内外近五年研究现状,关键技术赋能具身人形机器人,以及未来的发展趋势展望四个方面进行汇报
3. 王院士认为大模型机器人在感知、认知、思考、分析、判断、推理、的智能自主作业方向发展
4. 他提出未来在具身智能人形机器人方向上突破脑认知情感机理模态智大模型、个性化感知计算三个关键科学问题
阅读原文

重磅!腾讯开源中文最强MoE巨模型Hunyuan-Large,参数规模PK Llama!

文章概要:

1. 腾讯中文最强MoE巨模型unyuan-Large,拥有380亿参数,在多项基准测试显著Llama等同级别模型,在中文领域傲视群雄。br>2.yuanarge是业界首个参数规模最大且性能最优的Transformer架构开源MoE模型,在公开benchmark、多轮、高质量文本生成、逻辑、代码等多个任务上都取得了卓越的成绩。
3.yuan-Large采用了一系列关键技术创新,包括海量高质量合成数据、KV缓存压缩技术、专家特定学习率、超长上下文处理能力、混合路由策略与Recycleouting、MoE缩放法则探索、三阶段学习率调度、高效Tokenizer。5. Hunyuan-Large提供了vLLM和TRTLLM两种推理后端,并支持FP8和8量化,可以根据实际需求灵活选择最合适的方案。
. Hunyuanarge,是腾讯对AI社区的贡献,更是对AI技术发展和普惠AI的坚定承诺
阅读原文

瑞能股份:电池数据大模型的“价值逻辑”

文章概要:

1. 瑞能股份董事长毛广甫认为,装备企业要穿越行业周期,保持韧性增长,需要预见未来产业趋势并坚定前行。
2. 国内新能源电池产业进入竞争阶段,智能装备企业仍发挥重要作用,电池企业重视电池制造大数据分析与挖掘,需要装备企业支撑。
3. 瑞能股份早在5年前就踏上电池数据大模型的探索之路,一部分收入来自自动化成检测线,一部分收入来自检测服务与电池健康数据管理业务等。
4. 瑞能股份的电池数据大模型技术可服务于多个环节,通过该技术,瑞能股份实现了为电池“治未病”的战略目标。
5. 瑞能股份的技术优势表现得极具前瞻性其“云-边-端”架构使公司能够高效处理电池数据,形成高度精准的电池安全模型。
6. 瑞能股份看好后市场的发展前景,提前布局相关技术和服务,注重技术研发,提前进行相关业务布局。
7. 随着新能源汽车和储能市场的蓬勃发展,电池数据大模型的价值将愈发凸显,瑞能股份积极探索数据驱动的发展新模式,以应对未来市场的不确定性,实现长期价值发展。
阅读原文

大模型也像神经元一样分区:清华提出新型类脑稀疏模块化架构,揭示大模型和人脑智能关联,革新 MoE !

文章概要:

1. 麻省理工学院的研究揭示了大语言模型中存在和人类大脑结构类似的几何结构,如数学、代码等分区;
2. 清华大学的研究受启发于人脑高效的稀疏模块化特性,提出了一种高效稀疏模块化架构,证明了大模型神经元在预训练过程中,自发地产生了功能分化与分区的性质;
3. 该架构由涌现模块与定制模块组成,具有高效性、可复用性、可溯源性、可扩展性,并且更适合分布式计算,能够更好地契合未来大模型在端侧部署、在广泛的场景中使用、在新环境中的未来趋势;
4. 研究人员对通用生成式大模型进行了涌现模块分析,验证了大模型模块化观点;
5 作者团队已经在插件构建层面,取得了很多有益的尝试,如知识插件、长文本记忆插件、加速插件等;
6. 清华大学自然语言处理实验室已经在大模型稀疏模块化架构方面开展了大量的研究工作,附上相关论文列表,供大家参考。
阅读原文

雅意大模型重磅升级!上线“AI搜索”功能,自主思考解决复杂问题,让搜索更高效

文章概要:

1 雅意模型更新“AI”,通过模拟人类的推理思考过程,多级分解复杂问题,执行覆盖多种信源的深度搜索让大模型准确理解用户搜索意图,进行信息的“搜索筛选-整合”,给出个性化搜索结果,帮助用户高效地完成分析、调研等复杂任务。
2. AI搜索支持将问答对话分享给他人,接收者可以点开对话与大模型“接着聊”。
3 为了让AI搜索更加易用且适用多种场景,雅意“AI搜索”特别加入问题推荐、信源、话题深度追问等特色功能
阅读原文

科普|怎么给大模型喂知识?解密知识训练模型背后的秘密

文章概要:

1. 《追AI的》之AI科普系列短视频,将持续用简单清晰的向公众解释对于人工智能的普遍疑问,社会就人工智能的发展和达成。br>2 大模型给出的答案都是根据数据输出新知识更新频繁时,模型不能保持事实准确性和逻辑一致性。给大模型喂新知识通常有四种方法:RAG检索增强生成SFT有监督微调、ME模型编辑(又名:)、CP预训练。
3. 在ME领域,提出了一种检索增强提示新叫RECIPE,该方法可以提高知识终身学习编辑和推理效率其原理是先将知识描述,为且信息的提示token,M输入查询嵌入,有效细化基于知识的生成过程。
4. RECIPE方法已应用于阿里巴巴集团内部御风大模型,为相关内容风险业务。
阅读原文

Seed校招博士自述:我为什么选择来字节做大模型

文章概要:

1. 作者是音乐生成方向的博士,今年拿到了腾讯AI Lab、字节跳动等公司的offer,最终选择了字节跳动Seed团队。
2. 作者介绍了自己的读博经历,包括本科毕业后gap一年申请phd,在博二博三期间产出不多,三结束后经历了长达的实验失败阶段,最后在博三结束到博四期间构思完成了毕业论文。
3. 作者介绍了MIR领域的毕业选择,包括高校和工业界,并分析了两者的优缺点。
4. 作者介绍了目前涉及音乐业务的工业界版图,包括大厂和中小厂,并分析了它们的优缺点。
5. 作者介绍了自己选择字节跳动Seed团队的原因,包括方向匹配、竞争力的条件和技术转化等。
6. 作者介绍了面试期间的经历,包括面试邀请、面试流程和选择字节跳动的原因。
阅读原文

SAIL观察 | 大模型淘金热下,卖铲or卖水哪个更赚?

文章概要:

1. 大模型掀起的AI新浪潮,带来了创新技术和应用场景,有人选择加入淘金盛宴,也有人选择做生态构建者。
2. 在2024年的SAIL奖申报项目中,大模型产品占比13.47%,而大模型生态(含技术底座)项目占比15.54%,大模型生态构建者们所耕耘的领域,正逐渐成为科技创新的新焦点。
3. 算力、算法、数据是驱动AI发展的“三驾马车”,其中算力最重要,数据的重要性日益凸显,大模型时代需要能非结构化数据的AI数据库。
4. 大模型的角斗场上,平台服务商通过提供预训练模型和工具开发门槛,帮助开发者实现应用。
5. 大模型生态繁荣时,每一个企业都能找到自己的盈利点。
阅读原文

两位清华天才Yao Shunyu投身大模型,跨学科人才或将成为AI时代“香饽饽”

文章概要:

1. 姚清华物理系的奖得主,在凝聚态物理领域有突破性贡献,其研究成果发表在世界物理顶级期刊上。
2. 从清华本科毕业后,姚顺宇前往斯坦福攻读博士,毕业后加入了Anthropic的Claude团队。
. 姚雨是清华姚班学霸和联席会主席,专业,还是个Rapper,在上有不少成就,毕业后加入了OpenAI团队。<. Claude团队属于Anthropic,以其在大模型的工作成果而闻名,特别是在自然语言处理和机器学习领域。
5. Claude团队一直以来都对物理背景的人才有着特殊的偏好,其创始人Dario Amodei自己就是。
6. 姚顺宇的跨学科的职业发展之路,展示在当今中,不同专业背景的如何通过跨学科的拓宽自己的职业道路。
阅读原文

RAG真能优化LLM?丨大模型RAG热门论文解读

文章概要:

1. RAG(Retrieval Augmented Generation)是一种优化大型语言模型(LLM)输出的方法,使其能够在生成响应之前引用训练数据之外的权威知识库。RAG通过访问特定领域或组织的内部知识库,而无需重新训练模型,进一步提升了其输出的相关性、准确性和实用性。 2. RAG解决的LLM应用痛点包括在答案的情况下提供虚假信息的问题。它通过引入外部知识库等额外信息源,为这些问题有效的缓解策略。 . 文章整理了一些RAG【论文】合集,《Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity》《Are Large Language Models Good at Utility Judgments?》《Telco-RAG: Navigating the Challenges of Retrieval Augmented Language Models for Telecommunications》《Evaluating Large Language Models with RAG Capability: A Perspective from Robot Behavior Planning and Execution》等。
阅读原文

人工智能大模型赋能千行百业 | 医疗健康行业

文章概要:

1. 人工智能大模型赋能千行百业,中国联通推出的元景大模型已形成35个行业大模型和100多个标杆应用,在医疗健康行业成效显著。
2. 中国联通医疗改变健康生活方式,如线上挂号、分级诊疗、电子病例等。
3. 中国联通助力打造的“中山三院鼻窦炎精准分型及治疗项目”“京通健康大数据平台”全国数据要素×大赛“医疗健康赛道”总决赛中分别荣获二等奖和三等奖。
4. 中国联通在上海和重庆助力打造的“大数据+AI赋能医保智慧监管的实践与创新”“医保数据赋能精准服务”两项目也分获2024全国智慧医保大赛(全国总决赛)一等奖和三等奖。
5. 中国联通“元景大模型(医疗)”入选创新AI案例集,其快速处理和分析医疗数据的能力,可为医生提供更准确、更及时的诊断建议。
6. 中国联通“5G智慧急救” 自研产品更为现代急救体系注入了新的活力,如北京急救中心的坚强后盾和“5G智慧急救”产品。
7. 海南省传染病多点触发监测预警平台是海南联通承建的海南省传染病监测预警和应急指挥项目成果,有力支撑突发传染病和公共卫生事件第一时间应急响应和指挥决策。
8. 中国联通持续推进网络向新、服务向新,将新质生产力应用到智慧体系建设的方方面面,以数智力量护航民生幸福。
阅读原文

如何方便、快捷、低成本使用大模型:分分钟上手使用阿里云百炼大模型平台

文章概要:

1. 有太多为我们提供了大模型,比如百度的千帆模型、的炼大,这类平台可以视为大模型聚合平台在上我们可以很的选择各类;2. 本文以百为例,介绍使用,访问百炼、在模型广场选择合适的大模型获取-KEY、需要的包、引入所需的包、配置API-KEY、使用text_embedding_v3模型实现文本向量化、使用qwen2.5-72b-instruct模型实现问答;3. 如果你想要进一步学习,可以关注:遇码,回复大模型平台,平台访问地址。
阅读原文

大模型结合知识问答,重塑企业级智能服务新范式|爱分析活动

文章概要:

1 知识管理成为企业发展焦点,爱分析将联合阿里云举办网络研讨会。
2. 研讨会将探讨知识库问答系统在企业服务中的应用。
3. 揭秘大模型时代下知识库问答产品的全新设计。br> 4. 分享企业级知识库问答系统的实战案例。
5.将邀请阿里云智能集团两位资深专家分享并答疑。
阅读原文

疯狂卷投流的大模型应用们,到底哪款最好用?

文章概要:

1. 最近几个月,大应用广告增多,大模型公司投流费用模型应用在应用体验层面难以做出颠覆性创新,新识研究所测评了主流大模型的效果。
2. 豆包是当下最火热的AI产品,月活达到了5000万+,在使用体验上也确实很好,在友商竞品们都有的功能中,豆包都有着强于水平并且偶有高光表现。
3 文小言在最初领先,但目前月活仅有豆包的四分之一,文小言在充值上被诟病,某些功能还是有着一些亮点的。
4. 讯飞星火与腾讯元宝没有开通充值,主打大模型能力,没有自身鲜明特点,面临进退两难的境况。
5. Kimi以长与搜索见长,探索版会自主规划策略,将一个复杂的问题分解为层次化的子问题,建立清晰的任务结构,然后分步来执行。
6. 天工AI也走上了相似的道路,让其出圈的还是搜索,在天工3.0大模型的支持下,天工AI和Kimi探索版相同,都采用了类人思考的方法,会把用户提出的问题自动规划和拆解,将其分解为多个简单的小任务并逐步解决。
阅读原文

国产化宜创AI大模型一体机解决方案来啦~

文章概要:

1 宜创AI大模型一体机是算力、模型到Agent应用开发和场景部署,一体化落地的解决方案
2. 宜创模型一体机包括安全可控、高性能、超灵活、低成本、场景驱动,开箱即用等要点
3. 宜创AI大一体机的应用场景包括智能超级知识库、智能客服AI助理、文件编写、ChatBI智能、智能政企匹配系统智能设备、智能线索系统等
. 宜创科技204多位清华校友联合016年致力于AICode相关领域,223成为中国领先相关领域探索者,024年5月推出一款公测版基于AI大模型的本地文件检索客户端ChatAA
阅读原文

AI再进化:系统二思维让大模型学会深思熟虑

文章概要:

1. 大模型的发展现状:大模型的训练需要海量的数据强大的计算能力,成本高昂。
2 系统二思维的概念:系统二思维缓慢的、熟虑的善于分析的,支持复杂的问题解决、计划和推理。
3 系统二思维AI领域的应用提升推理和解决问题的能力,改善对上下文和细微差别的理解,减少偏见和错误制定决策,增强学习和适应能力,更人机协作。
4. 实现系统二思维的挑战:需要改进算法方法和能力,还需要更好理解人类的认知过程
5. 科技企业的探索:OpenAI推出的o1模型融入了系统二思维,DeepMind推出Talker-Reasoner框架结合了两种思维模式。
6 系统二思维的意义:将帮助我们解决更为复杂的问题、提供更加的服务推动人类社会迈向一个全新的智能时代。
阅读原文

可信AI大模型-城市治理大模型专项首轮评估正式启动

文章概要:

1. 随着多模态技术的进步,治理大模型能力边界不断拓宽,场景渗透率稳步提升
2. 中国信通院研究所联合业内专家共同编制了《行业的预训练模型技术和应用评估方法 第19部分:城市治理大模型》标准
3. 中国信通院现正式城市治理大模型专项首轮评估,评估范围围绕场景丰富度、能力支持度、应用成熟度
阅读原文

百度智能云x石景山区:大模型产业基地服务平台上线

文章概要:

1. 1月日“人工智能大模型产业发展大会”在石景山区石景模型产业,百度智能云千帆大产业(北京<> 石副书记、代理区长万在景中央和市委区委要求,深入实施城市更新和产业转型统筹做好产业融合等“四文章”,“串整合好人工智能产业发展资源,做强细分领域带动产业链聚集”。
3. 百度集团执行副总裁百度智能群发言提到云与石景山区联手打造创新基地,充分发挥政企合作的优势,实现资源共享和优势互补br>4. 在随后进行的大模型产业点亮仪式,中国工程院院士中央网信办专家北京市发展改革委林剑华北京市科委管委会组成员、董齐超,经济和局巡视员汪剑波,石景山区委书记常卫百度百度人工智能大模型展现出石产业的活力无限潜力。<.百度清华,北京智董宇共同见证了百度云千帆大模型产业()创新平台br>6今年的AI Day上,百度智能云充分发挥技术优势升级百度智能云千帆大模型平台,发布系列新开发,满足企业在场景落地中的多样化需求。同时,智能云与石北京。智能与石协同构建共赢生态,作为数字经济时代基础设施产业赋能引擎,推动产业跃迁!
阅读原文

北京首座大模型“超级工厂”落户京西

文章概要:

1. 115日,百度智能云千帆大模型产业(北京基地服务平台启动上线。
2. 北京市科委中关村管委会党组成员、副主任董齐超,人工智能是发展新质生产力重要引擎,也是北京聚焦“占先”发展的重要未来产业领域。
3 百度智能云千帆大模型产业(北京)基地可为大模型和AI原生应用的提供链条工具,配套“管家式”技术加速企业数智。
4. 百度集团执行副总裁、百度智能云群总裁抖介绍,与石景山区打造这一基地,充分发挥了政企优势,实现了资源共享和优势。
. 中关村数智人工智能产业联盟()创新中心启动,该中心致力于开放包容的创新创业为企业建立成长通道助力实现从0到1的跨越<. “智谱Z基金”同步启动,通过设立风险投资基金,链接并投资大批优秀的大模型创业者,服务大模型上下游的技术研发与应用创新。br>7. 超智算(北京)有限公司、北京智谱华章科技有限公司、摩尔线程智能科技(北京)有限公司商汤科技有限公司完成算力伙伴签约,入驻人工智能大模型产业集聚区。
. 智优沃是的城市数字经济产业运营商公司专注于、大数据云计算、AI大模型、工业互联网、智能硬件数字经济核心领域,面向政府和园区,提供集规划、招商、运营、孵化、为一体的产业运营。
阅读原文

医疗AI项目签约难?大模型商业化之路如何破冰?

文章概要:

1. 医疗AI项目签约难,大模型商业化之路如何破冰?
2. 人工智能的热潮还在持续,的商业化路径还尚未成熟,在医疗AI领域,国内厂商,国外也面临同样的. 医疗机构过于保守,面对超过12个月的合同的犹豫的不确定性。
4. AI技术的速度,尤其是在生成式AI工具例如ChatGPT推出之后,了一种氛围,使得医疗机构在采用新技术时只能考虑短期利益。
. 什么样的AI企业能市场AI的动态特性意味着,公司今天是的领导者可能到明天不再是。> 6 自行构建or直接购买AI工具,两条路面临各自的挑战。
7 进入2025年,CIO需要做好哪些事展望2025年CIO医疗领导者必须关注三个关键领域:云优化、人才培养和数据治理
阅读原文

山东大模型产业加快发展应用落地提速

文章概要:

1. 今年前三季度,山东省大模型产业发展应用落地提速,大模型业务收入实现较快增长
2 2024年山东重点大模型建设项目54个,总投资20.87亿元,年度计划投资11.32亿元,季度完成投资986亿元,投资完成87.2%。br> 3. 全省10个基础级大模型中,语言模型个视觉模型个多模态大模型等个<> 4 浪潮海若大模型、壹点天玑模型、法大模型、知业大4个大已通过生成式服务备案,和科技研发的问模型壹点的点天玑传媒大模型12大模型通过合成服务算法备案。
阅读原文

2024年度人工智能大模型金融领域示范场景及创新应用案例征集宣传展示活动Q&A

文章概要:

1. 申报主体:尚未加入联盟成员、联盟实验室或专委会成员的可以申报,单一法人主体申报项目数量有限制,科技企业不限注册地。
. 申报项目:示范场景主要面向金融要素市场金融机构,应用案例主要面向企业,机构申报创新应用案例建议作为联合申报单位。
3. 提交材料申报机构如有其他有助于项目评审的辅助材料可以一并提交,科技企业单独申报时需要提交合作金融机构的申报意见,联合申报的项目仅要求主申报单位盖章。
阅读原文

深度拓展媒体应用 蜜度自研垂直大模型赋能媒体融合发展

文章概要:

1. 融媒体时代,传媒业寻求转型发展新空间实现高质量发展的关键。蜜度研发的蜜巢、文修两个垂直大模型以及六大AI算法引擎,助力媒体在数据分析、内容创作与审校新闻洞察等场景的化。
2. 蜜巢大模型助力媒体构建专属知识库,信息的快速检索与智能问答,提升工作效率。在内容创作方面,蜜巢大模型可辅助媒体工作者快速生成初稿或大纲,还可以通过生图、图生等方式,为内容生产提供灵感和素材。
3. 文修智能校对大模型能够接入稿件审核流程,满足编辑对各类稿件、视频图片内容的校对需求,大幅度提升审校的效率。此外,修具备知识性差错检测内容导向识别,能够覆盖35个小类的错敏内容校对,有效保障内容的准确性和安全性。
4 基于蜜巢大的舆情分析能力,媒体能够快速筛选跟踪信息,洞察细节,保障报道内容的及时性丰富性。同时,它还在2分钟内生成高质量的舆情分析报告,媒体迅速了解事件动态。此外,巢还能媒体工作者提供稿件传播分析报告,量化评估传播效果,助力媒体行业进一步提升新闻传播影响力。
5. 未来,蜜度垂直大模型媒体行业的应用,在热点感知、内容、多模态内容审新媒体运营等方面,提供新交互、新服务媒体行业的智能化转型和高质量发展。
阅读原文

蜜巢大模型入选硅星人2024 年度最佳企业服务AI产品榜

文章概要:

1. 11月2日硅星人202年度榜单揭晓,蜜巢模型入选最佳企业服务产品榜20强
2 蜜巢大模型瞄准各行业办公场景“新生产力”,为客户提供大模型落地应用解决方案。br> 3. 目前,蜜巢大模型已在科研机构、企业智能客服领域落地。
4 未来,蜜度将继续深化技术研发,推动各行业办公场景智能化转型升级。
阅读原文

AI大模型——“引爆”行业新一轮变革的IT技术

文章概要:

1. AI大模型技术正重塑各行各业的面貌,成为推动产业革命的新引擎。
2 大模型技术应用关键在于对数据要素价值的进一步挖掘。
3.AI大模型纷纷布局开发平台。<> 4. 尽管大模型技术广阔,但算力瓶颈、兼容性以及人才紧缺等,仍是企业在应用大模型时面临的。
阅读原文

AI应用如何在企业落地? “AI大模型企业落地应用场景主题研讨峰会”邀您论剑

文章概要:

1. 人工智能成为行业关注的重要话题,AI技术正以前所未速度重塑着我们的工作
.技术在各行各业中广泛制造业、金融、零售、医疗、教育等行业领域发挥影响力,提高生产效率,产业流程,了企业转型升级进程
3. AI技术展现巨大影响力和未来潜力的同时,在实践中存在诸多挑战,一定程度上制约着AI应用
4. AI技术发展和应用需要我们治理,包括建立健全数据管理体系、增强AI模型可释性交流合作、制定相关法律法规、在人才培养、教育等需要多方面支持
5. 业内首场针对甲方企业AI大模型落地应用研讨峰会乘势而来,荟聚国内外行业专家、技术大咖以全球视角聚焦AI技术应用潜力
阅读原文

王耀南院士:AI大模型驱动的人形机器人与展望

文章概要:

1. 近日,王耀南院士作了题为《AI大模型驱动的人形机器人与展望》的主旨报告,从大模型赋能人形机器人的意义,国内外近五年研究现状,关键技术赋能具身智能人形机器人,以及未来的发展趋势与展望四个方面进行汇报。3. 王院士以多个案例详细介绍用AI大模型赋能具身智能人形机器人的思路和方法,他提出未来在具身智能人形机器人方向上需要突破脑认知情感机理、多模态情智大模型、个性化感知计算三个关键问题。
4. 文章还展示了截止到10月25日,“未来知识库”精选的100部前沿科技趋势报告的完整标题列表。
阅读原文

矿山大模型三国杀:华为、百度、科大讯飞谁主沉浮?

文章概要:

1. 矿山大模型是矿山智能化的典型发展趋势,华为盘古矿山大模型、百度矿山大模型、科大讯飞工业大模型(矿山版)各展其,正在上演精彩的 “三国杀
2. 华为矿山大模型具有安全保障升级和生产效率提升的优势,精准风险预判、规范作业监督、设备安全护航、智能开采优化、高效运输调度等。
3. 百度矿山模型在资源管理科学和知识管理与培训创新方面取得一定成就,如准确资源评估、合理资源配置、构建知识图谱、开展虚拟培训等
4. 讯飞矿山语音识别和人工智能交互领域优势为矿山大模型了独特的活力,如生产效率提升(智能开采优化)、经营管理高效(成本管控)等。> 5. 目前,华为的矿山大模型已经在多个大型矿山企业得到,的大模型也在一些矿山企业进行了试点应用,科大讯飞的矿山大模型在部分矿山企业中得到了应用。
阅读原文

中国AI大模型的崛起:从萌芽到广泛应用

文章概要:

1. 中国AI大模型的萌芽:AI大模型的起源可追溯人工智能技术的早期发展,中国AI大模型的萌芽可以追溯到世纪末和本世纪初。在AI大模型萌芽阶段于自然语言处理、计算机视觉等核心技术研究和。2. 中国大模型:进入21世纪20年代大模型的迎来了期以GPT为代表的预模型的,标志着AI大模型技术进入新的发展阶段。3. 中国AI大模型的现状:中国AI大模型规模呈现快速增长的态势,在技术水平方面,中国AI大模型取得了显著。4 中国AI大模型的应用领域:AI大模型的应用非常广泛涵盖了领域,包括智能制造、智慧城市、、医疗领域、金融领域等。5. 中国AI大的未来:AI大模型的为全球科技领域带来的和挑战。中国作为AI技术的重要参与者和推动者,在AI大模型领域取得了显著的成果和进展。未来,随着技术的不断应用场景的不断拓展,AI大模型将迎来更加广阔的发展前景和机遇。
阅读原文

瞬间对大模型与NLP的兴趣达到了2000000000%

文章概要:

1 介绍新作《自然语言处理:大模型理论与实践》,作者是赵宇教授和任福继教授
2. 阐述了的领域和成就,以及任教授的职业生涯和影响力
3. 强调这本书在AI时代的重要性不同读者群体,内容全面,从基础理论到高级应用都有涉及
4了的附录以及这本书能够收获
阅读原文

大模型产业发展每周速递(11.1-11.7)

文章概要:

1. 介绍了首个大孵化和加速载体模速空间,它立足徐汇滨江,“十百千万”目标,打造数据、算力、评测、金融、综合等功能平台,赋能各通用大模型、垂类大模型、大模型应用初创企业汇聚上海、引领全国、扬帆世界。
阅读原文

大模型来了,我还用搜索吗?

文章概要:

1. 传统搜索正在被分流,AI搜索市场火热,大模型的到来改变了一部分人的搜索习惯。
2. 程序员是目前使用大模型最多、效果最为明显的群体之一,大模型在编程辅助方面的应用,是试验下来确定性和ROI曲线都比较好的场景。
3. 大模型对于搜索更重要的意义,在于它能够跟自己头脑风暴。
4. 大模型和传统搜索引擎的关系并不是二元对立的,而是大概率会共存。
5. 大模型的到来,正在改变一部分人的搜索习惯。它在一定程度上取代了原来的搜索引擎的部分功能,但目前仍然还有许多无法替代的部分。
阅读原文

10月大模型领域动态速览

文章概要:

1. MetaAI生成Movie Gen,可根据文本提示生成和编辑视频,并为视频配上同步音频
2. Meta推出“自我训练评估器”AI模型基于自我训练的方式提高大型语言模型(LLM)的评估能力
3. Meta发布首个支持多模态能力的模型量化Llama3.2模型包含小型(11B)和中型(90B)两种版本的主要视觉模型,以及轻量级的1B和3B纯文本版本
4. Meta推出MarD融合掩码自回归(MAR)和扩散模型(DM)的优势,用于大规模视频生成
5. 苹果发布零样本单目深度估计模型Depth Pro,能在0.3秒内从单一2D图像生成高精度的3D深度图
6. 苹果发布多模态大语言模型MM1.5,提供1亿到300亿参数规模,具备图像识别和自然语言推理能力
7. 字节跳动推出GR-2机器人大模型,在预训练阶段,通过观看3800视频片段学习人类的日常行为模式
8. 字节跳动推出PersonaTalk AI,基于注意力机制的两阶段框架,用于实现高保真度和个性化的视觉配音
9. 北京智源人工智能实验室推出全球首个原生多模态世界模型Emu3,基于模型或方法,即可完成文本、图像视频三种模态数据的理解和
10. 北京智niGen,具有和性的特点
11. 北京智源人工智能视频模型Video-XL在处理长时出色
12AI推出增强的多模态支持音频输入输出,能够生成自然流畅的语音分析音频输入的 Open推出模型显著了生成速度在生成高质量内容时了50倍
4. Rhymes AI推出全球开源多模态原生Mixture-of-Experts(MoE模型Aria,能够理解和处理文本、代码、图像和视频等多种输入模态
15. C多模态AI搜索模型Embed3,将输入的文本和图像数据转换成数值向量,这些向量被称为嵌入向量,代表数据的“意义”
16. NVIDIA推出文本到图像框架Sana,能够高效生成高达40 阅读原文

“与 Google Cloud 一起捍卫大模型安全”之“保护你的大模型训练”

文章概要:

1 大模型面临安全风险,包括对抗性攻击、数据投毒、模型窃取、滥用和恶意使用、隐私和安全、模型篡改等。
2. 模型篡改风险涵盖对模型的任何未经授权修改包括对模型训练或微调注入后门或降低性能,修改模型参数或代码导致模型无法正常工作或产生错误结果。
3. 大模型训练面临基础设施、工具链、供应链、模型代码和配置等方面的风险,需要多管齐下进行保护。
4. Google Cloud提供多种云原生手段应对大模型投毒威胁,包括加强基础设施安全、使用可信工具链、保护模型代码和配置、进行持续监控和检测等。
5. 大模型训练工具需要从漏洞、用户访问控制、加密和网络隔离等多个方面入手进行保护。
6. 保障大模型训练安全,需审查预训练模型、第三方数据和依赖库,选择Google Cloud提供的预训练模型,并使用Artifact Analysis等工具进行漏洞扫描和依赖分析。
7. 在管理依赖库的安全风险方面,Google Cloud Assured OSS可以发挥重要作用,提供经过Google安全审查和维护的开源软件包。9. 生成式AI的安全及合规治理不容忽视,Google Cloud SAIF是一个旨在保障AI系统安全的概念框架,强调了默认安全、纵深防御、持续监控、持续改进等关键原则。
阅读原文

AI 科普丨调研180多篇论文,这篇综述终于把大模型做算法设计理清了

文章概要:

1. 本文对LLM4AD的研究进行了系统性回顾,沿着四个包括LLMs的作用、搜索技术、提示策略和应用,提出了一个系统性分类和现有研究的回顾,讨论了使用LLMs的潜力和成就。
2. 本文对新兴领域“大语言模型用于算法设计”(LLM4AD)中现有研究工作进行系统的梳理和分类,介绍了论文收集和扫描的详细流程。
3. LLM4AD论文按照大模型的结合方法可以分为四个范式:大模型作为优化算子(LLMaO)、大模型用于结果预测(LLMaP)、大用以特征提取(LLMaE)、大模型用来算法设计(LLMaD)。
4. 本文综述了目前在LLM4AD中采用的搜索方法,并将其大致分为四类:基于采样的方法、单点迭代的搜索方法、基于种群的搜索方法和基于不确定性的搜索方法。
5. 本文讨论了LLM4AD论文中使用的主要提示工程方法的应用情况,包括零样本、少样本、思维链、一致性和反思。7. 本文提出了几个未解问题和未来研究的方向,包括开发领域特定的LLMs、探索多模态LLMs、促进人与LLM的互动、使用LLMs进行算法评估和理解LLM行为、推进全自动算法设计,以及为系统评估LLM在算法设计中的表现进行基准测试。
8. 本文提供了一份最新的关于大语言模型在算法设计中应用(LLM4AD)的系统性综述,不仅突出了LLM在算法设计中的当前状态和发展,还引入了一个全新的多维分类体系,分类了LLM的、搜索方法、提示词方法和应用场景。
阅读原文

王耀南院士:AI大模型驱动的人形机器人与展望

文章概要:

1. 近日,王耀南了题为《AI大驱动与展望》的主旨报告> 2. 他从大模型赋能人形机器人的意义,国内外近五年研究现状技术身人形,的发展趋势与四个方面汇报> 3. 王院士认为人工智能大模型推动人形机器人感知、认知、思考、分析、判断、推理、的智能自主作业方向
4 他提出未来在具身智能人形机器人方向上需要突破认知情感机理、多模态情智模型、感知计算三个关键问题
阅读原文

企业如何有效落地大模型知识管理?鸿翼的实践探索与应对之策

文章概要:

1. AI、大数据和知识管理三股热潮的汇聚与,正所有的管理向更高效、智能化方向发展。鸿翼联合创始人兼CTO罗永秀带来《企业如何有效落地大模型知识管理》主题分享。
2. 鸿翼成立于2000年,专注在广义的电子文件或非结构化数据20余年。主营业务是和文件有关的各种平台及应用产品,包括网盘文档、非结构化数据管理平台、AI数据管理平台等等。
3. 鸿翼的AI能力实际上是一个双环端到端构建企业大模型应用的闭环,左侧主要是数据治理的体系平台和产品,右侧则更多地基于非结构化数据在企业内部实施大模型落地。
4. 模型数据实际上可以分为三类,第一个是全训模型数据,其实就是知识库;第二类是RAG数据,即我们将一系列的知识文件转换为各种内容块;第三类是进行微调和精调时需要使用的更高质量的QA数据。
5. 非结构化数据治理与AI数据处理包括文件的内容化处理和内容数据化,文件内容化的核心内容是解析内容、版面分析、内容拆分、QA萃取和自动化处理,内容数据化的过程是利用不同的基础大模型或垂直小模型,以满足不同业务和类型的数据化需求。
6. 知识管理的难度非常大,涉及到人、组织、团队等多个方面,因此我们不能简单地认为拥有一个知识库、一堆知识文件,并使用一个大模型就能实现良好的落地效果。
7. 鸿翼在大模型应用层面相关内容包括ECM文档云LLM应用、AI Agent智能体平台、典型企业大模型应用分层、大模型应用有效落地的四方面因素。
阅读原文

技术动态 | 第二届大模型与科学计算论坛:大模型开启科学计算新篇章(CNCC2024)

文章概要:

1. 大模型成为科学研究领域的全新工具打破了传统在复杂条件数据下计算效率与准确度br>2. 香港科技大学(广州)的雷教授,解决大模型科学中的数据、训练优化、模型解释三个关键问题,将是大模型数据科学的研究方向
. 之江实验室陈红阳研究员分享了题为《GeoGPT: A Large Language Model System for Geoscientists》的,GeoGPT是一个致力于全球地球科学研究领域的开源非营利探索性项目,响应“深数字地球”这一国际大科学计划倡议,一项汇集了研究机构、高等院校产业界以及众多其他组织共同参与的开放科学实践。
4. 浙江大学的陈钧教授从知识图谱和大型语言模型两个视角总结了人工智能相关发展趋势,探讨了利用知识图谱和语言模型来表示科学知识和处理科学语言的和思路,带领大家深入了解了化学元素知识图谱、融合知识增强和功能提示的分子图学习、蛋白质提示学习模型等最新研究进展。<>5. 北京大学助理教授张亿在报告《量子材料、模型和算法中的机器学习》中指出,量子多体有着巨大自由度和海量数据规模,经常导致我们无法进行有效计算分析。为此,张亿介绍了其团队采用机器学习策略应对量子多体系统的计算策略,包括使用机器学习基于复杂高通量实验或计算数据来分析量子态,如奇异的演生电荷序和量子自旋液体等。
6. 在圆桌论坛环节,与会专家和现场观众“AI for science取得了成功,但哪些?”“模型还是重要?”“大模型数据的管理存在哪些现实困境”等问题展开观点分享和讨论。br>7. OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的互联众包,并促进知识图谱算法、工具及平台开源开放。
阅读原文

清华大学联合东华大学发布国内首个纤维知识大模型

文章概要:

1 清华大学联合东华大学发布国内首个纤维知识大模型——中国纤贝AlphaFiber 1.0)。
2.模型由清华大学自动化系师丽教授团队与东华大学材料科学与工程学院、集萃先进纤维材料研究所有限公司联合开发。
3. 中国纤贝(AlphaFiber 1.0)是国内首个针对纤维行业的大依托大语言模型在自然语言处理方面的能力,经过对海量纤维领域知识的学习,实现在纤维领域精准信息供给和自动化内容生成。br> 4. 朱美芳纤维领域在人工智能下的发展趋势作报告,总结了人工智能在纤维材料的、研究、生产等方面的重要作用。
5.丽介绍了中国纤贝(AlphaFiber 1.0)的基本功能、技术特点和应用。
阅读原文

荣耀时刻 | 摸象科技荣耀入选“金融大模型先锋榜”,开启AI金融新纪元

文章概要:

1. 摸象科技在2024服贸会“金融大模型先锋榜”案例征集中脱颖而出。
2. 摸一直致力于将人工智能技术与金融服务相结合,为金融机构提供的决策支持。
3. 摸象为中国超过2000家银行机构量身定制智能员工提高了效率与营销成果。
. 摸象科技将继续在AI金融领域深耕细作,不断探索和实践,以创新为驱动力数字化转型。
阅读原文

智库视点 | 构建人工智能大模型开源生态 加速形成新质生产力

文章概要:

1. 7月底,Meta发布了Llama 3.1开源模型,标志着开源大了顶尖闭源大模型。上海应探索构建更完善的开源大模型发展生态,助力大模型行业长期持续发展。
2. 开源模式及开源大模型是指基于开源软件模式,由全球开发者共同参与共同维护、共同发展的机器学习模型。开源大模型的发展优势包括促进模型技术创新与迭代、降低使用门槛和成本、增强技术透明性与可信度、形成技术追随和构建行业标准。
3. 国内外大模型科技龙头企业及研究机构在大模型领域持续探索开源发展路径,并构建了特色鲜明的开源大模型生态体系。Meta坚定开源战略+生态建设从而保持开源竞争优势;阿里践行IaaS+PaaS+MaaS三位一体构建通义千问大模型生态;飞智聚焦全要素布局力争打造大模型时代“新Linux”开源开放生态。
4. 上海人工智能大模型发展居全国领先地位,并推出了面向大模型研发与应用的全链条开源体系。主体要素资源,完善龙头开源大模型技术创新链;以重点领域需求牵引,构建开源大模型落地应用产业链;依托开源生态运营,加速政产学研用金成果转化闭环等方面发力,推动开源大模型生态体系建设,加快形成新质生产力。
阅读原文

王耀南院士:AI大模型驱动的人形机器人与展望

文章概要:

1. 中国工程院院士王耀作了题为《AI大的人形展望》的报告>2. 王耀南从大模型人形机器人的意义,国内外近五年研究现状,关键技术赋能具身智能人形机器人,以及未来的发展趋势与展望四个方面进行汇报
3. 王认为人工智能大模型推动人形机器人在感知、认知、思考、分析、判断、推理、交互的智能自主作业发展
4. 王耀南院士以多个案例详细介绍了用AI模型具身智能人形机器人的思路和方法
5. 王耀南院士提出未来身智能人形机器人方向上需要突破脑认知情感机理、多情智模型、个性化感知计算三个关键科学问题
阅读原文

大模型| YuLan-Chat:基于多阶段课程学习的大语言模型

文章概要:

1. 《计算机学报》论文“YuLan-Chat:基于课程学习的大语言模型,作者来自中国人民大学。
2. 本文提出多阶段课程学习方法,包括迭代增强长尾知识的预、由简单到复杂指令微调课程、由易到难的人类对齐课程。
3. 在四个中英文评测基准上对YuLan-Chat进行评测,结果表明该模型能够在大部分场景下优于基线模型。<>. 分析实验表明课程学习方法在GAOKAO和AlignBench评测基准上,能够分别模型9%和18.的答案预测准确率br>5. 该工作完全依托中国人民大学科研力量以及算力资源。
阅读原文

腾讯一出手就是最大MoE大模型!开源大模型领域又来一位重磅玩家

文章概要:

1. 腾讯发布了市面上最大的MoE——Tencentyuan-Large
2. 该模型总参数量约3,激活参数量约52B ,上下文长度达256k,当前业界参数规模最大效果最好的Transformer架构的MoE模型
3.采用高效的超长文 Attention 训练和退火 4混元 Large 模型专项提升的长文能力已经应用腾讯 AI 助手腾讯元宝上
5E (Mixture Experts),即专家模型,MoE 模型的每一层都包含多个并行的同构,一次 token 的前向计算只会激活部分专家
6. 得益于 MoExture of Experts) 结构的优越性, Large 可以在保证模型推理的同时,显著提升模型的参数量进而提升模型性能
7. Hunyuan-Large在与业界开源的模型DeepSeek-V2、Llama31-70B以及Mixtral822B的对比,在CMMLU、MML、CEval等多学科综合集、中英文NLP任务、和数学等大维度全面领先,处于行业领先水平
8 腾讯把自研的、经过业务检验的大模型开放给技术,了个人开发者和中小科技企业的开发成本也推动了一个更加活跃的技术
阅读原文

石景山人工智能大模型产业创新大会顺利召开|流金科技“视界慧景”大模型首发

文章概要:

1 11月5日上午,人工智能大模型产业发展大会在石山区大模型产业集聚区顺利召开
2 会上,流金科技进行了 “视界慧”传媒类大模型启动仪式
3. 当前,流金科技“视界慧景”大模型重点赋能三大领域板块,包括广电传媒行业全生态、智能短剧和内容生产、文旅发展
4. 后续,金将基于“视界慧景”大模型,打造智能视听领域的各场景服务平台和媒资应用产品在芯片产品方面同步发力
阅读原文

干货+资料 | 百度智能云x石景山区:大模型产业基地服务平台上线

文章概要:

1. 1月5日,“人工智能大模型产业创新发展大会”在石景山区成功举办,石景山区人工智能大模型产业集聚区正式点亮,百度智能云千帆大模型产业(北京创新基地服务。<>. 服务平台的正式上线是山区人工智能产业创新发展的重要,也是百度大模型技术服务在产业基地合作中的一个重要里程碑。
. 石景山区委副书记、代理区长万隆在致辞中提到,景山区按照中央和市委区委部署要求,深入实施更新和产业转型发展,统筹做好产业融合等四篇文章”。
4.集团执行副总裁、百度智能云事业群沈抖作为企业代表上台发言,提到智能云与石景山区联手打造创新基地,发挥了政企合作的优势,实现资源共享和优势。
5 在随后进行的人工智能大模型产业集聚区点亮仪式上,中国院士、中央网信办专家咨询委员会顾问沈昌祥北京市发展改革党组副书记、副主任林,北京市科委、中关村管委会党组成员、董北京市经济和信息化局二级巡视员汪剑,石景山区委书记常卫与百度集团执行副总裁百度智能云事业群总裁共同点亮大集聚区。
6. 石景政府党组成员副区长李文化,百度石清华,北京智优沃科技有限公司董宇共同见证了百度智能云千帆大模型(基地服务平台上线。
7. 该服务平台将作为创新基地的核心技术引擎,为区内企业提供大模型生命周期工具链和环境。
阅读原文

沈向洋院士:关于大模型的10个思考

文章概要:

1. 近日,第四届“青年科学家50²论坛”在南方科技大学举行,美国国家工程院外籍院士沈向洋做了《通用人工智能时代,我们应该怎样思考大》的主题演讲,并给出了他对大的10个思考
2. 沈洋给出了对大模型的10个思考,包括算力是门槛、关于数据的数据、大模型的下一章、人工智能的范式转移、大模型横扫千行百业、,从愿景到落地、开源和闭源重视AI治理、重新思考人机关系、智能的本质
3. 沈向洋认为,在通用人工智能时代,我们应该思考大模型,他想谈几点自己的看法
4. 沈向洋认为,算力是门槛,大模型对算力的要求,过去10年非常巨大
5. 沈向洋认为,关于数据的数据,未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据
6. 沈向洋认为,大模型的下一章,有很多多模态的科研工作要做,他相信一个非常重要的方向是多模态的理解和生成的统一
7. 沈向洋认为,人工智能的范式转移,从原来的GPT的预训练思路,变成了今天的自主学习的道路,就是在推理这一步强化学习,不断地自我学习的过程
8. 沈向洋认为,大模型横扫千行百业,在中国的大模型建设浪潮当中,越来越多的是行业大模型
9. 沈向洋认为,AI Agent,从愿景到落地,超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent
10. 沈向洋认为,开源和闭源,开源今天做得非常好的是Meta的Llama 3AI的差距不大了。他认为它并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据,所以我们在用开源系统的时候,也要下定决心真正理解大模型的系统闭源的工作
11 沈向洋认为,重视AI治理,人工智能对千行百业、对整个社会的冲击非常大,整个世界的发展实际上是要大家共同来面对的
12. 沈向洋认为,重新思考人机关系,真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者
3. 沈向洋认为,智能的本质,今天虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的
阅读原文

这些AI大模型巨头开始下场做硬件了

文章概要:

1. Meta前增强现实眼镜项目负责人凯特琳・卡利诺夫斯基(Caitlininowski)加入OpenAI,担任机器人和消费领导位
2. 卡利诺斯基曾在Meta领导VR硬件团队约9,负责Meta Quest 2、Touch 控制器、Oculus Rift产品
3 2022年3月,她开始领导Meta的团队,并主要监督了Orion项目的开发
4. 加入Meta之前,她还在苹果公司担任技术领导,负责Mac Pro和MacBook Air产品
. 此次卡利斯基很有可能会与的前上司、前苹果高管乔尼·艾维(J Ive)合作,开发一款的硬件设备
6. OpenAI早期有研究机器人的计划,2018年曾制造一只能够自主学习抓取物体的
7. 2021年,OpenAI“缺乏训练机器人使用AI进行移动和推理所需的数据”为由,解散了自己的机器人团队
8. 但OpenAI一直都没放弃这个方向,频频出器人领域
9.有多家公司将OpenAI模型整合到他们的硬件中
10. 2024栖,阿里巴巴董事长CEO吴泳称,未来所有能够移动的物体都会变成智能机器人
11. 北大-银河通用身智能联合实验室王鹤指出,AI是代替人来决策的,本质上要人来的这两个能力上能达到跟人一样环境适应能力和任务泛化性后,就形成了机器人
12. 宇树科技创始人王兴表示,机器人是AI模型最好的落地载体,同时可以解决大模型落地场景的是非常的组合关系
阅读原文

生成式AI大模型高质量“竞速跑”,各路资本主动入局

文章概要:

1. 生成式AI大模型推动人工智能迈入2.0时代,市场规模超14万亿元。
2. 我国众多企业齐头并进,发力生成式人工智能研发应用,成果多点开花
3. 随着国内企业和科研院所在大模型领域不断实现技术突破,中国生成式人工智能水平已在世界处于领先地位。
4. 各领域大模型产品逐步完善,众多行业生产及工作效率大幅提升,为企业数智化转型及高质量发展提供了强有力保障。>5. 在生成式人工智能为企业及政府提供高效解决方案的同时,也有部分不法分子在利用相关技术实施新型网络诈骗。
6. 中央网信办主任庄荣文日前表示,截至目前,我国完成备案并上线、能为公众提供服务的生成式人工智能服务大模型已达190多个,注册用户数超过6亿
7. 庄荣文表示,积极推动生成式人工智能发展和管理,是网信工作的重要职责。
8. 2023年7月,国家网信办会同相关部门发布《生成式人工智能服务管理暂行办法》,在全球范围内率先开展立法,为我国人工智能健康发展保驾护航。
9. 相关技术和应用呈现出有序发展的良好态势。
10. 庄荣文表示,下一步,将坚持统筹高质量发展和高水平安全,推动这一重要领域的产业发展、技术进步与安全保障。
11. 在经历了“高歌猛进”的高速发展后,大模型企业纷纷调整战略方向,深入探索可持续发展路径。
12. 值得注意的是,模型技术日益成熟,但其商业化变现难仍是行业普遍面临的挑战。
13. 在此背景下,大模型厂商逐渐达成共识,应用场景落地才是大模型的最终“归宿”。
14. 只有将大模型深度融入各类应用及产品中,才能构建可持续的商业化模式。
15. 目前,人形机器人与智能两大领域已成为大模型商业化最为成功的典范,展现了技术与应用深度融合的巨大潜力。
16. 百度创始人李彦宏近期更是公开呼吁:“不要卷模型,要卷应用!大模型公司热衷于写‘高考作文’,价值不大。
17. 周鸿祎也表示,大模型技术的真正价值在于其在特定场景中的应用,这种结合才能充分发挥大模型的潜力。
18. 在应用落地前景逐步明确的背景下,大各路资本入局。
19. 据《证券日报》记者不完全统计,今年前7个月,我国大模型领域超千万元融资达到近90起,融资总额超320亿元。
20. 其中,多家独角兽AI公司获知名投资机构和互联网厂商投资。
阅读原文

人工智能教育大模型:体系架构与关键技术策略

文章概要:

1. 人工智能教育大模型是用于实现教育领域任务人工智能模型系统,能够满足教育特定场景任务需要,有效提升教育质量和推进。
国外已诞生了Khanmigo、Merlyn Mind、CheggMate、ChatGPT Edu等专门用于教育领域、解决各类教育场景任务的人工智能教育大模型。
3. 我国呈现“百花齐放”态势,科大讯飞、网易、腾讯等科技企业都在积极开展和部署自主研发的大模型技术,致力于研发好用、易用的人工智能教育大模型,力求差异化竞争。<>4. 人工智能教育大模型的建设需明确核心问题,搭建具体行业、场景的专业语料支持模型的训练,以及基于应用场景问题不断迭代、调试,才能有效解决算力、行业Know How等问题。
5. 人工智能教育大模型的建设可以通用大模型核心能力为基础,在教育领域专业语料库基础上精调优化以适配下游特定教育场景任务,并提供相应支持组件,以提升模型在教育场景应用中的适配性能、增强模型教育教学能力。
6. 人工智能教育大模型体系由基础支撑、模型能力、智能体平台、场景应用、模型评测五部分构成。
7. 采取何种技术策略,不仅是人工智能教育大的建设与应用从理论探索走向实践应用的桥梁,更是确保其在教育场景发挥最大效能、促进教育创新与变革的核心所在。
阅读原文

大模型如何赋能传统文化传承发展?我们有10个关键思考

文章概要:

1. 传统文化是国家和民族的精神命脉,在全球化和现代化进程中,如何保护、传承和发展中华传统文化成为的重要课题。2. 腾讯研究院与北京邮电大学交互技术与体验系统文化和旅游部重点实验室联合举办“大模型赋能传统文化传承发展研究报告发布暨专家研讨会”,会上发布报告成果,专家学者进行了主题分享和深入交流研讨。3. 课题组深入探讨了大模型赋能传统文化现在和未来的十大核心议题,总结了10个关键词洞察,以点窥面尝试勾勒出大模型与传统文化的融合创新蓝图。4. 大模型和传统文化的结合是双向奔赴,大模型技术的产业落地和创新应用,离不开中文料的数据支持,提升模型本身的可信度要求专业的语料数据训练。5.传承发展的新质生产力,将催生文化行业具有新兴科技思维的新型劳动者群体,同时将开创全新创作工具、基础设施平台等新型劳动资料,以及产生新兴的跨媒介个性交互等内容形态、创新体验场景等新型劳动对象。6. 行业大模型是大模型产业落地的最后一公里,通用大模型的泛化能力和专业能力难以平衡,行业大模型在精专化和经济性上占优。7. 大模型作为共性关键技术,能够为传统文化传承发展过程中“疑难杂症”提供解决方案,对传统文化资源、创意、生产、传播和体验的全价值链场景进行赋能。8. 传统文化的传承与发展关系国家文化安全,大模型赋能传统文化传承发展,“守正”是底线原则。9. 文化行业的市场传统文化得以传承发展的现实要求,在守正基础上,大模型赋能传统文化的创新需求凸显。10. 大模型落地文化行业,需要推动语料提供者、技术开发者和场景应用方的三方关键主体融合共创。
阅读原文

第一期课程回顾丨大模型研讨课

文章概要:

1. 2024年10月31日晚,处理器芯片全国实验室举办的“大模型课”科学院计算技术研究所正式开讲
2. 第一期课程采用线上线下结合的模式,吸引了上千人参加,来自科研机构、高校和公司
3 赵永威研究员介绍了及自然语言处理(NLP)领域的发展历程,并深刻阐释了语言模型的创新性诞生与发展
4. 张蕊副研究员介绍了大模型的基本结构原理,重点讲解了大模型所需的数据准备和预处理技术,深入探讨了Transformer架构中的模型结构细节,并对比了已有的架构,阐述了Transformer内核的优越之处> 5. 第二期课程将于11月7日19:00开讲,:计算技术中关村园区一层报告厅,线上:腾讯6746819671
阅读原文

【行业分析】AI大模型行业专题报告:大模型发展迈入爆发期,开启AI新纪元

文章概要:

1. 大模型发展呈现“规模定律”,Transformer为技术基座
2. GPT系列模型技术发展历程回顾
3. ChatGPT:一举成为现象级应用,引入RL算法改进训练数据
4. 大模型商业形态多元,B端变现模式更清晰
5. 全球API定价呈现下降趋势
6. 破局之路:企业级需求快速增长,MaaS助力降低模型使用门槛
7. 大模型技术与应用发展催生海量算力需求
8. 算力需求测算逻辑
9. 大模型服务器成本测算
阅读原文

《大模型落地路线图研究报告》系列解读(17/18):紧抓行业数字化转型机遇,全方位打造新质生产力

文章概要:

1 大模型正逐步成为多个行业的技术基座,未来将持续提升技术能力,成为打造新生产力的技术加速器
2. 各行业抢抓数字化转型机遇,将促使大模型应用能力向纵深,大模型落地路线应贴合行业实际需要
3. 大模型作为人工智能的前沿技术,能够成为打造新质生产力的中坚力量,成为实体行业的“智能助手
阅读原文

AI大家说——大模型助力软件研发测试技术沙龙成功举办

文章概要:

1 11月6日下午,“AI大家说——大模型助力软件研发测试技术沙龙举行,吸引了20多家企业测试负责人以及珠海科技学院和延安大学教授共50多名专业参会。
2. 本次活动邀请了行业知名朱少民教授进行主题分享,深入剖析了当前大模型技术背景下软件测试面临的与,并分享了最新软件测试方法和技术。
3. 在随后的圆桌分享环节,与会者们积极发言,大模型时代软件测试的热点问题展开了热烈的讨论
4. 软件测试在大模型时代将发挥更加重要的,本次活动成功举行,为软件行业的专业人士提供了一个交流学习,进一步推动了软件测试在大模型的应用与探讨
阅读原文

【科技资讯】双第一!百度智能云领跑中国大模型市场

文章概要:

1. 2024上半年,百度智能云在中国MaaS市场」和「中国AI大模型解决方案市场」中,市场为第一
2. 百度智能云的MaaS业务主要通过百度智能云大模型平台提供服务,为企业提供大模型全生命周期工具链和整套环境。
目前,千帆平台累计帮助用户精调了3万个大模型超过次。<>4. 得益于在全栈AI技术、产品创新和产业落地方面的持续投入,百度智能云中国最广最深的大模型产业落地规模,目前已有超60%的央企正在使用百度智能云AI。br>5. 百度智能云在汽车、互联网、在线教育金融、工业、交通、政务等多个行业都融合落地。
阅读原文

国内首个纤维知识大模型——中国纤贝正式发布!

文章概要:

1. 国内首个纤维知识大模型——中国纤贝发布!
2. 纤贝是中国首个纤维知识领域的大模型,其诞生主要来自东华大学和清华大学跨领域合作,结合了东华大学材料学院、纤维材料改性国家重点实验室的数据资源和江苏集萃先进纤维所有限公司的算力支持。
3. 纤AlphaFiber 1.0)是国内首个纤维的知识大模型,依托大语言在自然语言处理方面,经过对包括书籍、期刊、专利等文献数据,原料配方、实验步骤、物化性质等实验数据知识系统、专家经验、产业流程等其它类型在内的纤维领域知识的学习,实现在领域的精准信息供给和自动化内容生成,通过不断升级优化,为纤维科学普及提供了强有力帮助。
阅读原文

又一本开源免费的大模型书来了,449页pdf!

文章概要:

1. 介绍了《自然语言处理:实践》(预览版),以自然语言中语言模型为主,了基础理论高级应用的内容> 2. 提供了的资源领取方式,长按识别二维码添加微信领取
3 联合多位QS前50大佬做了最新的大模型实战系列课,原价699元,现在0元领取
4. 介绍了沃恩20周年·双11庆典的福利奖品,SCI限时秒杀,全场低至5项目买一送一实付满100元立10元
5. 直播间下单报名科研,立享四重豪礼:万元课时礼包、大牛顶速成课、赠送300/4090算力、中稿奖学金(最高奖励1000元现金)
阅读原文

全球超万亿使用量的热门数据库,首次被大模型揪出了严重漏洞

文章概要:

1. 谷歌人员利用大语言模型发现SQLite中存在可被利用的堆栈缓冲区下溢漏洞,漏洞可能导致程序崩溃甚至执行任意代码,已在10报告给开发团队并修复
2. 谷歌的“Big Sleep”是基于大语言模型的漏洞挖掘AI agent,此次是其在真实世界环境中的首次实验
3. 许多公司使用模糊测试来测试软件,但谷歌表示其在发现某些漏洞方面做得不够希望AI能缩小这一差距
4. AI公司宣布了一款免费、开源的工具VulnHunter,可在Claude AI模型的帮助下在Python代码库中发现零日漏洞
5. 谷歌称“Big”在广泛使用的真实软件中发现了首个未知的、可被利用的内存安全,而VulnHunter发现的是不同类型的缺陷
谷歌团队表示“Big Sleep”目前针对特定目标的模糊测试工具在发现漏洞方面至少同样有效
阅读原文

目前国内AI大模型30强榜单

文章概要:

1 文章介绍了目前国内AI大模型强名单。
2.介绍了Kimi智能助手的功能,包括编程助手、速读论文/博客、生活助手等。
3. 作者认为Kimi智能助手能够帮助用户提高工作效率,拥有更多摸鱼时间。
4. 文章呼吁大家支持中国大模型。
阅读原文

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

文章概要:

1. 字节豆包大团队提出超连接,解决残差连接局限,使预训练收敛速度最快加速80%。
2. 超连接的核心思想是引入可学习的深度连接和宽度连接,分为静态和动态两种,动态超连接效果更好。
3. 技术细节包括超连接的定义、动态超连接的等,实验结果表明超连接在大规模语言模型的预训练以及视觉任务中表现出显著的性能提升。
4. 超连接可以学习如何将神经网络层重新排列,形成顺序和并行配置的混合。<> 5主要集中在大规模语言模型的上,涵盖了Dense模型和E模型,使用超连接的模型显著优于使用残差连接的模型。
阅读原文

价值万亿的具身智能市场,大佬们如何从世界模型下刀?

文章概要:

1. 具身智能是赋予AI一个“身体”,让其在物理世界中行动自如,当大脑升级成世界模型,机器人可以灵活变通
2. 智源研究院院长王仲远介绍了智源大模型“全家桶”,其中最引人瞩目的要数首个原生多模态大模型Emu3
3. 智源具身多模态大模型研究中心负责人仉尚航展示了一系列基础模型的新成果,她的下一步是把模态的原生能力升维到4D——构建更好的4D世界模型与数据集
4. 北京大学助理教授、银河通用创始人王鹤认为,合成数据或许是更优解,他看好的是4D数据
5 智源研究院特邀了谷歌RT-1和RT-2的作者Ted Xiao带来分享,Ted Xiao回顾了scaling law如何在RT-1和RT-2的逐步生效
6. 清华大学自动化系教授赵明国展示了一场精彩的机器人足球赛,他认为要使机器人在行为层面展现出真正的智能,关键在于根据不同身体部位的功能分工来设计和训练机器人
7. 星尘智能的创始人兼CEO来杰提出,虽然大语言模型为机器人提供了很多知识,但这些知识离世界的底层逻辑还很远
8. 吉林大学唐敖庆讲席教授任雷则带来了一种不需要动脑,仅凭“肌肉记忆”,机器人就能自主行动全新方案
9. 中国科学院计算技术研究所研究员蒋树强从涉身性、交互性和情境性等维度,结合哲学视角,对具身智能这一概念进行了深入分析和定位
10. 乐聚机器人创始人冷晓琨分享了人形机器人产业的一线视角,乐聚机器人也正在科研平台、商业服务 、工业流水线、家庭康养、城市巡逻等各种场景中发光发热
11. 大湾区大学 (筹) 讲席教授王煜认为,人形机器人产业化的关键在于让触觉信息转化为,让机器人能真正地得心应手
2. 中科院自动化所研究员王鹏及其团队设计通用灵巧操作具身智能体系Casia Hand系列时,强调柔顺性与刚性的结合
13. 智源研究院副院长林咏华提出了一个问题:从硬件、数据、算法、芯片四个方面,哪个对搭载具身智能的机器人最重要?
阅读原文

具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队

文章概要:

1. 自变量机器人是国内唯一一家从第一天就选择了端到端统一大模型技术路线的公司,正在训练的Great Wall操作大模型系列的WALL-A甚至从参数规模上已经超过了Open AI投企业Physical Intelligence()。
2. 自变量机器人的模型效果已达到惊人水准,体现在包括处理长序列复杂任务,以及泛化性、通用性等方面。
3. 目前,这家成立不到一年的中国初创企业,已经做出了世界上最大规模的端到端统一具身大模型「WALL-A」,并在多个维度上超过了所有已知模型。
4. 自变量机器人认为,目前Great Wall系列的WALL-A类似于「GPT-2」,伴随着模型的不断迭代,机器人领域的「ChatGPT」时刻可能会在不久后来到。
阅读原文

大模型抵达“分水岭” | 商业头条No.49

文章概要:

1. OpenAI CEO山姆·奥特曼以玩笑方式透露OpenAI o2的进展,引起全网热议。
2. 国内大模型领域还没有复刻出o1-preview,OpenAI已经在“有意”透露具备多模态能力的完整版o1。
3. 智谱AI、百川智能、月之暗面、Minimax、零一万物、阶跃星辰这六家中国大模型初创公司,被业界冠以“六小虎”之称。
4. 随着大模型从业者们信仰的Scaling Law遇到瓶颈,模型训练不得不脱离“大力出奇迹”的轨道。
5. OpenAI发布o1大模型,它改变技术策略,加入了强化学习和思维链大幅提升了模型的推理能力,也将训练重点从预训练转向后训练。
6. 国内大模型战局正在显现分水岭,要不要跟进o1,成为国内创业者面前的选择题。
7. OpenAI发布o1大模型,它改变技术策略,加入了强化学习和思维链,大幅提升了模型的推理能力,也将训练重点从预训练转向后训练。
8. o1代表的技术范式还不至于是AGI的直通车,但它的确是一列全新的特快车。
9. 国内大模型公司都是抄OpenAI的路线,既然它蹚出了一条路,你也没有这么多试错成本,为什么不去copy它?
10. o1这条路未来可能遇到的最大瓶颈还是来自通用性,也就是模型的泛化能力。
11. 大模型未来在提升强化学习模型的泛化性上会遇到什么困难,还不得而知,短期内能够复现某个垂直领域的国产o1就是一种胜利。
12. 国内大模型公司要跟进做o1必须满足两个硬性条件。一是拥有这笔可支配的资源。二是基础模型的性能水平门槛。 13. 大模型公司可能自此分化:视频模型,模型,高级推理等等。
14. 在上一个竞争阶段,文心一言、通义千问、混元、豆包等产品,并没有跟创业公司完全拉开差距。而在o1路线上,这种优势也许会更加微弱,因为它对算力资源的要求不如之前高,也更考验技术团队的灵活性。
15. 投资人也听到不少所谓行业动荡的风声,但他们的大致体感是,在车上的都没有动摇过,不断动摇的都是没上车的。
16. 之所以不动摇,来自于一个长期判断:AGI能实现,绕不开大模型,而o1的出现说明了AGI可以实现,它的确提振了资本的信心。
17. 商业化,就是当前来自投资人最直接的拷问。需要认清的是,o1这个技术上的“大变革”,并不一定能激发大商机。
18. 一方面,o1所代表的“模型即产品”思路可能会革掉一批应用层公司的命。另一方面,o1即便做出来,在产品上也没有直接的变现手段。
19. 李江的看法有些悲观,认为即使国内公司做出o1这样的产品也不会对商业应用带来本质改变。
20. 以此1可能是大模型技术上的分水岭,但用户很难感知到。
21. 在AGI进程放缓时,o1的出现几乎被视为“全村的希望”,但它依然无法带大家挣到更多的钱,那它的意义到底是什么?——答案可能仍然在融资里。
阅读原文

什么是大模型?一文读懂大模型的基本概念

文章概要:

1. 大模型是指具有大规模参数和复杂计算结构的机器学习模型,能够处理更加复杂的任务和数据。3. 大模型的发展历程可以分为萌芽期、探索沉淀期和迅猛发展期三个阶段br>4. 大模型的特点包括巨大的规模、涌现能力、更好的性能和泛化能力、多任务学习、大数据训练、强大的计算资源、迁移学习和预训练、自监督学习、领域知识融合、自动化和效率。
5. 大模型的分类按照输入数据类型的不同,可以分为语言大模型、视觉大和多模态大模型;按照应用领域的不同,可以分为通用大模型模型。
6. 模型的泛化能力是指一个模型在面对新的、未见过的数据时,能够正确理解和预测这些数据的能力。
7. 模型微调的基本思想是使用少量带标签的数据对预训练模型进行再次训练,以适应特定任务。
阅读原文

报告分享 | 李彦胜教授:遥感大模型赋能复杂地理场景智能解译

文章概要:

1 10月17日,“遥感大模型智能应用”分论坛在河南召开,多位业内知名专家带来了精彩的专题报告了参会者。br> 2. 武汉大学遥感信息工程学院副院长李彦胜作《遥感大模型复杂场景智能解译》,介绍了与蚂蚁集团的2亿参数多模态时序遥感大模型Sense。
4. 李彦胜以SkySense为例,深入阐述了大模型在复杂地理场景解译中的应用方式。
阅读原文

关于大模型微调与训练的问题,大模型训练的难点在哪里?

文章概要:

1. 大模型训练的难点不在于大模型,而在于数据
2. 大模型训练的难点算力,不在于大模型的复杂度,而训练数据的收集与
. 训练数据的收集、处理、加载、存储都是问题,数据就是大模型的原料
阅读原文

第一批被大模型气死的人…

文章概要:

1. 通用大模型在企业级严肃场景、垂直场景可能会出现幻觉、水土不服的情况,因此需要进行精调;2. 大模型精调存在模型选择、数据清洗标注、算力等难点;3. 腾讯云TI平台可以解决大模型精调的各种难题,包括模型选择、数据准备、精调过程、模型评估与部署等;4. 腾讯云TI平台预置了数据清洗pipeline脚本和大模型标注工具,支持低代码、灵活自定义两种精调模式,提供三层保障机制,加速训练和推理,支持政企部署;5. 腾讯云TI平台提供了完善的模型评估体系,内置推理加速器,提供统一的大模型调用API和体验工具,支持可视化应用编排;6. 混元-Large×TI的强强联合服务已经腾讯云上开放,可以通过直接问答、构造自定义评测集、接入自有大模型应用、基于自有数据集精调等方式使用。
阅读原文

第一批被大模型气死的人…

文章概要:

1. 大模型在B端严肃场景中可能会出现问题,如数据分析、成本核算、招标助手等方面。
2. 大模型精调是解决问题的有效方法,但精调过程中存在难点,如模型选择、数据清洗和标注、算力消耗、模型部署等。
3. 腾讯云TI平台可以帮助企业快速搞定大模型精调,解决模型选择、数据清洗和标注、精调过程、模型与部署等难题。
4. 混元Large是腾讯云TI平台的一个开源模型,具有3890亿总参数量、520亿激活参数量,并支持256K上下文长度,是目前业界参数规模最大、性能领先的开源MoE模型。
5. 混元Large在推理速度和参数规模之间取得了平衡,显著提升了模型的处理能力。
6. 腾讯云TI平台提供了一套完善的模型评估体系,从精调的不同阶段了「轻量体验、客观评测、主观评测」等“考试环节”,并且支持在精调训练的任一checkpoint进行抽查。
7. 腾讯云TI平台提供了可视化应用编排,并可以纳管边缘集群,通过云端控制边缘服务发布,快速落地生产场景。
阅读原文

张钹院士:大模型时代的企业AI发展趋势

文章概要:

1. 张钹院士在“2024商业创新大会”上发表为《生成式人工智能时代的产业》的演讲从能力、应用、架构、趋势等维度阐述了学术界关于大模型洞察与思考,剖析了大模型的演进路径,了该技术的应用前景、挑战领域的应用
2. 大语言模型具有三大能力和一大缺陷,优势包括自然语言处理能力、多模态融合能力和自适应学习能力,缺陷是大模型的幻觉,即输出结果可能错误,不可控,提示词依赖性强,鲁棒性较差
3. 基础模型有三种落地方向,包括高阶应用如设计、规划,低阶应用如服务、营销,以及介于两者之间的应用
4. 张钹院士提出了基于大模型的六种架构模式,包括生成式预训练转换器、自监督学习、多模态融合、自适应学习、强化学习和知识图谱
. 生成式AI是人类发展史上的一次重大技术突破,解决了领域中的三个关键技术问题,包括文本的语义向量表示、生成式训练转换器和自监督学习
阅读原文

聊一聊大模型幻觉问题及其解决方案

文章概要:

1. 什么是大模型幻觉问题
2. 360可信大模型的幻觉解决方案
3. 360可信大模型应用案例
5. 问答环节
阅读原文

大模型技术实践(六)|优刻得AI推理平台升级高性能推理服务框架

文章概要:

1. 优刻得将为大家带来vLLM,一款高性能推理服务框架的相关内容,UModelVerse现已同步上线vLLM0.6.0。
2. API服务端与推理引擎各自独用python进程后,两个进程可以各自专注于份内职责,而不会受GIL的影响。
3. 多步调度的方法使得请求处理的调度更高效。
4. 新版vM引入了异步输出处理,使得模型推理和输出处理异步进行,从而重叠计算的时间。
5. 在优刻得UModelVerse体验新版vLLM。
阅读原文

怎么设计一个自己的大模型?设计一个大模型需要哪些能力?

文章概要:

1. 对学习大模型技术的人来说,大家都体验自己训练和微调一个模型,但受限于自身条件,可能很多人达成这个目的。
2. 设计一个大模型首先要做的就是需求采集,简单来说就是你想要一个什么样的大模型,也可以说你想让这个大模型实现什么样的功能。br> 3.了需求之后,还要做需求评审,也就是说这里面哪些需求是合适的,哪些是不合适的。
4. 有了之后,找到一个合适的机器学习模型。
5. 这一步我们需要根据自己的选择一个能够实现需求的神经网络模型。br> 6. 比如说,要想实现你的需求需要设计一个层神经网络,每个网络层作用是什么,应该实现哪些功能,用哪些算法去实现,可能存在哪些问题。
7. 神经网络模型的第一层就是输入层,它需要接收和处理来自外部的训练数据和用户数据。
8. 神经网络模型的最后一层就是输出层,输出层的作用是把神经网络处理之后的数据转换为需要的格式。
9. 有了损失函数之后,还需要有激活函数,函数又应该怎么设计。
10. 反向传播算法可以说是神经网络模型中非常的一个节点,没有反向传播,模型就无法做到参数调整。
11.选择了合适的模型架构,设计好了神经网络模型层,输出层激活函数,函数等,但怎么实现,哪种算法实现,是否还能进行优化。
阅读原文

Omdia中国商用大模型竞争力排名报告

文章概要:

1. 中国是开发人工智能最为积极的市场,截至2年1月,中国厂商开发的基础模型总数已超过230个
2.Omdia中国大模型厂商竞争力排名报告》代表着Omdia对目前百模大战的一个主观判断,旨在为中国商业基础模型基准测试提供一个全面客观的方法,帮助企业用户了解市场,选择理想的解决方案和厂商
阅读原文

真免费!10 款必备的语言类 AI 大模型

文章概要:

1. 文心一言是百度公司发布的一款人工智能语言模型,它能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
2. 豆包是字节跳动旗下的一款AI,相比于其他通用人工智能,豆包走了一个拟人化的风格路线,让人有着不少的好感。
3. 360脑36创始人周鸿祎在第七届世界智能大会上展示的一款大模型产品,具备大模型发展硬实力。
4. 通义问是阿里云推出的一个大型语言模型,它是通义系列的最新成果,能够回答问题、创作文字还能表达观点、撰写代码,具备丰富的知识和强大的语言生成能力。
. 讯飞星火是科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式与执行任务。
6. 腾讯由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。<>7. 百川大模型是由百川智能推出模型产品,融合了意图理解、信息检索以及强化学习技术,结合有监督与人类意图,支持多轮对话、内容、摘要、知识问答、代码生成、指令跟随、数学与逻辑推理等多元化。
. 天工,由昆仑万维的一个对话式助手,也是一个大语言模型。它拥有强大的自然语言和智能交互能力,能够实现智能问答、聊天互动、生成等多种应用场景,并且具有丰富的知识储备,科学、技术、文化、、历史等领域。
. “紫东太初”是中国科学院自动化所联合武汉人工智能研究院共同推出的业内首个千亿参数三模态,同时也是全球首个图、文、音三模态大模型。该模型具备强大的语言处理能力,可以进行文本生成、情感分析、系统等多种任务。br>10. ChatGPT大部分人都用不了3.5数据更新到022年,.0需开通会员使用
阅读原文

手搓AI大模型应用获25万用户,果断辞职创业,结果收入不如摆摊

文章概要:

1. 程序员mmoustafa开发了AI应用.bot用户量曾疯狂增长,后因收费导致活跃用户和付费用户减少。br>2. 网友建议产品付费需找到平衡点,如提供免费付费套餐、试用期等。
. 目前鲜有靠大模型应用致富例子,OpenAI的ChatGPT search已正式发布,版用户也将获得使用权限。
阅读原文

白话文讲解大模型| Attention is all you need

文章概要:

1. 本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构,包括论文介绍、LLM浅谈、Token、预测下一个Token、模型训练、上下文窗口、从马尔可夫链到神经网络、Transformer和注意力机制等内容。
2. 文章介绍了LLM的核心功能是根据输入的文本预测下一个可能出现的词汇Token,并通过具体例子解释了Token的概念和作用。
3. 文章还讨论了模型训练的过程和方法,包括使用马尔可夫链和神经网络进行训练,以及如何处理大规模上下文窗口的问题。
4. 此外,文章还介绍了Transformer的输入、Self-Attention、Multi-Head Attention、Add&Norm和Feed Forward等概念和技术。
阅读原文

豆包招聘速递|豆包大模型 LLM 团队热招中

文章概要:

1. 豆包大模型LLM团队热招中
2. 点击“阅读原文”,了解更多团队招聘信息
阅读原文

加速未来:AI行为大模型在各行业的应用展望

文章概要:

1. 在当今信息爆炸的时代,科技的飞速发展正在以前所未有的速度改变着我们生活和工作。br> 2 Salesforce的现任副总裁、前斯坦福大学终身教授vio Savarese表示随着人类行为模型深入研究,人工智能不仅处理语言,它们还采取有意义行动并通过环境反馈进行br> 3.加科技创始人兼中山大学校外导师黄彤元(Tony)先生分享了富加科技深耕人工智能大模型(HumAI)10年的。
4. 富加科技在创业初期就致力于打造“人类行为库(Humada)”这全新的人工智能大。
5. 富加科技通过人工智能大中国社区管理业务的深度融合并结合结构重组调整,帮助中国物业企业实现人工智能的转型升级。
6. 富加科技多次举办国际论坛,邀请行业大咖与国际人工智能领域专家,一起探讨和交流如何通过人类行为模型的驱动,带动行业的转型升级。
7. 人工智能的发展浪潮席卷全球,国外对人工智能领域的尤其重视。作为中国科技型企业,富加未来一定会积极参与投入到人工智能发展中,紧密结合需求,研究技术,实现算法创新、模型优化和理论突破,为应用提供理论基础,开发出更具有实际应用的人工智能产品和解决方案,人类行为大模型在行业的广泛落地,为中国经济发展和社会进步贡献力量。
阅读原文

白话文讲解大模型| Attention is all you need

文章概要:

1. 论文介绍:论文《Attention is all you need》是所有LLM的始祖,迈向NLP新时代的基础架构,于2017年6月12日由Google和多伦多大学发布。
2. LLM浅谈:大模型的核心功能是根据输入的文本预测下一个可能出现Token,Token是LLM理解的文本基本单位,LLM需要通过一个训练过程来学会做出这样的预测。
3. Transformer的输入:Transformer中单词的输入表示x由单词Embedding和位置Embedding(Positional Encoding)相加得到。
4. Self-Attention(自注意力机制):Self-Attention是一种允许模型在处理序列数据时关注不同部分的方法,特别适用于处理长文本,通过计算序列中每个元素与其他所有元素之间的相关性来实现这一点。
5. Add&Norm和Feed Forward:Add&Norm通过残差连接和层归一化,让模型更稳定,训练更快;Feed通过两层全连接网络增加模型的灵活性,使其能处理更复杂的数据。
6. Decoder结构:Transformer的Decoder block结构与Encoder block相似,但是存在一些区别,包含两个Multi-Head Attention层,第一个Multi-Head Attention层采用了Masked操作,第二个Multi-Head Attention层的K,V矩阵使用Encoder的编码信息矩阵C进行计算,而Q使用上一个Decoder block的输出计算,最后由一个Softmax层计算下一个翻译单词的概率。
阅读原文

白话文讲解大模型| Attention is all you need

文章概要:

1. 本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构,将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。
2. 论文《Attention is all you need》是所有LLM的始祖,迈向NLP新时代的架构。
3. 很多人认为大模型可以直接回答问题或参与对话,但实际上,它们的核心功能是根据输入的文本预测下一个可能出现的词汇,即“Token”。
4. Transformer中单词的输入表示x由单词Embedding和位置Embedding(Positional Encoding)相加得到。
5. Self-Attention是一种允许模型在处理序列数据时关注不同部分的方法,特别适用于处理长文本。它通过计算序列中每个元素与其他所有元素之间的来实现这一点。
6. 多头注意力(Multi-Head Attention)是了让模型从多个不同的角度捕捉信息。具体做法是并行运行多个Self-Attention层(每个称为一个“头”),然后将所有头的输出拼接在一起,再通过一个线性变换。
7. Add & Norm:通过残差连接和层归一化,让模型更稳定,训练更快。Feed Forward:通过两层全连接网络增加模型的灵活性,使其能处理更复杂的数据。
阅读原文

白话文讲解大模型| Attention is all you need

文章概要:

1. 本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构,包括技术概述、架构介绍到具体模型实现等。期望为读者提供一个全面的理解,帮助大家掌握大模型的工作原理,增强与客户沟通的技术基础。适合对大模型感兴趣的人员阅读。
2. 论文名称为《Attention is all you need》,发布时间为2017年6月12日,发布单位为Google和多伦多大学。
3. 简单摘要:所有LLM的始祖,迈向NLP新时代的基础架构。
4. 核心技术:模型架构(此处先留下大体印象 encode+decode)。
5. 很多人认为大模型可以直接回答问题或参与对话,但实际上,它们的核心功能是根据输入的文本预测下一个可能出现的词汇,即“Token”。
6. Token是LLM理解的文本基本单位。虽然将Token看作单词很方便,但对LLM来说,目标是尽可能高效地编码文本。
7. 给定一段文本,语言模型的任务是预测接下来的一个Token。要生成连续的文本,模型需要反复调用自身,每次生成一个新的Token并将其加入到已有的序列中,直至达到预设的长度。
8. 模型训练的过程中,模型会接触到大量的文本数据,从中学习语言模式和规则。训练完成后,模型就能够利用所学知识来估计任何给定Token序列之后可能出现的下一个Token的概率。
9. 上下文窗口过小,模型容易“忘记”先前的信息,导致生成的文本缺乏一致性,从一个词跳跃到另一个词。为了提高模型的预测质量,可以尝试增加上下文窗口的大小。
10. 现代语言模型,如GPT-2、GPT-3和GPT-4,使用了非常深的神经网络,拥有数亿甚至数万亿的参数。这些模型的训练过程非常复杂,通常需要数周甚至数月的时间。
11. Transformer是目前最流行的神经网络架构之一,特别适用于自然语言处理任务。Transformer模型的核心特点是其注意力机制。注意力机制允许模型在处理输入序列时,动态地关注序列中的不同部分,从而更好地捕捉上下文信息。
12. 多头注意力(Multi-Head Attention)是为了让模型从多个不同的角度捕捉信息。具体做法是并行运行多个Self-Attention层(每个称为一个“头”),然后将所有头的输出拼接在一起,再通过一个线性变换。
阅读原文

白话文讲解大模型| Attention is all you need

文章概要:

1. 本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构,从技术概述、架构介绍到具体模型实现等多个角度进行讲解,适合对大模型感兴趣的人员阅读。
2. 介绍了论文《Attention is all you need》,包括发布时间、发布单位、简单摘要、中文摘要等内容。
3. 解释了很多人认为大模型可以直接回答问题或参与对话,但实际上,它们核心功能是根据输入的文本预测下一个可能出现的词汇,即“Token”,并通过“Strawberry里有几个 r”的例子进行说明。
4. 探讨了模型训练的过程,包括如何将训练数据转换为概率矩阵,以及如何解决“模型幻觉”问题。
5. 介绍了Transformer的输入,包括单词Embedding和位置Embedding。
6. 解释了Self-Attention的工作流程,包括转换、计算注意力分数、归一化和加权求和。
7. 介绍了Multi-Head Attention的作用和结构,以及Add & Norm和Feed Forward的作用和结构。
8. 介绍了Decoder的结构,包括两个Multi-Head Attention层和一个Softmax层。
阅读原文

人工智能教育大模型:体系架构与关键技术策略

文章概要:

1. 发展现状:国外已诞生多款人工智能教育大模型,主要用于支持学生的个性问答、深度思考,充当教师的教学辅助工具,提供定制化的学习指导,学校管理效率等。我国呈现“百花齐放”,各大科技企业致力于研发好用、易用的人工智能教育大模型,力求差异化竞争。3. 体系架构:人工智能教育大模型体系由基础支撑、模型能力、智能体平台、场景应用、模型评测五部分构成。
4. 关键技术策略:聚焦安全性,建立可控的算力、算法和教育专属数据集;聚焦高性能,强化教育大模型基础能力的联动部署;聚焦适应性,推动个性化教育智能体的创建与控制。
5. 结语:人工智能教育大模型正不断探索与教育各环节的深度融合,向智能化、个性化和可解释性的方向,但其在教与学等的规模化应用方面,专业能力还有待提升、伦理问题等还有待解决。
阅读原文

小红花大语言模型排行榜(2024年11月):国产第一是豆包

文章概要:

1. 文章介绍了小红花技术领袖俱乐部旗下内容平台「小红花·文摘」发布的2024年1月大语言模型前三名是、lama和Claude
2. 本榜单仅是对各种大语言模型当下的流行度热门程度或采用/使用程度)进行排名,与它们本身的特性(如优缺点、适用性、功能、、价格、授权机制和厂商等)无关
3. 豆包成为国产第一,字节跳动是国内唯一仍然在大力投入的互联网厂商,后面会进一步拉大与其它对手的差距
4. 排行依据是小红花技术领袖俱乐部旗下内容「小红花·文摘」聚合全球开发者的准实时内容通过分析文章涉及的大语言模型,并据此进行统计
5. 与其它排行榜的不同之处在于,小红花大语言模型采用的数据是1年维度内的中短期内容为基数,个月维度内的新内容为参照,能够快速反映大语言模型的流行度变化,且大约有一半数据源是中文的,统计内容时间窗口短,选择受到厂商影响更少、噪音更少的内容,和真实世界的体感」更为接近>6. 一个中文内容占大大语言模型排行榜,对项目的技术方案选型有参考意义的,这是小红花大模型排行榜的动力之源,也是以后继续编制的意义所在
阅读原文

AI大模型全览:国内244个大AI模型及国外汇总

文章概要:

1. 国内大模型盘点(244个)
2. 国外大模型盘点
3. 介绍GPT系列模型(OpenAI),包括GPT-4的功能特点、使用方法、技巧及注意事项等内容
4. 介绍Gemini系列模型(Google)包括Gemini系列的功能、使用方法、技巧及注意等内容
5. 介绍Claude模型(Anthropic),Claude的功能、方法、技巧及事项等内容
6. 介绍LLaMA(Meta AI),包括LLaMA的基本功能、方法等内容
7. 介绍Copilot(GitHub、Microsoft、OpenAI),包括Copilot的基本功能、方法等内容
阅读原文

大语言模型 | 国内244个大模型及国外主要大模型汇总(收藏必备)

文章概要:

1. 国内大模型盘点(244个)
2. 国外大盘点。
3. 介绍GPT系列模型(OpenAI),包括GPT-的功能特点、方法技巧及注意事项内容。<> 4 介绍Gemini系列模型(Google),包括其功能、使用方法、技巧及注意事项等内容。<> 5. 介绍Claude系列模型(Anthropic),包括其功能、使用方法、技巧及注意事项内容。
6. 介绍LLaMA(Meta AI),包括其基本功能、方法等内容。
7. 介绍Copilot、Microsoft、OpenAI)包括其功能、方法等内容。
阅读原文