今日AI-大模型-2024年9月30日

发现全网最新的AI内容

复旦大学肖仰华:AI大模型在复杂决策方面存在诸多不足,幻觉、成本问题亟待解决|钛媒体AGI

文章概要:

1. 李强总理指出,人工智能技术必须与实体行业深度融合,赋能千行百业,才能将人工智能真正发展成为先进的新质生产力。
2. 目前大部分生成式大模型仅在聊天应用中取得了良好效果,但难以胜任复杂的认知决策任务。
3. 生成式大模型还存在"幻觉"问题,即可能产生不准确或虚假的信息。
4. 大模型在行业应用中还缺乏对特定领域的忠实度。
5. 大模型本质上是统计模型,因此面临着不可控和难以编辑的问题。
6. 在将大模型应用于行业时,它难以理解行业专有数据和企业私域数据。
7. 大模型还面临成本问题。
8. 为解决大模型行业落地中的这些问题,需要采取系统性的应对措施。
9. 持续向大模型注入领域行业知识是解决行业问题的关键。
10. 将企业流程进行解耦也很重要。
11. 在探索大模型的行业落地模式时,不应局限于简单的聊天界面。
12. 推动大模型向行业应用发展时,需要注重几个关键方面。
13. 大模型的研发应该以数据为中心,而不是以模型为中心。
14. 注重大小模型协同也是降低成本的关键。
15. 大模型与传统专家知识的协同,特别是与知识图谱的协同,也很重要。
16. 建立大模型的数据治理体系也很重要。
17. 解决大模型的问题是行业落地的关键。
18. 还需要系统性地提升大模型的认知能力。
19. 建立健全的评测体系也很重要。
20. 推进智能体的落地也是大模型行业应用的重要方向。
阅读原文

一文彻底搞懂大模型 - LLM四阶段技术

文章概要:

1. 探讨大模型(LLM)的四阶段技术时,我们可以从Prompt Engineering(提示工程)、AI Agent(人工智能代理)、Fine-tuning(微调)以及Pre-training(预训练)这四个关键阶段来详细阐述。
2. Prompt Engineering,即提示工程,是指设计和优化输入给大型语言模型(LLM)的文本提示(Prompt)的过程。
3. 大模型Agent是一种构建于大型语言模型(LLM)之上的智能体,它具备环境感知能力、自主理解、决策制定及执行行动的能力。br>4. Fine-Tuning指使用特定领域的数据集对训练的大型语言模型进行进一步训练的过程。 阅读原文

大模型的秋天来了吗?

文章概要:

1. OpenAI发布新一代语言模型o1,在推理能力上有重大进步,但回答速度更慢且更贵
2. o1模型采用“思维链”方案提升推理能力,但基座模型能力未有突破性进展
3. OpenAI更新模型频率不慢,但基座模型能力停滞不前,公司估值却快速膨胀
4. 大模型创业公司与风险投资的蜜月期结束,基础模型能力瓶颈使AI硬件繁荣空谈
5. 苹果大模型植入手机,但用户更关注硬件改变,新手机销量不佳
6. 华为三折叠屏手机受关注,反映用户对新鲜硬件形态兴趣超过AI功能
7. 字节跳动加速自研AI硬件,第一款产品将是搭载豆包大模型的智能耳机
阅读原文

行业前沿 | AI大模型行业深度:行业现状、应用情况、产业链及相关公司深度梳理

文章概要:

1. 9月7日,在由中国金融四十人论坛(CF40)与中国国际经济交流中心(CCIEE)联合主办的第六届外滩金融峰会上,外滩绿色金融报告《强化转型金融的体制机制》正式发布。
2. 本文深入探讨AI大模型的相关话题,分析当前行业的现状以及我国AI大模型面临的挑战。同时,简要概述AI大模型产业链的结构。随后,详细分析AI大模型的应用场景,探讨企业如何将业务与AI技术相结合,以及AI大模型在实际应用中的落地途径。最后,分析国内外公司在AI大模型领域的基本情况。根据以上内容展望未来发展趋势。
3. AI大模型定义:AI大模型是指在机器学习和深度学习领域中,采用大规模参数(至少在一亿个以上)的神经网络模型,AI大模型在训练过程中需要使用大量的算力和高质量的数据资源。
4. AI大模型主要特征:AI大模型具有泛化性、通用性以及涌现性特征。以ChatGPT为代表的AI大模型因其具有巨量参数和深度网络结构,能学习并理解更多的特征和模式,从而在处理复杂任务时展现强大的自然语言理解、意图识别、推理、内容生成等能力,同时具有问题求解能力,被视作通往通用人工智能的重要路径。
5. AI大模型分类:按模态划分,大模型可分为自然语言处理(NLP)大模型,视觉(CV)大模型、多模态大模型等。按照部署方式划分,AI大模型主要分为云侧大模型和端侧大模型两类。
6. AI大模型行业应用价值:AI大模型能够提升要素效率及数据要素地位。
7. 大模型发展以Transformer为技术基座:当前主流大模型普遍是基于Transformer模型进行设计的。Transformer模型在Google团队2017年论文《Attention Is All You Need》中被首次提出,Transformer的核心优势在于具有独特的自注意力(Self-attention)机制,能够直接建模任意距离的词元之间的交互关系,解决了循环神经网络(RNN)、卷积神经网络(CNN)等传统神经网络存在的长序列依赖问题。
8. 大模型商业模式:大模型收费模式可以总结为API、订阅、广告、定制化四种。
9. 行业现状:国内外企业争先发布AI大模型,AI大模型性能持续快速提升。开、闭源共存以满足不同应用开发需求。政策驱动中国AI大模型产业发展。国内模型百花齐放,互联网大厂、初创公司、科技企业均有代表性模型产品。国内AI大模型产业市场规模。国内通用AI大模型用户规模快速增长。
10. 国内AI大模型行业应用痛点及解决方案:AI大模型行业应用痛点包括算力、数据不足,人才缺失与法规风险,市场认知不准及行业know-how不足。AI大模型行业应用痛点解决方案包括租用算力,合作建设算力中心,优化算法,关注应用场景,减少对算力的需求,购买数据,与企业合作,布局现实传感,获取真实数据,与高校合作,举办开发者大赛,增加隐性以应对产权风险,建立安全风控机制及保护措施以应对数据安全风险,在方向选择或数据筛选过程中直接过滤不合规信息以应对伦理及合规风险,积极推进市场化应用的落地,并塑造企业案例,以提高市场对企业的准确理解和认知,与头部企业合作来积累know-how,聘请行业专家,与第三方行业咨询公司合作,以及构建行业生态合作体系,以促进know-how的获取和应用。
阅读原文

AI生成大模型,是拉高天花板?还是消灭创作者?

文章概要:

1. 今年2月Sora问世后,国内AI视频生成模型企业竿而起,5月开始国内企业相继公布自研的视频生成模型。
2. 如今轻体量的短剧,成为视频生成模型企业推出作品的首选方式,各家平台也具备的优势。
3. 视频生成大模型领域似乎一夜爆火,利好消息满天飞,但这个领域目前并没有出现一个爆款应用。
. 目前的视频生成模型最大的局限性在于可控性不足,从实际落地的层面上看,无论是广告、短剧,对画面连续性、一致性的要求是很高的。
5. 大模型接下来商业化怎么走?互联网大厂目前已经成为行业引领者,而之所以视频生成能够成为下一个有明确落地应用场景的行业,核心在于“视频”已经成为互联网时代下,C端用户的最大内容消费形式。
6. 视频生成大模型的用户分类分为B端和C端两类,AI商业模式也主要有两种,一种是SaaS(软件即服务)订阅模式,另一种是API(应用程序编程接口)形式。
7. 目前AI视频生成大模型在影视、广告、电商、自媒体等领域已经有了广泛的应用,甚至取代一部分特效、动画、广告短片、商品动态展示等创作场景。
阅读原文

2024百度云智大会大模型应用产品论坛闭幕,聚焦大模型应用创新与实践

文章概要:

1. 2024百度云智大会大模型应用产品论坛闭幕,该论坛由百度智能云主办,汇聚了来自不同领域的智库专家、企业用户、产业伙伴,共同围绕AI大模型的趋势、应用与实践展开交流。
2. 百度智能云全栈体系赋能,加速政企数智化转型,百度副总裁阮瑜表示,大模型技术正深刻改变着各行各业,百度智能云致力于为客户提供全栈领先的大模型应用服务,以加速政企智能化转型。
3. 大模型开启AI新范式,应用发展需关注五个方面,中国信通院人工智能研究所所长魏凯表示,大模型技术以其规模可扩展性、多任务适应性和能力可塑性,开启了人工智能的新范式。
4. 大模型技术渗透百业千企,产业落地百花齐放,来自不同行业的创新企业代表,也在论坛期间分享了在各自领域的探索与实践。
阅读原文

聚焦开源大模型前沿应用,GOSIM CHINA 2024《AI 模型与基础模型》专题论坛重磅揭晓!

文章概要:

1. 10月17-18日,GOSIM CHINA 2024将在北京盛大启幕,本次活动邀请了60多位国际开源专家,预计将有1000+开发者和开源人才齐聚北京,共议全球开源技术的创新与应用新趋势。
2. GOSIM CHINA 2024以国际化、社区化、强互动为特色,主题围绕AI模型与基础设施、具身智能、下一代互联网、下一代媒体、Rust编程语言、App开发等6大热点技术,共组织了2场Keynote、6大主题论坛、6场workshop、2场黑客马拉松大赛。
3. AI模型与基础设施的发展正经历着前所未有的变革,《AI模型与基础设施》专题邀请了潞晨科技创始人兼董事长、新加坡国立大学计算机系校长青年教授尤洋、CodeGeeX团队技术负责人郑勤锴、vLLM核心贡献者游凯超、英特尔软件与先进技术事业部高级软件工程师Huailong Zhang等13位技术专家与核心贡献者,以塑造人工智能未来为主题进行主题演讲。
阅读原文

用AI大模型把海量钙钛矿文献数据转换为通用知识图谱

文章概要:

1. 国家重点研发计划2024年度项目对文献数据获取、自主阅读分析能力了要求。
2. 笔者查询到钙钛矿相关的有效专利数量为5万余项,全球钙钛矿专利总量为73290项,SCI核心期刊文献为6630篇。
3. 近五年来,钙钛矿新增文献数据量呈现激增趋势。<式激增的文献数据,借助AI大模型实现自动获取、自主阅读和辅助分析,是完成国家重点研发计划项目的首要任务,也是推动钙钛矿技术产业化的关键基础。
5. 通过深度学习,AI大模型可以把海量钙钛矿文献数据转换为通用知识图谱。
6. 关于钙钛知识图谱的创建方法,将在后续公众号文章中讨论。
阅读原文

开源多模态大模型黑马Molmo Al来袭!部分能力超越GPT-4o和Claude 3.5

文章概要:

1. 非营利研究机构艾伦人工智能研究所正在推出名为“Molmo”的开源多模态语言模型,其性能可与OpenAI、Google和Anthropic的顶级专有模型相媲美。
2. Molmo模型在测量理解图像、图表和文档等内容的测试中,优于OpenAI的GPT-4o。
3. 一个较小的Molmo模型性能接近OpenAI最先进的模型,这一成就主要归功于更高效的数据收集和训练方法。
4. Molmo模型是在一个更小、更“精心策划”的上进行训练的,该数据集仅包含60万张图像,并且具有10亿到720亿个参数。
5. Molmo模型可以“指向”图像相关部分,这意味着它可以通过识别回答查询的像素来分析图像的元素。
6. Molmo模型可以让人们与用户界面进行交互。
7. 过去几年,人工智能公司吸引了数万亿美元的巨额投资。但在过去的几个月里,投资者对这项投资能否带来回报表示怀疑。
阅读原文

大模型知多少?前沿大模型盘点

文章概要:

1. 人工智能的发展遵循尺度定律,模型越大能力越强,扩展模型规模需要增加算力和数据。
2. 彭博社创建了BloombergGPT,在某些方面表现不错,但往往会被GPT-4击败。
3. 规模扩展的很多方面都是相关的,但涉及的度量和术语却像个大杂烩,人工智能公司往往对自己的模型讳莫如深。
4. 为了简单起见,作者给前沿模型贴上几个非常粗略的标签,包括第一代模型、第二代模型、第三代模型和第四代模型。
5. 第二代是GPT-4开启的,现在其他公司也已迎头赶上,我们正处在第一批三代模型的风口浪尖。
6. 作者列举了五个前沿的第二代模型,包括GPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro、Grok 2和Llama 3.1 405B。
7. OpenAI发布o1-preview以及o1-mini模型,这两种模型采用了完全不同的扩展方法,通过一种在训练模型后进行的新的扩展形式,该模型性能有了惊人提升。
8. 两个尺度定律的存在表明,人工智能的能力会在未来几年内得到显著提升,就算我们在训练大模型方面遇到瓶颈,人工智能仍然可以通过将更多的计算能力分配给“思考”来解决日益复杂的问题。
阅读原文

面对趋势,个人如何拥抱大模型?

文章概要:

1. 大模型已成为连接数字世界与现实生活的重要纽带,悄然改变着我们获取信息、处理任务和交流互动的方式,让我们的生活更加便捷、高效。
2. 人工智能是国家经济发展的战略重心,各部委纷纷提出AI赋能产业发展的政策与行动计划。
3. 大模型领域人才需求井喷,大模型领域工程师薪酬竞争力激增。
4. 对于普通人来说,目前有两条路径,可以让我们拥抱大模型:使用各类大模型,提高工作效率;掌握大模型,做大模型的开发者。
5. 学习大模型开发的路径有:Prompt工程师、数据工程师、Agent工程师、大模型应用开发工程师、大模型微调工程师。
6. 北大青鸟人工智能研究院,基于自己多年的AI行业成果,与北京大学学习科学实验室联合开发AI大模型系列课程。在大模型应用开发,大模型微调领域提供技能提升课程和就业课程
7. Python大模型开发实战营,包含了学习Python语言的基本内容,例如:基础语法,内置数据结构,内置库,第三方库,函数与模块,面向对象编程等等。与其他Python课程(不是数据分析就是爬虫)不同的,训练营还提供基于大模型的实战项目,你在入门阶段就能够上手调用大模型,部署大模型。
阅读原文

沈向洋最新演讲全文:关于大模型的10个思考

文章概要:

1. 沈向洋在第四届“青年科学家50²论坛”上发表主题演讲,分享了对大模型的10个思考
2. 思考包括算力是门槛、关于数据的数据、大模型的下一章、人工智能的范式转移、大模型横扫千行百业、AI Agent从愿景到落地、开源vs闭源、重视AI治理、重新思考人机关系、智能的本质
3. 沈向洋认为,未来通用大模型的占比会越来越低,行业大模型将成为主流
4. 他还强调了开源和闭源的区别,以及AI治理的重要性
5. 最后,他呼吁大家重新思考人机关系,探索智能的本质
阅读原文

OpenAI CFO 称高管离职不影响公司前景;智谱再掀价格战,所有模型 1 折调用;雇佣专家训练大模型成新生意丨AI情报局

文章概要:

1. OpenAI CFO 安抚投资者:高管离职不影响公司前景
2. 大模型再掀价格战,智谱API最大力度活动,1折调用其所有模型
3. 图灵奖得主姚期智:将来机器人的数目会比人更多
4. 周鸿祎谈英特尔“卖身”:IT行业没有永远的王者
5. 减少英伟达芯片依赖,监管机构鼓励国内企业使用本土芯片
6. 阿里妈妈开源全新AI图像修复模型FLUX-Controlnet-Inpainting
7. 科大讯飞入股灵童机器人
8. 因时机器人完成超亿元B+轮融资
9. AI独角兽特斯联赴港IPO:估值超200亿
10. 邮储银行推出货币市场AI交易机器人
11. 电信AI研究院开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型
12. 中国移动“算网大脑”规模商用,推动算力像水电一样即取即用
13. 国际机器人联合会:2023年我国新安装工业机器人27.63万台,超全球半数
14. 神秘“蓝莓”登顶文生图竞技场,疑似Flux.1续作
15. 本科生不够用,Cohere AI雇佣各领域专家训练大模型
16. 苏黎世联邦理工学院研究:AI可100%绕过谷歌验证
17. “AI换脸”色情犯罪将在韩国入刑
18. 英特尔推出下一代AI解决方案,正式发布至强6系列处理器和Gaudi 3 AI加速器
19. 扎克伯格持续看涨英伟达:GPU供应商会随着对GPU的需求大幅利好
20. 苹果将于春季推出新款智能家居设备,能够支持苹果AI功能
21. 研究发现AI越高级就越会装
22. LVMH集团盯上AI创业小公司,一口气投了5家
23. Galaxy AI项目负责人:2025年将是AI普及元年
24. Nurix AI筹集2750万美元,扩大定制企业级AI Agent的开发
阅读原文

面对趋势,个人如何拥抱大模型?

文章概要:

1 大模型已成为连接数字世界与现实生活的重要纽带,改变着我们获取信息、处理任务和交流互动的方式,让我们的生活更加便捷、高效
. 人工智能是国家经济发展的战略重心,全国人大十四届二次会议。国务院在2024政府工作报告,提出“+”的概念,强调大力推进现代化产业体系建设,加快发展新质生产力,围绕深化大数据、人工智能等研发应用,开展“人工智能+”行动,具有国际竞争力的数字产业集群
3. 对于普通人来说,目前有两条路径,可以让我们拥抱大模型:使用各类大模型,提高工作效率;掌握大模型,做大模型的开发者
4. 学习大模型开发的路径:Prompt工程师、数据工程师、Agent工程师、大模型应用开发工程师、大模型微调工程师
5 北大人工智能研究院,基于自己多年的AI行业成果与北京大学学习科学实验室联合开发的AI大模型系列课程。在大模型应用开发领域,大模型微调领域提供技能提升课程和课程
6. Python大模型开发实战营包含了学习Python语言的基本内容,例如:基础,内置数据结构,内置库,库,函数与模块,面向对象编程等等
7. Python大模型开发实战营采用的是线上授课方式,讲师全程直播授课,每周3次课,都是晚上。不耽误上课和工作的时间
8. 学习过程中的作业,有编写代码的,也有要提交程序运行效果的,老师都会认真点评,及时指出问题,让自己少走弯路
9. 学习和写作过程中,如果有,可以在社群中答疑,课上也会有集中答疑的时间,另外,还有一个很好用的小工具:Molly,它是基于大模型一款答疑工具随时随地解决疑问
阅读原文

案例 | 大模型在金融智能运维中的探索

文章概要:

1. 金融科技发展带来数据中心运维规模增长,运行风险和操作风险凸显,金融机构面临巨大压力。
2. 大模型技术飞速发展,金融机构开始研究如何将金融运维数据与模型技术,提升运维效率。
3. 传统大模型用于自然语言处理任务,AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。
4. 借助基于AI代理的大模型技术,可以和各种运维工具进行交互,提升故障预测精准度并完善系统自愈水平。
5. 日常故障处理需要实时、全面的监控IT系统状态,并及时发现系统异常,通过AI代理技术,将大模型与各种运维工具进行集成。
6. 在发现异常后,AI代理迅速触发模型的智能诊断流程,给出准确的故障定位和诊断依据,将故障恢复时间从小时级缩短到分钟级。
7. 业务变更保障需要耗费大量人力,通过大模型技术,可实现业务变更不再强依赖运维人员的经验大幅提高业务变更的准确性。
8. 例行系统巡检需要大量的人力投入,AI代理通过预训练的语言模型,深入解析用户输入的巡检指令,关键信息,选取最适合的工具进行全面检查分析。
9. 新华三相信,金融大模型在运维场景的应用不止于此,未来将继续探索更高效、更安全的运维模式,为金融行业的数字化转型和可持续发展注入强大的动力。
阅读原文

【喜报】联通研发大模型荣获“人工智能+电信业”领航先锋案例

文章概要:

1. 联通研发大模型荣获“人工智能+电信业”领航先锋案例
2. 该案例基于联通元景大模型,结合联通业务场景,通过构建代码、研发文档等数据集,研究训练、微调算法和策略,构建出一套应用于电信行业软件开发全生命周期的研发大模型和解决方案
3. 该案例模型基于模型选代的数据生成算法,解决中文数据量较小的问题,并随着模型选代优化
4. 该案例结合联通低代码开发平台加入低代码场景化模型训练形成交互式低代码,在可视化应用构建的功能上,实现通过自然语言交互轻量级应用,再次降低低代码的使用门槛> 该案例还结合联通低代码开发平台低代码场景化模型训练形成交互式低代码,在可视化应用构建的功能上,实现通过自然语言交互生成轻量级应用,再次降低低代码的使用门槛
6. 公共平台与架构研发事业部将秉持创新、协作与前瞻性原则,不断推动研发大模型的优化与升级,以AI为核心引擎,为研发领域注入前所未有的活力与效率,助力全联通数字化转型步伐,推进智能化水平提升
7.,通过不断优化和完善研发大模型技术,结合更多的研发工具,推动相关产业链上下游的协同发展,形成良性的产业生态
阅读原文

同方知网携大模型技术产品首次亮相中国—东盟博览会

文章概要:

1. 9月24日-28日,第21届中国—东盟博览会在广西南宁举行,同方知网携华知大模型5.0、“中国-东盟法律大模型”等产品和首次亮相。
2. 展会期间,多家单位领导及部分国际展团代表先后莅临中核集团信息展台,听取了华知大模型在企业知识管理、核电行业应用、政府办公辅助等场景的介绍和应用案例。
3. 同方知网与广西壮族自治区发展局联合建设的面向东盟国家的法律大模型——“-东盟法律大模型”在东博会最新发布。
4. “中国-东盟法律大模型”以华模型为底座,结合东盟语料库多语种、高质量资源,旨在为东盟区域内的经贸合作法治协作提供专业、智能的支持。
5. 同方知网未来将继续深化与广西壮族自治区大数据发展局合作,扩大语料收录、加强多源向量库融合,通过多层语义融合的多模态大模型进一步提升法律服务的专业性、可信度和场景融合力,服务中国-东盟经贸。
阅读原文

重庆首个网络安全知识库大模型发布

文章概要:

1. 重庆首个网络安全知识库大模型“两江智网星CyberStar”近日在重庆新区发布。
2. 该大模型以人工智能技术通过数据进行学习分析,构建全面、精准的安全知识体系。
3. “两江智网星CyberStar”可对网络安全相关信息进行快速检索,并准确回答提出问题,及时有效降低网络安全风险。
4. 两江新区党工委宣传部部长杜术林表示两江智网星Cyber”广大市民提供丰富网络与最新前沿动态,为从业者知识支持和实践建议,为推动网络安全行业智能化发展贡献力量。
阅读原文

评审结果公示丨2024年度CCF-快手大模型探索者基金

文章概要:

1. 2024年度CCF-快手大探索者基金共征集来自59所不同高校129份课题申报书,经综合评审,共14个项目获得资助,现予以公示。
2. CCF-快手大模型探索者基金是CCF与快手联合发布的科研基金,2024年度大模型探索者基金聚焦于大模型领域,设立5个研究方向,共12项研究课题。
3. 本年度大模型探索者基金共收到来自59不同高校的129份申报,项目组邀请了产学领域30余位专家组成评审委员会进行评审,13位来自海内外的高校及机构的优秀学者最终获得大模型探索者基金的支持。
4. 未来,快手将为各位学者开放真实的业务场景,连接产业实际问题与学术科研问题,并提供技术、算力、资金和脱敏数据资源支持,促进研究成果的快速转化。
阅读原文

大模型不懂得谦虚-越大的模型错误越多,该如何让大模型变得正直

文章概要:

1. 关于大模型参数越大,越容易出差的研究吸引了关注。该研究对比了不同参数量的开源和闭源模型,针对偏理科考察模型性能,结果大模型能将过去几乎无法回答的问题以一定概率回答,但出现了准确率随参数增加而下降的反常现象
2. 该研究将大模型的回复分为正确、错误回避,较小参数的模型会回避问题,而较大参数的模型答错的概率变大
3. 针对该问题,也许读者会觉得新出的GPT-4能解决问题,然而官方选择了通过时间的scaling up来试图继续延续指数级的性能提升。当下的大模型既然是助手,那不妨尝试让其变得更加正直,从而提升用户体验
4. 可以在构建专家混合模型时,让每个模型不再按照其擅长的问题分,而是按照品行去细分,还可以引入图结构,通过让预训练后的模型进行批判、总结、模拟不同性格间的内心辩论,通过有向无环图(DAG)的方式迭代,之后再次由各个性格的模型回复、批判,最终先对各组回复及批判按质量排序,并由一个负责总结的模型得到最终结果
5. 相比于链式的scaling,上述的多性格混合模型范式有训练过程更加多样化、推理过程更加透明、用户可以根据自己预期的计算量调整计算过程、可以避免模型越大错误出现概率越多的悖论等优势
阅读原文

目前最完整,188+26大模型名单!

文章概要:

1. 国家互联网办公室最新数据显示,已备案的人工智能大模型18家,地方登记26家。
2. 文章介绍了常用的大模型及特点,如百度的文心一言、科大讯飞的星火大阿里云的通义千问等。br>3. 近年来,国内模型行业快速发展,成为AI热点,广泛应用金融、医疗、智能制造等。
. 国内大模型的优势,全产业链覆盖、政策支持、技术创新、多样化。但也存在技术门槛高、数据隐私和安全风险、模型解释性不足、成本、认知不足与预期过问题。
阅读原文

图解大模型训练之:数据并行上篇(DP, DDP与ZeRO)

文章概要:

1. 介绍了以Google GPipe为代表的流水线并行范式,其通过切割mini-batch实现对训练数据的流水线处理,提升GPU计算通讯比,并通过re-materialization机制降低显存消耗
2. 介绍了数据并行的核心思想,即在各个GPU上都拷贝一份完整模型,各自吃一份数据,算一份梯度,最后对梯度进行累加来更新整体模型
3. 递进介绍了三种主流数据并行的实现方式:DP、DDP、ZeRO
4. 介绍了DP和DDP的通讯量分析,DDP把通讯量均衡负载到了每一时刻的每个Worker上,而DP仅让Server做勤劳的搬运工。当越来越多的GPU分布在距离较远的机器上时,DP的通讯时间是会增加的
阅读原文

颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

文章概要:

1. 最新研究登上Nature,表明大模型不可靠,越大越不可靠。
2. 瓦伦西亚理工大学团队及其合作者研究发现,大参数模型在简单任务上可能会出现过度拟合或错误估计的风险,反而更靠。
. 研究人员从用户与LLM互动的角度,探讨了难度一致性、任务回避和提示稳定性三个核心交织元素对LLM可靠性的影响。
4. 研究团队对比了GPT、LLaMA、BLOOM三大模型系列在不同任务中的表现,揭示了模型扩展带来的能力反差现象。
5. 研究发现,模型在面对复杂任务时表现显著提升,但在简单任务上的错误率却有明显上升。
6. 研究还揭示了优化后模型中回避行为与错误率之间的微妙关系。
7. 该研究分析了模型对提示词的敏感性,特别是某些提示是否存在“安全区”。
8. 研究发现,当用户的难度预期与模型的输出结果不一致时,尤其是对于简单任务,模型和用户的错误监督都会增加,且人类监督无法弥补这些问题。
9. 尽管该研究在揭示LLM的提示敏感性、扩展与优化对性能的影响等方面取得了重要成果,但仍存在一些局限性。
阅读原文

聊一聊大模型六小虎生存现状!

文章概要:

1. ChatGPT的出现引发了生成式AI创业热潮,国内智谱AI、百川智能、零一万物、月之暗面、Minimax等公司率先领跑,今年6月,阶跃星辰获得20亿美元融资,进入第一梯队,大模型创企的“六小虎”格局形成。
2. 从新年伊始,AI应用层的井喷被预告为今年AI领域的最强看点,3月份,Kimi200万字长文本横空出世,率先出圈,此后大模型厂商开启了激烈的用户争夺战,用铺天盖地的投放轰炸目标用户的心智,越来越多的人开始了解AI工具,使用AI工具。
3. 然而,我们也无法忽视大模型能力的增长正陷入普遍的停滞,新一代模型的发布就像“狼来了”的故事,AI社区普遍对奥特曼的谜语和炒作开始感到疲倦。
4. 大模型厂商们是否遇到了同样的困境?2024年已经过半,“六小虎”们过得还好吗?
阅读原文

大模型谁先用起来,谁就抢占先机

文章概要:

1. 过去的一年,大模型从技术变革走向产业变革的关键一年。大与云计算紧密结合,正在成为新型的基础设施。这样大范围的基础设施升级将带来生产力的巨大跃迁。大模型给每个企业提供了平等的增长机会。不管企业大小、场景多少,谁先用起来,就抢占。
2. GPU集群有三个特征:极致规模、极致高密和极致。这些“极致”带来了方面的严峻挑战。一方面是巨额的建设、运营成本,要想建立一个万卡集群,单GPU的成本就高达几十亿元;另一方面在如此大规模的集群上,运维的复杂性急剧增加。
3. 模型训好了之后就是推理,也就是模型在各个场景被用起来的。在这个阶段,最重要的两件事是速度和成本。前者决定用户体验后者决定性价比。而且,现在长文本推理逐渐成为主流,这两个问题会越来越突出。
4. 大模型应用的爆发,离不开便捷、高效的大模型工具链和应用开发平台。百度官方数据显示,目前,在千帆大模型平台上,文心大模型日均调用量超过7亿次,累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。
阅读原文

南威软件携手华为昇腾,共同推动原生AI大模型应用创新落地

文章概要:

1. 第九届华为全联接大会在上海举行,南威软件作为华为昇腾原生开发合作伙伴,携手华为共同发布大模型推理行业解决方案。
2. 南威软件完成对华为昇腾全系列AI芯片的适配工作,覆盖了昇腾10、910B、800IA2和300IDuo处理器。
3. 南威软件在华为昇腾芯片的国产化适配工作,确保国内数字政府、公共安全、城市治理等应用的安全,也降低了对国外芯片的依赖风险。
4. 南威软件同时深度融入华为硬件生态系统,主要产品包括白泽启元大模型开发平台泽文墨公文写作平台、獬豸智能阅卷系统、白泽对话管理平台、白泽智能标注平台、深圳宝安区清政企服务平台、白泽云搜知识管理平台、白云图平台、AgentLabs智能体应用中心等。
5. 南威软件通过华为昇腾芯片的深度合作,在AI芯片国产化适配和原生开发方面取得了显著进展。未来,南威软件将持续深耕政府行业领域,不断探索与实践,提供更多智能化产品与解决方案,推动AI与行业场景的深度融合,实现更广泛的。
阅读原文

荣耀加冕!南威白泽大模型荣获华为昇腾AI创新大赛(福建赛区)决赛银奖

文章概要:

1. 9月27华为昇腾AI创新大赛2024福建区域赛在福州成功举办,南威白泽政务大模型斩获银奖。
2. 南威白泽政务大模型基于昇腾AI技术构建,可实现精准的自动化显著提升效率和准确性。
3. 该模型还能提供智能问答、智能搜索个性化和智能化的服务,以及风险管理与决策支持。
4. 南威白泽政务大模型能够自动化处理、重复性的政务服务任务,有效减轻工作人员负担工作效率。
5 该模型还能为符合条件的企业和个人及时推送相关政策服务,帮助企业和个人精准获取服务信息,及时享受政策优惠和服务。
6. 昇腾AI创新大赛是一项专为AI开发者设立的顶级竞赛,其目的在于激发全行业开发者利用昇腾AI技术与产品,开发出软硬件解决方案,探索并优化模型算法,从而加快AI与各行各业的融合进程,提升开发者的专业技能
阅读原文

智能体涌入大模型之战“下半场”,应用场景定义AI的未来

文章概要:

1. 人工智能的风开始吹到了AI智能体,技术正逐渐走向“寻常百姓家”。
2. 智能体是李彦宏最的AI原生应用发展方向,越来越多的人靠自然语言提示词,就可以做出很有用的智能体。
3. 在今年文心杯创业大赛中,全球大模型优秀创业者基于文心大模型构建AI原生应用,涵盖文娱、电商营销、、办公、、企业服务等,有超过60%参赛聚焦智能体的应用,最终角逐出8支优秀创企组团队,获得百度数千万的现金与资源投资。
4场景成为创业者的机会,对于创业公司来说,于大模型技术的并不是一个合理的战略选择真正有价值在应用层面上,创业者可以利用自身优势,在产业链中找到并专注于自己的强项。
5.本次大赛一等奖得主极睿科技,面向电商场景,为消费品牌提供覆盖图文及短视频的AI内容生成、管理工具及转化服务。> 6. 大赛二等奖得主Kotoko则推出的AI原生社交游戏,该游戏采用了多智能体(Multi-Agent)架构,支持环境与角色之间,以及角色与角色之间的智能互动。
7. 尖端科技与市场应用之间常常难以逾越的裂痕,这就需要创业者不仅要关注技术研发,还要关注市场需求、用户体验和商业模式的创新。
8. 新技术的必须确保成本的可控性和的提升如果技术导致成本过高,即使效率有所提升,也不利于企业长期发展,不是有效的产业落地策略。
9. 随着百模大战业界的焦点已经从构建基础大模型转移到如何将这些模型有效应用于实际场景。<> 10. 传统产业应认识到,必须把握当前的智能化浪潮,实现自身的转型与升级以此提升生产力和创新能力。同时,大的发展与传统行业的深厚积累密不可分。
阅读原文

30000亿,地方国资带着“大模型订单”来了

文章概要:

1. 2024年中国大模型市场招投标活跃,央国企采购招标数量持续上涨,金额占比约40%,应用类项目数量占比高达70%左右。
2. 国资委要求央企担起发展大模型的重任,同时为各类大模型的落地买单,目前产线升级改造的需求是部分央企计划采买大模型的动力。
3. 2024年上半年大模型技术采购需求主要集中在经济发达地区,科大讯飞、智谱AI等企业中标项目较多。
4. 大模型企业的中标项目中有超过六成都来自央国企,ToG市场竞争激烈,利润有限,政府和企业更倾向于整体解决方案。
5. 大模型企业面临商业化问题,需要考虑技术需求、技术难度和成本等因素,同时还需要把握时间窗口。
6. 地方国资成为支撑国内大模型公司成长的重要力量,不仅为大模型企业提供资金支持,还为其提供应用场景和市场机会。
阅读原文

浅谈企业管理与大模型的关联:向上沟通是“压缩”,向下沟通是“扩散”

文章概要:

1. 人类大脑的认知能力限制了社交网络的规模,使得人们只能与大约150个人维持稳定的人际关系,这被称为“邓巴数字”。
2. 在一个小型的团队中,管理者很容易记得住每个人的名字、性格和经历,沟通是相对直接和高效的。
3. 当企业的规模逐渐扩大,员工人数超过150时,管理者会发现以前那种紧密的联系开始变得疏远,管理上的挑战也随之增加。
4. 企业的向上沟通中一个常见的例子就是团队的周报或项目的进展报告。
5. 当管理层级增加时,信息的压缩和汇总过程变得更加复杂和多层次。
6. 在企业内部,信息的向上汇报通常遵循固定的途径,这些途径通常是由组织架构中固定的汇报关系所决定的。
7. 如果能够利用大模型将这些“PPT干部”的信息压缩经验进行提炼,并转化为企业信息汇报中的各种Prompt和Agent,员工在PPT上的时间投入将显著减少。
8. 当我们需要精确控制图片的细节时,Photoshop等工具是不错的选择,但使用这些工具来生成完整的图片成本非常高。
9. 企业领导者通常希望通过制定一个简单的战略和目标来明确方向,并推动整个公司朝着这个方向前进,确保从上到下执行到位。
10. 在企业管理和运营中,企业的整体运作和管理风格(即全局概率)是由创始团队的背景、偏好、企业文化、历史、组织架构以及各部门之间的利益关系等因素共同构成的。
11. 在企业管理过程中,“一抓就死,一放就乱”成了一个普适性的痛点。
12. Nvidia的CEO黄仁勋(Jensen Jen-hsun Huang)的管理风格可以用“灵活性”和“扁平化”来概括。
阅读原文

央视网《新质观察》——大模型不大,打工人不慌

文章概要:

1. 人工智能时代来临,工作模式已不能满足快节奏工作需要,大模型的兴起为人工智能的发展注入了的,人工智能的终极目标始终是全心全意为人类服务
. 星环科技打造出AI PC版本的无涯·问知”大模型问答类产品,将大模型做小型化,通用模型做专业化,让打工人在笔记本上即可轻松使用大模型,解决工作中遇到的各类痛点。
3. 宏碁与英特尔和星环科技通力合作,共同开发全新的AI PC产品,该产品内部部署了星环KH知识库,并基于无涯大模型开发了宏碁专属的AI助手“A星人专业版”。
. 在新质生产力背景下,各个行业和企业也在利用AI和大模型实现数字化转型和业务能力的提升。
5. 英特尔凭借强劲且广泛部署的软硬件平台和易用的AI推理加速方案,也在为各行业和企业赋能,加速行业AI落地。
阅读原文

目前最全,188+26个国产大模型!

文章概要:

1. 文章介绍了国家互联网办公室披露的已通过国家级备案的188家人工智能大模型和地方网信部门登记在册的26家AI大模型的情况。
2. 文章罗列了常用的大模型及其优缺点,包括百度的文心一言、科大讯飞的星火大模型、阿里云的通义千问、字节跳动的豆包、智谱华章的智谱清言、腾讯的混元、商汤的商量SenseChat、天工AI、百川智能的百川大模型、360的360安全大模型等。
3. 文章还介绍了一些有潜力的大模型,如华为云的盘古大模型、小米的MiLM-6B、中科院自动化研究所的紫东太初、Minimax的ABAB大模型、月之暗面的Kimi Chat等。
4. 文章分析了国内大模型行业落地的现况,包括金融、医疗、智能制造等领域的应用。
5. 文章探讨了国内大模型的优势,如全产业链覆盖、政策支持、技术创新、场景多样化等。
6. 文章指出了国内大模型面临的挑战,如技术门槛高、数据隐私和安全、模型可解释性不足、高额成本、认知不足与预期过高等。
7. 文章展望了国内大模型行业的前景,包括技术创新持续、产业链协同发展、政策支持加强、应用场景拓展等。
阅读原文

融资、投流、造血,大模型“新星”开启变现竞速

文章概要:

1. 2024年被称为“AI大模型应用元年”,行业变化太快,充斥着各种声音。原本漫长的技术发展周期,在大模型身上被装上了加速键。从卷参数、到卷应用,短短两年时间,玩家“百模大战”、资本烈火烹油,都在探索,又备受质疑。步入下半年,整个行业的风向更加微妙。分析机构Similarweb的最新数据指出ChatGPT网站的月度访问总量遭遇断崖式暴跌;OpenAI发布新品的节奏明显变慢;英伟达股价震荡,跌出美股市场的单日最高值;在国内也不乏给大模型“泼冷水”的大佬们。另一方面,国内大模型“新星”仍炙手可热。月之暗面被曝腾讯入局投资的消息,公司投后估值已达30亿美元;智谱AI拿到新一轮融资,金额高达数十亿元,投前估值200亿元;李飞飞首次创业项目World Labs宣布获得2.3亿美元融资,背后站着英伟达。行业正陷入“冰与火”的焦灼之中。而这背后,是市场逐渐对大模型祛魅,资本也回归理性,也只有当热潮退去,真正有价值的企业或应用才会浮现出来。
2. 大模型的特殊性在于“烧钱”,技术上的研发成本,应用上的运行成本,每一步都少不了真金白银的支持,这也是大模型企业们的“紧箍咒”。尤其是像月之暗面、智谱AI这样的创业企业,它们不及巨头们的资金雄厚、资源丰富,如果一味地依赖融资输血,无法无法自我造血,则势必会被淘汰。潮水方向的变化推着模型行业向前走。 从“百模大战”走到“应用之战”,大模型行业即将进入新的阶段,而这个阶段,除了产品、应用外,找到一条属于自己的变现之路极为重要。
3. 过去22个月大模型的到来,让AI的发展速度空前。从百模大战,到应用大战,除了互联网大厂下场做大模型,众多与AI相关的创业公司涌现出来。几轮淘汰赛过后,在我国也诞生了不少明星企业。从“新AI四小龙”,到“AI五小虎”AI六小强”,这背后都离不开资本的助推。CBInsights数据显示,2023生成式AI新创在全球获得约204亿美元融资,是2022年36亿美元的5倍以上。到如今,热潮还在持续。
4. 资本迫切的回报周期压力之下,融资只是独角兽们拿到大模型船票的第一步,学会赚钱,才是他们的必修课。告别去年的“百模大战”,今年大模型行业开始走向应用落地,也就是商业化。和去年技术路线之争一样,今年的商业化落地路径依旧是行业激辩的焦点。本质上,是大模型商业化之路的B端和C端之争。一方认为B端应用相对明确,覆盖行业广,能快速实现多个场景的应用,C端竞争大,想要跑出一个爆款应用时间成本较高;另一方认为,行业内卷加剧价格战,B端大模型利润被压缩,而C端能更快地看到收益。
5. 大模型浪潮之下,互联网巨头和初创企业站在同一起跑线上。如果说去年技术层面是大模型的资格赛,那今年应用层面已经到了决赛阶段。很难说,面对资源更丰富、生态更的大厂,仅靠资本输血的初创企业会没有压力。于初创企业而言,首当其冲的就是高昂的大模型训练成本、逐渐上涨的应用获客成本。进入今年,大模型内卷加剧,加之大模型应用用户留存低,为了拉新,大模型C端应用卷出新高度。到了今年,关于赚钱的问题更加棘手。五月,字节、阿里、百度、腾讯等厂商都将主力模型的API价格普遍下调了90%以上,大模型也正式进入价格战之中。
阅读原文

产品发布|企业级端侧大模型 Alivia Vision Mini,持续提升大空间理解力

文章概要:

1. 「Whale 帷幄」推出全新的企业级侧大模型 Alivia Vision Mini,主要面向图文理解,特别是大空间理解场景。<>2 该模型在零售空间场景中,能够精准识别车辆的车门开启与关闭情况,人员的进出车辆的动作,并实时生成其对应的边界定位。
3. 针对企业用户,帷幄提供了 Alivia Vision Mini 的 Fine-tuning 能力,确保为企业级应用提供高精确度的模型理解能力。
4. Alivia Mini 是帷幄首个支持 AI 边缘计算盒子端侧设备上进行图片和实时视频理解的模态大模型。<>5. 用户可以在单个或者多个摄像头中,通过 Prompt 提示词,相应事件。
6. 用户也可以对摄像头场景做解读,并通过 Alivia 大模型,汇总总结报告。
7. 使用 32T 算力ale Hub Pro 鲸盒 V3,可同时接入 28 路摄像头 Alivia Vision Mini 推理。
阅读原文

【资讯】2024汽车操作系统与AI大模型生态大会·滴水湖峰会成功举办

文章概要:

1 202操作系统与AI大模型生态大会·滴水湖峰会在临港新片区成功举办,近50家相关企业和机构、100多位行业专家、学者参加。
2. 临港新片区管委会高科处上海临港新片区国际投资发展有限公司向与会企业和嘉宾做产业介绍。
. 临港投控集团和思研战略合作为临港汽车软件产业发展提供研究和服务。
4 企业嘉宾围绕汽车操作系统、软件生态AI大模型等进行了主题演讲。
5. 活动最后的圆桌论坛,展示了智能汽车大模型的最新技术和实践经验,为行业发展提供宝贵建议。
阅读原文

独家专访 Tripo CMO,揭秘如何实现 3D 用户破圈增长和多社区联动策略

文章概要:

1. 产品进化:Tripo.AI的迭代与未来蓝图,包括产品的介绍、生成能力的评价、与竞品的不同、数据的获取、用户对生成内容的控制和修改、遇到的问题以及未来的发展方向。
2. 找到用户:探索3D资产的不同需求,包括目标用户的介绍、落地场景的举例、与3D打印机厂商的合作以及商业模式的探索。
3. 从社区到生态:Tripo.AI的创新运营与全球增长策略,包括用户增长的策略、社区运营的关键点、吸引内容消费者的增长策略、病毒传播方式的尝试以及出海的心得和拓展经验。
阅读原文

AI“硬控”,大模型时代怎么赢?

文章概要:

1. AI的发展速度超越人类想象,自ChatGPT掀起生成式人工智能热潮以来,AI持续进化迭代。
2. 2024年,全球对AI大模型进行狂热探索,AI对千行百业产生颠覆与变革,如电商领域数字人主播重塑直播形态,教育领域“AI家教”变革学习体验,办公领域AI助手重塑工作模式等。
3. AI大模型了全新的智能纪元,带来无限可能和机遇,也带来巨大不确定性。
4. 2024年10月23日,由财视传媒主办的“‘赢在大模型时代’2024未来发布论坛暨‘向上拾年’财视十周年盛典”将在北京举行,活动将邀请各领域大咖,新观点、新思路,共话发展新未来。
5. 文章列出了拟邀嘉宾名单。
阅读原文

大模型落地应用:难点与破局

文章概要:

1. 大模型重构科研生产关系:AI为科研带来重构生产力和关系科研效率,促进了科研原始创新,展示出人工智能为科学研究带来的巨大价值,AI大模型领先科研团队成果丰硕。
2. 科研大模型落地需理解底层科学规律:AI大模型已经为科学研究带来了巨大价值,但在下游工业的科研大模型落地中,仍面临一系列相关场景挑战。<>3. 大模型赋能制造需深化融合应用:AI大模型正逐渐渗透到制造业各环节,成为制造业通往智能化、柔性化和自动化的核心技术之一,为制造业带来新机遇。
4. 大模型进终端推动AI规模化普及:端侧AI是AI发展的下一阶段,通过将大模型赋能终端硬件,有望开启AI应用浪潮。
阅读原文

基于大模型的应用的价值到底在哪里?

文章概要:

1. 基于大模型研发的智能体能够执行特定任务、与环境交互并做出决策,其核心价值在于人类的认知和决策过程,提供更加自然、高效和个性化的交互体验。
2. 大模型通常指的是具有大量参数的深度学习模型,它们能够执行多种任务,如自然语言处理、图像识别、语音合成等。
3. 大模型的AI助手的核心价值在于提高效率、降低成本、增强用户体验,并为企业和个人提供决策支持。
4. AI助手可以做一些有固定流程或者规则的复杂任务系列,而不能自主决策的事项。
5. AI助手不能做像人类一样有感情或伦理以及相关决策的事项。
6. 大模型助手的应用和普通SAAS的应用的区别是利用大语言模型的语言能力,去完成一个任务,这中间可能需要拆分成多个小任务,并行执行。
7. 目前大部分的观点是“SaaS挣不到的钱,会通过Agent挣到”。br>8. 黎科峰博士认为,未来企业的运营将更多依赖于工具而非人力资源。那些拥有数据并能够利用工具提升效率的企业将成为最有价值的企业。
阅读原文

基于大模型的应用的价值到底在哪里?

文章概要:

1. 大模型技术正在逐渐改变我们的工作和生活方式,本文探讨了大模型的应用、价值、商业化等问题。
2. 基于大模型研发的智能体能够执行任务、与环境交互并做出决策,其核心价值在于模拟人类的认知和决策过程,提供更加自然、高效和个性化的交互体验。
3. 大模型的AI助手的核心价值在于提高效率、降低成本、增强用户体验,并为企业和个人提供决策支持。
4. AI助手可以做一些有固定流程或者规则的复杂任务系列,而不能自主决策的事项。
5. 大模型助手的应用和普通SAAS的应用的区别是利用大语言模型语言能力,去一个任务,这中间可能需要拆分成小任务,并行执行。
6 目前大部分的观点是“SaaS挣不到的钱,会通过Agent挣到”,未来企业的运营将更多依赖于工具而非人力资源。
7. 数势科技的优势在于利用软件和算法解决问题,而不是依赖人力,其产品能够提高决策能力,降低软件的使用门槛。
8. 在产品技术方面,企业需要明确智能代理与大模型之间的依赖关系,优化智能代理的产品设计,使其更高效地运作,减少与大模型的交互次数,只将必要的任务交给大模型处理,从而节约资源。
阅读原文

大模型时代的企业AI发展趋势浅析

文章概要:

1. 大模型时代的企业AI发展趋势,探讨大型模型的发展轨迹、应用前景、挑战及具体应用情况。
2. 具备强大的语言生成能力、自然语言对话能力和迁移学习能力,但也存在“幻觉”现象。<> 3. 落地方向包括针对不同行业的专业大模型在模型的基础上开发产业应用、将大模型与其他技术和工具结合。<> 4 六种模式包括提示工程检索增强生成、微调、知识图谱与向量数据库、内部监测与控制、安全与治理。
5. 第三代人工智能的发展重点聚焦于构建具有可解释性和稳健性的AI理论与方法、开发安全、可控、可信、可靠且可扩展推动AI的创新应用与产业化进程。> 6. 坚持中国自主发展道路,充分结合和利用知识数据、算法、等关键要素,推动中国人工智能产业的繁荣发展。
7. 在人工智能技术迅猛发展的当下,大模型正在各行各业中展现出巨大的潜力。
8. 展望未来,要关注技术本身的突破,更要深入思考如何将其与产业实际紧密结合。
阅读原文

最强大脑上线!全国首个基层法院研发训练的AI司法大模型来了!

文章概要:

1. 香洲法院正式启用“香法AI·云上智审”平台,这是全国首个基层法院研发训练的AI司法大模型。<>2. 该平台能实现证据比对核验及当事人陈述逻辑审查,提示法官关注矛盾之处,流程辅助法官高效处理审判。
3. 平台将办案人员非结构化的自然表述转化为结构化的法律信息,呈现出更加精准的法律检索结果。
4. 香法AI总结的案件事实简洁精准、诉辩分析有理有据、文书说理逻辑清晰,有效辅助法官提高工作质效。
5. 香洲法院将持续推进人工智能、云计算、区块链等新技术成果与司法工作融合。
阅读原文

【极简综述第二期27】大模型生成内容溯源技术

文章概要:

1. 大模型生成内容溯源技术因其强大的内容创作能力引发全球关注,但也带来了内容安全和风险管理挑战。本文将分别介绍生成文本溯源和生成图像溯源技术。
2. 生成文本溯源任务一般被定义为多分类任务,可将现有的生成文本溯源方法大致分为基于预训练-微调的方法、基于风格特征的方法、基于重写的方法和基于概率特征的方法。
3. 生成图像溯源建立了生成模型的内部状态与生成图像之间的某种关系。根据这种关系的创建和识别的方式,现有的研究水印的方法、基于模型反演的方法和基于指纹的方法。
4. 尽管现有工作已经在大模型生成内容溯源方面取得了一些进展,但仍然存在模型溯源过程的可解释性问题、世界模型溯源的泛化性问题、人机混合场景下的溯源问题、溯源方法的攻击鲁棒性问题。
阅读原文

【科技前沿】“中国版Sora”再落一子,火山引擎如何赢战中国AI大模型下半场?

文章概要:

1. 火山引擎发布了AI视频模型——豆包·视频生成模型,该模型基于全新DiT扩散模型架构,能够精准理解复杂prompt,实现多个主体运动的复杂交互,保持多镜头切换内容的一致性,且具备高保真高美感的影视级生成水准,可用于电商营销、城市文旅、动画教育、微短剧等多个场景中。
2. 火山引擎加速豆包大模型产品和方案落地,截至今年9月,豆包大模型的日均Tokens使用量已经超过1.3万亿,4个月时间里Tokens整体增长超过10倍,C端下载量超过1亿次,拥有超过3000万月活经过字节内部50+真实业务场景实践验证,30+行业外部企业深度共创。
3. 火山引擎发布和升级6款大模型产品,包括豆包·视频生成模型、豆包·同声传译模型、豆包·音乐模型、豆包通用模型pro、豆包·语音合成模型、豆包·文生图模型。
4. 火山引擎与30+行业外部企业深度共创豆包大模型商业落地,全面助力零售、游戏、汽车、教育、医疗、企业服务等领域,助力客户提速增效。
5. 火山引擎的定位是云和AI服务提供商,在大模型的时代,他们的主要目标是帮助企业降低成本、提高效率,并且促进企业的创新。
6. 生成式AI将开启一个新的黄金时代,拥有巨大的市场潜力,企业需要以开放、创新的心态拥抱变革。
阅读原文

金科视界|大模型性能提升:涌现能力 & CoT

文章概要:

1. 本期导读:在自然语言处理领域,大模型在多个任务中展现其强大的理解和生成能力。我国在电力、、纺织等多个行业的知识储备已具备领先优势,但在数理能力方面还有提升空间。大模型的“涌现能力”和思维链(Chain-of-Thought, CoT)成为大模型自然语言处理领域的重要研究趋势
2. 国内资讯:2024世界人工智能大会(WAIC暨人工智能全球治理高级别会议于今年7月上海开幕。展会现场,45款机器人和超100个大模型展示了AI在医疗、研发和翻译等领域带来显著效率提升。人工智能企业已形成覆盖基础支撑、软件、应用的完整产业体系,产生了制造业、金融、具身智能机器人等垂类领域应用。
. 国际瞭望:亚马逊AGI团队称其AI展现出“涌现能力,一个新的亚马逊人工智能模型展现出了未经过训练语言能力该BASE TTS,初始模型在10万小时的公共语音数据上训练,能够生成各种各样的句子。为测试大型模型在“涌现的表现,亚马逊AG团队分别在1000小时和1000小时的数据上了较小的BASE TTS。AGI团队的“涌现能力”标准包含理解标点符号、非英语单词和情感的能力100小时语音数据的BASE TTS得分最高,该模型生成的句子对人类而言自然。
4. 技术论文:为解决零样本CoT中缺失推理步骤的,本文提出了先计划后求解(PS)提示方法。该方法由两个部分组成首先,一个计划将整个任务分解成更小的子任务,然后根据计划执行这些子任务。为了解决零样本CoT中的计算错误并提高生成推理步骤的质量,本文向PS提示中了更详细的指令
阅读原文

阿里云 Qwen2.5:大语言模型的显著改进 | 开源日报 No.375

文章概要:

1. Qwen2.5是由阿里云Qwen团队开发的大型语言模型系列,多种大小以及基础和指导变体的密集易用解码器语言模型,在遵循指令、成长文本等方面有显著>2. excelCPU是一个Excel设计的16位CPU,包含ROM、指令集等主要电子表格文件,提供Excel-ASM16编译器和相关语言down文件,支持或手动控制模式,并提供多种操作>3. metavoice-src是一个人类级别语音的AI项目,基于10小时的语音训练而成的1.参数基础模型,用于TTS文本转语音支持英文情感性语音节奏和语调,无幻觉
4. ReplaceAnything是一个可以替换任何内容的项目,支持衣物替换、身份照片家庭照片背景替换、人物替换、背景替换,保留严格遮罩区域
. Leaked-GPTs一个用于绕过25条消息限制或尝试GPTs的项目,Plus订阅绕过25条消息限制,可以尝试GPTs功能而无需Plus订阅,提供了大量的GPT Prompts列表
阅读原文

国内AI大模型已近80个,哪个最有前途?

文章概要:

1 Github上的一个名为Awesome LLMs In China的项目帮我们详细的总结截至目前为止的所有国产大模型的基本情况,目前共有大模型243个
2. 这些大模型的领域各有不同,比如百度的文心一言、讯飞的星火、智谱华章的清言、百川智能的、阿里云的通义千问等是可以陪我们普通人聊天的通用大模型而像北京大学的ChatLaw则是专注法律问题的大模型,思的MathGPT则是于算法讲解的大模型。br> 3. 不管是这种「小而专的模型,还是「大而全」的模型,未来都会越来越多,几乎所有企业都得用模型重塑一下形态,过程就会重塑机会,所以先别管大模型有前途,咱们都实际点关注下自己在 AI 大模型浪潮中的前途。
4. 微调模型可能具有更好的效果,现在已经有包括智谱清言百川、通义千问在内的众多开源模型,这些模型均提供了大小不同的微调的模型。
5. 目前国产大模型种类繁多,涉及的领域和专业也是不计其数,很难一概而论评价哪个大最有前途。
6.我觉得对于提高工作效率来说,还是开源模型的潜力更大一些。只要明确自己的需求、目标、数据,一个大模型,可以有效帮我们完成一些无聊的重复性工作,简单写个代码啥的完全没有问题。
阅读原文

33个AI大模型,你更钟情哪一个?

文章概要:

1. 介绍了33个AI大模型,包括秘塔AI、文心一言、通义千问大模型、豆包AI模型、天工AI模型、商量(商汤)AI模型、星火认知大模型、书生AI模型、Kimi AI模型、ChatGLMS模型、混元AI模型、百川(百小应)AI模型、腾讯元宝模型、智谱清言大模型、蓝心、科大讯飞星火大模型、边界Aichat、盘古大模型、封神榜开源体系、360智脑模型、文修大模型、KnowLM平台、Google Bard、紫东太初、写易智能创作引擎、小冰、CPM-Bee模型、YonGPT大模型、赤兔大模型、ChatGPT、Claude、GPT-4、Moss等。
2. 这些AI大模型涵盖了语法检查、文本创作、知识问答、智能客服、多模态交互等丰富的功能特长,适用于法律文书、学术论文、广告营销、在线教育、企业办公等众多领域。
3. 文章认为这些AI大模型将为我们的生活、学习和工作带来前所未有的人工智能技术,充分发挥它们的潜力,共同迈向一个更加智能、高效、创新的未来。
阅读原文

沈向洋: 关于大模型的10个思考

文章概要:

1. 沈向洋在第四届“青年科学家50²论坛”上发表了主题演讲,分享了他对大模型的10个思考
2. 大模型对算力的要求非常高,过去10年增长巨大,未来需要更多的多模态数据和人工合成数据
3. 大模型的下一章是多模态的理解和生成的统一,需要做很多科研工作
4. 人工智能的范式转移是从GPT的预训练思路,变成了今天的自主学习的道路,需要非常多的算力
5. 大模型横扫千行百业,未来通用大模型的占比会越来越低
6. AI Agent是超级应用,需要理解工作流,拆解问题,目前还没有强大到能够完成所有工作
7. 开源和闭源都有各自的优势和挑战,需要根据具体情况选择
8. 重视AI治理,人工智能对千行百业、对整个社会的冲击非常大,需要大家共同来面对
9. 重新思考人机关系,真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者
10. 智能的本质是没有理论的,需要更多的探索和研究
阅读原文