大模型为什么有“幻觉”?我被问傻了...
文章概要:
1 本文提出了LLMs幻觉现象的分类,分析了用于幻觉的基准测试,探讨了旨在减轻LLMs幻觉的现有方法,并讨论了未来研究的方向
. 本文将幻觉分为输入幻觉、上下文幻觉、事实幻觉三个定义,并提出了三种Benchmark来评估LLM幻觉问题
. 本文提出了训练期间策略、监督式微调(FT)期间的、基于人类反馈的强化学习(RLHF)、推理期间(inference time)的幻觉缓解策略等对应的解决方法
. 本文讨论了多种缓解大型语言模型(LLMs)的方法,并提出了研究展望
阅读原文
. 本文将幻觉分为输入幻觉、上下文幻觉、事实幻觉三个定义,并提出了三种Benchmark来评估LLM幻觉问题
. 本文提出了训练期间策略、监督式微调(FT)期间的、基于人类反馈的强化学习(RLHF)、推理期间(inference time)的幻觉缓解策略等对应的解决方法
. 本文讨论了多种缓解大型语言模型(LLMs)的方法,并提出了研究展望
大模型公司想让你对图形用户界面(GUI)说再见|新皮层
文章概要:
1. 大模型公司想让用户对图形用户界面(GUI)说再见,AI可以代替人类操作电脑和手机,如智谱推出的AutoGLM和Anthropic发布的“计算机操作”功能。
2. 图形用户界面(GUI)已越来越臃肿,AI可能玩得更好,如智谱AutoGLM的phone use首先上线的8款App是:微信、美团、淘宝、大众点评、小红书、高德地图、12306和携程。
3. 「代操作」AI的出现也将重新定义AI设备,如微软、Google苹果等巨头都没有将「代操作」作为一台AI设备的重点,而Anthropic和智谱用一个「代操作」工具让大量既有的、没那么先进的设备直接变成了AI机器。
4. 从推理问题变为模仿问题,大模型公司们一定程度上把这些障碍都绕过了,如Anthropic的Claude模型在实现computer use功能时,没有调取被操作应用程序的API,仅仅是通过大量分析用户的屏幕截图,理解了用户如何完成任务分解和分步骤实现目标,就学会了「代操作」。
阅读原文
2. 图形用户界面(GUI)已越来越臃肿,AI可能玩得更好,如智谱AutoGLM的phone use首先上线的8款App是:微信、美团、淘宝、大众点评、小红书、高德地图、12306和携程。
3. 「代操作」AI的出现也将重新定义AI设备,如微软、Google苹果等巨头都没有将「代操作」作为一台AI设备的重点,而Anthropic和智谱用一个「代操作」工具让大量既有的、没那么先进的设备直接变成了AI机器。
4. 从推理问题变为模仿问题,大模型公司们一定程度上把这些障碍都绕过了,如Anthropic的Claude模型在实现computer use功能时,没有调取被操作应用程序的API,仅仅是通过大量分析用户的屏幕截图,理解了用户如何完成任务分解和分步骤实现目标,就学会了「代操作」。
聊聊对大模型的一些看法
文章概要:
1.GPT的火热带起了对LLM的讨论,作者对大模型的态度是信念上认同,现实上怀疑,因为在从业经历中,有太多用大模型来做宣传,但没有真正诉诸落地的case。
2. ChatGPT的出现更新了作者的认识,作者对大模型的技术方向的现实上的怀疑也开始被打消。
3. 作者对ChatGPT这类技术实际线上serving的计算成本做过一个大略的推算,以GPT3-175B模型为例,一台DGX A100 8卡服务器可以完成serving,所以用NV开源的FasterTransformer的推理性能作为参考,以Azure的8卡A100的服务器三年包年价格为基准,选取batch size为128,输入文本长度=200,输出文本长度=200的性能数字,最终计算下来生成1000个token的成本是大约是0.3美分的样子。
4. 作者对大模型的训练成本进行了分析,通常训练LLM,一个直观的计算尺度是以达到模型预期效果所需消耗的训练token数量为计算总任务需求,结合GPU上训练过程中的token吞吐能力,来计算在限定时间内完成一个满足要求的训练过程,需要多少块GPU,进而推算出需要多少成本。
5. 作者认为在中国的环境下,如果真的想支持大模型这类技术工作,不论是投资机构,还是国家基金,做好五年30亿以上不计回报投入的准备,会是一个资金上的保底。
6. 作者认为假设能找到合适的资金投入,能够在经营回报上不设预期,并且能保障资金投入的规模满足运营要求,下一步的挑战就是人了。
7. 作者认为假设无论是建模相关的人才,还是系统相关的人才,找到了。更关键的一步是硬件资源了。
8. 作者认为只有对上述挑战的客观性,有着清晰的认识之后,还愿意投入到这个方向,对这个领域才可能带来比较关键的帮助。很期望大模型技术在国内能取得更关键的突破和进展,也很不希望最近整个行业对大模型的反应过于躁动,把这个方向的发展潜力以一种不健康的方式过早消耗掉,反而影响到了后续的发展。
阅读原文
2. ChatGPT的出现更新了作者的认识,作者对大模型的技术方向的现实上的怀疑也开始被打消。
3. 作者对ChatGPT这类技术实际线上serving的计算成本做过一个大略的推算,以GPT3-175B模型为例,一台DGX A100 8卡服务器可以完成serving,所以用NV开源的FasterTransformer的推理性能作为参考,以Azure的8卡A100的服务器三年包年价格为基准,选取batch size为128,输入文本长度=200,输出文本长度=200的性能数字,最终计算下来生成1000个token的成本是大约是0.3美分的样子。
4. 作者对大模型的训练成本进行了分析,通常训练LLM,一个直观的计算尺度是以达到模型预期效果所需消耗的训练token数量为计算总任务需求,结合GPU上训练过程中的token吞吐能力,来计算在限定时间内完成一个满足要求的训练过程,需要多少块GPU,进而推算出需要多少成本。
5. 作者认为在中国的环境下,如果真的想支持大模型这类技术工作,不论是投资机构,还是国家基金,做好五年30亿以上不计回报投入的准备,会是一个资金上的保底。
6. 作者认为假设能找到合适的资金投入,能够在经营回报上不设预期,并且能保障资金投入的规模满足运营要求,下一步的挑战就是人了。
7. 作者认为假设无论是建模相关的人才,还是系统相关的人才,找到了。更关键的一步是硬件资源了。
8. 作者认为只有对上述挑战的客观性,有着清晰的认识之后,还愿意投入到这个方向,对这个领域才可能带来比较关键的帮助。很期望大模型技术在国内能取得更关键的突破和进展,也很不希望最近整个行业对大模型的反应过于躁动,把这个方向的发展潜力以一种不健康的方式过早消耗掉,反而影响到了后续的发展。
天池蚂蚁AFAC大模型挑战赛-冠军方案(含代码)
文章概要:
1. 天池蚂蚁AFAC大模型挑战赛冠军方案分享,包括赛题背景、数据案例解析、评价指标、赛题理解、算法实现等内容。
2. 赛题要点包括标准产品名提取、用户意图识别和相关例子召回。
3. 算法实现包括框架介绍、Prompt设计技巧、训练技巧和推理技巧。
4. 框架介绍包括Prompt构造、训练和推理阶段。
5. Prompt设计技巧包括产品名召回意图识别和例子召回。
6. 训练技巧包括模型选型和Lora微调。
7. 推理技巧包括温度设置和多数投票。
阅读原文
2. 赛题要点包括标准产品名提取、用户意图识别和相关例子召回。
3. 算法实现包括框架介绍、Prompt设计技巧、训练技巧和推理技巧。
4. 框架介绍包括Prompt构造、训练和推理阶段。
5. Prompt设计技巧包括产品名召回意图识别和例子召回。
6. 训练技巧包括模型选型和Lora微调。
7. 推理技巧包括温度设置和多数投票。
利用大模型完善抗体设计:AbLang-2语言模型突破种系偏差限制
文章概要:
1. 研究背景:抗体作为重要的生物治疗药物,其开发过程复杂且成本高昂。近年来,基于Transformer的语言模型在蛋白质序列设计领域取得进展,但抗体序列中的种系偏差限制了现有语言模型的应用效果。
2. 研究创新:牛津大学研究团队开发了AbLang-2,通过创新性的训练策略,克服了种系偏差的限制,能够更准确地预测抗体序列中的非种系突变。
3. 关键发现:种系偏差具有普遍性,现有模型存在局限性,AbLang-2采取了焦点损失、多样化掩码策略和两阶段训练等改进策略。
4. 实验结果:AbLang-2在预测非种系残基时性能显著优于其他模型,能够更准确地预测关键突变位点。
5. 应用价值:AbLang-2在治疗性抗体开发中具有重要应用价值,能够降低开发成本,减少实验筛选的工作量,提高抗体优化的效率。
6. 开源贡献:AbLang-2已开源发布,可通过GitHub获取。
7. 总结与展望:AbLang-2的成功开发标志着抗体设计领域的重要突破,未来研究方向包括进一步提升模型性能、整合更多实验验证数据和探索在其他类型生物分子设计中的应用潜力。
阅读原文
2. 研究创新:牛津大学研究团队开发了AbLang-2,通过创新性的训练策略,克服了种系偏差的限制,能够更准确地预测抗体序列中的非种系突变。
3. 关键发现:种系偏差具有普遍性,现有模型存在局限性,AbLang-2采取了焦点损失、多样化掩码策略和两阶段训练等改进策略。
4. 实验结果:AbLang-2在预测非种系残基时性能显著优于其他模型,能够更准确地预测关键突变位点。
5. 应用价值:AbLang-2在治疗性抗体开发中具有重要应用价值,能够降低开发成本,减少实验筛选的工作量,提高抗体优化的效率。
6. 开源贡献:AbLang-2已开源发布,可通过GitHub获取。
7. 总结与展望:AbLang-2的成功开发标志着抗体设计领域的重要突破,未来研究方向包括进一步提升模型性能、整合更多实验验证数据和探索在其他类型生物分子设计中的应用潜力。
大模型历史文章目录
文章概要:
1. 介绍了大模型历史文章目录
2. 包含大模型介绍、模型部署、检索增强、实际应用等内容
阅读原文
2. 包含大模型介绍、模型部署、检索增强、实际应用等内容
智库研究 | 新质服务业典型业态介绍:工业大模型
文章概要:
1. 长城战略咨询选取工业大模型、工业元宇宙、虚拟数字人、数据交易服务、AI for Science五大新质服务业典型业态进行重点剖析。
2. 工业大模型指面向工业领域需求,以预测和优化工业系统运行为目的建立的人工智能模型,具备多维度建模、高度集成与智能优化三个特征。
3. 20世纪90年代,国外工业大模型的发展历程,经历了从理论探索到技术突破,再到广泛应用的深刻变革。
4. 2024年1月,国务院常务会议研究部署推动人工智能赋能有关工作,我国大模型技术正处于高速发展的黄金时期。
5. 工业大模型作为智能化升级的关键工具,对工业企业至关重要,具备广阔应用场景,落地应用离不开算力基础设施的支撑。
阅读原文
2. 工业大模型指面向工业领域需求,以预测和优化工业系统运行为目的建立的人工智能模型,具备多维度建模、高度集成与智能优化三个特征。
3. 20世纪90年代,国外工业大模型的发展历程,经历了从理论探索到技术突破,再到广泛应用的深刻变革。
4. 2024年1月,国务院常务会议研究部署推动人工智能赋能有关工作,我国大模型技术正处于高速发展的黄金时期。
5. 工业大模型作为智能化升级的关键工具,对工业企业至关重要,具备广阔应用场景,落地应用离不开算力基础设施的支撑。
智启未来:AI大模型
文章概要:
1. 智启未来:AI大模型
阅读原文
《瞭望》:大模型开闭源争议何在
文章概要:
1. 2024年10月28日《瞭望》发布文章探讨大模型开闭源争议。
2. 大模型开闭源对应两种软件开发模式,开源指开放源代码,闭源则不公开源代码。
3. 2022年底ChatGPT横空出世,大模型开闭源路线之争如影随形。
4. 今年,国内大模型应用加速落地,开闭源争论愈发激烈。
5. 开源派多论生态建设价值,闭源派则多讲性能领先优势。
6. 技术路线之争只是表象核心利益之争。
7. 开源与闭源既是技术策略,更是商业策略br>8. 开源与闭源模式之争表面上是技术路线差异,实则是在大模型应用加速落地的背景下,企业为争夺市场占有率的商业策略之争。
9. 开源与闭源模型各有利弊,短期来看,二者并不冲突。
10. 短期内,开源与闭源共存并相互竞争有利于国产大模型行业逐步壮大。
11. 长期来看大模型或将走向开源。
阅读原文
2. 大模型开闭源对应两种软件开发模式,开源指开放源代码,闭源则不公开源代码。
3. 2022年底ChatGPT横空出世,大模型开闭源路线之争如影随形。
4. 今年,国内大模型应用加速落地,开闭源争论愈发激烈。
5. 开源派多论生态建设价值,闭源派则多讲性能领先优势。
6. 技术路线之争只是表象核心利益之争。
7. 开源与闭源既是技术策略,更是商业策略br>8. 开源与闭源模式之争表面上是技术路线差异,实则是在大模型应用加速落地的背景下,企业为争夺市场占有率的商业策略之争。
9. 开源与闭源模型各有利弊,短期来看,二者并不冲突。
10. 短期内,开源与闭源共存并相互竞争有利于国产大模型行业逐步壮大。
11. 长期来看大模型或将走向开源。
《瞭望》:大模型开闭源争议何在
文章概要:
1. 大模型开闭源对应两种软件开发模式,开源指开放源代码,闭源则不公开源代码。2022年底ChatGPT横空出世,大模型开闭源路线之争如影随形。2. 大模型开闭源之争表面上是性能与技术路线之争,实则利益才是重中之重。短期看,理想状态是在开闭源两种模式之间找到平衡,在技术进步与生态建立方面优势互补;长期看,大模型可能会像互联网一样,逐步走向开源,由全世界共同维护、共同受益。3. 开源派多生态建设价值,闭源派则多讲性能领先优势。有业内人士认为,多数开源大模型并非“真”开源,闭源大技术壁垒也尚未稳固,技术路线之争只是表象。4 开源与闭源既是技术策略,更是商业策略。表面上的发展路线之争,实则是利益之争。选择不同的路线源于开发者基因不同。5. 开源与闭源模式之争表面上是技术路线差异实则是在大模型应用加速落地的背景下,企业为争夺市场占有率的商业策略之争。6. 开源模型与闭源模型各有利弊,开源模型前期免费但无法“开箱即用”,后期隐性成本较高,更适合预算有限、对数据安全要求高的学术研究、业务探索等小型项目;闭源模型供应商通常会提供技术服务,模型相对稳定可靠但费用较高,适合对成本不敏感的大型项目7. 短期内,开源与闭源共存并相互竞争有利于国产大模型行业逐步壮大。长期来看,大模型或将走向开源。
阅读原文
一篇大模型数据合成和增强技术最新综述
文章概要:
1. 大型语言模型(LLMs)高质量数据的增长速度远远落后于训练数据集的扩张,在这种情况下,合成数据已成为一个希望的解决方案。目前,数据生成主要包含两种主要方法:数据增强和合成。全面回顾并总结了LLMs生命周期中的数据生成技术,包括数据准备、预训练、微调、指令调优、偏好对齐和应用。
2. 介绍了数据生成方法的分类,这些方法在处理数据稀缺性和不平衡性方面起着关键作用,从而提高模型性能和泛化能力,将增强和合成技术的发展和演变进行了总结。
3. 讨论了在大型语言模型(LLMs)的数据准备阶段,和高质量的数据集,以应对真实世界数据的挑战。
4. 探讨在大型语言模型(LLMs)的预训练阶段,数据合成和增强如何提供丰富、多样化且可控制的训练数据,以提升模型性能并减少偏见。
5. 讨论了在大型语言模型(LLMs)的微调阶段,数据合成和如何通过生成的数据对LLMs进行微调,以提升模型在特定任务上的表现。
6. 探讨了在大型模型调,数据合成和增强如何生成高质量的指令遵循数据。
7. 讨论如何通过数据合成和增强技术来优化大型语言模型(LLMs)以符合复杂的人类偏好。br>8Ms)应用领域中如何通过数据增强技术来提升性能。
阅读原文
2. 介绍了数据生成方法的分类,这些方法在处理数据稀缺性和不平衡性方面起着关键作用,从而提高模型性能和泛化能力,将增强和合成技术的发展和演变进行了总结。
3. 讨论了在大型语言模型(LLMs)的数据准备阶段,和高质量的数据集,以应对真实世界数据的挑战。
4. 探讨在大型语言模型(LLMs)的预训练阶段,数据合成和增强如何提供丰富、多样化且可控制的训练数据,以提升模型性能并减少偏见。
5. 讨论了在大型语言模型(LLMs)的微调阶段,数据合成和如何通过生成的数据对LLMs进行微调,以提升模型在特定任务上的表现。
6. 探讨了在大型模型调,数据合成和增强如何生成高质量的指令遵循数据。
7. 讨论如何通过数据合成和增强技术来优化大型语言模型(LLMs)以符合复杂的人类偏好。br>8Ms)应用领域中如何通过数据增强技术来提升性能。
度小满朱光:推理大模型在金融领域的应用将从外围场景深入到核心业务
文章概要:
1. 20香港金融科技周在香港亚洲国际博览馆,吸引了来自100多个经济体的3多名参会者。
2. 度小满CEO朱光周主论坛上,以o1推理大为代表的新一波生成式技术在金融领域的应用,将从外围场景深入到核心业务影响金融行业的核心决策质量,为客户产品上带来巨大突破的同时将会重塑金融科技行业。br3. 朱光认为,生成式AI要一个行业带来巨大变革有两个前提,一是必须让的客户体验发生巨大改变,二是必须对业务的核心产生br4. GPT-o1发布之前大模型在金融领域的应用主要是智能客服、文档助手、办公提效等
5. 今年9月份,OpenAI发布了GPT-o1大模型,“思考能力提升进行复杂逻辑推理和问题拆解。br>6. 在信贷领域,推理大模型可以通过客户的征信、银行流水,推理出来客户的还款能力,给出是否审核通过的风控建议。
. 关于推理大模型的风控决策质量,我们还在做更多的测试验证是已经掌握了风控知识并具备推理能力,让我们看到了大模型在决策应用上的巨大潜力br>8. 在量化投资领域,通过大模型挖掘高价值的因子,并优化投资算法。在保险领域,可以根据客户的情况,进行个性化的产品设计和承保的决策。模型在金融领域具有广泛的,金融行业应该迎接这波技术浪潮做好充分准备。
阅读原文
2. 度小满CEO朱光周主论坛上,以o1推理大为代表的新一波生成式技术在金融领域的应用,将从外围场景深入到核心业务影响金融行业的核心决策质量,为客户产品上带来巨大突破的同时将会重塑金融科技行业。br3. 朱光认为,生成式AI要一个行业带来巨大变革有两个前提,一是必须让的客户体验发生巨大改变,二是必须对业务的核心产生br4. GPT-o1发布之前大模型在金融领域的应用主要是智能客服、文档助手、办公提效等
5. 今年9月份,OpenAI发布了GPT-o1大模型,“思考能力提升进行复杂逻辑推理和问题拆解。br>6. 在信贷领域,推理大模型可以通过客户的征信、银行流水,推理出来客户的还款能力,给出是否审核通过的风控建议。
. 关于推理大模型的风控决策质量,我们还在做更多的测试验证是已经掌握了风控知识并具备推理能力,让我们看到了大模型在决策应用上的巨大潜力br>8. 在量化投资领域,通过大模型挖掘高价值的因子,并优化投资算法。在保险领域,可以根据客户的情况,进行个性化的产品设计和承保的决策。模型在金融领域具有广泛的,金融行业应该迎接这波技术浪潮做好充分准备。
CNCC2024|从科研到产业,产学研专家共议大模型前沿技术与落地实践
文章概要:
1. 10月24日,由中国计算机学会主办的2024中国计算机大会(CNCC2024)在东阳市横店开幕。
2. 大会首日,蚂蚁集团联合浙江大学、中国科学技术大学、中科院计算所、西安交通大学,中国人民大学等单位共同组织了“AI大模型的科技探索与应用交流活动”,多位专家和学者从产学研用多个角度,共同探讨大模型技术发展与应用落地的挑战和解决方案。
3. 中国科学技术大学讲席教授、博士生导师,认知智能全国重点实验室副主任陈恩红带来了“大模型驱动的科研范式变革与实践”的分享。
4. 浙江大学计算机学院教授、博导,浙江省数智科技研究会副会长,中文开放知识图谱OpenKG牵头发起人陈华钧带来的分享是“浅谈大模型的知识增强与知识治理”。
5. 中科院计算所副所长、智能算法安全重点实验室主任程学旗带来的分享是“数据基础设施与广谱关联分析”。
6. 西安交通大学电信学部计算机学院副教授,博士生导师师斌分享了“垂直领域的大模型推理增强”。
7. 中国人民大学准聘副教授,博士生导师李崇轩分享了“扩散模型前沿进展”。
8. 蚂蚁集团平台技术事业群资深算法专家陈景东分享了“蚂蚁多模态大模型进展与展望”。
9. 蚂蚁集团资深算法专家,医疗大模型负责人王剑分享了“支付宝医疗大模型技术与应用”。
阅读原文
2. 大会首日,蚂蚁集团联合浙江大学、中国科学技术大学、中科院计算所、西安交通大学,中国人民大学等单位共同组织了“AI大模型的科技探索与应用交流活动”,多位专家和学者从产学研用多个角度,共同探讨大模型技术发展与应用落地的挑战和解决方案。
3. 中国科学技术大学讲席教授、博士生导师,认知智能全国重点实验室副主任陈恩红带来了“大模型驱动的科研范式变革与实践”的分享。
4. 浙江大学计算机学院教授、博导,浙江省数智科技研究会副会长,中文开放知识图谱OpenKG牵头发起人陈华钧带来的分享是“浅谈大模型的知识增强与知识治理”。
5. 中科院计算所副所长、智能算法安全重点实验室主任程学旗带来的分享是“数据基础设施与广谱关联分析”。
6. 西安交通大学电信学部计算机学院副教授,博士生导师师斌分享了“垂直领域的大模型推理增强”。
7. 中国人民大学准聘副教授,博士生导师李崇轩分享了“扩散模型前沿进展”。
8. 蚂蚁集团平台技术事业群资深算法专家陈景东分享了“蚂蚁多模态大模型进展与展望”。
9. 蚂蚁集团资深算法专家,医疗大模型负责人王剑分享了“支付宝医疗大模型技术与应用”。
双第一!百度智能云领跑中国大模型市场
文章概要:
1 IDC发布报告显示,2024上半年百度智能云以24%的市场份额,中国aaS市场;以17.0%的营收占,中国AI大模型解决方案市场> 2 百度智能云的MaaS主要通过智能千帆大模型平台提供服务,企业模型生命周期工具链和环境
3. 百度智能云针对千帆大在应用开发、模型服务、模型开发等层面不断精进迭代
4 百度智能云拥有中国最广的模型产业规模已有超60%的央企正在使用百度智能云AI,同时在汽车、互联网、在线教育、金融、工业、交通等行业都加速融合落地
5.集团执行百度智能云事业群总裁抖表示,大模型和云计算的紧密结合,正在成为新型的基础设施
阅读原文
3. 百度智能云针对千帆大在应用开发、模型服务、模型开发等层面不断精进迭代
4 百度智能云拥有中国最广的模型产业规模已有超60%的央企正在使用百度智能云AI,同时在汽车、互联网、在线教育、金融、工业、交通等行业都加速融合落地
5.集团执行百度智能云事业群总裁抖表示,大模型和云计算的紧密结合,正在成为新型的基础设施
智库研究 | 新质服务业典型业态介绍:工业大模型
文章概要:
1. 长城战略咨询选取工业大模型、工业元宇宙、虚拟数字人、数据交易服务、AI for Science五大新质服务业典型业态进行重点剖析,本文介绍工业大模型。工业大模型指面向工业领域需求以预测和优化工业系统运行为目的建立的人工智能模型,广泛应用于研发、生产、管理的诸多场景和环节,可提升工业效率,降低运营成本,提高产品质量。
2. 2世纪90年代,国外工业大模型的发展历程,经历了从理论探索到技术突破,再到广泛应用的深刻变革。2018年以来随着数据资源和能力的持续增强,大规模预训练模型成为工业大模型发展的新趋势。当前,我国大模型技术正处于高速发展的黄金时期。现阶段,国内布局工业大模型的主体可分为四类:AI厂商、工业服务商、创新成长型企业、科研机构/科技巨头。
3. 工业大模型作为智能化升级的关键工具,企业至关重要,具备广阔应用场景。我国规上工业企业户数已达50万户,工业企业智能化转型的需求为工业大模型提供了广阔的应用市场。工业大模型应用场景贯穿工业企业全生命周期,可实现“跨场景”赋能。工业大模型的落地应用离不开算力基础设施的支撑。
阅读原文
2. 2世纪90年代,国外工业大模型的发展历程,经历了从理论探索到技术突破,再到广泛应用的深刻变革。2018年以来随着数据资源和能力的持续增强,大规模预训练模型成为工业大模型发展的新趋势。当前,我国大模型技术正处于高速发展的黄金时期。现阶段,国内布局工业大模型的主体可分为四类:AI厂商、工业服务商、创新成长型企业、科研机构/科技巨头。
3. 工业大模型作为智能化升级的关键工具,企业至关重要,具备广阔应用场景。我国规上工业企业户数已达50万户,工业企业智能化转型的需求为工业大模型提供了广阔的应用市场。工业大模型应用场景贯穿工业企业全生命周期,可实现“跨场景”赋能。工业大模型的落地应用离不开算力基础设施的支撑。
大模型上车,智能座舱穿越“无人区”
文章概要:
1. 大模型上车,推动智能座舱的深入发展。
2. 生态应用百花齐放,汽车从移动工具成为生活重要的第三空间。
3. 大模型席卷下的智能座舱开发,正在加速AI算力的消耗。
阅读原文
2. 生态应用百花齐放,汽车从移动工具成为生活重要的第三空间。
3. 大模型席卷下的智能座舱开发,正在加速AI算力的消耗。
对话语音合成大模型GPT-Talker: Generative Expressive CSS
文章概要:
1. 内蒙古大学刘瑞研究员、字节跳动青年科学家任意、香港中文大学(深圳)李海洲教授合作发表对话语音合成大模型工作GPT-Talker《Generative Expressive Conversational Speech Synthesis》。
2. 该工作基于GPT大模型架构和VITS合成器,对话语音合成大模型GPT-Talker,探索三阶段训练策略,构建自然对话语音数据集NCSSD。
3. 主观和客观评价表明,GPT-Talker在自然性和表现力方面明显优于其他最先进的CSS系统。
阅读原文
2. 该工作基于GPT大模型架构和VITS合成器,对话语音合成大模型GPT-Talker,探索三阶段训练策略,构建自然对话语音数据集NCSSD。
3. 主观和客观评价表明,GPT-Talker在自然性和表现力方面明显优于其他最先进的CSS系统。
【需求发布】人形机器人大模型开发
文章概要:
1. 需求简介:研发人形机器人软件系统技术、跨模态感知与人自然技术、人形机器人具身智能感控“大脑”机器人全身运动控制技术(“”)等方向。基于通用型算法,通过生成式AI,具备语义理解、人机交互、自主决策等能力,可适用于多个场景,如探索环境,复刻人类工作,自主操控物品等。br> 2 应用领域:机器人
3. 合作方式:合作> 4.:熊经理:15882882899
阅读原文
3. 合作方式:合作> 4.:熊经理:15882882899
活动回顾 | “模塑申城”大模型垂直应用示范开放场景复审系列活动:文化旅游、具身智能、科学智能、自动驾驶方向答辩会顺利举行
文章概要:
1. 近日,在多部门指导下,2024模型垂直应用示范开放场景复审:文化具身智能、科学智能、自动驾驶方向答辩会。<> 2. 本次评审会1个行业、个领域的模型垂直应用开发场景进行了复审,遴选和标杆场景,垂直大模型。
3 “模塑申城大示范开放场景复审系列活动,围绕“56”垂直领域重点布局场景陆续展开。
4. 该系列围绕“”垂直领域重点布局逐步,旨在带动各方优势资源围绕垂直大模型对接、融合发展
阅读原文
3 “模塑申城大示范开放场景复审系列活动,围绕“56”垂直领域重点布局场景陆续展开。
4. 该系列围绕“”垂直领域重点布局逐步,旨在带动各方优势资源围绕垂直大模型对接、融合发展
360在图文多模态大模型领域的突破与实践
文章概要:
1. 背景介绍:介绍大模型的发展背景和视觉能力在通用人工智能中的重要性。
2. 图文多模态大模型:介绍多模态大模型的研究路线和三代发展,包括原生多模态路线和单模态专家模型缝合路线。
3. 360多模态大模型探索:介绍360在多模态大模型方面的探索,包括SEEChat和360VL的模型结构和特点。
4. 360多模态大模型业务落地实践:介绍360多模态大模型在智能产品、视频安防巡检等方面的业务落地实践。
阅读原文
2. 图文多模态大模型:介绍多模态大模型的研究路线和三代发展,包括原生多模态路线和单模态专家模型缝合路线。
3. 360多模态大模型探索:介绍360在多模态大模型方面的探索,包括SEEChat和360VL的模型结构和特点。
4. 360多模态大模型业务落地实践:介绍360多模态大模型在智能产品、视频安防巡检等方面的业务落地实践。
企业级大模型服务标准首次研讨会即将召开!
文章概要:
1 以大模型为代表的人工智能发展,迈入规模应用,国务院国资委强调深入推进产业新,加快布局和发展人工智能产业
2. 中国信通院正式启动企业级AI系列标准编制工作,旨在推动企业级AI的标准化、规范化,减少企业开发和应用大模型,加速AI技术在各行各业的应用落地推动产业的数字化转型和智能化升级
3. 中国信通计划于10月31日(周四)下午14:0召开首次标准,对标准框架进行,诚邀专家拨冗出席
阅读原文
2. 中国信通院正式启动企业级AI系列标准编制工作,旨在推动企业级AI的标准化、规范化,减少企业开发和应用大模型,加速AI技术在各行各业的应用落地推动产业的数字化转型和智能化升级
3. 中国信通计划于10月31日(周四)下午14:0召开首次标准,对标准框架进行,诚邀专家拨冗出席
上周市场观察——大模型驱动产业升级,AI与云计算融合引领未来
文章概要:
1. 上周市场观察显示模型与云计算结合推动产业升级,百度智能云推出百舸AI异构计算平台4.0和千帆3.0平台,助力产业发展
2. 即时零售改变消费电子行业,华为、苹果等新品通过即时零售平台提升购买便捷性
3. 全球AI服务器市场广阔,预计到2032年市场规模将达1830亿美元
4. 中国工业机器人市场持续增长,2023年新安装量全球一半以上,预计到2027年将以每年5至0%的速度
5. 大模型行业竞争加剧,企业通过降价与技术创新提升竞争力
6智能云央企国企数字化转型,优化算力效率等方式帮助企业降本增效
7.以旧换新政策激发消费潜力,预计2024吸引更多参与
阅读原文
2. 即时零售改变消费电子行业,华为、苹果等新品通过即时零售平台提升购买便捷性
3. 全球AI服务器市场广阔,预计到2032年市场规模将达1830亿美元
4. 中国工业机器人市场持续增长,2023年新安装量全球一半以上,预计到2027年将以每年5至0%的速度
5. 大模型行业竞争加剧,企业通过降价与技术创新提升竞争力
6智能云央企国企数字化转型,优化算力效率等方式帮助企业降本增效
7.以旧换新政策激发消费潜力,预计2024吸引更多参与
电厂 | 搭档华为,科大讯飞让国产大模型落地生根
文章概要:
1. 1月24日,世界声博会暨2024讯飞全球1024开发者节上,讯飞星火4.0 Turbo如约而至
2 讯飞星火是国内第一个、也是唯一一个基于全国产算力底座训练出的大模型。
4. 科大讯飞华为、合肥市大数据资产运营有限公司三方联合超大规模智算“飞二号”,旨在走得更远不仅要算力规模从万卡向万P发展,还要在可控的底座与平台之上,进一步推进AI和普惠。
. 科大讯飞是今年1-9月份大模型市场中标数量、中标金额第一厂商。
6. 科大讯飞联手中国石油、中国移动、共建的大模型;携手中国海油、电信打造的“海”模型携手中国绿发打造的泰山大模型
7. 央国企客户数据显示,基于讯飞的SFT数据工具链,至少需要1-2个月时间来构建的50万条高质量数据,现在仅需两周完成。br> 8. 科大讯飞展示了与华为联合研发的声音修复技术。
9. 上述声音修复技术也已在搭载鸿蒙系统的移动终端,让过往“不被看见”的,能手握一把与人沟通的钥匙。
10. 科大讯飞与中国移动、中国电信等运营商也已深度合作,国产大发展加速。
11. 科大讯飞牵头成立AI基金,用5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为创业团队提供产业落地。
阅读原文
2 讯飞星火是国内第一个、也是唯一一个基于全国产算力底座训练出的大模型。
4. 科大讯飞华为、合肥市大数据资产运营有限公司三方联合超大规模智算“飞二号”,旨在走得更远不仅要算力规模从万卡向万P发展,还要在可控的底座与平台之上,进一步推进AI和普惠。
. 科大讯飞是今年1-9月份大模型市场中标数量、中标金额第一厂商。
6. 科大讯飞联手中国石油、中国移动、共建的大模型;携手中国海油、电信打造的“海”模型携手中国绿发打造的泰山大模型
7. 央国企客户数据显示,基于讯飞的SFT数据工具链,至少需要1-2个月时间来构建的50万条高质量数据,现在仅需两周完成。br> 8. 科大讯飞展示了与华为联合研发的声音修复技术。
9. 上述声音修复技术也已在搭载鸿蒙系统的移动终端,让过往“不被看见”的,能手握一把与人沟通的钥匙。
10. 科大讯飞与中国移动、中国电信等运营商也已深度合作,国产大发展加速。
11. 科大讯飞牵头成立AI基金,用5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为创业团队提供产业落地。
百度智能云千帆 AppBuilder 大模型应用开发解读
文章概要:
1. 百度智能云千帆AppBuilder旨在提供企业级大模型应用开发平台,帮助企业解决大模型应用落地过程中遇到的问题,如准确可靠性、与已有系统融合、AI人才稀缺、数据安全保障等。
2. 使用AppBuilder创建大模型应用很简单,通过五步就能创建一个应用,包括应用创建、模型选择、能力拓展、应用调试和预览、发布和集成。
3. 百度智能云千帆AppBuilder与其他平台的区别主要在五个方面,包括企业级RAG、Agent、集成、安全部署和应用落地方法论。
4. 文章介绍了几个案例,包括某直辖市的城投集团、污水宝、中卫慧通等,展示了百度智能云千帆AppBuilder的应用效果。
阅读原文
2. 使用AppBuilder创建大模型应用很简单,通过五步就能创建一个应用,包括应用创建、模型选择、能力拓展、应用调试和预览、发布和集成。
3. 百度智能云千帆AppBuilder与其他平台的区别主要在五个方面,包括企业级RAG、Agent、集成、安全部署和应用落地方法论。
4. 文章介绍了几个案例,包括某直辖市的城投集团、污水宝、中卫慧通等,展示了百度智能云千帆AppBuilder的应用效果。
大模型技术与机器人技术的应用融合“基于大模型的智慧零售平台”
文章概要:
1. 随着科技发展,推动各行业,大模型在智慧零售领域有显著优势能实现市场趋势准确预测、商品库存智能管理定制化购物。
2 “基于大模型的智慧零售”大模型与机器人在“智慧零售”应用需求为模拟无人零售店场景,分析消费者行为数据提供个性化商品销售。
3 该平台硬件、软件、实训场景、教学资源组成,具有大模型技术集成、智能硬件集成、交互式学习体验、双向教育价值、开拓展升级场景定制化能力更强、易于维护、主流编程语言支持、多种连接方式等特性。
4 产品参数包括智能机械臂模型智能套件、摄像头、模块、直线导轨工作台等。
5.基于大模型的智慧是自动化零售解决方案,可培养学生掌握多项,提高综合职业素养接近企业工作岗位需求。
6 该平台兼具教学及竞赛技能应用,与用户创造更多可能
7. 朝元成立于00年,致力于机器人与人工智能教育、科研以及商业领域的,涉及人形机器人等,已获得多项软件权和知识产权,为几百所高校提供产品及技术服务。
阅读原文
2 “基于大模型的智慧零售”大模型与机器人在“智慧零售”应用需求为模拟无人零售店场景,分析消费者行为数据提供个性化商品销售。
3 该平台硬件、软件、实训场景、教学资源组成,具有大模型技术集成、智能硬件集成、交互式学习体验、双向教育价值、开拓展升级场景定制化能力更强、易于维护、主流编程语言支持、多种连接方式等特性。
4 产品参数包括智能机械臂模型智能套件、摄像头、模块、直线导轨工作台等。
5.基于大模型的智慧是自动化零售解决方案,可培养学生掌握多项,提高综合职业素养接近企业工作岗位需求。
6 该平台兼具教学及竞赛技能应用,与用户创造更多可能
7. 朝元成立于00年,致力于机器人与人工智能教育、科研以及商业领域的,涉及人形机器人等,已获得多项软件权和知识产权,为几百所高校提供产品及技术服务。
CNCC2024:openKylin端侧大模型解决方案精彩亮相
文章概要:
1 第二十一届中国计算机大会(CNCC2024)在浙江省东镇圆明新园举行,主题为“发展新质生产力,计算引领,逾万名计算机行业翘楚参会,邀请到了17位国内院士,800余位国内外顶尖学者、企业技术精英带来特邀报告、大会38场专题论坛
2. openKylin社区秘书长余杰受邀参与大会端侧大模型”技术专项论坛,带来《openKylin for AIPC技术及实践主题分享
3.CF颁奖典礼于1月25日在横店圆明新园的夏法国馆隆重举行,由余杰openKylin社区秘书长)、、马俊(openKylin社区OS4AIPC SIG Maintainer)张晖、琢 ( openKylin社区OS4AIPC SIG Maintainer ) 、李峰Kin技术委员会委员) 等共同完成的面向国产操作系统的蒙古文智能信息处理技术研究及应用项目被授予CCF科技进步二等奖
4. openKylin(开放麒麟)社区旨在以“共创”为核心,在开源、自愿、平等、的上,通过、开放的方式与企业构建合作伙伴生态体系,共同打造开源操作系统顶级社区推动Linux开源技术及其软硬件生态繁荣发展
5. 社区理事成员单位包括麒麟软件、普华基础软件、中科方德、麒麟信安思铭软件、中兴新、心科技、中国电科2所、技德、北京麟卓、先进操作系统创新中心、飞腾、兆芯、芯、景美科技、达摩院、申泰信息海21家同仁和行业机构
阅读原文
2. openKylin社区秘书长余杰受邀参与大会端侧大模型”技术专项论坛,带来《openKylin for AIPC技术及实践主题分享
3.CF颁奖典礼于1月25日在横店圆明新园的夏法国馆隆重举行,由余杰openKylin社区秘书长)、、马俊(openKylin社区OS4AIPC SIG Maintainer)张晖、琢 ( openKylin社区OS4AIPC SIG Maintainer ) 、李峰Kin技术委员会委员) 等共同完成的面向国产操作系统的蒙古文智能信息处理技术研究及应用项目被授予CCF科技进步二等奖
4. openKylin(开放麒麟)社区旨在以“共创”为核心,在开源、自愿、平等、的上,通过、开放的方式与企业构建合作伙伴生态体系,共同打造开源操作系统顶级社区推动Linux开源技术及其软硬件生态繁荣发展
5. 社区理事成员单位包括麒麟软件、普华基础软件、中科方德、麒麟信安思铭软件、中兴新、心科技、中国电科2所、技德、北京麟卓、先进操作系统创新中心、飞腾、兆芯、芯、景美科技、达摩院、申泰信息海21家同仁和行业机构
度小满CEO朱光:推理大模型在金融领域的应用将从外围场景深入到核心业务
文章概要:
1. 10月28日,202年香港金融科技开幕,吸引了来自100多个经济体3万多名者
2 度小满CEO朱光在科技周主论坛上表示,以o1推理大模型为的一波式AI技术金融领域将从外围场景深入到核心业务,直接影响金融行业的核心决策质量。
3. 朱光认为,生成式AI技术要对一个行业带来巨大变革有两个,一是必须让核心的客户体验发生巨大改变二是必须对业务的核心产生影响。
4. GPT-o1发布之前,模型在金融领域的是智能客服、助手、内部办公提效等场景。
. 今年9月份,OpenAI发布了GPT-o1大模型,“思考能力”显著提升,能够进行复杂逻辑推理和问题拆解。
6. 朱光分享了度小满用推理大模型在风控场景上做的一些创新性探索。
7 朱光表示,大模型已经可以像专业审核员一样读征信报告、账单流水,甚至能解读网络大数据,思考和捕捉数据之间的关联,并生成判断的依据和结论。
8. 这种具备较强推理能力的慢思考”大模型一些厂商也都在布局和研发。
阅读原文
2 度小满CEO朱光在科技周主论坛上表示,以o1推理大模型为的一波式AI技术金融领域将从外围场景深入到核心业务,直接影响金融行业的核心决策质量。
3. 朱光认为,生成式AI技术要对一个行业带来巨大变革有两个,一是必须让核心的客户体验发生巨大改变二是必须对业务的核心产生影响。
4. GPT-o1发布之前,模型在金融领域的是智能客服、助手、内部办公提效等场景。
. 今年9月份,OpenAI发布了GPT-o1大模型,“思考能力”显著提升,能够进行复杂逻辑推理和问题拆解。
6. 朱光分享了度小满用推理大模型在风控场景上做的一些创新性探索。
7 朱光表示,大模型已经可以像专业审核员一样读征信报告、账单流水,甚至能解读网络大数据,思考和捕捉数据之间的关联,并生成判断的依据和结论。
8. 这种具备较强推理能力的慢思考”大模型一些厂商也都在布局和研发。
智库研究 | 新质服务业典型业态介绍:工业大模型
文章概要:
1. 长城战略咨询自1995年起开始编制并发布《企业研究报告》,对科技创新、产业升级、区域发展、政府治理、创新理念等多个领域进行深度分析和发展研判。
2. 文章基于企业研究报告总第6期《新质服务业的特征与典型业态》内容进行编辑,介绍了工业大模型、工业元宇宙、虚拟数字人、数据交易服务、AI for Science五大新质服务业典型业态。
3. 工业大模型指面向工业领域需求,以预测和优化工业系统运行为目的建立的人工智能模型,广泛应用于研发、生产、管理的诸多场景和环节,可提升工业效率,降低运营成本,提高产品质量。
4. 工业大模型具备多维度建模、高度集成与智能优化三个特征,使其成为推动工业智能化转型的重要引擎
5. 人工智能技术进步驱动工业大模型发展,2世纪90年代,国外工业大模型的发展历程,经历了从理论探索到技术突破,再到广泛应用的深刻变革。
6. 工业大模型开启工业企业广阔市场前景,工业大模型作为智能化升级的关键工具,对工业企业至关重要,具备广阔应用场景。
7. 工业大模型应用场景贯穿工业企业全生命周期,可实现“跨场景”赋能。
8. 工业大模型的落地应用离不开算力基础设施的支撑。
9. 文章介绍了华为盘古大模型和思谋科技IndustryGPT两个工业大模型典型案例。
阅读原文
2. 文章基于企业研究报告总第6期《新质服务业的特征与典型业态》内容进行编辑,介绍了工业大模型、工业元宇宙、虚拟数字人、数据交易服务、AI for Science五大新质服务业典型业态。
3. 工业大模型指面向工业领域需求,以预测和优化工业系统运行为目的建立的人工智能模型,广泛应用于研发、生产、管理的诸多场景和环节,可提升工业效率,降低运营成本,提高产品质量。
4. 工业大模型具备多维度建模、高度集成与智能优化三个特征,使其成为推动工业智能化转型的重要引擎
5. 人工智能技术进步驱动工业大模型发展,2世纪90年代,国外工业大模型的发展历程,经历了从理论探索到技术突破,再到广泛应用的深刻变革。
6. 工业大模型开启工业企业广阔市场前景,工业大模型作为智能化升级的关键工具,对工业企业至关重要,具备广阔应用场景。
7. 工业大模型应用场景贯穿工业企业全生命周期,可实现“跨场景”赋能。
8. 工业大模型的落地应用离不开算力基础设施的支撑。
9. 文章介绍了华为盘古大模型和思谋科技IndustryGPT两个工业大模型典型案例。
阅读原文
智库研究 | 新质服务业典型业态介绍:工业大模型
文章概要:
1. 长城战略咨询选取工业大模型、工业元宇宙、虚拟数字人、数据交易服务、AI for Science五大新质服务业典型业态进行重点剖析,本篇介绍工业大模型
2. 工业大模型指面向工业领域需求,以预测和优化工业系统运行为目的建立的人工智能模型,广泛应用于研发、生产、管理的诸多场景和环节,可提升工业效率,降低运营成本,提高产品质量
3. 人工智能技术的进步驱动了工业大模型的发展,高速发展的黄金时期,现阶段,国内布局工业大模型的主体可分为四类:AI厂商、工业技术服务商、创新成长型企业、科研/科技巨头
4. 工业大模型作为智能化升级的关键工具,对工业企业至关重要,具备广阔应用场景,其应用场景贯穿工业企业全生命周期,可实现“跨场景”赋能
5. 工业大模型的落地应用离不开算力基础设施的支撑,工业大模型的构建需要大量的工业数据和知识,参数量至少在数亿>6. 华为盘古大模型包括“5+N+X”三层架构,思谋科技开发了全球首个工业多模态大模型——IndustryGPT V1.0
7. 虽然我国的工业大模型发展已取得一定成效,但与国际顶尖水平相比,我国在制造业AI普及率、工业垂直领域落地、核心生产应用和数据完整性、连通性方面仍存在一定差距
阅读原文
2. 工业大模型指面向工业领域需求,以预测和优化工业系统运行为目的建立的人工智能模型,广泛应用于研发、生产、管理的诸多场景和环节,可提升工业效率,降低运营成本,提高产品质量
3. 人工智能技术的进步驱动了工业大模型的发展,高速发展的黄金时期,现阶段,国内布局工业大模型的主体可分为四类:AI厂商、工业技术服务商、创新成长型企业、科研/科技巨头
4. 工业大模型作为智能化升级的关键工具,对工业企业至关重要,具备广阔应用场景,其应用场景贯穿工业企业全生命周期,可实现“跨场景”赋能
5. 工业大模型的落地应用离不开算力基础设施的支撑,工业大模型的构建需要大量的工业数据和知识,参数量至少在数亿>6. 华为盘古大模型包括“5+N+X”三层架构,思谋科技开发了全球首个工业多模态大模型——IndustryGPT V1.0
7. 虽然我国的工业大模型发展已取得一定成效,但与国际顶尖水平相比,我国在制造业AI普及率、工业垂直领域落地、核心生产应用和数据完整性、连通性方面仍存在一定差距
度小满朱光:推理大模型在金融领域的应用将从外围场景深入到核心业务
文章概要:
1. 度小满朱光表示推理大模型金融领域的应用将从外围场景深入到核心业务
阅读原文
度小满朱光:推理大模型在金融领域的应用将从外围场景深入到核心业务
文章概要:
1. 202年香港金融科技周香港亚洲国际博览馆开幕的万多名。
2 度小满CEO朱光科技周主论坛上表示,o1推理大模型为代表的一波生成式AI技术在领域,将从外围场景深入到核心业务,影响金融行业的核心决策质量,在为客户的产品和服务上突破的同时,重塑金融科技行业
4.PT-o1发布之前大模型在金融领域应用是客服、文档助手、内部办公提效等场景
5. 今年9月份,AI发布了GPT-o1大模型,“思考能力”显著提升,进行复杂逻辑推理和问题拆解。br> 6. 朱光,大模型可以像专业审核员一样读征信报告、看账单流水,甚至能解读网络大数据,思考和捕捉数据之间的关联,并生成风险判断的依据和结论。
7. 据了解,这种具备较强推理能力的“慢思考”大模型,国内一些厂商也都在布局和研发
阅读原文
2 度小满CEO朱光科技周主论坛上表示,o1推理大模型为代表的一波生成式AI技术在领域,将从外围场景深入到核心业务,影响金融行业的核心决策质量,在为客户的产品和服务上突破的同时,重塑金融科技行业
4.PT-o1发布之前大模型在金融领域应用是客服、文档助手、内部办公提效等场景
5. 今年9月份,AI发布了GPT-o1大模型,“思考能力”显著提升,进行复杂逻辑推理和问题拆解。br> 6. 朱光,大模型可以像专业审核员一样读征信报告、看账单流水,甚至能解读网络大数据,思考和捕捉数据之间的关联,并生成风险判断的依据和结论。
7. 据了解,这种具备较强推理能力的“慢思考”大模型,国内一些厂商也都在布局和研发
从美新闻集团起诉Perplexity 看大模型应用中的刑事法律风险
文章概要:
1. 美新闻集团旗下的道琼斯和《纽约邮报》在联邦法院对人工智能初创公司Perplexity AI提起诉讼,指控其未经授权大量复制版权作品用于AI的“答案引擎”中,本文将探讨AI应用中可能涉及的刑事法律风险
2. AI数据收集的刑事风险
3. AI应用场景及相应刑事风险
4. 结语
阅读原文
2. AI数据收集的刑事风险
3. AI应用场景及相应刑事风险
4. 结语
从入局到求变,各银行AI大模型走到哪一步了?
文章概要:
1. 银行业已进入AI时代,AI大模型落地的“排头兵”。
2. 大行占据领先位置,如工行、邮储银行、建行、农行、中行、交行等在大模型研发和场景应用上不断深入。
3. 股份制银行也不甘落后,如兴业银行、民生银行等在场景应用不断开花。
4. 中小银行在AI技术的筹备和应用滞后,但也在“另辟蹊径”地行动起来。
5. AI大模型为银行业科技发展带来了无限可能,但实际应用效果有待提升。
阅读原文
2. 大行占据领先位置,如工行、邮储银行、建行、农行、中行、交行等在大模型研发和场景应用上不断深入。
3. 股份制银行也不甘落后,如兴业银行、民生银行等在场景应用不断开花。
4. 中小银行在AI技术的筹备和应用滞后,但也在“另辟蹊径”地行动起来。
5. AI大模型为银行业科技发展带来了无限可能,但实际应用效果有待提升。
从入局到求变:各银行AI大模型进展到哪一步了?
文章概要:
1. 银行业已然进入AIAI大模型技术改变着银行业的服务方式和用户体验。
2. 国有大行在AI大模型的运用上占据领先位置,在半年报中均提及了大模型的研发进展和场景落地应用的进阶br>3. 股份制银行在应用上不断开花,如兴业银行“随兴写”生成式大模型已经赋能反洗钱,民生银行将大模型赋能研发。
4. 银行业在大模型不断开拓的背后,是其源源不断金融科技领域的投入。
. AI大模型为银行业科技发展带来了无限可能,但实际应用效果存在差异。
中小银行在技术的筹备和应用上相对有所滞后,但越来越多的中小银行已经“另辟蹊”地行动。
阅读原文
2. 国有大行在AI大模型的运用上占据领先位置,在半年报中均提及了大模型的研发进展和场景落地应用的进阶br>3. 股份制银行在应用上不断开花,如兴业银行“随兴写”生成式大模型已经赋能反洗钱,民生银行将大模型赋能研发。
4. 银行业在大模型不断开拓的背后,是其源源不断金融科技领域的投入。
. AI大模型为银行业科技发展带来了无限可能,但实际应用效果存在差异。
中小银行在技术的筹备和应用上相对有所滞后,但越来越多的中小银行已经“另辟蹊”地行动。
行业交流 | AI大模型在金融领域如何落地?我院专家受邀作主题分享
文章概要:
1. 202年10月3日,苏州银行业协会的“苏州大讲堂之AI大模型金融场景探索及实现主题交流成功举办。
2 上海交通大学苏州人工智能研究院金融研究中心主任刘明进行分享,围绕“大模型金融领域技术发展与场景应用”和“用自然语言重塑银行报表”两个主题开展交流培训。
3 智谱AI华东区技术负责人仿围绕“大模型金融行业的应用”展开分享,介绍了领域的需求整理模型能力和以及大模型应用案例。
4. 上海钱拓网络运营官、AI解决方案专家沈卓珺分享了私有化大模型银行运营、对公业务、外规内化的场景”
5. 未来,上海大学苏州人工智能研究院智慧金融研究将助力银行业协会,苏州银行业数字化探索创新。
阅读原文
2 上海交通大学苏州人工智能研究院金融研究中心主任刘明进行分享,围绕“大模型金融领域技术发展与场景应用”和“用自然语言重塑银行报表”两个主题开展交流培训。
3 智谱AI华东区技术负责人仿围绕“大模型金融行业的应用”展开分享,介绍了领域的需求整理模型能力和以及大模型应用案例。
4. 上海钱拓网络运营官、AI解决方案专家沈卓珺分享了私有化大模型银行运营、对公业务、外规内化的场景”
5. 未来,上海大学苏州人工智能研究院智慧金融研究将助力银行业协会,苏州银行业数字化探索创新。
硅谷深思:GPT应用迟未爆发,大模型泡沫根源初探
文章概要:
1. 大模型行业泡沫正在显现,GPT应用在to C和to B侧都更像是超级APP,而非底层平台,限制其进行平台型商业化的根源是数据和算力的困局。
2. 目前领域投资人以及创业者主要分成应用场景派和底层技术派,前者投资标的是依靠对底座模型实现垂直行业大模型商业化的公司,后者更聚焦底座大模型,但目前都遇到了瓶颈。
3. 人工智能产业化的本质是第一次制造了对于数据和算力的充分应用和依赖,这也制造了极大的门槛和困局。
4. 数据困局是自称“AI驱动”的企业都必须拥有足够的私有数据,才有足够的护城河,但目前数据运用的主流方法无法推动更大涌现,算力困局是为打破英伟达显卡带来的高额算力成本投入的僵局,很多下游行业玩家推出“垂直行业小模型”或者“端侧小模型”,但在技术上很难真正有捷径可走。
5. 潜在破局方案包括借鉴互联网时代的思考,短期投资策略建议聚焦既非纯应用场景、也非纯底座模型的公司,而是“垂直整合应用”公司,长期可能演变包括新的后训练方法出现与持续优化、预训练及推理成本和门槛大大降低、彻底改变预训练+后训练的模式。
阅读原文
2. 目前领域投资人以及创业者主要分成应用场景派和底层技术派,前者投资标的是依靠对底座模型实现垂直行业大模型商业化的公司,后者更聚焦底座大模型,但目前都遇到了瓶颈。
3. 人工智能产业化的本质是第一次制造了对于数据和算力的充分应用和依赖,这也制造了极大的门槛和困局。
4. 数据困局是自称“AI驱动”的企业都必须拥有足够的私有数据,才有足够的护城河,但目前数据运用的主流方法无法推动更大涌现,算力困局是为打破英伟达显卡带来的高额算力成本投入的僵局,很多下游行业玩家推出“垂直行业小模型”或者“端侧小模型”,但在技术上很难真正有捷径可走。
5. 潜在破局方案包括借鉴互联网时代的思考,短期投资策略建议聚焦既非纯应用场景、也非纯底座模型的公司,而是“垂直整合应用”公司,长期可能演变包括新的后训练方法出现与持续优化、预训练及推理成本和门槛大大降低、彻底改变预训练+后训练的模式。
AI厂商再次打响大模型竞赛,智能自主是下一个重要应用方向
文章概要:
1. AI厂商再次打响大模型竞赛,自主是下一个重要应用方向。
2. OpenAI被曝12月Orion猎户座,AI性能提升百倍。
3. 谷歌计划12月发布Gemini 2.0。<> 4. Claude 3. Sonnet推出Computer Use功能,可以像人一样使用计算机br> 5. Claude发布了分析工具、可视化CSV文件中的数据br> 6. 智谱密集发布新功能:CogAgent/AutoGLM、GLM-4-Voice。
7. 荣耀AI操作系统发布,赵明表示:AI操作系统是荣耀独立以来最大布局。
8. 高通CEO预言:5年内AI智能手机普及全球,应用场景丰富。
9. 北京将面向全市大中小学推广AI学伴和AI导学应用。<> 10. 新华社批“AI污染”乱象。
阅读原文
2. OpenAI被曝12月Orion猎户座,AI性能提升百倍。
3. 谷歌计划12月发布Gemini 2.0。<> 4. Claude 3. Sonnet推出Computer Use功能,可以像人一样使用计算机br> 5. Claude发布了分析工具、可视化CSV文件中的数据br> 6. 智谱密集发布新功能:CogAgent/AutoGLM、GLM-4-Voice。
7. 荣耀AI操作系统发布,赵明表示:AI操作系统是荣耀独立以来最大布局。
8. 高通CEO预言:5年内AI智能手机普及全球,应用场景丰富。
9. 北京将面向全市大中小学推广AI学伴和AI导学应用。<> 10. 新华社批“AI污染”乱象。
大模型专题:百度大模型原生安全构建之路
文章概要:
1. 今天分享的是大模型大模型原生安全构建之路。
2. 该报告由景辉在全球人工智能开发与应用大会上的演讲内容整理而成。
数据清洗要标准,隐私信息;安全围栏有对抗性防御架构,包括输出过滤、多轮、必答知识库和模型防火墙;安全采用有监督调等方法;持续评估要全面检测风险。
7.,要关注智能体安全,包括场景安全、Prompt、AG投毒等问题,明确应用与基础模型责任边界,构建纵深防御架构,遵循安全原则,如禁止角色扮演等。通过安全与外层防护配合,实现模型安全。
阅读原文
2. 该报告由景辉在全球人工智能开发与应用大会上的演讲内容整理而成。
数据清洗要标准,隐私信息;安全围栏有对抗性防御架构,包括输出过滤、多轮、必答知识库和模型防火墙;安全采用有监督调等方法;持续评估要全面检测风险。
7.,要关注智能体安全,包括场景安全、Prompt、AG投毒等问题,明确应用与基础模型责任边界,构建纵深防御架构,遵循安全原则,如禁止角色扮演等。通过安全与外层防护配合,实现模型安全。
智能新纪元:大模型的现状、挑战与未来展望
文章概要:
1. 大模型已成为全球科技竞争的新焦点,本文将带你一探大模型的神秘面纱,它如何成为推动各行各业变革的力量。
. 大模型的现状:大模型是参数超级多的深度学习模型,能够处理海量的数据,进行复杂的,已经成为全球科技竞争的新高地,在学界和界都有广泛的应用。
3.模型的问题:模型有时会犯事实性错误,数学和逻辑推理能力需要加强,形式语义理解能力提升可解释和调试较弱。
4 大模型的未来趋势:AI云侧与端侧大模型满足不同需求,大模型趋于通用化专用大模型将广泛开源,AI高性能芯片不断升级。
阅读原文
. 大模型的现状:大模型是参数超级多的深度学习模型,能够处理海量的数据,进行复杂的,已经成为全球科技竞争的新高地,在学界和界都有广泛的应用。
3.模型的问题:模型有时会犯事实性错误,数学和逻辑推理能力需要加强,形式语义理解能力提升可解释和调试较弱。
4 大模型的未来趋势:AI云侧与端侧大模型满足不同需求,大模型趋于通用化专用大模型将广泛开源,AI高性能芯片不断升级。
银行业AI大模型,从入局到求变
文章概要:
1. 银行业成为AI大模型率先探索的重要行业,国有大行在大模型的研发和场景应用上处于领先位置如工商银行、、农业银行等。
2. 股份制银行也在不断探索大模型在金融领域的应用,如兴业银行的“随兴写”生成式大模型赋能反洗钱,民生银行将大模型研发。
3. 银行业在大模型的开拓,离不开其对金融科技领域的投入,202年国有六大行的金融科技投入总了128.2亿元。<>4 AI大模型在银行业的应用效果存在差异,中小银行在AI技术的筹备和应用上相对滞后,但也在通过招标等方式积极探索。
阅读原文
2. 股份制银行也在不断探索大模型在金融领域的应用,如兴业银行的“随兴写”生成式大模型赋能反洗钱,民生银行将大模型研发。
3. 银行业在大模型的开拓,离不开其对金融科技领域的投入,202年国有六大行的金融科技投入总了128.2亿元。<>4 AI大模型在银行业的应用效果存在差异,中小银行在AI技术的筹备和应用上相对滞后,但也在通过招标等方式积极探索。
传播大模型,打造媒体内容创作新引擎
文章概要:
1. 媒体大模型的研发需考虑以下几个:为基层用户提供简洁直观的操作界面和多场景的一键生成功能,降低操作难度,提高工作效率;为专业用户提供高级写作工具和深度挖掘功能,同时支持多轮交互,允许他们提出进一步的问题或要求,以便生成更加精细和个性化的报道;为媒体机构内部各岗位人员提供量身定制的功能支持,如内容素材库、多平台风格内容生成、内容审校工具以及视觉元素匹配和AI设计工具等,确保每位用户都能获得最符合其工作需求的功能支持;强化内容的透明度与可控性,为所有用户提供智能编辑器,支持他们对生成的内容进行溯源查证以及编辑调整,以确保最终结果可信且符合预期。
2. 为了满足不同层级用户的需求,我们需要构建一个既强大又灵活的媒体大模型。该模型不仅能够基础级别的任务,如快速生成文章概要、智能改写润色等,还能解决复杂问题,如创建具有深度分析、独特视角和高度原创性的文章,以及跨模态的内容生成与编辑。模型支持根据不同的用户角色和场景,提供定制化的多媒体内容生成方案。
3. “大模型应用超市”构建的核心是打造AI创新应用,传播大脑科技公司基于对市场需求的充分调研和分析,结合最新的人工智能技术和行业经验,创新孵化推出多项具有标杆意义的工具,助力提升媒体工作的效率和质量。
4. 媒体大模型的应用并非单纯的技术堆砌,而是需要深入理解业务需求,将复杂的技术转化为实用、易用的应用工具。要实现媒体大模型的应用落地,关键在于破解“最后一公里”的难题,即将媒体众多复杂的多任务需求翻译串联或并联的单任务简单指令,并将这些指令无缝融入业务功能中,以场景化的大模型指令集能力来提升工作效率。
阅读原文
2. 为了满足不同层级用户的需求,我们需要构建一个既强大又灵活的媒体大模型。该模型不仅能够基础级别的任务,如快速生成文章概要、智能改写润色等,还能解决复杂问题,如创建具有深度分析、独特视角和高度原创性的文章,以及跨模态的内容生成与编辑。模型支持根据不同的用户角色和场景,提供定制化的多媒体内容生成方案。
3. “大模型应用超市”构建的核心是打造AI创新应用,传播大脑科技公司基于对市场需求的充分调研和分析,结合最新的人工智能技术和行业经验,创新孵化推出多项具有标杆意义的工具,助力提升媒体工作的效率和质量。
4. 媒体大模型的应用并非单纯的技术堆砌,而是需要深入理解业务需求,将复杂的技术转化为实用、易用的应用工具。要实现媒体大模型的应用落地,关键在于破解“最后一公里”的难题,即将媒体众多复杂的多任务需求翻译串联或并联的单任务简单指令,并将这些指令无缝融入业务功能中,以场景化的大模型指令集能力来提升工作效率。
传播大模型,打造媒体内容创作新引擎
文章概要:
1. 2023年,以大模型、AIGC为代表的通用人工智能技术,在全球范围内掀起了一股波澜壮阔的技术浪潮。
2. 媒体作为内容生产和传播的重要阵地,其用户群体广泛,需求也呈现出复杂多样的特征。
3. 为了满足不同层级用户的需求,我们需要构建一个既强大又灵活的媒体大模型。
4. 传播大脑科技公司基于对市场需求的充分调研和分析,结合最新的人工智能技术和行业经验,创新孵化推出多项具有意义的AI工具,助力提升媒体工作的效率和质量。
5. 媒体大模型的应用并非单纯的技术堆砌,而是需要深入理解业务需求,将复杂的技术转化为实用、易用的应用工具。
阅读原文
2. 媒体作为内容生产和传播的重要阵地,其用户群体广泛,需求也呈现出复杂多样的特征。
3. 为了满足不同层级用户的需求,我们需要构建一个既强大又灵活的媒体大模型。
4. 传播大脑科技公司基于对市场需求的充分调研和分析,结合最新的人工智能技术和行业经验,创新孵化推出多项具有意义的AI工具,助力提升媒体工作的效率和质量。
5. 媒体大模型的应用并非单纯的技术堆砌,而是需要深入理解业务需求,将复杂的技术转化为实用、易用的应用工具。
时序大模型突破十亿参数!新混合专家架构,普林斯顿格里菲斯等机构出品
文章概要:
1. 来自全球多只华人研究团队提出了一种基于混合专家架构(Mixture of Experts, MoE)的时间基础模型——Time-MoE。
2. 该模型首次将时间序列预训练大模型的参数规模推向十亿级别,通过MoE架构的独特优势,将模型参数成功扩展2亿,不仅显著提升了预测精度,还在降低计算成本的同时了众多现有模型,全面达到了SOTAState of the Art)水平。br>3. 团队精心整理了训练Time-3B,这是目前时序最大的公开数据集,为各类时序任务提供了通用解决方案。
阅读原文
2. 该模型首次将时间序列预训练大模型的参数规模推向十亿级别,通过MoE架构的独特优势,将模型参数成功扩展2亿,不仅显著提升了预测精度,还在降低计算成本的同时了众多现有模型,全面达到了SOTAState of the Art)水平。br>3. 团队精心整理了训练Time-3B,这是目前时序最大的公开数据集,为各类时序任务提供了通用解决方案。
一块显卡理解一部完整电影!智源联合多所高校推出小时级的超长视频理解大模型Video-XL
文章概要:
1. 智源联合多所高校推出小时级的超长视频理解大模型Video-XL,该模型借助语言模型的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力理解上展现了出色的泛化能力。
2. Video-XL在效率与性能之间实现了良好的平衡,仅需一块80G显存的显卡即可处理2048帧输入,并在视频“海中捞针”任务中取得了接近95%的准确率。
3. Video-XL有望检测、广告植入检测等应用场景中展现出广泛的应用价值,成为得力的长视频理解助手。
阅读原文
2. Video-XL在效率与性能之间实现了良好的平衡,仅需一块80G显存的显卡即可处理2048帧输入,并在视频“海中捞针”任务中取得了接近95%的准确率。
3. Video-XL有望检测、广告植入检测等应用场景中展现出广泛的应用价值,成为得力的长视频理解助手。
AI大模型(LLMs)五大热点研究方向分享!
文章概要:
1. 图灵学术是创业黑马旗下的独立事业部,为计算机/人工智能领域的学生提供论文保录辅导、RA实习、名校申博服务。
2. 文章梳理了AI顶会上的五大热门研究方向,包括检索增强生成RAG)、大模型Agent、Mamba、高效微调(LoRA)和混合模型(MoE)。
3. 图灵学术的科研学者将亲自带学生做科研,提供选题、idea、实验、写作投稿等环节的指导成功发表。
阅读原文
2. 文章梳理了AI顶会上的五大热门研究方向,包括检索增强生成RAG)、大模型Agent、Mamba、高效微调(LoRA)和混合模型(MoE)。
3. 图灵学术的科研学者将亲自带学生做科研,提供选题、idea、实验、写作投稿等环节的指导成功发表。
国内AI百团大战还打么?大模型要上房还是要“凉凉”?丨正经深度
文章概要:
1. 国内AI大模型的发展现状,包括投入产出、商业化和技术等方面的问题,以及行业内对其未来发展的不同观点。
2. 国内外AI大模型的现况全景,包括业态速写、场景拓展和政策支持等方面的内容。
3. AI大模型面临的挑战,包括技术瓶颈与创新、商业化与盈利模式和数据安全与隐私等方面的问题。
4. 国内外AI大模型业态解析,包括技术、投入与研发和未来发展趋势等方面的内容。
阅读原文
2. 国内外AI大模型的现况全景,包括业态速写、场景拓展和政策支持等方面的内容。
3. AI大模型面临的挑战,包括技术瓶颈与创新、商业化与盈利模式和数据安全与隐私等方面的问题。
4. 国内外AI大模型业态解析,包括技术、投入与研发和未来发展趋势等方面的内容。
端到端语音大模型,大模型、语音转文本、tts三合一
文章概要:
1. 介绍了智谱技术团队发布的M-4-Voice端到端语音大模型的功能、技术架构和开源使用情况。
2. 模型功能包括情感表达和情感、调节语速、随时打断、多语言和多方言支持。
3. 模型架构包括GLM-4-Voice-Tokenizer、GLMoice-9B和GLM-4-Voice-Decoder。
4. 技术细节包括端到建模和预训练任务。
5. 开源使用包括下载和安装、启动Web Demo。
6. 提供了智谱开源项目的链接和详细信息。
阅读原文
2. 模型功能包括情感表达和情感、调节语速、随时打断、多语言和多方言支持。
3. 模型架构包括GLM-4-Voice-Tokenizer、GLMoice-9B和GLM-4-Voice-Decoder。
4. 技术细节包括端到建模和预训练任务。
5. 开源使用包括下载和安装、启动Web Demo。
6. 提供了智谱开源项目的链接和详细信息。
AI大模型与智算中心:构建未来智能社会的基石
文章概要:
1. AI大模型在自然语言处理、图像处理、音频处理等多个领域展现出巨大的应用潜力,提高了生产效率,推动了新兴应用的不断涌现。
2. AI大模型是通过深度学习算法和人工神经网络训练出的具有庞大规模参数的人工智能模型。
3. 智算中心是集成了高性能计算资源与优化管理的综合计算平台,其核心功能包括数据存储、模型训练、实时推理。
4. 中国移动京津冀(天津)西青数据中心是按照中国移动最高标准建设的天津地区最大规模的数据中心,承载能力超1.4万架。
5. 中国移动智算中心(青岛)是中国移动在建设的11个区域节点之一,首期投资超5.5亿元,智能算力规模达825PFlops。
6. 毫末智行的MANA OASIS智算中心目前中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。
7. AI大模型与智算中心的协同发展将会迎来几个重要趋势:多模态模型的兴起、边缘计算的应用、模型压缩与加速技术。
阅读原文
2. AI大模型是通过深度学习算法和人工神经网络训练出的具有庞大规模参数的人工智能模型。
3. 智算中心是集成了高性能计算资源与优化管理的综合计算平台,其核心功能包括数据存储、模型训练、实时推理。
4. 中国移动京津冀(天津)西青数据中心是按照中国移动最高标准建设的天津地区最大规模的数据中心,承载能力超1.4万架。
5. 中国移动智算中心(青岛)是中国移动在建设的11个区域节点之一,首期投资超5.5亿元,智能算力规模达825PFlops。
6. 毫末智行的MANA OASIS智算中心目前中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。
7. AI大模型与智算中心的协同发展将会迎来几个重要趋势:多模态模型的兴起、边缘计算的应用、模型压缩与加速技术。
投资人逃离大模型
文章概要:
1. 文章介绍了AI大模型的发展历程,从20世纪50年代开始,已经先后四次引起大规模的关注,如今正处在第四次的大模型时代。
2. 文章指出,ChatGPT的出现带起了一股技术热潮,全国各大科技公司开始纷纷投入资源和人力,开发自己的大模型产品,并在不同的场合进行展示和推广,百模也就揭开帷幕。
3. 文章提到,在这场百模大战中,AI产品更新迭代涌入快车道,大厂在持续加码,新玩家也在持续入局。
4. 文章还提到,目前百模大战朝新方向转变,此前拼技术的玩家们必须直面落地商业化的难题。
5. 文章最后指出,百模大战进入新局势,放眼如今的竞争者们,谁又将成为赢家,独领风骚呢?
阅读原文
2. 文章指出,ChatGPT的出现带起了一股技术热潮,全国各大科技公司开始纷纷投入资源和人力,开发自己的大模型产品,并在不同的场合进行展示和推广,百模也就揭开帷幕。
3. 文章提到,在这场百模大战中,AI产品更新迭代涌入快车道,大厂在持续加码,新玩家也在持续入局。
4. 文章还提到,目前百模大战朝新方向转变,此前拼技术的玩家们必须直面落地商业化的难题。
5. 文章最后指出,百模大战进入新局势,放眼如今的竞争者们,谁又将成为赢家,独领风骚呢?
一顶“帽子”带来近250万元收入,国产AI+3D已经到next level了!
文章概要:
1. 一顶“帽子”带来近250万元收入,国产AI+3已经到 level了!
2小众的赛道能靠AI捞到金
3 AI加持,3D模型进入<> 4 先Midjourney生成图像、再将其转为3D模型依旧是最好的选择。<> 5. Tripo图像转3D。
6. 细节优化。
7 喜欢的话一定记得点赞关注一波,我会更有动力分享新的内容~
阅读原文
2小众的赛道能靠AI捞到金
3 AI加持,3D模型进入<> 4 先Midjourney生成图像、再将其转为3D模型依旧是最好的选择。<> 5. Tripo图像转3D。
6. 细节优化。
7 喜欢的话一定记得点赞关注一波,我会更有动力分享新的内容~
【产业信息速递】算力即服务,首个基于RISC-V算力的行业大模型生态系统问世
文章概要:
1. 我国始终将“数字化”“智能化”摆在关键位置,强调加快数字经济发展。2022年OpenAI发布的ChatGPT引领了从判别式小模型转向生成式大模型的发展热潮。广州希姆半导体科技有限公司是一家致力于研发AI领域专用架构处理器的公司,旨在基于RISC-V本身强大的自主可控标准化优势通过软硬一体的大模型解决方案为政企客户的数智化转型赋能。2. 希姆计算设计开发了希姆九州大模型、希姆玄数数据治理平台以及希姆擎天智能体开发平台,三者相辅相成,共同构建了一个高效的数据处理生态系统,覆盖了大模型应用开发的完整生命周期,不仅解决了单一技术手段难以应对复杂业务场景的问题,而且极大地促进了从数据到价值转化的过程。3. 希姆计算基于擎天、九州、玄数平台,为广州市黄埔区开发了智能政务问答助手,利用政务图谱能够从海量的政务公共数据中提炼关键信息,在落地中涵盖了37个政府部门的2000余项事项以及数千份政策文件和指南。4. 希姆计算从公司成立伊始就坚持软硬一体自主可控的发展方向,支撑、玄数、擎天的底层核心全链路自主研发,基于自研AI计算矩阵扩展指令集设计了STCP920芯片、推理以及配套软件,为智算中心量身定制了希姆智算云平台,提供了落地大模型应用的RISC-V创新方案,是RISC-V软硬一体技术创新的代表性企业。5. 希姆计算在时就瞄准了基于RISC-V研发AI领域专用架构处理器的切入点,突破了SIMD向量指令、GEMM通用矩阵计算以及深度学习模型中的算子计算加速等技术难关,自主研发并在全球开源了AI计算矩阵扩展指令集,完成了基于RISC-V指令集的标量、向量、张量的一体化指令集架构,也形成了自身的核心竞争力。6. 希姆计算以算力即服务为交付理念,通过成熟的软件生态,简化模型部署的链路,降低客户开发AI应用的复杂度,对信创/非信创的软硬件生态均有良好的适配和支持,帮助客户打通从模型开发到部署的最后一公里,方便一键式发布、部署模型服务。7. 希姆智算云平台是希姆计算面向智算中心研发的专业算力平台,旨在有机调动智算集群中的计算、网络、存储资源,形成云上随用随取的AI算力,应对当前AI算力中心建设中标准不一、技术深度不足、交付周期冗长等一系列挑战。8. 目前,希姆计算已经在全国各地成功落地了多个智算中心项目,支撑了各种 AI 应用,包括AIGC、问答助手、内容创作、缺陷检测、安全施工、烟火报警、交通研判、医疗诊断、内容审核、语音识别等,全面覆盖了互联网、智慧办公、智慧城市、智慧工业、智慧金融、智慧医疗等热门领域。9. 希姆计算, AIGC时代软硬一体解决方案的领导者。
阅读原文
【NLP】一篇大模型数据合成和增强技术最新综述
文章概要:
1. 合成数据已成为解决大型语言模型(LLMs)高质量数据增长速度落后于训练数据集扩张的有希望的解决方案。
2. 文章全面回顾并总结了LLMs整个生命周期中的数据生成技术,包括数据准备、预训练、、指令调、偏好对齐和应用。
3. 文章介绍了数据生成方法的分类,包括数据增强和合成,并将其发展和演变进行了总结。
4. 文章讨论了在LLMs的数据准备阶段,数据合成和增强如何帮助生成多样化和高质量的数据集,以应对真实世界数据稀缺的挑战。
5. 文章探讨了在LLMs的预训练阶段,数据合成和增强如何提供丰富、多样化且可控制的训练数据,以提升模型性能并减少偏见。
6. 文章讨论了在LLMs的微调阶段,数据合成和增强如何通过生成的数据对LLMs进行微调,以提升模型在特定任务上的表现。
7. 文章探讨了在LLMs的指令调优阶段,数据合成和增强如何帮助生成高质量的指令遵循数据。
8. 文章讨论了如何通过数据合成和增强技术来优化LLMs以符合复杂的人类偏好。
9. 文章探讨了LLMs在特定应用领域中如何通过合成和增强技术来提升性能。
阅读原文
2. 文章全面回顾并总结了LLMs整个生命周期中的数据生成技术,包括数据准备、预训练、、指令调、偏好对齐和应用。
3. 文章介绍了数据生成方法的分类,包括数据增强和合成,并将其发展和演变进行了总结。
4. 文章讨论了在LLMs的数据准备阶段,数据合成和增强如何帮助生成多样化和高质量的数据集,以应对真实世界数据稀缺的挑战。
5. 文章探讨了在LLMs的预训练阶段,数据合成和增强如何提供丰富、多样化且可控制的训练数据,以提升模型性能并减少偏见。
6. 文章讨论了在LLMs的微调阶段,数据合成和增强如何通过生成的数据对LLMs进行微调,以提升模型在特定任务上的表现。
7. 文章探讨了在LLMs的指令调优阶段,数据合成和增强如何帮助生成高质量的指令遵循数据。
8. 文章讨论了如何通过数据合成和增强技术来优化LLMs以符合复杂的人类偏好。
9. 文章探讨了LLMs在特定应用领域中如何通过合成和增强技术来提升性能。
大模型开源还是闭源?表面上是发展路线之争,实则是……
文章概要:
1. 大模型开源还是闭源?表面是发展路线之争,实则是利益之争。
2. 开源派多论生态建设价值,闭源派则多讲性能领先优势。
3. 开源与闭源既是技术策略,更是商业策略。
4. 开源与闭源模式之争表面上是技术路线差异,实则是在大模型应用加速落地的背景下,企业为争夺市场占有率的商业策略之争。
5. 短期来看,开源与闭源共存并相互竞争有利于国产大模型行业逐步壮大。
6. 长期来看,模型或将走向开源。
阅读原文
2. 开源派多论生态建设价值,闭源派则多讲性能领先优势。
3. 开源与闭源既是技术策略,更是商业策略。
4. 开源与闭源模式之争表面上是技术路线差异,实则是在大模型应用加速落地的背景下,企业为争夺市场占有率的商业策略之争。
5. 短期来看,开源与闭源共存并相互竞争有利于国产大模型行业逐步壮大。
6. 长期来看,模型或将走向开源。
关于大模型能力问题与质量问题的感受
文章概要:
1. 大能力圈,要离它远一点才能形成完整认识
2. 大模型能根据输入给出包括文字图片、视频等多种格式的,还能做推理和行程规划,但知识截止到训练那天,可能会胡说八道
. 对完全外行的人来说,大模型就是能力强大但偶尔风的
4.人员容易从技术角度看待问题钻牛角尖,应从大模型的能力去认识它
5. 大模型的质量问题很重要,国外很多模型比国内好,原因是国内技术不达标
6. 做大模型应用的企业要选好底层模型,应用开发者要认识到大模型的圈并找质量更好的模型,也可以学习研究底层
7. 专家学者的任务是扩展大模型的圈并提升其能力
阅读原文
2. 大模型能根据输入给出包括文字图片、视频等多种格式的,还能做推理和行程规划,但知识截止到训练那天,可能会胡说八道
. 对完全外行的人来说,大模型就是能力强大但偶尔风的
4.人员容易从技术角度看待问题钻牛角尖,应从大模型的能力去认识它
5. 大模型的质量问题很重要,国外很多模型比国内好,原因是国内技术不达标
6. 做大模型应用的企业要选好底层模型,应用开发者要认识到大模型的圈并找质量更好的模型,也可以学习研究底层
7. 专家学者的任务是扩展大模型的圈并提升其能力
经典回顾|赛迪科创“独角兽“观察:AI大模型领域独角兽企业——月之暗面
文章概要:
1. AI大模型发展现状:20年11月ChatGPT后,全球掀起了人工智能浪潮,国内产学研多方发力追赶突破,目前已形成“百模大战的竞争态势。
2. AI模型领域独角兽企业:月之面成立于20233月专注于人工智能领域,大模型技术的与应用,202年10推出全球首个支持输入0万汉字的智能助手产品K,02年3月18日,月之暗面Kimi助手在长上下文窗口技术上再次取得突破,上下文长度提升了一个数量级到200万字。
赛迪研判:全球大模型领域的竞争已进入白热化阶段,模型在发展中对于算力、数据的需求将不断,伴随大模型升级迭代,应用落地有望全面铺开。月之暗面作为一家新兴的AI大模型企业,其在文本技术的优势和的产品策略迅速崭露头角,但面临来自行业巨头的和自身的商业化挑战。
阅读原文
2. AI模型领域独角兽企业:月之面成立于20233月专注于人工智能领域,大模型技术的与应用,202年10推出全球首个支持输入0万汉字的智能助手产品K,02年3月18日,月之暗面Kimi助手在长上下文窗口技术上再次取得突破,上下文长度提升了一个数量级到200万字。
赛迪研判:全球大模型领域的竞争已进入白热化阶段,模型在发展中对于算力、数据的需求将不断,伴随大模型升级迭代,应用落地有望全面铺开。月之暗面作为一家新兴的AI大模型企业,其在文本技术的优势和的产品策略迅速崭露头角,但面临来自行业巨头的和自身的商业化挑战。
【重点】2024大模型落地路线图报告|附下载
文章概要:
1. 近年来,大模型技术能力不断创出新高,产业应用持续走深向实,加快人工智能通用化实用化、普惠化发展进程。
2. 本报告重点梳理了大模型应用落地遵循的诊断、建设、、管理四个重要阶段,归纳总结出能力分析、需求挖掘、方案设计、研发测试、应用开发、效能评估、运维监测、运营管理八个关键步骤。<> 3.诊断阶段,通过分析大模型技术能力、梳理大模型应用场景、评估大模型发展基础,帮助应用方明晰业务发展和转型需求。
4. 能力建设阶段,设计契合应用方战略规划业务需求的大模型建设方案,通过系统性研发和测试手段筑牢大模型技术底座。
5. 应用部署阶段,给出专用大模型部署和智能应用定制开发等模式,并构建出覆盖大模型设计开发、定制优化、运营全生命周期的效能体系。> 运营管理,大模型和服务给出运维监测和运营管理的参考模式,给出实时监测、动态和机制等具体方法,建立健全大模型运营管理体系的原则和要点。
7. 未来,大模型有望持续为新一轮人工智能阶跃式发展注入强大动能,助力人工智能实现技术能力不断融合创新、应用场景持续纵深拓展、产业生态加速转型升级、治理体系趋于完善稳健。
阅读原文
2. 本报告重点梳理了大模型应用落地遵循的诊断、建设、、管理四个重要阶段,归纳总结出能力分析、需求挖掘、方案设计、研发测试、应用开发、效能评估、运维监测、运营管理八个关键步骤。<> 3.诊断阶段,通过分析大模型技术能力、梳理大模型应用场景、评估大模型发展基础,帮助应用方明晰业务发展和转型需求。
4. 能力建设阶段,设计契合应用方战略规划业务需求的大模型建设方案,通过系统性研发和测试手段筑牢大模型技术底座。
5. 应用部署阶段,给出专用大模型部署和智能应用定制开发等模式,并构建出覆盖大模型设计开发、定制优化、运营全生命周期的效能体系。> 运营管理,大模型和服务给出运维监测和运营管理的参考模式,给出实时监测、动态和机制等具体方法,建立健全大模型运营管理体系的原则和要点。
7. 未来,大模型有望持续为新一轮人工智能阶跃式发展注入强大动能,助力人工智能实现技术能力不断融合创新、应用场景持续纵深拓展、产业生态加速转型升级、治理体系趋于完善稳健。
传播大模型,打造媒体内容创作新引擎
文章概要:
1. 2023年,以大模型、AIGC为代表的通用人工智能技术在全球范围内掀起技术浪潮,被各界人士赋予不同意义,共同指向这场变革将对人类活动产生深远且广泛的影响。
2. 人工智能战略性技术,成为推动新一轮科技革命和产业变革的核心力量,被广泛认为是推动新质生产力形成的重要引擎。
3. 媒体大模型要想发挥最大的效能,就必须深入洞察不同层级用户的需求差异,并据此提供精准的服务,才能有效应对这一多元化的用户需求格局。
4. 为了满足不同层级用户的需求,我们需要构建一个既强大又灵活的媒体大模型。该模型不仅能够处理基础级别的,还能解决复杂问题,如创建具有深度分析、独特视角和高度原创性的文章以及跨模态的内容生成与编辑。
5. 传播大脑科技公司基于对市场需求的充分调研和分析,结合最新的人工智能技术和行业经验,创新孵化推出多项具有标杆意义的AI工具,助力提升媒体工作的效率和质量。
6. 媒体大模型的应用并非单纯的技术堆砌,而是需要深入理解业务需求,将复杂的技术转化为实用、易用的应用工具。要实现媒体大模型的应用落地,关键在于破解“最后一公里”的难题,即将媒体众多复杂的多任务需求串联或并联的单任务简单指令,并将这些指令无缝融入业务中,以场景化的大模型指令集能力来提升工作效率。
阅读原文
2. 人工智能战略性技术,成为推动新一轮科技革命和产业变革的核心力量,被广泛认为是推动新质生产力形成的重要引擎。
3. 媒体大模型要想发挥最大的效能,就必须深入洞察不同层级用户的需求差异,并据此提供精准的服务,才能有效应对这一多元化的用户需求格局。
4. 为了满足不同层级用户的需求,我们需要构建一个既强大又灵活的媒体大模型。该模型不仅能够处理基础级别的,还能解决复杂问题,如创建具有深度分析、独特视角和高度原创性的文章以及跨模态的内容生成与编辑。
5. 传播大脑科技公司基于对市场需求的充分调研和分析,结合最新的人工智能技术和行业经验,创新孵化推出多项具有标杆意义的AI工具,助力提升媒体工作的效率和质量。
6. 媒体大模型的应用并非单纯的技术堆砌,而是需要深入理解业务需求,将复杂的技术转化为实用、易用的应用工具。要实现媒体大模型的应用落地,关键在于破解“最后一公里”的难题,即将媒体众多复杂的多任务需求串联或并联的单任务简单指令,并将这些指令无缝融入业务中,以场景化的大模型指令集能力来提升工作效率。
钛媒体AGI对话“AI四小龙”依图科技:回归聚焦智能城市与安防赛道,AI大模型将加速万亿安防数智化
文章概要:
1. 近几年很少对外发声的“AI四小龙”依图科技,蛰伏许久后,在新一轮AI大模型热潮下开始加速AI安防领域的商业化。
2. 依图科技总裁段爱国表示,过去十年,依图拥有世界级算法,持续深耕安防行业,支撑了近千万路的视频智能化应用,在算法、数据、算力、AI架构方面都积累了显著优势。
3. 依图科技研发副总裁许焰表示,所有人一直希望AI能够赋能百业,而AI大模型解决了过去行业成本高、门槛高、场景难通用等挑战,如今,依图的AI技术可以实现客户需求场景的匹配,To B/G政企端业务更多不再做“项目制”,而是提供软硬件产品方案,以实现公司高毛利率60%以上的预期。
4. 作为“AI四小龙”之一,依图也经历了“技术成熟度曲线”类似过程。
5. 依图很早就开始以Transformer架构为基础的生成式AI大模型研究与应用探索。
6. 依图科技伙伴业务总经理李雄威透露,当前依图已经在金融、消防、医院、通用园区、能源、工地/建造、应急、森防8大行业37家独立软件供应商(ISV),未来计划推进到20大行业、60家ISV伙伴,并成立联盟理事会,大力发展认证经销商。
7. 国内智能安防赛道依然有巨大的市场增长需求。
8. 依图科技研发副总裁许焰表示,60%的高毛利是依图的一个重要指标,而这个毛利率是由市场竞争得到的。
阅读原文
2. 依图科技总裁段爱国表示,过去十年,依图拥有世界级算法,持续深耕安防行业,支撑了近千万路的视频智能化应用,在算法、数据、算力、AI架构方面都积累了显著优势。
3. 依图科技研发副总裁许焰表示,所有人一直希望AI能够赋能百业,而AI大模型解决了过去行业成本高、门槛高、场景难通用等挑战,如今,依图的AI技术可以实现客户需求场景的匹配,To B/G政企端业务更多不再做“项目制”,而是提供软硬件产品方案,以实现公司高毛利率60%以上的预期。
4. 作为“AI四小龙”之一,依图也经历了“技术成熟度曲线”类似过程。
5. 依图很早就开始以Transformer架构为基础的生成式AI大模型研究与应用探索。
6. 依图科技伙伴业务总经理李雄威透露,当前依图已经在金融、消防、医院、通用园区、能源、工地/建造、应急、森防8大行业37家独立软件供应商(ISV),未来计划推进到20大行业、60家ISV伙伴,并成立联盟理事会,大力发展认证经销商。
7. 国内智能安防赛道依然有巨大的市场增长需求。
8. 依图科技研发副总裁许焰表示,60%的高毛利是依图的一个重要指标,而这个毛利率是由市场竞争得到的。
ComfyUI | 5分钟部署最新Flux大模型
文章概要:
1. Flux是比Midjourney和Stable Diffusion更强大的AI图像生成模型,生成图像更加逼真,在细节上更符合现实世界。
2. Flux AI模型以卓越视觉质量、精确的提示词遵循、多样化的风格和复杂场景生成能力而
. Flux AI模型采用了创新的混合架构结合了多模态处理能力和并行扩散机制的Transformer技术,并扩展至高达120亿个参数。
4. Flux模型在处理复杂构图方面表现出色得益于其先进的架构。特别是文字方面,flux可以输出带文字的图片,只要提示词足够的准确可以直接输出设计海报级别的图片。
5. Flux模型包含风格多,支持风格多样,不依赖额外的模型协助补充
6. 可忽略输入负面提示词,单靠正面提示词即可准确输出。
7. 如何部署安装flux:保证你的comfyui是最新的版本;进入官网的汉堡主页 https://huggingface.com/black-forest-labs/flux.1-dev下载ae.safetensors(即vae)、flux1-dev.safetensors(即unet);下载clip文件,进入ui的github主页找到;放置其他资源包括controlnet及lora,在xlab-ai主页https://huggingface.co/XL-AI系统设置。
8. 如何快速使用:官方给出了相关使用的工作流,只需要把官方github的案例图片拖放到comfyui即可。
阅读原文
2. Flux AI模型以卓越视觉质量、精确的提示词遵循、多样化的风格和复杂场景生成能力而
. Flux AI模型采用了创新的混合架构结合了多模态处理能力和并行扩散机制的Transformer技术,并扩展至高达120亿个参数。
4. Flux模型在处理复杂构图方面表现出色得益于其先进的架构。特别是文字方面,flux可以输出带文字的图片,只要提示词足够的准确可以直接输出设计海报级别的图片。
5. Flux模型包含风格多,支持风格多样,不依赖额外的模型协助补充
6. 可忽略输入负面提示词,单靠正面提示词即可准确输出。
7. 如何部署安装flux:保证你的comfyui是最新的版本;进入官网的汉堡主页 https://huggingface.com/black-forest-labs/flux.1-dev下载ae.safetensors(即vae)、flux1-dev.safetensors(即unet);下载clip文件,进入ui的github主页找到;放置其他资源包括controlnet及lora,在xlab-ai主页https://huggingface.co/XL-AI系统设置。
8. 如何快速使用:官方给出了相关使用的工作流,只需要把官方github的案例图片拖放到comfyui即可。
小白学大模型:提示词工程与Agent
文章概要:
1. 文章介绍了大模型的提示词工程与Agent,包括Prompt的定义、组成部分、常见技术等。
2. 文章还介绍了Agent与外部工具的交互,包括工具使用代理、代码生成代理、基于观察的代理、终身学习代理等。
3. 文章对六种不同的提示技术进行了基准测试,并展示了测试结果。
阅读原文
2. 文章还介绍了Agent与外部工具的交互,包括工具使用代理、代码生成代理、基于观察的代理、终身学习代理等。
3. 文章对六种不同的提示技术进行了基准测试,并展示了测试结果。
大模型“六小虎”,一战定生死
文章概要:
1. AI大模型发展正处在从无序竞争到日趋稳定的漫长进化中,虽然最终格局还没出现,但初步轮廓似乎已若隐若现。
2. 国外AIGC产业格局呈现出巨头主导、应用场景多元化的特点,国内AIGC产业同样发展迅猛,在上述五大应用场景中均有企业布局。
3. 以“六小虎”为代表的国内头部AI企业,要想突破挑战,抓住机遇,取决于两大核心因素:大模型研发可持续性和商业模式闭环的能力。
4. 大模型的发展离不开算力、算法、数据三大要素,其中数据更是重中之重,既是支撑决策和优化的基础,又是算法发挥作用的前提。
5. 构建一个繁荣的应用生态,也是AI企业建立竞争优势、打造壁垒的关键举措。
阅读原文
2. 国外AIGC产业格局呈现出巨头主导、应用场景多元化的特点,国内AIGC产业同样发展迅猛,在上述五大应用场景中均有企业布局。
3. 以“六小虎”为代表的国内头部AI企业,要想突破挑战,抓住机遇,取决于两大核心因素:大模型研发可持续性和商业模式闭环的能力。
4. 大模型的发展离不开算力、算法、数据三大要素,其中数据更是重中之重,既是支撑决策和优化的基础,又是算法发挥作用的前提。
5. 构建一个繁荣的应用生态,也是AI企业建立竞争优势、打造壁垒的关键举措。
大模型“六小虎”,就要凉凉了
文章概要:
1. AI圈传闻,在整体融资困难和估值推高的背景下,一些大模型创业公司举步维艰,其中备受关注的“六小虎”中的某两虎,甚至已经放弃基础大模型研发,转向AI应用。
2. 大模型创业公司的生态图谱,包括大模型“六小虎”、AI新势力和老牌科技巨头。
3. 从“大模型”转向“AI应用”的原因,包括基础大模型训练非常烧钱,C端营销成本居高不下。
4. 大模型盈利难的原因,包括AI微笑曲线,大模型位于利润低点,面临巨额投入却难以变现的窘境,以及价格战提前到来,让原本就变现困难、利润微薄的AI企业雪上加霜。
5. “六小虎”谁能走出黎明前的黑暗,包括拼估值和看市占率。
阅读原文
2. 大模型创业公司的生态图谱,包括大模型“六小虎”、AI新势力和老牌科技巨头。
3. 从“大模型”转向“AI应用”的原因,包括基础大模型训练非常烧钱,C端营销成本居高不下。
4. 大模型盈利难的原因,包括AI微笑曲线,大模型位于利润低点,面临巨额投入却难以变现的窘境,以及价格战提前到来,让原本就变现困难、利润微薄的AI企业雪上加霜。
5. “六小虎”谁能走出黎明前的黑暗,包括拼估值和看市占率。
大模型"说谎",真的能被纠正吗? | 让LLM变聪明的新方法:如何教会"小模型"像"大模型"一样解数学题
文章概要:
1. 研究人员开发出了一种叫“知识编辑”的技术,声称可以纠正LLM的错误认知。但研究发现,现有的编辑方法远没有之前评估中表现那么有效。
2. 研究人员了一个创新的“方法”SIKeD,让“小模型”也能像“大模型”一样灵活解题。
3. 无论是LLM的发展还是的成长,都需要持续不断的努力和积累。
阅读原文
2. 研究人员了一个创新的“方法”SIKeD,让“小模型”也能像“大模型”一样灵活解题。
3. 无论是LLM的发展还是的成长,都需要持续不断的努力和积累。
大模型走到AI战略分岔口,字节们面临偏航危机
文章概要:
1. 字节跳动在AI方面的最新动态:实习生恶意代码事件,资源分配问题引发关注,字节跳动在视频方向上的投入和成果,以及与文本大模型相比的资源倾斜。
2. AI视频生成的现状和挑战:百度CEO李彦宏对AI视频生成的看法,视频生成企业的市场表现,用户不买账的原因,包括成本、质量、效果等方面的问题,以及AI视频生成的技术短板和市场竞争情况。
3. 数据枯竭下的深度推理:LLM的scaling law的神话,强化学习的作用,文本模型和深度推理的关系,以及国内大厂在深度推理方面的表现和差距。
4. 大模型的战略选择:OpenAI推出o1后的战略分岔口,字节跳动和智谱清言的战略选择,以及追求大而全的路线所面临的商业困境。
阅读原文
2. AI视频生成的现状和挑战:百度CEO李彦宏对AI视频生成的看法,视频生成企业的市场表现,用户不买账的原因,包括成本、质量、效果等方面的问题,以及AI视频生成的技术短板和市场竞争情况。
3. 数据枯竭下的深度推理:LLM的scaling law的神话,强化学习的作用,文本模型和深度推理的关系,以及国内大厂在深度推理方面的表现和差距。
4. 大模型的战略选择:OpenAI推出o1后的战略分岔口,字节跳动和智谱清言的战略选择,以及追求大而全的路线所面临的商业困境。
字节大模型内部赛马,下一个爆款 or 烧钱深坑?
文章概要:
1. 今年最火的两款全球AI产品,当属视频生成大模型产品Sora和音乐生成大模型产品Suno,两款AI产品的火爆,迅速点燃了国内大厂对这两条赛道的争夺战。
2. 字节跳动在AI视频和AI音乐这两条热门赛道上的全布局,火力全开之下的字节,能够得偿所愿吗?
3. 字节AI赛道创业:试错、内部赛马并举。豆包视频生成大模型的发布,是字节在AI领域的一次重磅亮相。基于豆包视频生成大模型,字节内部也推出了相关的具有AI视频生产能力的产品,主要由业务团队在推进,一个是豆包,一个是剪映,可以看做是内部的一场赛马。
4. 音乐生成方面,海绵音乐APP则是字节的代表,这款产品是字节在AI赛道上试错的一个典型案例。海绵音乐的前身是2022年2月海绵乐队APP。
5. 字节的AI产品在这两条赛道上的发展并不是独立,而是相互竞争。豆包、即梦在近期也开始推出音乐生成服务,逐步渗透到AI音乐赛道。
6. 左手视频,右手音乐。字节视频生成APP即梦自今年8月上线以来,在iOS端的摄影与录像(免费)榜单的排名逐渐上升,两个月时间,已经稳定在前40的名次,安卓端,近30日均下载量,为22978次。
7. 相比于字节在视频生成方面取得的成绩,字节在音乐生成方面,目前仍然是不温不火。音乐行业人士李磊认为,虽然AI音乐很火,但好听的AI歌曲创作多来自于专业人士,普通用户对于AI音乐生成工具的使用门槛和学习成本也有一定的要求,如果工具过于复杂或难以使用,就会影响用户的体验和接受度。而且,用户对AI音乐的接受度也需要时间来培养。
8. 下一个AI爆款,还是烧钱深坑。AIGC(人工智能生成内容)是一个巨大的市场,量子位智库预计,2024年我国AIGC应用市场规模达到200亿。2030年,我国AIGC应用将成为万亿规模市场,五年(2024-2028年)平均复合增长率超过30%。
阅读原文
2. 字节跳动在AI视频和AI音乐这两条热门赛道上的全布局,火力全开之下的字节,能够得偿所愿吗?
3. 字节AI赛道创业:试错、内部赛马并举。豆包视频生成大模型的发布,是字节在AI领域的一次重磅亮相。基于豆包视频生成大模型,字节内部也推出了相关的具有AI视频生产能力的产品,主要由业务团队在推进,一个是豆包,一个是剪映,可以看做是内部的一场赛马。
4. 音乐生成方面,海绵音乐APP则是字节的代表,这款产品是字节在AI赛道上试错的一个典型案例。海绵音乐的前身是2022年2月海绵乐队APP。
5. 字节的AI产品在这两条赛道上的发展并不是独立,而是相互竞争。豆包、即梦在近期也开始推出音乐生成服务,逐步渗透到AI音乐赛道。
6. 左手视频,右手音乐。字节视频生成APP即梦自今年8月上线以来,在iOS端的摄影与录像(免费)榜单的排名逐渐上升,两个月时间,已经稳定在前40的名次,安卓端,近30日均下载量,为22978次。
7. 相比于字节在视频生成方面取得的成绩,字节在音乐生成方面,目前仍然是不温不火。音乐行业人士李磊认为,虽然AI音乐很火,但好听的AI歌曲创作多来自于专业人士,普通用户对于AI音乐生成工具的使用门槛和学习成本也有一定的要求,如果工具过于复杂或难以使用,就会影响用户的体验和接受度。而且,用户对AI音乐的接受度也需要时间来培养。
8. 下一个AI爆款,还是烧钱深坑。AIGC(人工智能生成内容)是一个巨大的市场,量子位智库预计,2024年我国AIGC应用市场规模达到200亿。2030年,我国AIGC应用将成为万亿规模市场,五年(2024-2028年)平均复合增长率超过30%。
初探大模型压缩
文章概要:
1. 语言模型越大越好,但使用100B+参数模型存在着明显的挑战,如存储空间需求大等。
压缩的目的是在不牺牲性能的情况下减少机器学习模型的大小,主要有量化、修剪、知识蒸馏3大类。
3. 量化是降低模型参数的精度,主要有训练后量化(PTQ)和量化感知训练(QAT)两种技术。
4. 修剪的目的是删除对性能影响很小的模型组件,主要有非结构化修剪和结构化修剪两类。
5. 知识蒸馏是将知识从(较大的)教师模型转移到(较小的)学生模型,最近的蒸馏应用程序完全放弃了对logit的需要,而是从教师模型生成的合成数据中学习。
6. 实验将压缩一个100M参数模型,该模型将URL分类为安全还是不安全,首先利用知识精馏将100M参数模型压缩为50M参数模型,然后使用4位量化,进一步减少了3倍的内存占用,导致最终的模型是原始模型的1/8。
阅读原文
压缩的目的是在不牺牲性能的情况下减少机器学习模型的大小,主要有量化、修剪、知识蒸馏3大类。
3. 量化是降低模型参数的精度,主要有训练后量化(PTQ)和量化感知训练(QAT)两种技术。
4. 修剪的目的是删除对性能影响很小的模型组件,主要有非结构化修剪和结构化修剪两类。
5. 知识蒸馏是将知识从(较大的)教师模型转移到(较小的)学生模型,最近的蒸馏应用程序完全放弃了对logit的需要,而是从教师模型生成的合成数据中学习。
6. 实验将压缩一个100M参数模型,该模型将URL分类为安全还是不安全,首先利用知识精馏将100M参数模型压缩为50M参数模型,然后使用4位量化,进一步减少了3倍的内存占用,导致最终的模型是原始模型的1/8。
2024 计算机行业专题:视频大模型奇点时刻加速到来
文章概要:
1. 2024计算机行业专题:视频大到来
阅读原文
大语言模型在计算机视觉领域的应用
文章概要:
1. 文章介绍了大语言模型在计算机视觉领域的应用
2.回复“2418,可获得下载资料的方法
阅读原文
2.回复“2418,可获得下载资料的方法
人工智能教育大模型:体系架构与关键技术策略
文章概要:
1. 国外大模型教育应用实践表明,直接将大模型用于教学存在专业知识不足和生成内容不确定性等问题,需依据教育场景和用户需求定制,以解决特定任务下可能产生的内容误差、偏见、伦理以及生成内容的版权争议等。国外已诞生了 Khanmigo、Merlyn Mind、CheggMate、ChatGPT Edu 等专门用于教育领域、解决各类教育场景任务的人工智能教育大模型。这些行业模型锚定教育特定场景,通过不同技术方式实现能力的跃升,应用效果突出。
2. 教育大模型的技术实现方式包括:通过提示词工程等提升教育大模型理解人类问题的能力,通过专门训练语料库提升教育大模型的专业能力,通过外挂知识库实时更新知识,使用加密技术保护数据的存储和传输不被授权访问。与国外由少数几家技术巨头主导的趋势不同,我国呈现“百花齐放”态势。科大讯飞、网易、腾讯等科技企业都在积极开展和部署自主研发的大模型技术,致力于研发好用、易用的人工智能教育大模型,力求差异化竞争。
3. 目前人工智能教育大模型的研究处于试验加速期,产业界正积极推动适用教育领域的专用大模型设计及研发,试图通过最新技术手段提升模型性能,并探索其在教育全流程中的应用。学界的研究焦点也正从通用大模型的教育应用逐步转为对教育大模型的理论深化与价值探讨。相比产业界和学术界对教育大模型关注的增加,人工智能教育大模型的内涵定义、能力特征有待澄清。
4. 人工智能教育大模型建设是以重构未来教育图景为目标、以开放算法模型架构为基础、以创新教育应用场景为核心的系统性变革。推进教育大模型的建设与应用,必须从全局视角重新审视与教育数字化转型相关业务、技术与应用间的相互关系以及这种关系对教育流程和教育效果的影响。
5. 人工智能教育大模型的体系架构由基础支撑、模型能力、智能体平台、场景应用、模型评测五部分构成。基础支撑包括硬件设施、算法模型、行业通用数据、教育专属数据集等;模型能力包括教育专有能力、AI 引擎、公共基础构件、公共服务 API 等;智能体平台包括教育智能体创建与编排工具、教育插件、教育知识库等;场景应用包括智能检索、咨询答疑、创意增强、个性化支持与反馈、情感互动等;模型评测包括专业能力和安全能力。
6. 采取何种技术策略,不仅是人工智能教育大模型的建设与应用从理论探索走向实践应用的桥梁,更是确保其在教育场景发挥最大效能、促进教育创新与变革的核心所在。探讨人工智能教育大模型建设与应用的关键技术策略,能为构建更智能、高效、安全的人工智能教育大模型生态提供策略支撑与实践指南。
阅读原文
2. 教育大模型的技术实现方式包括:通过提示词工程等提升教育大模型理解人类问题的能力,通过专门训练语料库提升教育大模型的专业能力,通过外挂知识库实时更新知识,使用加密技术保护数据的存储和传输不被授权访问。与国外由少数几家技术巨头主导的趋势不同,我国呈现“百花齐放”态势。科大讯飞、网易、腾讯等科技企业都在积极开展和部署自主研发的大模型技术,致力于研发好用、易用的人工智能教育大模型,力求差异化竞争。
3. 目前人工智能教育大模型的研究处于试验加速期,产业界正积极推动适用教育领域的专用大模型设计及研发,试图通过最新技术手段提升模型性能,并探索其在教育全流程中的应用。学界的研究焦点也正从通用大模型的教育应用逐步转为对教育大模型的理论深化与价值探讨。相比产业界和学术界对教育大模型关注的增加,人工智能教育大模型的内涵定义、能力特征有待澄清。
4. 人工智能教育大模型建设是以重构未来教育图景为目标、以开放算法模型架构为基础、以创新教育应用场景为核心的系统性变革。推进教育大模型的建设与应用,必须从全局视角重新审视与教育数字化转型相关业务、技术与应用间的相互关系以及这种关系对教育流程和教育效果的影响。
5. 人工智能教育大模型的体系架构由基础支撑、模型能力、智能体平台、场景应用、模型评测五部分构成。基础支撑包括硬件设施、算法模型、行业通用数据、教育专属数据集等;模型能力包括教育专有能力、AI 引擎、公共基础构件、公共服务 API 等;智能体平台包括教育智能体创建与编排工具、教育插件、教育知识库等;场景应用包括智能检索、咨询答疑、创意增强、个性化支持与反馈、情感互动等;模型评测包括专业能力和安全能力。
6. 采取何种技术策略,不仅是人工智能教育大模型的建设与应用从理论探索走向实践应用的桥梁,更是确保其在教育场景发挥最大效能、促进教育创新与变革的核心所在。探讨人工智能教育大模型建设与应用的关键技术策略,能为构建更智能、高效、安全的人工智能教育大模型生态提供策略支撑与实践指南。
大模型重要技术系列三:高效推理
文章概要:
1. 文章介绍了高效推理的方法,包括模型算法和系统优化两个大类。
2. 文章重点介绍了两篇综述文章,从不同的分类角度全面概括高效推理的方法。
3. 文章还介绍了数据维度优化、模型维度优化和系统维度优化的方法。
4. 文章最后介绍了常见推理工具优化功能的支持对比和性能对比。
阅读原文
2. 文章重点介绍了两篇综述文章,从不同的分类角度全面概括高效推理的方法。
3. 文章还介绍了数据维度优化、模型维度优化和系统维度优化的方法。
4. 文章最后介绍了常见推理工具优化功能的支持对比和性能对比。
大型视觉语言模型中幻觉现象的综述
文章概要:
1. 大型视觉语言模型(LVLMs)通过在大型语言模型(LLMs)的基础上整合视觉模态,增强了用户交互并丰富了用户体验。它展现了强大的信息处理和生成能力。然而,幻觉现象的存在限制了LVLMs在各个领域的潜力和实际效用。
2. 本文对LVLM幻觉现象的最新进展进行了综述。首先,介绍了与LVLM和幻觉相关的背景知识。其次,提供了LVLM的结构及其产生幻觉的主要原因。接着,总结了幻觉的纠正和减缓工作。然后,介绍了用于评估LVLM幻觉的基准。最后,对LVLM幻觉纠正的未来前景提供了一些见解,并描绘了潜在的研究方向。
阅读原文