【4k 下载!】基础大模型能一次性输出万字长文吗? longwriter: 没问题; 魔塔社区:只需要666条数据就能实现!
文章概要:
1. 文章介绍了LLM一个有意思的方向:输出长文本能力,目前国内主流大部分大模型都不能一口气输出长文本,清华大学的THUDM团队提出longwriter-6K数据集能够有效让基础大模型实现长文本输出,最近魔塔社区的研究者进一步改进,只需要666条高质量longwriter-6k-filtered数据集就能让大模型实现长文输出。
2. 文章通过理论篇和实战篇详细介绍了longwriter-6k和longwriter-6k-filtered数据集的内容和对应微调后大模型生成万字长文的效果案例展示。
3. 文章在理论篇介绍了longwriter的相关内容,包括国产主流大的输出长度表现、为什么普遍的大模型输出长度难以达到2k、longwriter-6k数据集和longwriter-glm4-9b模型、longwriter-6k-filtered数据集和训练对应的llm。
4. 文章在实战篇介绍了部署longwriter-glm4-9B大模型长文本输出效果,包括配置python环境、以nf4量化加载longwriter-glm4-9B大模型今天推理、数学问题-效果展示、常识问题-效果展示、6k长文本输出能力-效果展示、1万字长文本输出能力-效果展示。
5. 文章最后给出了参考链接。
阅读原文
2. 文章通过理论篇和实战篇详细介绍了longwriter-6k和longwriter-6k-filtered数据集的内容和对应微调后大模型生成万字长文的效果案例展示。
3. 文章在理论篇介绍了longwriter的相关内容,包括国产主流大的输出长度表现、为什么普遍的大模型输出长度难以达到2k、longwriter-6k数据集和longwriter-glm4-9b模型、longwriter-6k-filtered数据集和训练对应的llm。
4. 文章在实战篇介绍了部署longwriter-glm4-9B大模型长文本输出效果,包括配置python环境、以nf4量化加载longwriter-glm4-9B大模型今天推理、数学问题-效果展示、常识问题-效果展示、6k长文本输出能力-效果展示、1万字长文本输出能力-效果展示。
5. 文章最后给出了参考链接。
聊一聊大模型六小虎生存现状!
文章概要:
1. ChatGPT的出现引发了生成式AI的创业热潮,国内的智谱AI、百川、零一万物、月之暗面、Minimax和阶跃星辰成为大模型创企的“六小虎”。
2. 今年AI应用层的井喷被预告为今年AI领域的最强看点,大模型厂商开启了激烈的用户争夺战,同时今年的融资情况也异常顺利。
3. 然而,大模型能力的增长正陷入普遍的停滞,OpenAI的商业化探索也依然迷茫,国内大模型厂商们是否遇到了同样的困境?
4. 模型能力增长放缓,各家如何开卷产品差异化?
5. 大模型厂商想卷出产品上的差异化,却卷得不够明白,加之AI应用在大众层面的渗透率还不够高,谁能抢先触达到用户就变成了模型间竞争的一个关键。
6. 大模型厂商在线上线下纷纷铺开营销,其争夺用户和流量的强度有着愈演愈烈的趋势——烧钱,烧更多的钱。
7. 从人事变动看增长停滞:裁员、出走与内斗大戏
8. AGI的等待:冲刺上市,旷日持久
9. 大模型“六小虎”的路绝不是一帆风顺,模型能力增长与商业化探索,这两条路皆阻碍重重。
10. IPO或将成为OpenAI的出路,此前的爆料透露,“六小虎”已经有公司在冲刺上市了。
阅读原文
2. 今年AI应用层的井喷被预告为今年AI领域的最强看点,大模型厂商开启了激烈的用户争夺战,同时今年的融资情况也异常顺利。
3. 然而,大模型能力的增长正陷入普遍的停滞,OpenAI的商业化探索也依然迷茫,国内大模型厂商们是否遇到了同样的困境?
4. 模型能力增长放缓,各家如何开卷产品差异化?
5. 大模型厂商想卷出产品上的差异化,却卷得不够明白,加之AI应用在大众层面的渗透率还不够高,谁能抢先触达到用户就变成了模型间竞争的一个关键。
6. 大模型厂商在线上线下纷纷铺开营销,其争夺用户和流量的强度有着愈演愈烈的趋势——烧钱,烧更多的钱。
7. 从人事变动看增长停滞:裁员、出走与内斗大戏
8. AGI的等待:冲刺上市,旷日持久
9. 大模型“六小虎”的路绝不是一帆风顺,模型能力增长与商业化探索,这两条路皆阻碍重重。
10. IPO或将成为OpenAI的出路,此前的爆料透露,“六小虎”已经有公司在冲刺上市了。
沈向洋在青年科学家50²论坛的演讲全文:关于大模型的10个思考
文章概要:
1. 沈向洋在青年科学家50²论坛的演讲全文:关于大模型的10个思考
2. 算力是门槛:大模型对算力的要求,过去10年非常巨大
3. 关于数据的数据:如果有GPT-5,可能会上到200T的数据量
4. 大模型的下一章:有很多多模态的科研工作要做
5. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路
6. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型
7. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent
8. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据
9. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对
10. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者
11. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的
阅读原文
2. 算力是门槛:大模型对算力的要求,过去10年非常巨大
3. 关于数据的数据:如果有GPT-5,可能会上到200T的数据量
4. 大模型的下一章:有很多多模态的科研工作要做
5. 人工智能的范式转移:o1出来后,从原来的GPT的预训练思路,变成了今天的自主学习的道路
6. 大模型横扫千行百业:在中国的大模型建设浪潮当中,越来越多的是行业大模型
7. AI Agent,从愿景到落地:超级应用一开始就在那里,这个超级应用就是一个超级助理,就是一个超级Agent
8. 开源vs闭源:我认为Meta的Llama并不是传统的开源,它只是开源了一个模型,并没有给你原代码和数据
9. 重视AI的治理:人工智能对千行百业、对整个社会的冲击非常大,要大家共同来面对
10. 重新思考人机关系:真正把人机交互搞清楚,才能成为每一代高科技企业真正有商业价值的领导者
11. 智能的本质:虽然大模型已经给大家带来很多的震惊,但是我们对大模型、深度学习是没有理论的
人工智能大模型教育场景应用优秀案例
文章概要:
1. 本教学案例采用依赖神经网络和深度学习算法的AI渲染手段,旨在引导学生在减少时间和提高效率的同时,更好地实现创新建筑设计。
2. 本教学案例具有三方面创新:模式创新,通过智能增效推动传统建筑设计教学模式的革新,有针对性的培养学生专业素养能力;形式创新,通过虚实共生实现建筑方案的可视化设计,为学生展现独特设计理念提供了有效途径;内容创新,通过引入AI技术这一新质生产力,促使学生以更高效、更个性的特征创造出具备“美”的建筑设计作品。
3. 本教学在设计教学前期和后期引入AI渲染,引导学生在设计意图的三维形式上,进行进一步的AI大模型效果图生成,快速地将各种设计概念可视化,并进行反复推敲。
4. 本教学案例以建筑学专业的建筑设计3-4》和《参数化设计》课程为载体,针对对象为三年级学生,《参数化设计》课程为软件,《建筑设计3-4》为专业设计实践课,学生经过前者的学习,将其知识应用到后者的设计过程中,从而通过以上两门课程的授课,达到理论联系实践的良好结合。
5. 针对建筑效果图渲染,对于Stable diffusion的文生图,可将其与controlnet、lora两者相结合,通过以上三者的整合,即可实现案例的教学目的。
6. 本教学案例引入AI渲染技术,通过输入文字和简单线稿,引导学生快速生成想要的建筑形式意向图,成功应用到建筑设计过程的两个具体场景中:一是建筑设计前期的概念方案创作阶段,利用AI的泛化生成能力,实现概念阶段的多方向对比;二是建筑设计后期的方案表达阶段,通过输出高质量的生成图像,减少获得合适效果图所消耗的大量精力,促使学生能够专注于创新方案的设计。
7. 本教学通过引用AI技术,能够通过其强大的虚实孪生能力,引导学生对以上问题进行解决。第一,教学后期通过使用增强现实(AR)和虚拟现实(VR)等技术,学生可以将设计方案实时投影真实中,使得用户能够更好地理解和体验设计意图。第二,学生可以根据用户的需求和偏好快速调整设计方案,实时展示不同的设计选项,并根据反馈进行修改和优化。第三,学生可以根据方案设计快速生成动态视频,能够全方位展现方案空间,获取更好的体验感,提高设计效率和质量。
8. 本教学案例通过引入技术这一新质生产力,为学生提供了新的设计创新与表达的机会。通过这种创作过程锻炼学生的计算性设计思维,拓展学生的创造力与想象力,获得建筑美学培养的关键技能,包括:明确建筑设计主题、推敲建筑三维造型、综合应用美学知识、体验空间氛围等。这些技能在使用人工智能技术的过程中,以更高效、更个性的特征创造具备“美”的建筑设计作品,实现建筑美育教学的新途径,创新性提升学生审美素养。
9. 本教学以建筑设计课程为应用对象,在设计教学前期和后期引入AI渲染,引导学生应用AI大模型进行效果图生成,具有较强的教学适应性,并取得了很好的教学成效。
阅读原文
2. 本教学案例具有三方面创新:模式创新,通过智能增效推动传统建筑设计教学模式的革新,有针对性的培养学生专业素养能力;形式创新,通过虚实共生实现建筑方案的可视化设计,为学生展现独特设计理念提供了有效途径;内容创新,通过引入AI技术这一新质生产力,促使学生以更高效、更个性的特征创造出具备“美”的建筑设计作品。
3. 本教学在设计教学前期和后期引入AI渲染,引导学生在设计意图的三维形式上,进行进一步的AI大模型效果图生成,快速地将各种设计概念可视化,并进行反复推敲。
4. 本教学案例以建筑学专业的建筑设计3-4》和《参数化设计》课程为载体,针对对象为三年级学生,《参数化设计》课程为软件,《建筑设计3-4》为专业设计实践课,学生经过前者的学习,将其知识应用到后者的设计过程中,从而通过以上两门课程的授课,达到理论联系实践的良好结合。
5. 针对建筑效果图渲染,对于Stable diffusion的文生图,可将其与controlnet、lora两者相结合,通过以上三者的整合,即可实现案例的教学目的。
6. 本教学案例引入AI渲染技术,通过输入文字和简单线稿,引导学生快速生成想要的建筑形式意向图,成功应用到建筑设计过程的两个具体场景中:一是建筑设计前期的概念方案创作阶段,利用AI的泛化生成能力,实现概念阶段的多方向对比;二是建筑设计后期的方案表达阶段,通过输出高质量的生成图像,减少获得合适效果图所消耗的大量精力,促使学生能够专注于创新方案的设计。
7. 本教学通过引用AI技术,能够通过其强大的虚实孪生能力,引导学生对以上问题进行解决。第一,教学后期通过使用增强现实(AR)和虚拟现实(VR)等技术,学生可以将设计方案实时投影真实中,使得用户能够更好地理解和体验设计意图。第二,学生可以根据用户的需求和偏好快速调整设计方案,实时展示不同的设计选项,并根据反馈进行修改和优化。第三,学生可以根据方案设计快速生成动态视频,能够全方位展现方案空间,获取更好的体验感,提高设计效率和质量。
8. 本教学案例通过引入技术这一新质生产力,为学生提供了新的设计创新与表达的机会。通过这种创作过程锻炼学生的计算性设计思维,拓展学生的创造力与想象力,获得建筑美学培养的关键技能,包括:明确建筑设计主题、推敲建筑三维造型、综合应用美学知识、体验空间氛围等。这些技能在使用人工智能技术的过程中,以更高效、更个性的特征创造具备“美”的建筑设计作品,实现建筑美育教学的新途径,创新性提升学生审美素养。
9. 本教学以建筑设计课程为应用对象,在设计教学前期和后期引入AI渲染,引导学生应用AI大模型进行效果图生成,具有较强的教学适应性,并取得了很好的教学成效。
人工智能大模型教育场景应用优秀案例
文章概要:
1. 传统渲染方式在建筑效果图制作中存在诸多问题,本教学案例采用AI渲染手段,旨在引导学生减少时间和提高效率,更好地实现创新建筑设计。
2. 本教学案例具有三方面创新:模式创新,通过智能增效推动传统建筑设计教学模式的革新针对性的培养学生专业素养能力;形式创新,通过虚实共生实现建筑方案的可视化设计,为学生展现独特设计理念提供了有效途径;内容创新,通过引入AI技术这一新质生产力,促使学生以更高效、更个性的特征创造出具备“美”的建筑设计作品。
3. 本教学以建筑学专业的建筑设计3-4》和《参数化设计》课程为载体,针对对象为三年级学生,《参数化设计》课程为软件操作教学,《建筑设计3-4》为专业设计实践课,学生经过前者的学习,将其知识应用到后者的设计过程中,从而通过以上两门课程的授课,达到理论联系实践的良好结合。
4. 本教学案例通过引入AI技术这一新质生产力,为学生提供了新的设计创新与表达的机会。通过这种创作过程锻炼学生的计算性设计思维,拓展学生的创造力与想象力,获得建筑美学培养的关键技能,包括:明确建筑设计主题、推敲建筑三维造型、综合应用美学知识、体验空间等。
阅读原文
2. 本教学案例具有三方面创新:模式创新,通过智能增效推动传统建筑设计教学模式的革新针对性的培养学生专业素养能力;形式创新,通过虚实共生实现建筑方案的可视化设计,为学生展现独特设计理念提供了有效途径;内容创新,通过引入AI技术这一新质生产力,促使学生以更高效、更个性的特征创造出具备“美”的建筑设计作品。
3. 本教学以建筑学专业的建筑设计3-4》和《参数化设计》课程为载体,针对对象为三年级学生,《参数化设计》课程为软件操作教学,《建筑设计3-4》为专业设计实践课,学生经过前者的学习,将其知识应用到后者的设计过程中,从而通过以上两门课程的授课,达到理论联系实践的良好结合。
4. 本教学案例通过引入AI技术这一新质生产力,为学生提供了新的设计创新与表达的机会。通过这种创作过程锻炼学生的计算性设计思维,拓展学生的创造力与想象力,获得建筑美学培养的关键技能,包括:明确建筑设计主题、推敲建筑三维造型、综合应用美学知识、体验空间等。
2024年,国内AI大模型发展报告!
文章概要:
1. 2024年,国内AI大模型发展报告!随着AI技术发展,大模型成为科技竞争新高地、产业新赛道、经济新引擎,我国视其为国家战略,出台政策扶持。大模型广泛应用,推动科技革命与产业变革,面临发展挑战需各界努力。
2. 2023年大模型爆发,变革生产生活,国产大模型崛起。大模型与传统行业融合提升产业效率;赋能金融、医疗等,助力新质生产力发展。模型政策保障,促进健康发展,服务各,注入发展新动能。
3. 2024年,多重因素推动大模型发展,政府支持、用户需求增长、科技投入增加。面临算力分散、结构最优疑问、数据稀缺等挑战。趋势上,基础模型训练公司或减少,更多公司寻找应用场景。
4. 中国AI大模型产业发展受多领域需求驱动,如办公制造、金融等,旨在降本增效、提高效率和降低风险。这些领域的创新推动AI大模型产业蓬勃发展,预示广阔市场前景。
5. 我国AI大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI大模型落地商用,各类通用、行业以及端侧大模型已在多个领域取得了显著的成果,如在金融、医疗、政务等领域,AI大模型已成为提升服务质量和效率的重要手段。
6. 当前,我国AI大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI大模型落地商用,各类通用、端模型已在多个领域取得了显著的成果,如在金融、医疗、政务等领域,AI大模型已成为提升服务质量和效率的重要手段。
7. 算力瓶颈制约大模型发展,AI大模型训练依赖高性能芯片,算力直接影响模型训练速度和质量。GPT等大语言模型对算力要求更高。英伟达A100、H100是主流,但国内GPU资源有限且性能不足。受管制影响,替代品A800也缺货溢价。国产AI芯片虽在崛起,但与顶尖水平仍有差距,算力不足制约大模型发展。
8. Transformer架构局限明显,Transformer架构消耗大量算力和内存,计算量随上下文长度平方级增长,存储需求大。如1000亿参数模型需400GB空间。
9. 训练数据集需扩展,国内AI大模型数据主要来自互联网,数据类型不全、可信度低。中文数据库体量小,缺乏多数据源调用,数据碎片化。政府及企业数据不公开,影响模型训练。需构建高质量数据集,扩充数据源。
10. 爆款应用尚未出现,ChatGPT等应用虽受欢迎,但国内尚未出现类似爆款。GPT4.0新增语音功能,GPT商店上线,应用多样,但国内应用发展仍需努力。
11. AI云侧与端侧大模型满足需求,C端用户主导端侧市场,我国云侧大模型繁荣,如百度文心一言、阿里通义千问等,依托强大算力和数据库,语言理解、问答、推理、代码生成等能力。云侧模型服务C端(智能问答、生成)和B端(营销、客服等),而端侧大模型因成本低、便携、数据安全,主导C端市场,如手机文档搜索、图像创作等。端侧化降低云端成本,保障隐私,预示端侧化趋势。瑞银预测生成式AI智能手机出货量激增,端侧模型前景广阔。
12. AI大模型通用化与专用化并行,垂直行业成关键,通用大模型参数庞大,泛化力强,擅长多任务学习,支持多模态理解生成。行业大模型聚焦金融、政务、医疗等领域,特定任务,如信用评估、政务问答等,具备专业性和高数据安全性。行业大模型集中资源于特定领域,降低成本,结合内部数据提升经营效率。
13. AI大模型广泛开源,小型开发者受益,未来大模型开源将降低门槛,提高算法透明度。开源进展包括GLM-130B、Baichuan-7B等模型。开源促进AI产业创新,小型开发者可调用大模型提升开发效率,实现应用快速落地,无需复杂训练和调参。
阅读原文
2. 2023年大模型爆发,变革生产生活,国产大模型崛起。大模型与传统行业融合提升产业效率;赋能金融、医疗等,助力新质生产力发展。模型政策保障,促进健康发展,服务各,注入发展新动能。
3. 2024年,多重因素推动大模型发展,政府支持、用户需求增长、科技投入增加。面临算力分散、结构最优疑问、数据稀缺等挑战。趋势上,基础模型训练公司或减少,更多公司寻找应用场景。
4. 中国AI大模型产业发展受多领域需求驱动,如办公制造、金融等,旨在降本增效、提高效率和降低风险。这些领域的创新推动AI大模型产业蓬勃发展,预示广阔市场前景。
5. 我国AI大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI大模型落地商用,各类通用、行业以及端侧大模型已在多个领域取得了显著的成果,如在金融、医疗、政务等领域,AI大模型已成为提升服务质量和效率的重要手段。
6. 当前,我国AI大模型产业呈现蓬勃发展的态势。伴随多家科技厂商推出的AI大模型落地商用,各类通用、端模型已在多个领域取得了显著的成果,如在金融、医疗、政务等领域,AI大模型已成为提升服务质量和效率的重要手段。
7. 算力瓶颈制约大模型发展,AI大模型训练依赖高性能芯片,算力直接影响模型训练速度和质量。GPT等大语言模型对算力要求更高。英伟达A100、H100是主流,但国内GPU资源有限且性能不足。受管制影响,替代品A800也缺货溢价。国产AI芯片虽在崛起,但与顶尖水平仍有差距,算力不足制约大模型发展。
8. Transformer架构局限明显,Transformer架构消耗大量算力和内存,计算量随上下文长度平方级增长,存储需求大。如1000亿参数模型需400GB空间。
9. 训练数据集需扩展,国内AI大模型数据主要来自互联网,数据类型不全、可信度低。中文数据库体量小,缺乏多数据源调用,数据碎片化。政府及企业数据不公开,影响模型训练。需构建高质量数据集,扩充数据源。
10. 爆款应用尚未出现,ChatGPT等应用虽受欢迎,但国内尚未出现类似爆款。GPT4.0新增语音功能,GPT商店上线,应用多样,但国内应用发展仍需努力。
11. AI云侧与端侧大模型满足需求,C端用户主导端侧市场,我国云侧大模型繁荣,如百度文心一言、阿里通义千问等,依托强大算力和数据库,语言理解、问答、推理、代码生成等能力。云侧模型服务C端(智能问答、生成)和B端(营销、客服等),而端侧大模型因成本低、便携、数据安全,主导C端市场,如手机文档搜索、图像创作等。端侧化降低云端成本,保障隐私,预示端侧化趋势。瑞银预测生成式AI智能手机出货量激增,端侧模型前景广阔。
12. AI大模型通用化与专用化并行,垂直行业成关键,通用大模型参数庞大,泛化力强,擅长多任务学习,支持多模态理解生成。行业大模型聚焦金融、政务、医疗等领域,特定任务,如信用评估、政务问答等,具备专业性和高数据安全性。行业大模型集中资源于特定领域,降低成本,结合内部数据提升经营效率。
13. AI大模型广泛开源,小型开发者受益,未来大模型开源将降低门槛,提高算法透明度。开源进展包括GLM-130B、Baichuan-7B等模型。开源促进AI产业创新,小型开发者可调用大模型提升开发效率,实现应用快速落地,无需复杂训练和调参。
目前最完整,188+26大模型名单!
文章概要:
1 国家互联网办公室最新数据显示,已备案人工智能大模型达18,地方登记26家,文章介绍的大模型及特点,如百度的文心一言、科大讯飞的星火大模型、阿里云的通义千字节跳动的豆包、智谱的智谱清言、腾讯的、商汤的商量SenseChat、天工AI、百川智能的百川大。
2. 近年来,国内大模型行业快速发展,成为AI热点,广泛应用金融、医疗、智能制造等领域,如金融行业的投资、风险管理,医疗的医疗影像数据训练,智能制造的生产数据实时监控等。但也存在技术门槛高、数据和、模型可解释不足、成本、认知不足与预期过高等问题。
阅读原文
2. 近年来,国内大模型行业快速发展,成为AI热点,广泛应用金融、医疗、智能制造等领域,如金融行业的投资、风险管理,医疗的医疗影像数据训练,智能制造的生产数据实时监控等。但也存在技术门槛高、数据和、模型可解释不足、成本、认知不足与预期过高等问题。
科大讯飞与华为深化合作,“昇腾”+“星火”加速大模型应用落地
文章概要:
1. 9月22日,科大讯飞与中国绿发联合发布泰山大模型,双方将共同研发行业大模型。
2. 9月9日-21日,科大讯飞华为进一步深化合作,带来“昇腾”+“星火”在多领域的最新成果。
. 90日,重庆市政府副市长江涛一行莅临科大讯飞合肥总部开展调研。
4. 920日至23日2024世界制造业大会在合肥滨湖国际会展中心举办,讯飞星火大模型V4.0以及多款产品及解决方案参展。
阅读原文
2. 9月9日-21日,科大讯飞华为进一步深化合作,带来“昇腾”+“星火”在多领域的最新成果。
. 90日,重庆市政府副市长江涛一行莅临科大讯飞合肥总部开展调研。
4. 920日至23日2024世界制造业大会在合肥滨湖国际会展中心举办,讯飞星火大模型V4.0以及多款产品及解决方案参展。
产品推介 | 基于大模型的企业知识管理系统LAMBE
文章概要:
1. 广州院人工智能实验室推出基于大模型企业知识管理AM应对企业在知识管理方面的。
. LAMBE整合并管理,深入理解用户的查询意图,价值
系统知识管理分为企业知识库和员工个人,企业知识库支持多生成、、数据库知识库融合和行业小模型应用。br>4. 个人知识库管理对每位员工个人学习上的,实现日报周报的自动生成与提交。
5AMBE已在广州市的一家高新技术企业成功实施显著提升信息处理能力和工作效率。
阅读原文
. LAMBE整合并管理,深入理解用户的查询意图,价值
系统知识管理分为企业知识库和员工个人,企业知识库支持多生成、、数据库知识库融合和行业小模型应用。br>4. 个人知识库管理对每位员工个人学习上的,实现日报周报的自动生成与提交。
5AMBE已在广州市的一家高新技术企业成功实施显著提升信息处理能力和工作效率。
如果强化学习是问题,大模型是否是「答案」?丨GAIR live
文章概要:
1. 大模型和强化学习技术的结合成为研究和产业界的焦点,南洋大学安波教授团队的一篇论文提出了一个名为TWOSOME的框架,旨在通过强化学习(RL)将大型语言模型(LLMs)与具身环境(embodied environments)对齐,以解决决策任务
2. 围绕该论文所讨论的强化学习与大语言模型、具身环境相结合的研究,雷峰网举办的「大模型时代的强化学习」线上研讨会,汇集了南洋理工大学安波、南京大学俞扬、华为诺亚方舟实验室/天津大学郝建业、清华大学华哲等行业专家
3. 俞扬教授基于给定的问题进行了深入拓展,特别强调了世界模型的重要性,他认为构建准确的世界模型是实现真正智能决策的关键
4. 郝建业教授指出了大模型中强化学习的作用,包括安全对齐和人类价值观对齐,并分享了强化学习技术在推荐系统、游戏AI、工业软件优化以及自动驾驶等领域的应用,以及大模型技术如何帮助强化学习解决一些传统优化问题等
5. 许华哲教授,以他在具身智能领域的前沿研究为基础,展示了强化学习如何使机器人更加智能化,分享了他在具身智能领域的研究,特别是强化学习在机器人步态优化和Minecraft等环境中的创新应用
阅读原文
2. 围绕该论文所讨论的强化学习与大语言模型、具身环境相结合的研究,雷峰网举办的「大模型时代的强化学习」线上研讨会,汇集了南洋理工大学安波、南京大学俞扬、华为诺亚方舟实验室/天津大学郝建业、清华大学华哲等行业专家
3. 俞扬教授基于给定的问题进行了深入拓展,特别强调了世界模型的重要性,他认为构建准确的世界模型是实现真正智能决策的关键
4. 郝建业教授指出了大模型中强化学习的作用,包括安全对齐和人类价值观对齐,并分享了强化学习技术在推荐系统、游戏AI、工业软件优化以及自动驾驶等领域的应用,以及大模型技术如何帮助强化学习解决一些传统优化问题等
5. 许华哲教授,以他在具身智能领域的前沿研究为基础,展示了强化学习如何使机器人更加智能化,分享了他在具身智能领域的研究,特别是强化学习在机器人步态优化和Minecraft等环境中的创新应用
大模型最大的落地场景出现了|2024数字开物大会成功举办
文章概要:
1. 9月27日,以“探索AI边界 重构数字场景”为主题的2024数字开在北京国家信息技术应用创新产业园成功举办。
2. 本次大会由中关村产业技术联盟联合会、中国通信工业协会数据中心委员会、中国信息协会集团企业数字化工作委员会主办,中关村融智机器人联盟、数字开物、大健康派、北京首科集团承办。
3. 活动现场,来自中国信通院、清华大学、中关村融智特种机器人产业联盟、北京机械工程学会、中国建筑集团、中国能源建设集团、国家电投集团、中国纺集团、中国云、正大集团、腾飞资本、大陆智源机器人、珞石(山东)机器人、伽利略(天津)技术、思必驰、智維引擎科技的众多机构领导和企业高管出席本次活动并进行了精彩分享。
4. 与会嘉宾普遍认为AI和大模型技术在推动产业数字化转型方面具有潜力,但也面临质量、技术成本、人才短缺等挑战。
阅读原文
2. 本次大会由中关村产业技术联盟联合会、中国通信工业协会数据中心委员会、中国信息协会集团企业数字化工作委员会主办,中关村融智机器人联盟、数字开物、大健康派、北京首科集团承办。
3. 活动现场,来自中国信通院、清华大学、中关村融智特种机器人产业联盟、北京机械工程学会、中国建筑集团、中国能源建设集团、国家电投集团、中国纺集团、中国云、正大集团、腾飞资本、大陆智源机器人、珞石(山东)机器人、伽利略(天津)技术、思必驰、智維引擎科技的众多机构领导和企业高管出席本次活动并进行了精彩分享。
4. 与会嘉宾普遍认为AI和大模型技术在推动产业数字化转型方面具有潜力,但也面临质量、技术成本、人才短缺等挑战。
大模型最大的落地场景出现了|2024数字开物大会成功举办
文章概要:
1. 9月27日,2024数字开在北京国家信息技术应用创新产业园成功举办,活动现场众多机构领导和企业高管出席并进行了精彩
2. 清华大学计算机系长聘教授邓志东认为,交互式的智能体将促进自动驾驶与机器人的协同发展。
3. 中国建筑集团有限公司管理部杨表示,垂直行业将是AI大模型的,建筑行业AI大模型针对建筑行业特定任务场景的大模型。
4. 中国能源建设集团有限公司信息中心主任郑晓东表示,电力行业的发、输、变、配、全领域和投资、规划、设计、建设、运营等全环节,都有人工智能广泛应用
5. 在以“重构智造——大模型如何赋能智能机器人加速突破?”为主题的场景对话环节,几位嘉宾分享了他们对人工智能在机器人领域应用的深刻见解和对未来发展的展望。
6. 在以“AI赋能产业数字化转型——大模型驱动传统行业转型升级?”为主题场景对话,嘉宾围绕AI传统行业价值释放、AI大模型工业制造、能源电力智慧等行业的具体实践与以及AI模型未来展望展开精彩。br>7. 大会现场正式启动了《面向中央企业数字化转型:人工智能赋能应用研究报告》的编制工作。<>8. 在大会的2024全国科普日外场活动,“数字开物”发布了《AI大模型10典型场景》以及《100+医疗健康大模型》。
. 与会嘉宾普遍认为AI和大技术在产业数字化转型方面具有巨大潜力,但也面临质量、技术成本、人才短缺等挑战。
阅读原文
2. 清华大学计算机系长聘教授邓志东认为,交互式的智能体将促进自动驾驶与机器人的协同发展。
3. 中国建筑集团有限公司管理部杨表示,垂直行业将是AI大模型的,建筑行业AI大模型针对建筑行业特定任务场景的大模型。
4. 中国能源建设集团有限公司信息中心主任郑晓东表示,电力行业的发、输、变、配、全领域和投资、规划、设计、建设、运营等全环节,都有人工智能广泛应用
5. 在以“重构智造——大模型如何赋能智能机器人加速突破?”为主题的场景对话环节,几位嘉宾分享了他们对人工智能在机器人领域应用的深刻见解和对未来发展的展望。
6. 在以“AI赋能产业数字化转型——大模型驱动传统行业转型升级?”为主题场景对话,嘉宾围绕AI传统行业价值释放、AI大模型工业制造、能源电力智慧等行业的具体实践与以及AI模型未来展望展开精彩。br>7. 大会现场正式启动了《面向中央企业数字化转型:人工智能赋能应用研究报告》的编制工作。<>8. 在大会的2024全国科普日外场活动,“数字开物”发布了《AI大模型10典型场景》以及《100+医疗健康大模型》。
. 与会嘉宾普遍认为AI和大技术在产业数字化转型方面具有巨大潜力,但也面临质量、技术成本、人才短缺等挑战。
千万IP创科普丨颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature
文章概要:
1 研究表明大参数模型不会承认它们的无知”,更倾向于生成答案,人们也不善于这些错误。
2. 瓦伦西亚理工大学团队及其合作者研究发现,更大的M生成的答案更准确,但整体可靠性较低,在简单任务上可能会出现过度拟合或错误的风险。
3. 研究人员探讨了难度一致性、任务回避和提示稳定性三个核心交织元素对LLM可靠性的影响。
4. 模型在面对复杂任务时表现显著提升在简单任务上的率有明显上升。
5. 优化后模型中回避行为与错误率之间存在微妙关系,模型更“自信”,减少了回避行为,但错误率却随之增加。
6. 模型对提示词的提高,但在不同难度级上仍然存在不一致的表现。
阅读原文
2. 瓦伦西亚理工大学团队及其合作者研究发现,更大的M生成的答案更准确,但整体可靠性较低,在简单任务上可能会出现过度拟合或错误的风险。
3. 研究人员探讨了难度一致性、任务回避和提示稳定性三个核心交织元素对LLM可靠性的影响。
4. 模型在面对复杂任务时表现显著提升在简单任务上的率有明显上升。
5. 优化后模型中回避行为与错误率之间存在微妙关系,模型更“自信”,减少了回避行为,但错误率却随之增加。
6. 模型对提示词的提高,但在不同难度级上仍然存在不一致的表现。
何水兵:面向大模型的存算技术,未来系统发展新趋势 | CNCC专家谈
文章概要:
1. 在即将于今年10月24-26日在浙江横店举办的CNCC2024上,138个技术论坛覆盖了人工智能、安全、AI+、网络、计算+、系统软件、教育、芯片等34个专业领域,推动不同领域的交叉融合,为各界专业人士提供了广泛的专业内容。
2. 随着ChatGPT、Stable Diffusion等新型AI现象级应用的出现,通用AI进入了大模型时代。大模型已经出现在人们生活的方方面面,如自然语言处理、计算机视觉、推荐系统等等,极大地便利了人们的生活。4. 为了解决上述挑战,我们迫切需要寻求新的存算技术,从存储、计算、网络等诸多方面对现有大模型训推系统进行升级改造。按照系统架构的不同,可分为两种思路:一是对经典冯·诺伊曼架构下的大模型训推系统进行优化,二是探索开发基于新型存算一体架构的大模型存算系统。
5. 随着大模型的参数量与计算规模井喷式增长,驱动大模型训练与推理的存算技术也需不断推陈出新。日益发展的大模型在计算与存储系统领域会带来哪些新的问题与挑战?面向大模型的新型存算技术又将往何处发展?敬请关注本年度CNCC大会组织的“面向大模型的存算技术,未来系统发展新趋势”论坛。
阅读原文
2. 随着ChatGPT、Stable Diffusion等新型AI现象级应用的出现,通用AI进入了大模型时代。大模型已经出现在人们生活的方方面面,如自然语言处理、计算机视觉、推荐系统等等,极大地便利了人们的生活。
5. 随着大模型的参数量与计算规模井喷式增长,驱动大模型训练与推理的存算技术也需不断推陈出新。日益发展的大模型在计算与存储系统领域会带来哪些新的问题与挑战?面向大模型的新型存算技术又将往何处发展?敬请关注本年度CNCC大会组织的“面向大模型的存算技术,未来系统发展新趋势”论坛。
2024年CCF大模型论坛关于增选执行委员的通知
文章概要:
1. CCF模型等,。、过相关项目等。
. 每位申请人由位CCF大模型论坛现任执行委员推荐。
. 执委增补工作会将于10月24日在浙江召开,申请人必须亲自到场参加竞选演说。
6. 224年中国计算机大会(CNCC)将于124-26日在浙江省东阳市横店举办,主题为“发展新质生产力,引领未来”。
阅读原文
. 每位申请人由位CCF大模型论坛现任执行委员推荐。
. 执委增补工作会将于10月24日在浙江召开,申请人必须亲自到场参加竞选演说。
6. 224年中国计算机大会(CNCC)将于124-26日在浙江省东阳市横店举办,主题为“发展新质生产力,引领未来”。
CNCC | 第二届智能网络与网算融合论坛-大模型AIGC时代的智能网络技术
文章概要:
1. 第二届智能网络与网算融合论坛-大模型AIGC时代的智能网络技术将于10月24日13:30-17:30举办,地点为夏苑-谐奇趣东角楼一楼。
2. 本论坛面向互联网、物联网、网络安全和云边协同智能应用等多元化领域研究场景,探讨大模型时代下的智能网络与算网融合技术发展的新挑战与新机遇,并思考大模型时代智能网络技术的未来发展方向。
3. 论坛日程包括主题演讲和Panel环节,主题演讲嘉宾包括苏金树、曹建农、任奎、徐恪、谭焜等,Panel环节嘉宾包括过敏意、王兴伟、李向阳、褚晓文、邢国良、王新、崔勇、刘云新、陈旭、赵宝康等。
4. 论坛主席为傅晓明,共同主席为郭文忠,讲者包括苏金树、曹建农、任奎、徐恪、谭焜等。
阅读原文
2. 本论坛面向互联网、物联网、网络安全和云边协同智能应用等多元化领域研究场景,探讨大模型时代下的智能网络与算网融合技术发展的新挑战与新机遇,并思考大模型时代智能网络技术的未来发展方向。
3. 论坛日程包括主题演讲和Panel环节,主题演讲嘉宾包括苏金树、曹建农、任奎、徐恪、谭焜等,Panel环节嘉宾包括过敏意、王兴伟、李向阳、褚晓文、邢国良、王新、崔勇、刘云新、陈旭、赵宝康等。
4. 论坛主席为傅晓明,共同主席为郭文忠,讲者包括苏金树、曹建农、任奎、徐恪、谭焜等。
获中国信通院能力评估认证,一文解读斗象安全大模型背后的实力
文章概要:
1. 斗象科技的安全大模型最新研发成果XSOC Co-Pilot中国院安全大模型基础网络安全能力评估认证,成为首批获证的家企业之一。
. 斗授中国人工智能产业发展联盟《安全大要求与评估方法 第部分:总体框架》核心参编单位。
3. 斗象科技早在2023年就与华为云盘古大开展合作,致力于打造安全行业专属大,以AI驱动网络安全行业的水平提升。
4. 斗象旗下拥有中国最具影响力网络安全“FreeBuf”、“FreeBuf 知识” APP 以及中国民间最大的安全众测服务平台“漏洞盒子”,能够为象大模型丰富专业的安全通识知识、细分领域知识、海量攻防样本数据集、齐全的恶意样本数据集等高质量网安语料及信息密度。
5. 此次通过中国信通院安全大基础网络安全能力评估的斗象安全运营中心智能副驾系统XCP,是斗与华为大模型在今年6月的华为开发者大会2024(H 2024)上共同发布的联创成果。
6. XCP可以通过总结和理解威胁情报来简化危机复杂性来自多个来源的数据综合为清晰、可摘要,帮助防御者网络流量的噪音并识别恶意活动,并在而不是小时或几天响应事件,极大地缩短了事件响应时间br>7. X依托国内最庞大的漏洞情报数据和相关领域知识将通过关联威胁活动信号并在检查攻击时建立正确的连接来协助检测以前忽视的威胁,并结合海量网络安全领域知识和威胁情报,能大幅安全检测效果,识别未知攻击,助力安全一步。
阅读原文
. 斗授中国人工智能产业发展联盟《安全大要求与评估方法 第部分:总体框架》核心参编单位。
3. 斗象科技早在2023年就与华为云盘古大开展合作,致力于打造安全行业专属大,以AI驱动网络安全行业的水平提升。
4. 斗象旗下拥有中国最具影响力网络安全“FreeBuf”、“FreeBuf 知识” APP 以及中国民间最大的安全众测服务平台“漏洞盒子”,能够为象大模型丰富专业的安全通识知识、细分领域知识、海量攻防样本数据集、齐全的恶意样本数据集等高质量网安语料及信息密度。
5. 此次通过中国信通院安全大基础网络安全能力评估的斗象安全运营中心智能副驾系统XCP,是斗与华为大模型在今年6月的华为开发者大会2024(H 2024)上共同发布的联创成果。
6. XCP可以通过总结和理解威胁情报来简化危机复杂性来自多个来源的数据综合为清晰、可摘要,帮助防御者网络流量的噪音并识别恶意活动,并在而不是小时或几天响应事件,极大地缩短了事件响应时间br>7. X依托国内最庞大的漏洞情报数据和相关领域知识将通过关联威胁活动信号并在检查攻击时建立正确的连接来协助检测以前忽视的威胁,并结合海量网络安全领域知识和威胁情报,能大幅安全检测效果,识别未知攻击,助力安全一步。
AI大模型工业应用模式及其实现
文章概要:
1. 人工智能是引领科技革命和产业变革的战略性技术,通用人工智能大模型是集智能智能执行功能于一体的泛在智能技术,通过数据、算力、算法三要素深度融合,实现生产要素优化配置。
2. 大模型在工业领域的潜在应用模式包括原理化研发大模型、前瞻化设计大模型、高效化仿真大模型、精细化检测、智能化调控、科学化运维大模型、定制化售后大模型。
3. 现阶段,我国大模型与工业的融合应用还处于初级探索阶段,发展面临一定挑战,建议面向工业场景数据资源池,大模型工业领域性能评测机制,推动大模型在工业领域典型应用的试点示范。
阅读原文
2. 大模型在工业领域的潜在应用模式包括原理化研发大模型、前瞻化设计大模型、高效化仿真大模型、精细化检测、智能化调控、科学化运维大模型、定制化售后大模型。
3. 现阶段,我国大模型与工业的融合应用还处于初级探索阶段,发展面临一定挑战,建议面向工业场景数据资源池,大模型工业领域性能评测机制,推动大模型在工业领域典型应用的试点示范。
目前最全的国内AI大模型117家名单。。。
文章概要:
1. 介绍了目前国内AI大模型发展情况。
2. 给出了117家已备案的AI大名称、所属公司和主要应用领域。
3. 呼吁读者收藏这份名单,并加入数字化转型网的人工智能研究学习社区。
阅读原文
2. 给出了117家已备案的AI大名称、所属公司和主要应用领域。
3. 呼吁读者收藏这份名单,并加入数字化转型网的人工智能研究学习社区。
字节豆包视频生成大模型发布
文章概要:
1. 近日,字节跳动火山引擎在深圳举办AI创新巡展,宣告进军AI视频生成领域发布两款视频生成大模型——豆包视频生成-PixelDance与豆包视频生成-Sea
2. 豆包视频生成基于DiT架构,实现了视频在大动态与镜中的自由切换,拥有多镜头语言能力,在多镜头切换的内容一致性上取得了显著
3. 豆包视频生成模型在技术上实现了突破,风格多样化上为用户提供了丰富的选择,具备专业级的光影布局和色彩调和能力,支持多种风格,适配各种设备的比例
4 豆包视频生成大模型从发布之初就充分考虑了商业化应用的需求,新款豆包生成模型正在即梦AI内测版小范围测试,未来将逐步给所有用户
阅读原文
2. 豆包视频生成基于DiT架构,实现了视频在大动态与镜中的自由切换,拥有多镜头语言能力,在多镜头切换的内容一致性上取得了显著
3. 豆包视频生成模型在技术上实现了突破,风格多样化上为用户提供了丰富的选择,具备专业级的光影布局和色彩调和能力,支持多种风格,适配各种设备的比例
4 豆包视频生成大模型从发布之初就充分考虑了商业化应用的需求,新款豆包生成模型正在即梦AI内测版小范围测试,未来将逐步给所有用户
大模型落地应用:难点与破局
文章概要:
1. 大模型应用现状:大模型数量众多,竞争激烈,已进入卷生态、拼“获客”新阶段。
2. 大模型重构科研生产关系:AI为科研带来重构生产力和生产关系的关键时期,提升了科研效率,促进了科研原始创新。
3. 科研大模型落地需理解底层科学规律:AI大模型为科学研究带来了巨大价值,但在下游工业的科研大模型落地中,仍面临一系列相关场景挑战。
4. 大模型赋能制造需深化融合应用:AI大模型正逐渐渗透到制造业各环节,成为制造业通往智能化、柔性化和自动化的核心技术之一,为制造业带来新机遇。
5. 大模型进终端推动AI规模化普及:端侧AI是AI发展的下一阶段,通过将大模型赋能终端硬件,有望开启AI应用浪潮。
阅读原文
2. 大模型重构科研生产关系:AI为科研带来重构生产力和生产关系的关键时期,提升了科研效率,促进了科研原始创新。
3. 科研大模型落地需理解底层科学规律:AI大模型为科学研究带来了巨大价值,但在下游工业的科研大模型落地中,仍面临一系列相关场景挑战。
4. 大模型赋能制造需深化融合应用:AI大模型正逐渐渗透到制造业各环节,成为制造业通往智能化、柔性化和自动化的核心技术之一,为制造业带来新机遇。
5. 大模型进终端推动AI规模化普及:端侧AI是AI发展的下一阶段,通过将大模型赋能终端硬件,有望开启AI应用浪潮。
信息科学技术分会“AI大模型推动新一轮科技及产业变革”第七期主题沙龙活动成功举行!
文章概要:
1. 9月28DMU校友会信息科学技术分会、北京大学工程管理联合会联合主办的AI大模型新一轮科技产业”沙龙活动在京成功
2. 大连海事校友会副会长兼信息科技分会会长李迎春、北京大学工程管理硕士联合会主席门宗等30余人现场参会
3. 活动由信息科技分会副秘书长李向虎
4. 我们荣幸地邀请了杰出嘉宾,他们就本次主题进行了深入且精彩演讲>5. 在嘉宾精彩分享之后,现场各位与会人员也继续热烈地针对人工智能的相关议题展开了深入的交流与探讨
6 信息科学分会副会长程德恭对本次活动进行了全面总结向北京大学工程硕士联合会、母校大连海事大学人工智能学院对本次活动大力支持以及现场线上参会各位校友表示诚挚的
阅读原文
2. 大连海事校友会副会长兼信息科技分会会长李迎春、北京大学工程管理硕士联合会主席门宗等30余人现场参会
3. 活动由信息科技分会副秘书长李向虎
4. 我们荣幸地邀请了杰出嘉宾,他们就本次主题进行了深入且精彩演讲>5. 在嘉宾精彩分享之后,现场各位与会人员也继续热烈地针对人工智能的相关议题展开了深入的交流与探讨
6 信息科学分会副会长程德恭对本次活动进行了全面总结向北京大学工程硕士联合会、母校大连海事大学人工智能学院对本次活动大力支持以及现场线上参会各位校友表示诚挚的
《面向智能制造的工业大模型标准化白皮书》 第二次编制会成功召开
文章概要:
1. 2024年90日至11日面向智能制造的工业大模型标准化白皮书》第二次编制会在北京以线上线下形式成功召开,30家单位代表参加会议。
2. 会议回顾了白皮书编制启动会的讨论情况,详细介绍了白皮书的大纲及首轮合稿。
3. 与会专家对智能制造与工业大及其标准化的关系进行了梳理,对政策现状、行业现状、技术现状进行了分析,并就白皮书章节结构及各章节关系的调整提出了建议。
4. 与会专家针对工业大模型参考架构进行了研讨,提出了由基础设施层、数据层、模型层、应用层等多层组成的技术架构及边多维组合架构
5. 提出了工业大涉及的技术,并进一步讨论形成了工业大模型标准框架,与通用大模型标准衔接的基础上聚焦工业领域的重点标准化需求。
6.形成了任务分工、下一步编制工作重点及十月底召开第三次编制会的时间安排。
阅读原文
2. 会议回顾了白皮书编制启动会的讨论情况,详细介绍了白皮书的大纲及首轮合稿。
3. 与会专家对智能制造与工业大及其标准化的关系进行了梳理,对政策现状、行业现状、技术现状进行了分析,并就白皮书章节结构及各章节关系的调整提出了建议。
4. 与会专家针对工业大模型参考架构进行了研讨,提出了由基础设施层、数据层、模型层、应用层等多层组成的技术架构及边多维组合架构
5. 提出了工业大涉及的技术,并进一步讨论形成了工业大模型标准框架,与通用大模型标准衔接的基础上聚焦工业领域的重点标准化需求。
6.形成了任务分工、下一步编制工作重点及十月底召开第三次编制会的时间安排。
2024年,国内AI大模型发展报告!
文章概要:
1. 我国政府高度重视人工智能发展,出台政策支持推动大型模型研究与应用。
2. 2023年以来,我国各地出台了大模型产业相关政策。
3. 中国AI大模型产业的发展受到了来自办公、制造、金融等多个行业需求的推动。
4. AI大模型展现出泛化性、通用性、以及涌现性等特点。
5. 依据部署方式,AI大模型主要分为两大类:云端大模型和终端大模型。
6. 中国AI模型行业正处于快速增长的阶段。
7. 算力瓶颈、Transformer架构的局限性、训练数据集的扩展需求、缺乏>8. 我国侧模型发展迅速,云侧模型服务于端和B端端侧大模型因其低成本、便携性和数据安全性,主导了C端市场。
9. 通用大模型擅长多任务学习和多模态内容的理解与生成,行业大模型则专注于金融、政务、医疗等领域,处理特定任务。
10. 未来大模型的开源将进一步降低行业门槛,提高算法的透明度。
阅读原文
2. 2023年以来,我国各地出台了大模型产业相关政策。
3. 中国AI大模型产业的发展受到了来自办公、制造、金融等多个行业需求的推动。
4. AI大模型展现出泛化性、通用性、以及涌现性等特点。
5. 依据部署方式,AI大模型主要分为两大类:云端大模型和终端大模型。
6. 中国AI模型行业正处于快速增长的阶段。
7. 算力瓶颈、Transformer架构的局限性、训练数据集的扩展需求、缺乏>8. 我国侧模型发展迅速,云侧模型服务于端和B端端侧大模型因其低成本、便携性和数据安全性,主导了C端市场。
9. 通用大模型擅长多任务学习和多模态内容的理解与生成,行业大模型则专注于金融、政务、医疗等领域,处理特定任务。
10. 未来大模型的开源将进一步降低行业门槛,提高算法的透明度。
OpenAI发布最强模型o1,大模型杀疯了!
文章概要:
1 OpenAI发布新模型o1系列,可进行通用复杂推理,在解决博士水平的物理问题时表现优秀
2. 联合哥本哈根大学学者开设「大应用八日集训班」,以免费形式带你体验AI创造之奇和提效之妙,提供700篇大模型顶会论文,学完后送99个模型微调工具
3. 课程由哥本哈根老师亲授,8天掌握大模型,不要求编程基础跟电脑配置
4. 文末福利:为了让大家更能进一步了解时下大前沿热点,QS前50导、大厂算法研究员等多位大牛打造了大模型系列课程,附论文代码讲解,原价666元,限时免费领
阅读原文
2. 联合哥本哈根大学学者开设「大应用八日集训班」,以免费形式带你体验AI创造之奇和提效之妙,提供700篇大模型顶会论文,学完后送99个模型微调工具
3. 课程由哥本哈根老师亲授,8天掌握大模型,不要求编程基础跟电脑配置
4. 文末福利:为了让大家更能进一步了解时下大前沿热点,QS前50导、大厂算法研究员等多位大牛打造了大模型系列课程,附论文代码讲解,原价666元,限时免费领
最新测评!美图大模型提前揭秘,这波风格化美到窒息
文章概要:
1. 美图公司宣布奇想大模型视频生成能力全面升级,支持1分钟、1080P分辨率的超长视频生成,且具有超强的风格化。
2. 奇想大模型在写实风格上,能够重现真实物理规律,支持大幅度流畅运动,还能进行复杂的语义理解。
3. 动画风格上,奇想大模型能够快速生成精美的动画,节省制作时间和人力成本。
4. 国风风格上,奇想大模型能够理解中国传统文化的元素和美学,生成具有地道“中国味”的动画。
5. 风格化方面,奇想大模型在艺术风格、细腻画风、细节把控之间实现了高度平衡,具备强大的风格泛化力与兼具艺术审美的视觉表现力。
6. 人像风格上,奇想大模型能够根据文本或图像,生成逼真的人像视频,为影视制作、广告创意、时尚行业以及多媒体艺术创作打开了一扇新的大门。
阅读原文
2. 奇想大模型在写实风格上,能够重现真实物理规律,支持大幅度流畅运动,还能进行复杂的语义理解。
3. 动画风格上,奇想大模型能够快速生成精美的动画,节省制作时间和人力成本。
4. 国风风格上,奇想大模型能够理解中国传统文化的元素和美学,生成具有地道“中国味”的动画。
5. 风格化方面,奇想大模型在艺术风格、细腻画风、细节把控之间实现了高度平衡,具备强大的风格泛化力与兼具艺术审美的视觉表现力。
6. 人像风格上,奇想大模型能够根据文本或图像,生成逼真的人像视频,为影视制作、广告创意、时尚行业以及多媒体艺术创作打开了一扇新的大门。
盘点11款国产应急大模型,以新质生产力助推应急管理体系和能力现代化建设
文章概要:
1. “十四五”规划提出强化数字技术在突发公共事件应对中的运用,提升预警和应急处置能力。
2. 智慧应急是依靠科技创新推进应急管理能力现代化的重大战略举措,我国应急管理面临挑战,大模型成为提升应急管理能力和效率的关键措施。
3. 网信部门等七部门联合发布《生成式人工智能服务管理暂行办法》,各地加强大模型产业顶层设计和布局,已有117项大模型通过备案。
4. 通用大模型具备广泛适用性,行业大模型针对特定行业需求进行专项训练,我国具有代表性通用大模型包括百度文心一言大模型、阿里通义千问大模型、讯飞星火大模型等。
5. 应急管理部发布应急管理领域“久安”AI大模型,中国气象局发布“风清”“风雷”“风顺”三大AI气象模型,国家超级计算成都中心、中国地震局地球物理研究所与清华大学联合开发“谛听”地震波大模型。
6. 上海人工智能实验室发布全球中期天气预报大模型“风乌”,国家城安院、深圳城安院预发布“城安”大模型,华为发布盘古气象大模型,广东南方应急管理研究院与北京广监云科技有限公司联合研发“大羽”安全应急模型。
7. 中山大学发布“神机大模型”,上海科学智能研究院、复旦大学发布“伏羲”气象大模型,山东能源集团、华为公司联合发布盘古矿山大模型,浪潮发布智慧矿山AI大模型。
阅读原文
2. 智慧应急是依靠科技创新推进应急管理能力现代化的重大战略举措,我国应急管理面临挑战,大模型成为提升应急管理能力和效率的关键措施。
3. 网信部门等七部门联合发布《生成式人工智能服务管理暂行办法》,各地加强大模型产业顶层设计和布局,已有117项大模型通过备案。
4. 通用大模型具备广泛适用性,行业大模型针对特定行业需求进行专项训练,我国具有代表性通用大模型包括百度文心一言大模型、阿里通义千问大模型、讯飞星火大模型等。
5. 应急管理部发布应急管理领域“久安”AI大模型,中国气象局发布“风清”“风雷”“风顺”三大AI气象模型,国家超级计算成都中心、中国地震局地球物理研究所与清华大学联合开发“谛听”地震波大模型。
6. 上海人工智能实验室发布全球中期天气预报大模型“风乌”,国家城安院、深圳城安院预发布“城安”大模型,华为发布盘古气象大模型,广东南方应急管理研究院与北京广监云科技有限公司联合研发“大羽”安全应急模型。
7. 中山大学发布“神机大模型”,上海科学智能研究院、复旦大学发布“伏羲”气象大模型,山东能源集团、华为公司联合发布盘古矿山大模型,浪潮发布智慧矿山AI大模型。
融资、投流、造血,大模型“新星”开启变现竞速
文章概要:
1. 2024年被称为“AI大模型应用元年”,行业变化迅速,大模型的发展周期被加速,玩家众多,资本,但也备受质疑。
2. 分析机构指出ChatGPT网站的月度访问总量遭遇断崖式暴跌,OpenAI发布新品的节奏明显变慢,英伟达股价震荡,国内也有大佬给大模型“泼冷水”。
3. 国内大模型“新星”仍炙手可热,之暗面被曝腾讯入局投资,公司投后估值已达30亿美元,智谱AI拿到新一轮融资,金额高达数十亿元,投前估值200亿元,李飞飞首次创业项目World Labs宣布获得2.3亿美元融资,背后站英伟达。
4. 行业正陷入“冰与火”的焦灼之中,而这背后,是市场逐渐对大模型祛魅,资本也回归理性,也只有当热潮退去,真正有价值的企业或应用才会浮现出来。
5. 商业化是大模型行业反复提到的话题,大模型的特殊性在于“烧钱”,技术上的研发成本,应用上的运行成本,每一步都少不了真金白银的支持,这也是大模型企业们的“紧箍咒”。
6. 像月之暗面、智谱AI这样的创业企业,它们不及巨头们的资金雄厚、资源丰富,如果一味地依赖融资输血,无法自我造血,则势必会被淘汰。
7. 潮水方向的变化推着大模型行业向前走,从“百模大战”走到“应用之战”,大模型行业即将进入新的阶段,而这个阶段,除了产品、应用外,找到一条属于自己的变现之路极为重要。
阅读原文
2. 分析机构指出ChatGPT网站的月度访问总量遭遇断崖式暴跌,OpenAI发布新品的节奏明显变慢,英伟达股价震荡,国内也有大佬给大模型“泼冷水”。
3. 国内大模型“新星”仍炙手可热,之暗面被曝腾讯入局投资,公司投后估值已达30亿美元,智谱AI拿到新一轮融资,金额高达数十亿元,投前估值200亿元,李飞飞首次创业项目World Labs宣布获得2.3亿美元融资,背后站英伟达。
4. 行业正陷入“冰与火”的焦灼之中,而这背后,是市场逐渐对大模型祛魅,资本也回归理性,也只有当热潮退去,真正有价值的企业或应用才会浮现出来。
5. 商业化是大模型行业反复提到的话题,大模型的特殊性在于“烧钱”,技术上的研发成本,应用上的运行成本,每一步都少不了真金白银的支持,这也是大模型企业们的“紧箍咒”。
6. 像月之暗面、智谱AI这样的创业企业,它们不及巨头们的资金雄厚、资源丰富,如果一味地依赖融资输血,无法自我造血,则势必会被淘汰。
7. 潮水方向的变化推着大模型行业向前走,从“百模大战”走到“应用之战”,大模型行业即将进入新的阶段,而这个阶段,除了产品、应用外,找到一条属于自己的变现之路极为重要。
大模型能力扩展之——提示词(Prompt),知识库,思维链(CoT)和Agent(代理)
文章概要:
1. 大模型的推理能力配合外部工具才能真正发挥大模型的作用,在学习和使用大模型的过程中,我们会发现大模型只能用来进行一下简单的问答;一旦涉及到复杂的问题,大模型就无能为力了
2. 对大模型的使用大致分为以下几种类型,入门级别可以简单使用大模型提供的聊天窗口进行问答来解决一些问题;再厉害一点的就是学会使用一些第三方基于大模型开发的一些AI工具
3. 而在更加高级的使用场景中,就不是普通人能够完成的了,这就需要有一定的技术和开发能力才能实现
4. 比如,自己搭建一个知识库,每次使用大模型的时候都会从知识库中获取知识输入到大模型,以获得更好的结果;而再高级一点的就是使用提示词+知识库+思维链+外部工具(API,功能代码等)来实现人类才能做到的事情
5. 大模型知识来源有三个方向,第一种就是大模型本身的知识储备,这些知识来源于预训练数据;也是为什么大在不依靠任何的情况下就可以回答一些问题
6. 第二种就是知识库,简单大模型一个资料库
7. 第三种就是外部工具,天气查询的API或者股票查询接口等
8 人工智能代理(AI Agent),目前为止其并没有一个公认的定义简单来说就是让大模型能够像真正的人类一样来完成更加复杂任务的一种和方法论
9. 使用过大模型的人都知道,提示词直接影响到大模型的表现;简单的提升词虽然也能让大任务,但往往完成的不是很好,甚至会有很大问题
10. 而在专业的提升词工程中,大模型会有几个角色,一个是system(系统)角色,一个是assistant(助手)角色和user(用户)角色
11. system角色是来限定大模型定角色范围的,比如是老师,科学家,医生等,不同的角色会擅长不同的领域;而user角色就是我们使用者的角色,可以用来提出问题等;assistant角色就是大模型本身或者说是大模型回答user角色问题的“助手”
12. 而仅有提示词功能还不足以完全发挥大模型的能力,因此又有了思维链(CoT)的出现,思维链的作用就是让大模型有一个完整的思考过程,并且可以给出一些案例,来让大模型处理更加复杂的任务
13. 外部工具的作用就是让大模型可以实时获取当前的信息,比如股票的价格波动;以及能够借助外部工具自主完成任务,比如订票
14. 通过以上方式用户就可以创建一个具有某种功能的Agent,比如一个理财大师;而用户可以创建多个不同的Agent来互相协作,比如创建一个投资人的Agent,它能够根据当前的市场环境做出准确的投资决策;然后再创建一个软件开发的Agent,这样就可以让两个角色互相配合,软件开发的Agent复杂产品的设计和研发,投资Agent复杂做市场融资和市场开拓
15. 大模型并不只是一个用来回答问题的机器人,通过提示词,思维链,知识库和工具集的合理配合,它能够发挥人们无法想象的威力
阅读原文
2. 对大模型的使用大致分为以下几种类型,入门级别可以简单使用大模型提供的聊天窗口进行问答来解决一些问题;再厉害一点的就是学会使用一些第三方基于大模型开发的一些AI工具
3. 而在更加高级的使用场景中,就不是普通人能够完成的了,这就需要有一定的技术和开发能力才能实现
4. 比如,自己搭建一个知识库,每次使用大模型的时候都会从知识库中获取知识输入到大模型,以获得更好的结果;而再高级一点的就是使用提示词+知识库+思维链+外部工具(API,功能代码等)来实现人类才能做到的事情
5. 大模型知识来源有三个方向,第一种就是大模型本身的知识储备,这些知识来源于预训练数据;也是为什么大在不依靠任何的情况下就可以回答一些问题
6. 第二种就是知识库,简单大模型一个资料库
7. 第三种就是外部工具,天气查询的API或者股票查询接口等
8 人工智能代理(AI Agent),目前为止其并没有一个公认的定义简单来说就是让大模型能够像真正的人类一样来完成更加复杂任务的一种和方法论
9. 使用过大模型的人都知道,提示词直接影响到大模型的表现;简单的提升词虽然也能让大任务,但往往完成的不是很好,甚至会有很大问题
10. 而在专业的提升词工程中,大模型会有几个角色,一个是system(系统)角色,一个是assistant(助手)角色和user(用户)角色
11. system角色是来限定大模型定角色范围的,比如是老师,科学家,医生等,不同的角色会擅长不同的领域;而user角色就是我们使用者的角色,可以用来提出问题等;assistant角色就是大模型本身或者说是大模型回答user角色问题的“助手”
12. 而仅有提示词功能还不足以完全发挥大模型的能力,因此又有了思维链(CoT)的出现,思维链的作用就是让大模型有一个完整的思考过程,并且可以给出一些案例,来让大模型处理更加复杂的任务
13. 外部工具的作用就是让大模型可以实时获取当前的信息,比如股票的价格波动;以及能够借助外部工具自主完成任务,比如订票
14. 通过以上方式用户就可以创建一个具有某种功能的Agent,比如一个理财大师;而用户可以创建多个不同的Agent来互相协作,比如创建一个投资人的Agent,它能够根据当前的市场环境做出准确的投资决策;然后再创建一个软件开发的Agent,这样就可以让两个角色互相配合,软件开发的Agent复杂产品的设计和研发,投资Agent复杂做市场融资和市场开拓
15. 大模型并不只是一个用来回答问题的机器人,通过提示词,思维链,知识库和工具集的合理配合,它能够发挥人们无法想象的威力
CrewAI+LlamaIndex实现金融分析师Agent探索
文章概要:
1. 本文将详细阐述如何利用CrewAI与LlamaIndex框架构建金融研究助手agent,并具体应用于对Uber 2019年度风险因素的深入分析。
2. CrewAI是一个创新的开源框架,它允许用户利用智能代理的协作能力来完成复杂任务。
3. LlamaIndex是另一个用户友好的框架,它支持开发者利用自己的数据轻松构建基于LLM(大型语言模型)的应用程序。
4. 实现金融分析师Agent的步骤:构建RAG系统、封装RAG查询引擎、定义Agent角色和目标、创建任务和流程、执行Agent工作流程。
5. 研究员agent利用LlamaindexTool工具,通过多次查询Uber 2019年10K年度报告中的相关章节,特别是“风险因素”部分,逐步揭示了Uber在新市场扩张、技术创新、监管和安全等方面所面临的风险。
6. 作家agent在接收到研究员agent的分析报告后,开始撰写博客文章。文章以“Uber的艰难旅程:驾驭未来的挑战”为题,通过生动的语言和清晰的逻辑结构,向读者展示了Uber在2019年所面临的三大主要挑战。
阅读原文
2. CrewAI是一个创新的开源框架,它允许用户利用智能代理的协作能力来完成复杂任务。
3. LlamaIndex是另一个用户友好的框架,它支持开发者利用自己的数据轻松构建基于LLM(大型语言模型)的应用程序。
4. 实现金融分析师Agent的步骤:构建RAG系统、封装RAG查询引擎、定义Agent角色和目标、创建任务和流程、执行Agent工作流程。
5. 研究员agent利用LlamaindexTool工具,通过多次查询Uber 2019年10K年度报告中的相关章节,特别是“风险因素”部分,逐步揭示了Uber在新市场扩张、技术创新、监管和安全等方面所面临的风险。
6. 作家agent在接收到研究员agent的分析报告后,开始撰写博客文章。文章以“Uber的艰难旅程:驾驭未来的挑战”为题,通过生动的语言和清晰的逻辑结构,向读者展示了Uber在2019年所面临的三大主要挑战。
广告烧钱过亿,70%用户靠投流,大模型算不过成本账?
文章概要:
1. 广告投放是当下大模型白热化竞争中的一个切面,大模型厂商们希望获得足够多的用户,讲一个大模型原生应用的故事。但现实是,高额的成本、千万级的用户,都不足以支撑故事继续。
2. 大模型创业公司最激进的是月之暗面,这家公司旗下的AI智能助手Kimi因对话能力出圈,是时下最火热的大模型产品之一。通过AppGrowning查询发现,今年3月开始,Kimi每个月的广告投放都高达上千万元。
3. 广告为Kimi带来了海量的用户。今年3月20日,因为流量超过了规划,Kimi一度宕机。App Growing的数据显示,从3月到8月,短短6个月,Kimi的广告投入已经将近1.4亿元。
4. 投放带来的结果显而易见。据Similarweb统计,年初至今AI五小龙(智谱AI、MiniMax、百川智能、零一万物、月之暗面)产品的总访问量,在6个月内暴涨了963%。
5. 获客只是第一步,更重要的是留存和转化。一位国内对话类大模型产品的员工告诉Tech星球,他所负责的产品有超过85%的新增用户是靠投流获得。
6. 大模型厂商们希望更多的用户来训练“调教”产品,用户有限的使用次数显然无法让他们来实现这个目标,好处是,厂商成本也不太多。7. 成本过高导致产品无法大规模商用,几乎是所有先进科技都面临的挑战,自动驾驶如此,大模型亦如此。
8. 疯狂投广告的背后,是厂商们极大的用户焦虑。因为没有用户,意味着故事没办法继续讲下去。几乎所有的创业公司都面临的挑战是,一旦投资人热情不再,企业的生存都面临极大的风险。
9. 相比于大模型,小模型需要的参数数量和计算复杂度更少,这意味着成本更低、速度更快、更好用,适配的设备更多,缺点是在复杂计算时明显不如大模型。
阅读原文
2. 大模型创业公司最激进的是月之暗面,这家公司旗下的AI智能助手Kimi因对话能力出圈,是时下最火热的大模型产品之一。通过AppGrowning查询发现,今年3月开始,Kimi每个月的广告投放都高达上千万元。
3. 广告为Kimi带来了海量的用户。今年3月20日,因为流量超过了规划,Kimi一度宕机。App Growing的数据显示,从3月到8月,短短6个月,Kimi的广告投入已经将近1.4亿元。
4. 投放带来的结果显而易见。据Similarweb统计,年初至今AI五小龙(智谱AI、MiniMax、百川智能、零一万物、月之暗面)产品的总访问量,在6个月内暴涨了963%。
5. 获客只是第一步,更重要的是留存和转化。一位国内对话类大模型产品的员工告诉Tech星球,他所负责的产品有超过85%的新增用户是靠投流获得。
6. 大模型厂商们希望更多的用户来训练“调教”产品,用户有限的使用次数显然无法让他们来实现这个目标,好处是,厂商成本也不太多。
8. 疯狂投广告的背后,是厂商们极大的用户焦虑。因为没有用户,意味着故事没办法继续讲下去。几乎所有的创业公司都面临的挑战是,一旦投资人热情不再,企业的生存都面临极大的风险。
9. 相比于大模型,小模型需要的参数数量和计算复杂度更少,这意味着成本更低、速度更快、更好用,适配的设备更多,缺点是在复杂计算时明显不如大模型。
中国工业大模型行业发展研究报告
文章概要:
1. 工业大模型伴随着大模型技术的发展,逐渐渗透至工业,处于萌芽阶段。
2. 工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。
3. 大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很多问题值得探讨与思考。
4. 大模型落地工业的竞争要素:基础能力、模型能力、模型应用是主要竞争点,且在不同行业发展阶段,其相对竞争优势有所不同,具体而言:短期主要看大模型技术,长期则主要看模型应用深度。
5. 大小模型间的关系:大小模型间不存在替代关系,是并存且是协同融合赋能的关系。
6. 工业大模型服务走向平台化:大模型落地工业的服务平台化特征以开始显现,且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案
7. 产业数据拉通助力工业大模型能力进化的同时,对大模型落地工业的广度、深度都大有裨益。
阅读原文
2. 工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。
3. 大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很多问题值得探讨与思考。
4. 大模型落地工业的竞争要素:基础能力、模型能力、模型应用是主要竞争点,且在不同行业发展阶段,其相对竞争优势有所不同,具体而言:短期主要看大模型技术,长期则主要看模型应用深度。
5. 大小模型间的关系:大小模型间不存在替代关系,是并存且是协同融合赋能的关系。
6. 工业大模型服务走向平台化:大模型落地工业的服务平台化特征以开始显现,且逐步形成垂直行业大模型+智能体+小模型+机理模型为主的平台化调用方案
7. 产业数据拉通助力工业大模型能力进化的同时,对大模型落地工业的广度、深度都大有裨益。
中国工业大模型行业发展研究报告
文章概要:
1. 工业大模型伴随着大模型技术的发展,逐渐渗透至工业,处于萌芽阶段。
2. 大模型的本质是由一系列参数化的数学函数组成的计算系统,且是一个概率模型,其工作机制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此,当前大模型具有不可解释性和幻觉不可消除等主要特征。
3. 工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。
4. 大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很多问题值得探讨与思考。
阅读原文
2. 大模型的本质是由一系列参数化的数学函数组成的计算系统,且是一个概率模型,其工作机制是基于概率和统计推动进行的,而非真正的理解和逻辑推理,因此,当前大模型具有不可解释性和幻觉不可消除等主要特征。
3. 工业大模型玩家与工业互联网平台玩家重合度高,其成长路径目前也表现出高度相似的特征,但目前市场产品、服务、落地场景都处于探索阶段,大家都在同一起跑线。
4. 大模型落地工业的探索中,还处于非常早期的阶段,供需双方都在尝试,当然,也有很多问题值得探讨与思考。
33个AI大模型,你更钟情哪一个?
文章概要:
1. 文章介绍了33个AI大模型,包括秘塔AI、文心一言、通义千问大模型、豆包AI模型等。这些模型涵盖了语法检查、文本创作、知识问答、智能客服、多模态交互等功能特长,适用于法律文书、学术论文、广告营销、在线教育、企业办公等领域。
2. 文章还详细介绍了每个模型的前景、功能特长、适用领域和适用人群,并提供了官方网址。
阅读原文
2. 文章还详细介绍了每个模型的前景、功能特长、适用领域和适用人群,并提供了官方网址。
苏商银行承办金融大模型创新与应用研讨会
文章概要:
1. 9月25由江苏省数字金融协会主办苏商银行承办的“金融数据大模型创新与应用”在南京召开。
2. 会议深入学习贯彻习近平总书记关于发展人工智能的重要论述和对江苏重要讲话指示精神,深入探讨人工智能大模型发展趋势以及在金融领域,为推动江苏省人工智能大模型发展蓄势赋能。
3. 会议认为,随着数字化转型加速,金融业面临着巨大的机遇与挑战,模型技术应用可有效提升决策效率、风险控制和客户服务质量。与此同时,新技术运用要确保符合数据安全和科技伦理要求。
4. 研讨会上,江苏省数字金融发布2024年金融AI技术应用跟踪报告》,报告提出,大模型技术已在智能营销、客服、运营、投研、信贷、风控、办公及研发等多个应用实施,有效提升了金融机构的决策效率和服务质量同时,应加强监管和安全策略,确保客户数据安全和服务的绝对可靠性。
5. 在主题分享环节,参会单位了各自在数字化转型中的创新成果和实践经验。
6. 在自由发言环节,与会嘉宾针对“金融大模型在推动数字金融中的创新应用”主题,进行深入交流和讨论,探讨了国产化算力的替代方案、大模型投入与成本效益分析、具体场景下用户粘性的策略、选择大模型微调与R技术的,以及大模型在信创环境下的适配性等问题。
7. 近年来,苏商银行坚持“科技驱动的O2O银行”定位,狠抓数据能力和科技能力建设,积极规划布局大模型技术研发应用,注重“数据、算法、系统”三驾马车协同驱动,今年7月获批“南京市金融大模型工程技术研究中心”,已申请大模型发明专利,推动大模型在智能运营、智能营销、智能风控、智能研发等多个场景应用,实现数字技术对金融服务的创新赋能。
阅读原文
2. 会议深入学习贯彻习近平总书记关于发展人工智能的重要论述和对江苏重要讲话指示精神,深入探讨人工智能大模型发展趋势以及在金融领域,为推动江苏省人工智能大模型发展蓄势赋能。
3. 会议认为,随着数字化转型加速,金融业面临着巨大的机遇与挑战,模型技术应用可有效提升决策效率、风险控制和客户服务质量。与此同时,新技术运用要确保符合数据安全和科技伦理要求。
4. 研讨会上,江苏省数字金融发布2024年金融AI技术应用跟踪报告》,报告提出,大模型技术已在智能营销、客服、运营、投研、信贷、风控、办公及研发等多个应用实施,有效提升了金融机构的决策效率和服务质量同时,应加强监管和安全策略,确保客户数据安全和服务的绝对可靠性。
5. 在主题分享环节,参会单位了各自在数字化转型中的创新成果和实践经验。
6. 在自由发言环节,与会嘉宾针对“金融大模型在推动数字金融中的创新应用”主题,进行深入交流和讨论,探讨了国产化算力的替代方案、大模型投入与成本效益分析、具体场景下用户粘性的策略、选择大模型微调与R技术的,以及大模型在信创环境下的适配性等问题。
7. 近年来,苏商银行坚持“科技驱动的O2O银行”定位,狠抓数据能力和科技能力建设,积极规划布局大模型技术研发应用,注重“数据、算法、系统”三驾马车协同驱动,今年7月获批“南京市金融大模型工程技术研究中心”,已申请大模型发明专利,推动大模型在智能运营、智能营销、智能风控、智能研发等多个场景应用,实现数字技术对金融服务的创新赋能。
百度谢广军:百模大战和价格战之后,大模型下一个战场在工具平台
文章概要:
1. AI大模型对生产生活的影响深远,企业和模型厂商共同迭代,大模型的下一个战场在工具平台上
2. 谢广军将过去一年半多的时间划分为三个阶段:百模大战时期、应用场景探索时期、深入场景和深度融合应用时期
3. 百度千帆大模型平台顺应阶段性变化,不断升级,从模型训练到全栈开发,为企业提供生成式AI生产以及应用全流程开发工具链
4. 千帆大模型平台3.0提供企业级RAG和企业级Agent的开发工具,从检索效果、检索性能、存储扩展、调配灵活性四方面对企业级检索增强生成(RAG)进行了全面升级
5. 大模型的落地需要重视在行业场景当中的能力增强和应用,用户会挑选业界领先的伙伴合作,借助生态共同成长
6. 大模型产业落地的未来趋势是模型推理成本的降低,价格会持续下降,同时要重视推理架构和自身成本的优化与控制
7. 百度千帆大模型平台始终与一线需求共同迭代,最初的提供大模型调用和精调服务,到如今面向生产力场景的企业级一体化服务平台
阅读原文
2. 谢广军将过去一年半多的时间划分为三个阶段:百模大战时期、应用场景探索时期、深入场景和深度融合应用时期
3. 百度千帆大模型平台顺应阶段性变化,不断升级,从模型训练到全栈开发,为企业提供生成式AI生产以及应用全流程开发工具链
4. 千帆大模型平台3.0提供企业级RAG和企业级Agent的开发工具,从检索效果、检索性能、存储扩展、调配灵活性四方面对企业级检索增强生成(RAG)进行了全面升级
5. 大模型的落地需要重视在行业场景当中的能力增强和应用,用户会挑选业界领先的伙伴合作,借助生态共同成长
6. 大模型产业落地的未来趋势是模型推理成本的降低,价格会持续下降,同时要重视推理架构和自身成本的优化与控制
7. 百度千帆大模型平台始终与一线需求共同迭代,最初的提供大模型调用和精调服务,到如今面向生产力场景的企业级一体化服务平台
MOE模型的过去、现状和未来是怎样的?
文章概要:
1. 文章主要讨论了MOE模型的现状和未来。现状方面,MoE目前的架构基本集中在于将原先GPT每层的FFN复制多份作为n个expert,并增加一个router,用来计算每个token对应到哪个FFN。算法层面上,对现阶段有指导价值的工作是围绕这个trade off的Pareto曲线。工程层面上,主要是需要实现更高效的MoE训练/推理基建。未来方面,作者期待有发展的点有两个,一个是MoE的激活参数变化在哪些方面有,另一个是目前MoE架构的稳定性问题。
阅读原文
孙蕾蕾 | 视频生成模型在视听内容生产中的研发与应用——以央视听媒体大模型为例
文章概要:
1. 以ChatGPT为标志,大模型如今已进入加速发展的第二年。当下,大模型技术已覆盖到传媒生产力的多个细分领域,比想象中更快速地应用到视听内容生产中,并不断推进媒体的融合发展。对于广电主流媒体而言,如何抓住生成式人工智能崛起的契机,借助AI赋能传媒业务,让新质生产力成为内容产品高质量发展的最大增量,已成为一个重要的现实议题。
2. 总台运用AI赋能视听内容生产的创新实践,包括利用人工智能模拟人声完成配音、运用AI技术创作词曲并演唱、使用基于AI的3D降噪和超分辨率等技术对视频画面进行修复、推出多部AI作品等。
3. 央视听媒体大模型的技术架构与功能,包括视频生成大模型“书生·筑梦”、AnimateDiff文生视频框架在内的多项先进技术,共同构成了央视听媒体大模型的核心。该模型不仅集成了上海AI实验室书生通用大模型体系的语言处理和知识构建能力,还具备超强的视频理解能力和视听媒体问答能力,可通过逐步呈现的视觉元素,理解并分析视频。
4. 关于视频生成模型研发与应用的思考,包括坚持原创性研究是推动我国发展自主通用人工智能的根本所在、要努力打造具有中国文化特色的文生视频大模型、做好平台建设,深化推进“产学研用”一体化,持续优化安全可靠的AIGC技术平台等。
5. 将文生视频大模型应用于内容生产的发展前景广阔,央视的一系列AI实践也为广电视听行业提供了宝贵经验。央视听大模型不仅提高了创作效率,拓展了创意空间,还带来人机交互方式的变革。它借助强大的对话能力和易用的互动模式,将人机互动推至高度,为AI技术在视听内容生产领域的应用树立了新的标杆。
阅读原文
2. 总台运用AI赋能视听内容生产的创新实践,包括利用人工智能模拟人声完成配音、运用AI技术创作词曲并演唱、使用基于AI的3D降噪和超分辨率等技术对视频画面进行修复、推出多部AI作品等。
3. 央视听媒体大模型的技术架构与功能,包括视频生成大模型“书生·筑梦”、AnimateDiff文生视频框架在内的多项先进技术,共同构成了央视听媒体大模型的核心。该模型不仅集成了上海AI实验室书生通用大模型体系的语言处理和知识构建能力,还具备超强的视频理解能力和视听媒体问答能力,可通过逐步呈现的视觉元素,理解并分析视频。
4. 关于视频生成模型研发与应用的思考,包括坚持原创性研究是推动我国发展自主通用人工智能的根本所在、要努力打造具有中国文化特色的文生视频大模型、做好平台建设,深化推进“产学研用”一体化,持续优化安全可靠的AIGC技术平台等。
5. 将文生视频大模型应用于内容生产的发展前景广阔,央视的一系列AI实践也为广电视听行业提供了宝贵经验。央视听大模型不仅提高了创作效率,拓展了创意空间,还带来人机交互方式的变革。它借助强大的对话能力和易用的互动模式,将人机互动推至高度,为AI技术在视听内容生产领域的应用树立了新的标杆。
万字长文带你全面解读视觉大模型
文章概要:
1. 文章主要介绍了基础模型的概念和发展背景,包括其在视觉领域的应用和分类。文章还讨论了不同类型的基础模型,如基于文本提示、视觉提示和异构模态的模型,并介绍了它们的架构、训练目标和应用。
2. 文章详细介绍了基础模型的架构,包括双编码器架构、融合架构、编码器-解码器架构和自适应LLM架构。文章还讨论了不同的训练目标,如对比式学习和生成式学习,并介绍了它们的原理和应用。
3. 文章介绍了基础模型的预训练和微调,包括预训练数据集、微调机制和常见的提示模式。文章还讨论了基础模型在不同任务上的应用,如开放世界物体检测、视觉定位和指导调整。
4. 文章介绍了基于文本提示的基础模型,包括对比学习、生成学习和混合方法。文章还讨论了这些方法的原理和应用,并介绍了一些典型的模型,如CLIP、ALIGN、FILIP、FLIP、MaskCLIP、EVA、RegionCLIP、CRIS、Grounding DINO、OpenSeg和GroupViT。
5. 文章介绍了基于视觉提示的基础模型,包括SAM、SEEM、CLIPSeg、SegGPT和MedSAM。文章还讨论了这些模型的原理和应用,并介绍了一些改进和应用,如AutoSAM、Learnable Ophthalmology SAM、3DSAM-adapter、Medical SAM Adapter、DeSAM、MedLAM、SAMM、TAM、SAM-Track、SAM-PT和SAM-DA。
6. 文章介绍了综合性基础模型,包括基于异构架构的基础视觉模型和基于代理的基础视觉模型。文章还讨论了这些模型的原理和应用,并介绍了一些典型的模型,CLIP2Video、AudioCLIP、ImageBind、MACAW-LLM、COSA、Valley、Palm-E、ViMA、MineDojo和LM-Nav。
阅读原文
2. 文章详细介绍了基础模型的架构,包括双编码器架构、融合架构、编码器-解码器架构和自适应LLM架构。文章还讨论了不同的训练目标,如对比式学习和生成式学习,并介绍了它们的原理和应用。
3. 文章介绍了基础模型的预训练和微调,包括预训练数据集、微调机制和常见的提示模式。文章还讨论了基础模型在不同任务上的应用,如开放世界物体检测、视觉定位和指导调整。
4. 文章介绍了基于文本提示的基础模型,包括对比学习、生成学习和混合方法。文章还讨论了这些方法的原理和应用,并介绍了一些典型的模型,如CLIP、ALIGN、FILIP、FLIP、MaskCLIP、EVA、RegionCLIP、CRIS、Grounding DINO、OpenSeg和GroupViT。
5. 文章介绍了基于视觉提示的基础模型,包括SAM、SEEM、CLIPSeg、SegGPT和MedSAM。文章还讨论了这些模型的原理和应用,并介绍了一些改进和应用,如AutoSAM、Learnable Ophthalmology SAM、3DSAM-adapter、Medical SAM Adapter、DeSAM、MedLAM、SAMM、TAM、SAM-Track、SAM-PT和SAM-DA。
6. 文章介绍了综合性基础模型,包括基于异构架构的基础视觉模型和基于代理的基础视觉模型。文章还讨论了这些模型的原理和应用,并介绍了一些典型的模型,CLIP2Video、AudioCLIP、ImageBind、MACAW-LLM、COSA、Valley、Palm-E、ViMA、MineDojo和LM-Nav。
颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature
文章概要:
1. 研究表明大参数模型不会承认它们的“无知”,而更倾向于生成错误答案,人们并不善于发现错误
2. 研究人员从人类用户与LLM互动的角度,了难度一致性、任务回避和提示稳定性三个核心交织元素对LLM可靠性的
3. 研究发现,模型在面对复杂任务时表现显著提升,但在简单任务上的错误率却有明显上升
4. 优化后模型回避行为与错误率之间的关系,模型在无法正确回答问题时,选择不作答或给出不符合要求的回应
5. 研究分析了模型对提示词的敏感性,模型规模的,模型对不同自然语言表述的敏感度有所提高,能更好地应对措辞上的微调
6. 研究发现,当用户的难度预期与的输出结果不一致时,对于简单任务,模型和用户的错误监督都会增加,且人类监督无法弥补这些问题
7. 尽管该研究在揭示LLM的提示敏感性、扩展与优化对性能的影响等方面取得了重要成果,但仍存在一些局限性
阅读原文
2. 研究人员从人类用户与LLM互动的角度,了难度一致性、任务回避和提示稳定性三个核心交织元素对LLM可靠性的
3. 研究发现,模型在面对复杂任务时表现显著提升,但在简单任务上的错误率却有明显上升
4. 优化后模型回避行为与错误率之间的关系,模型在无法正确回答问题时,选择不作答或给出不符合要求的回应
5. 研究分析了模型对提示词的敏感性,模型规模的,模型对不同自然语言表述的敏感度有所提高,能更好地应对措辞上的微调
6. 研究发现,当用户的难度预期与的输出结果不一致时,对于简单任务,模型和用户的错误监督都会增加,且人类监督无法弥补这些问题
7. 尽管该研究在揭示LLM的提示敏感性、扩展与优化对性能的影响等方面取得了重要成果,但仍存在一些局限性
大语言模型的知识冲突:成因、根源与展望
文章概要:
1. 大语言模型的知识冲突是指其内部固化的参数知识与来自上下文环境的外部获取知识之间存在的差异、矛盾和冲突。
2. 知识冲突的成因包括训练数据的局限性、模型问题,以及外部信息缺陷三个方面。
3. 知识冲突的解决方案包括领域事实增强、提示工程和模型结构层面的改进。
4. 未来研究方向包括建立可靠的评估框架、基于大模型的智能体研究,以及多模态背景下的知识冲突处理。
阅读原文
2. 知识冲突的成因包括训练数据的局限性、模型问题,以及外部信息缺陷三个方面。
3. 知识冲突的解决方案包括领域事实增强、提示工程和模型结构层面的改进。
4. 未来研究方向包括建立可靠的评估框架、基于大模型的智能体研究,以及多模态背景下的知识冲突处理。
国产大模型做翻译,你选对模型了吗?
文章概要:
1. 截至2024年8月,我国已有180多个能为公众提供服务的生成式人工智能赋能大模型上线,语言服务行业出现了多种语言服务人才岗位。
2. 本文选取国内十款大语言模型,借助Python语言及国外大模型ChatGPT对它们的译文结果进行质量评估,以小说《追风筝的人》中的部分段落为例进行测试。
3. 通过算法实现了译文文本间的语义相似度计算,采用了基于词向量的余弦相似度方法,针对参考译文和待评估译文,引入了基于Sentence-BERT的语义相似度计算。
4. 从余弦相似度结果来看,大部分模型的余弦相似度都保持在0.97以上,说明这些模型的翻译质量都相对较高,与参考译文在语义上非常接近。
5. 从表现最佳的模型来看,字节豆包以0.9836的余弦相似度表现最佳,说明其翻译结果与参考译文的语义最为接近。
6. 从表现中等的模型来看,多数模型的余弦相似度介于0.9760到0.9790之间,包括清华智谱清言、通义千问、腾讯元宝、天工AI(昆仑万维)等。
7. 从表现相对较差的模型来看,讯飞星火(0.9728)和商汤商量(0.9723)是表现相对较低的模型。
8. 结合评估和Cosine Similarity结果,字节豆包、百度文心一言和Kimi(月之暗面)表现出色,特别是在语义准确性和美学表达方面,适合用于对翻译质量要求较高的任务。
9. 腾讯元宝、通义千问和天工AI表现稳定,语义传达和美学处理均衡,是适合处理复杂
10 讯飞星火和汤商量在翻译中加入了不必要的细节,影响了整体连贯性和美感,需要进一步优化翻译细节和语篇逻辑。
阅读原文
2. 本文选取国内十款大语言模型,借助Python语言及国外大模型ChatGPT对它们的译文结果进行质量评估,以小说《追风筝的人》中的部分段落为例进行测试。
3. 通过算法实现了译文文本间的语义相似度计算,采用了基于词向量的余弦相似度方法,针对参考译文和待评估译文,引入了基于Sentence-BERT的语义相似度计算。
4. 从余弦相似度结果来看,大部分模型的余弦相似度都保持在0.97以上,说明这些模型的翻译质量都相对较高,与参考译文在语义上非常接近。
5. 从表现最佳的模型来看,字节豆包以0.9836的余弦相似度表现最佳,说明其翻译结果与参考译文的语义最为接近。
6. 从表现中等的模型来看,多数模型的余弦相似度介于0.9760到0.9790之间,包括清华智谱清言、通义千问、腾讯元宝、天工AI(昆仑万维)等。
7. 从表现相对较差的模型来看,讯飞星火(0.9728)和商汤商量(0.9723)是表现相对较低的模型。
8. 结合评估和Cosine Similarity结果,字节豆包、百度文心一言和Kimi(月之暗面)表现出色,特别是在语义准确性和美学表达方面,适合用于对翻译质量要求较高的任务。
9. 腾讯元宝、通义千问和天工AI表现稳定,语义传达和美学处理均衡,是适合处理复杂
10 讯飞星火和汤商量在翻译中加入了不必要的细节,影响了整体连贯性和美感,需要进一步优化翻译细节和语篇逻辑。