笃志好“学”,行稳“职”远 | “鸿图”大讲堂系列之“大模型技术的发展、实践及挑战”活动回顾
文章概要:
1. 2024年10月30日晚,美团大模型算法工程师陈博润老师为东南大学研究生同学们带来了题为“大模型技术的发展、实践及挑战”的讲座分享
2. 陈老师首先介绍了大模型的项目背景,强调了其在各个领域的广泛应用潜力
3. 随后,陈老师介绍了美团的研发目标及其在大模型领域的关键技术
4. 接着,陈老师了大模型评测所面临的困难与挑战
5. 在提问互动环节,积极与陈老师进行交流,表现出对大模型技术及其应用的浓厚兴趣
6. 美团的HR也来到了现场,为同学们介绍了今年美团秋招计划和不同的岗位需求
阅读原文
2. 陈老师首先介绍了大模型的项目背景,强调了其在各个领域的广泛应用潜力
3. 随后,陈老师介绍了美团的研发目标及其在大模型领域的关键技术
4. 接着,陈老师了大模型评测所面临的困难与挑战
5. 在提问互动环节,积极与陈老师进行交流,表现出对大模型技术及其应用的浓厚兴趣
6. 美团的HR也来到了现场,为同学们介绍了今年美团秋招计划和不同的岗位需求
用「聚合数据」就够了!天聚地合助力科大讯飞高效训练大模型
文章概要:
1. 当ChatGPT所带来热的温度逐渐下降,人们开始质疑它的短期商业价值以及AI模型解决问题的场景能否灵活运用。对于AI大模型企业来说,如何更高效更低成本训练好大模型产品是问题的本质。
2 天聚地业务模型需求的“数据要素”,满足了科大讯飞对多样化、高质量数据的需求,还帮助其了数据获取的成本和训练br 天聚合API数据交易平台为科大讯飞种高效、低成本地获取结构化的数据服务,实现实时调用动态,让更快、更稳更安全的数据带动大模型更上一层楼。5. 聚合数据平台为讯飞的大模型训练提供了全面的数据支持平台通过收集需求数据,并对进行严格的清洗和标准化处理,数据准确可靠。实时更新系统让大数据始终最新保持时效性。同时,技术设计保证了数据的快速响应,模型训练更高效,更顺畅。在数据流通全过程,为了确保数据合规,加密隐私一个都不能少。
阅读原文
2 天聚地业务模型需求的“数据要素”,满足了科大讯飞对多样化、高质量数据的需求,还帮助其了数据获取的成本和训练br 天聚合API数据交易平台为科大讯飞种高效、低成本地获取结构化的数据服务,实现实时调用动态,让更快、更稳更安全的数据带动大模型更上一层楼。
AI+大模型联手出击!多通道蛋白质相互作用位点预测新方法MIPPIS重磅发布
文章概要:
1. 蛋白质之间的相互作用是生命活动中最基本也是最重要的生物学过程之一,准确预测蛋白质相互作用位点对于理解疾病机制和药物开发具有重要意义。
2. 研究团队提出了一种创新的多通道蛋白质相互作用位点预测网络MIPPIS,主要包含两个步骤:氨基酸特征嵌入和特征学习与预测。
3. MIPPIS在多个评估指标上优于现有方法,且具有良好的鲁棒性。
4. MIPPIS的成功开发为蛋白质相互作用位点的预测提供了一种解决方案。
阅读原文
2. 研究团队提出了一种创新的多通道蛋白质相互作用位点预测网络MIPPIS,主要包含两个步骤:氨基酸特征嵌入和特征学习与预测。
3. MIPPIS在多个评估指标上优于现有方法,且具有良好的鲁棒性。
4. MIPPIS的成功开发为蛋白质相互作用位点的预测提供了一种解决方案。
AI赋能教育时代:讯飞星火、通义千问、天工AI、豆包AI、GPT-4O、商汤AI、文心一言8个AI大模型应用(带链接)
文章概要:
1. 随着科技不断向前迈进,人工智能已我们的日常生活里占据关键地位,在教育领域,人工智能出巨大的赋能潜力>. 本文将详细剖析文心一言、星火、义天工、百川AI、豆包AI、GPT-4、商汤AI这八个AI模型功能特点优势所在,并给出它们的链接
3. 文心一言属于大规模语言,拥有强大的自然语言本领,可进行文本创作、翻译、、辅助写作等多项任务>. 讯飞星火主要用于语音识别与合成,同时还支持多语种翻译、智能对话以及教育测评等
5. 通义问是一款综合型AI大模型,多模态数据处理、智能问答以及个性化学习路径推荐教育应用场景
6. 天工AI在图像识别、自然语言处理以及机器学习领域均有出色表现,应用于评估和校园管理
7. 百川AI主要在智能客服、图谱构建以及教育资源推荐等方面发挥作用>8. 豆包AI专注于情感计算与人机交互,在教育心理健康辅导和智能辅导员方面独具优势>9. GPT-4O是新一代大规模语言模型,以卓越的文本生成和深度理解能力著称>10. 商汤AI在计算机视觉和深度学习方面优势显著,应用于智能监控、教育和虚拟实验室
1. 上述八个AI大模型在教育领域的应用,极大地了效率和质量,个性化、智能化教育提供了支撑。各个大模型的功能和特长各有侧重,教育工作者可根据实际需求最为合适的AI工具,更好地教育赋能
阅读原文
3. 文心一言属于大规模语言,拥有强大的自然语言本领,可进行文本创作、翻译、、辅助写作等多项任务>. 讯飞星火主要用于语音识别与合成,同时还支持多语种翻译、智能对话以及教育测评等
5. 通义问是一款综合型AI大模型,多模态数据处理、智能问答以及个性化学习路径推荐教育应用场景
6. 天工AI在图像识别、自然语言处理以及机器学习领域均有出色表现,应用于评估和校园管理
7. 百川AI主要在智能客服、图谱构建以及教育资源推荐等方面发挥作用>8. 豆包AI专注于情感计算与人机交互,在教育心理健康辅导和智能辅导员方面独具优势>9. GPT-4O是新一代大规模语言模型,以卓越的文本生成和深度理解能力著称>10. 商汤AI在计算机视觉和深度学习方面优势显著,应用于智能监控、教育和虚拟实验室
1. 上述八个AI大模型在教育领域的应用,极大地了效率和质量,个性化、智能化教育提供了支撑。各个大模型的功能和特长各有侧重,教育工作者可根据实际需求最为合适的AI工具,更好地教育赋能
ChatGPT4o、o1 谁才是最佳大模型?
文章概要:
1. ChatGPT模型概述:介绍了OpenAI提供的各个版本ChatGPT模型,GPT-3.5、GPT-、GPT- Turbo、GPT Mini和O等,每个模型在速度、性能、价格等各具特色。
2. 如何选择合适GPT模型:根据任务复杂度、响应速度和预算控制等因素选择合适ChatGPT模型。
3.AI更新细节:介绍了OpenAI几次重要的更新,包括GPT-4 Turbo的发布、消息任务定制、s自定义功能等。
4. GPTs定制化的ChatGPT:介绍了GPTs的功能,包括任务定制、行为引导和集成外部等。
. 总结:无论你是普通用户、内容创作者管理者,还是,OpenAI提供的多种ChatGPT模型都可以满足你的不同需求。
阅读原文
2. 如何选择合适GPT模型:根据任务复杂度、响应速度和预算控制等因素选择合适ChatGPT模型。
3.AI更新细节:介绍了OpenAI几次重要的更新,包括GPT-4 Turbo的发布、消息任务定制、s自定义功能等。
4. GPTs定制化的ChatGPT:介绍了GPTs的功能,包括任务定制、行为引导和集成外部等。
. 总结:无论你是普通用户、内容创作者管理者,还是,OpenAI提供的多种ChatGPT模型都可以满足你的不同需求。
智能政策 | 广州市天河区出台多项政策措施,以促人工智能行业大模型产业高质量发展
文章概要:
1. 广州市天河区科技工业和信息化发布通知,出台多项政策措施以促进大模型产业发展。
2. 这些政策措施包括支持创新联合体建设、推进开源技术发展、打造公共智能算力中心、强化算力供给、激励智能算法研发、完善数据要素体系等。
3. 措施还包括附则,对扶持对象、来源、奖补原则、不予支持情形、涉税支出、申报方式等进行了规定。
4. 该措施自公布之日起30日后施行,三年。
阅读原文
2. 这些政策措施包括支持创新联合体建设、推进开源技术发展、打造公共智能算力中心、强化算力供给、激励智能算法研发、完善数据要素体系等。
3. 措施还包括附则,对扶持对象、来源、奖补原则、不予支持情形、涉税支出、申报方式等进行了规定。
4. 该措施自公布之日起30日后施行,三年。
大模型的分类
文章概要:
1. 按任务类型分类:生成式模型、判别式模型、混合模型
2. 按数据模态分类:单模态模型多模态模型
3. 按训练方法分类:预训练模型、从零训练模型、迁移学习模型
4. 按应用领域分类:自然语言、计算机视觉模型、语音处理模型
. 按模型架构分类:Transformer架构、卷积神经网络、循环神经网络和长短期记忆网络
6. 按通用程度分类:通用大模型、行业大模型、垂直大模型
阅读原文
2. 按数据模态分类:单模态模型多模态模型
3. 按训练方法分类:预训练模型、从零训练模型、迁移学习模型
4. 按应用领域分类:自然语言、计算机视觉模型、语音处理模型
. 按模型架构分类:Transformer架构、卷积神经网络、循环神经网络和长短期记忆网络
6. 按通用程度分类:通用大模型、行业大模型、垂直大模型
大语言模型安全,到底是什么的安全
文章概要:
1. AI安全即人工智能安全,涉及在人工智能系统的开发、部署和使用全过程中,采取的一系列措施以保护系统免受攻击、侵入、干扰和非法使用,确保稳定可靠的运行
2. LLM安全,即大型语言模型安全,是指在大型语言模型的开发、部署和使用过程中,采取必要的措施来保护模型免受攻击、侵入、干扰和非法使用,确保其稳定可靠运行
3. CyberSecEval 3是Meta的Purple Llama项目的一部分,提供了一套全面的安全基准测试,用以评估LLM在网络安全风险和能力方面的表现
4. 结合CyberSecEval 3,LLM安全的测试内容涵盖了指令劫持测试、角色扮演测试、反向诱导测试、网络安全测试、训练数据泄露测试、个人隐私泄露测试、不安全代码建议测试、代码执行能力测试、提示注入测试、越狱测试、恶意代码生成测试
5. AI应用自身的安全涉及到从开发到部署的整个供应链,包括但不限于代码库、依赖项、API接口以及与外部系统的交互
6. 针对AI应用自身的安全,测试内容应包括但不限于认证和授权、数据加密、输入验证、输出编码、错误处理、日志和监控、API安全、依赖项安全、代码审计
7. AI安全是一个多维度的问题,它要求我们在技术发展的同时,不断更新和加强安全措施
阅读原文
2. LLM安全,即大型语言模型安全,是指在大型语言模型的开发、部署和使用过程中,采取必要的措施来保护模型免受攻击、侵入、干扰和非法使用,确保其稳定可靠运行
3. CyberSecEval 3是Meta的Purple Llama项目的一部分,提供了一套全面的安全基准测试,用以评估LLM在网络安全风险和能力方面的表现
4. 结合CyberSecEval 3,LLM安全的测试内容涵盖了指令劫持测试、角色扮演测试、反向诱导测试、网络安全测试、训练数据泄露测试、个人隐私泄露测试、不安全代码建议测试、代码执行能力测试、提示注入测试、越狱测试、恶意代码生成测试
5. AI应用自身的安全涉及到从开发到部署的整个供应链,包括但不限于代码库、依赖项、API接口以及与外部系统的交互
6. 针对AI应用自身的安全,测试内容应包括但不限于认证和授权、数据加密、输入验证、输出编码、错误处理、日志和监控、API安全、依赖项安全、代码审计
7. AI安全是一个多维度的问题,它要求我们在技术发展的同时,不断更新和加强安全措施
速度快,价格低,效果稳!即梦AI视频模型2.0上线,再放大招?
文章概要:
1. 即梦AI全量上线视频模型S2.0,速度快效果稳,定价实惠,还有免费额度提供,近期或有更大更新动作。
2. 即梦AI在视频分辨率、画质清晰度、流畅性效果等维度均进一步提升,能够生成幅度更大的动作,且动作效果更加自然流畅,细节,还可以生成生动的微表情、自然的服饰头发等细节。
3. 即梦AI在动态效果呈现上的表现实力,使得画面在视觉上充满了动感和活力。同时,在真实人物场景中,发丝随风飘动,精致、细腻,呈现出不同的形态和角度,使视频更具质感。
4. 即梦AI在文化底蕴和创意构思方面均展现出了不错的水平,瞬间心有灵犀地get到了小朋友托腮动作和《呐喊》的相似性,并在此基础上“借题发挥”,使得案例不仅复刻了名画《呐喊》,也在视觉上呈现出新鲜感和趣味性。
5. 即梦AI在捕捉和呈现人物情感方面的技术提升,使得生成的小孩哥在情感表达上更加纯真、自然。
6. 即梦AI在画面质感维度一如既往稳定发挥:女人的黑色长卷发在阳光照耀下呈现出细腻的光泽,既真实又富有艺术性。绿皮火车的质感同样出色,车窗上的斑驳水渍被细腻地呈现出来,细节感、真实感和电影感max。
7. 即梦AI在捕捉和呈现人物情感方面展现出了出色的“控场力”。从色彩上来看,画面色彩丰富和谐,从女人身上的服饰到绿皮火车的颜色,再到窗外的远景,都形成了和谐的色彩搭配,不仅增强了画面的视觉冲击力,也使得整个场景更加生动、立体。
8. 即梦AI的高速生成与优质画质,离不开其背后的“技术底座”,即豆包视频生成模型依托字节跳动自主研发的DiT(Dynamic Integration Transformer)架构。
9. 即梦定价同样实惠,更具“质价比”——用户每天免费生成机会,免费额度用尽后,可选择付费使用,且费用比市面其他同类产品更低。
10. 即梦在应用上更易上手,符合实操场景,正成为艺术家想象力变现的“创意搭子”。
11. 即梦正不断扩展想象力边界,成为艺术家的灵感搭子。
12. 即梦也受到了影视行业的认可。
13. 即梦AI的风靡,也正推动AI普惠下的全民AI热。
14. 即梦为创作者提供了探索全新未来世界的有力工具,希望能够成为创作者们最喜欢和信赖的生成式AI工具及内容平台,为所有人提供有趣的、快乐的、自由的创作,以更广阔的创作空间和灵感启发,帮助用户打开连接现实世界和想象世界的大门。
15. 即梦的升级将进一步激发全民AI创作热情,让更多金点子落地,以热爱为名,共同拥抱AIG的星辰大海。
阅读原文
2. 即梦AI在视频分辨率、画质清晰度、流畅性效果等维度均进一步提升,能够生成幅度更大的动作,且动作效果更加自然流畅,细节,还可以生成生动的微表情、自然的服饰头发等细节。
3. 即梦AI在动态效果呈现上的表现实力,使得画面在视觉上充满了动感和活力。同时,在真实人物场景中,发丝随风飘动,精致、细腻,呈现出不同的形态和角度,使视频更具质感。
4. 即梦AI在文化底蕴和创意构思方面均展现出了不错的水平,瞬间心有灵犀地get到了小朋友托腮动作和《呐喊》的相似性,并在此基础上“借题发挥”,使得案例不仅复刻了名画《呐喊》,也在视觉上呈现出新鲜感和趣味性。
5. 即梦AI在捕捉和呈现人物情感方面的技术提升,使得生成的小孩哥在情感表达上更加纯真、自然。
6. 即梦AI在画面质感维度一如既往稳定发挥:女人的黑色长卷发在阳光照耀下呈现出细腻的光泽,既真实又富有艺术性。绿皮火车的质感同样出色,车窗上的斑驳水渍被细腻地呈现出来,细节感、真实感和电影感max。
7. 即梦AI在捕捉和呈现人物情感方面展现出了出色的“控场力”。从色彩上来看,画面色彩丰富和谐,从女人身上的服饰到绿皮火车的颜色,再到窗外的远景,都形成了和谐的色彩搭配,不仅增强了画面的视觉冲击力,也使得整个场景更加生动、立体。
8. 即梦AI的高速生成与优质画质,离不开其背后的“技术底座”,即豆包视频生成模型依托字节跳动自主研发的DiT(Dynamic Integration Transformer)架构。
9. 即梦定价同样实惠,更具“质价比”——用户每天免费生成机会,免费额度用尽后,可选择付费使用,且费用比市面其他同类产品更低。
10. 即梦在应用上更易上手,符合实操场景,正成为艺术家想象力变现的“创意搭子”。
11. 即梦正不断扩展想象力边界,成为艺术家的灵感搭子。
12. 即梦也受到了影视行业的认可。
13. 即梦AI的风靡,也正推动AI普惠下的全民AI热。
14. 即梦为创作者提供了探索全新未来世界的有力工具,希望能够成为创作者们最喜欢和信赖的生成式AI工具及内容平台,为所有人提供有趣的、快乐的、自由的创作,以更广阔的创作空间和灵感启发,帮助用户打开连接现实世界和想象世界的大门。
15. 即梦的升级将进一步激发全民AI创作热情,让更多金点子落地,以热爱为名,共同拥抱AIG的星辰大海。
【CAC2024平行会议】“教育大模型技术前沿发展与挑战会议”圆满举行
文章概要:
1. 11月1日下午“教育大模型技术前沿发展与挑战”平行会议青岛世博城国际会议中心顺利召开。br> 2.万良担任会议主席发表致辞,指出智慧教育正引领着教育领域的深刻变革。
3. 北京师范大学教授李艳燕作“人工智能时代的创新型人才”主题报告,提出了以生成式为基础的教育创新实践路径。
4. 重庆邮电大学研究员熊余作“大模型的发展现状与未来展望探析”主题报告,强调要审视大模型的风险挑战。<> 5. 北京师范大学教授郑勤华作“AI支持下学生综合素质评价的创新”主题报告,强调要依托人工智能等信息技术,构建起表现性评价能力。br> 6. 华中师范大学教授孙建文“教育大模型塔式构建法创新探索”基于分析经典教育理论“经验之塔”,探索性提出教育大模型塔式构建法。
7. 浙江大学研究员罗亚威“智能体赋能智慧教育——关键与探索”系统性分析现有挑战,并提出创新解决方案。
8.教育学院教授于晓雅作“-AI创新教与学场景的与”主题报告,深入探讨了式人工智能Gen-AI为教育领域带来的学习方式的深刻变革。
9. 本次会议深入贯彻落实国家人工智能战略和创新驱动发展战略,推进教育数字化转型与智能化升级。
阅读原文
3. 北京师范大学教授李艳燕作“人工智能时代的创新型人才”主题报告,提出了以生成式为基础的教育创新实践路径。
4. 重庆邮电大学研究员熊余作“大模型的发展现状与未来展望探析”主题报告,强调要审视大模型的风险挑战。<> 5. 北京师范大学教授郑勤华作“AI支持下学生综合素质评价的创新”主题报告,强调要依托人工智能等信息技术,构建起表现性评价能力。br> 6. 华中师范大学教授孙建文“教育大模型塔式构建法创新探索”基于分析经典教育理论“经验之塔”,探索性提出教育大模型塔式构建法。
7. 浙江大学研究员罗亚威“智能体赋能智慧教育——关键与探索”系统性分析现有挑战,并提出创新解决方案。
8.教育学院教授于晓雅作“-AI创新教与学场景的与”主题报告,深入探讨了式人工智能Gen-AI为教育领域带来的学习方式的深刻变革。
9. 本次会议深入贯彻落实国家人工智能战略和创新驱动发展战略,推进教育数字化转型与智能化升级。
【CAC2024平行会议】“教育大模型技术前沿发展与挑战会议”圆满举行
文章概要:
1. 11月1下午,“教育大模型前沿发展与”平行会议在青岛世博城国际会议中心顺利召开。
2. 浙江工业大学教授王万良担任会议主席并发表致辞,北京师范大学教授李燕、重庆邮电大学研究员熊余、北京师范大学教授勤华华中师范大学教授建文、研究员罗亚威、教育学院教授于晓应邀作主题报告。br>3 会议旨在深入贯彻落实国家人工智能战略和创新发展,推进教育转型与智能化升级。
阅读原文
2. 浙江工业大学教授王万良担任会议主席并发表致辞,北京师范大学教授李燕、重庆邮电大学研究员熊余、北京师范大学教授勤华华中师范大学教授建文、研究员罗亚威、教育学院教授于晓应邀作主题报告。br>3 会议旨在深入贯彻落实国家人工智能战略和创新发展,推进教育转型与智能化升级。
大模型,智能家居的春秋战国之交
文章概要:
1. 智能家居发展十多年后仍呈现技术人工智障、市场四分五裂的局面,原因是传统家电+通信模块+语音交互+手机APP的低水平“智能化”,门槛较低,各生态平台不服谁,导致行业一盘散沙。
2. 大模型时代将终结这种情况,自2023年以来,我们已经见证了手机、PC等智能终端,基于大模型的AI之战血雨腥风,并且呈现出高水平、巨头化的竞争格局,苹果、三星、华荣OV米等如同战国时期的七雄并立。
3. 目前,我们能看到三大派系的巨头集结在大模型周围,科技派派。
4. 大模型,正作为智能家居的变革起点,推动行业进入春秋战国之交。这一阶段的典型特点是,实力较弱的诸侯国,在激烈竞争中相互兼并或被强国拿下,最终形成少数强国并立的局面。
5. 大模型的到来,将智能家居的准入门槛大幅拉高。目前进入大模型领域的厂商都是具有一定技术实力和知名度的,实力不足的厂商会被消费者第一时间就从决策中筛选出去。
6. 智能家居领域,谁能实现统一并垄断市场呢?目前看,还没有哪个智能家居巨头,展现压倒性优势。
7. 大模型的智能家居产品化,注定是一个更为漫长的过程,目前尚未有哪家公司占据明显的市场优势,鹿死谁手也有较大不确定性。
阅读原文
2. 大模型时代将终结这种情况,自2023年以来,我们已经见证了手机、PC等智能终端,基于大模型的AI之战血雨腥风,并且呈现出高水平、巨头化的竞争格局,苹果、三星、华荣OV米等如同战国时期的七雄并立。
3. 目前,我们能看到三大派系的巨头集结在大模型周围,科技派派。
4. 大模型,正作为智能家居的变革起点,推动行业进入春秋战国之交。这一阶段的典型特点是,实力较弱的诸侯国,在激烈竞争中相互兼并或被强国拿下,最终形成少数强国并立的局面。
5. 大模型的到来,将智能家居的准入门槛大幅拉高。目前进入大模型领域的厂商都是具有一定技术实力和知名度的,实力不足的厂商会被消费者第一时间就从决策中筛选出去。
6. 智能家居领域,谁能实现统一并垄断市场呢?目前看,还没有哪个智能家居巨头,展现压倒性优势。
7. 大模型的智能家居产品化,注定是一个更为漫长的过程,目前尚未有哪家公司占据明显的市场优势,鹿死谁手也有较大不确定性。
大语言模型LLMs在医学领域的最新进展总结(4000字全面综述)
文章概要:
1. 文章总结了近一年来医学领域大模型的研究进展,主要分为辅助诊断、药物研发、基因组学、医患沟通等。
2. 辅助方面,介绍了哈佛大学生物医学信息学助理教授余坤兴团队开发的临床组织病理学成像评估基础模型(CHIEF),能够对19种癌症进行诊断,检测准确率接近94
3. 药物开发方面,介绍了浙江大学人工智能医学创新研究院开发的LEDAP模型,利用了基于LLM的生物文本特征编码来预测药物-疾病关联、药物-药物相互作用和药物-副作用关联。
4. 基因组学方面,介绍了布朗大学团队开发的多模态深度学习模型EPBDxDNABERT-2,使用包含690个ChIP-seq实验结果的染色沉淀测序(ChIP-Seq)数据进行训练,显著提高了60多个TF-DNA的预测。
5. 其他方面,介绍及合作者团队利用微调的LLMs和对话上下文,开发了一种名为SpeakFaster的文本输入用户界面,将高度缩写的英语文本扩展为所需的完整短语,具有非常高的准确性。
6. 文章还总结了LLM在医疗领域的优势,包括更准确的诊断和预测、促进早期疾病检测和个性化治疗计划的制定、为医生提供实时决策支持和更新的医学知识、优化临床决策过程、个性化治疗方案、为患者提供更精确的治疗选择和用药选择、增强患者管理和医疗流程、提高医疗效率和患者护理质量、支持医学教育和医疗知识的传播、促进医学生和从业者的持续学习和改进。
7. 文章最后指出了LLM在医疗领域面临的挑战,包括潜在的算法偏见、在人工智能辅助的临床决策中的知情同意、医疗责任和法律责任问题、对数据所有权和隐私的担忧。
阅读原文
2. 辅助方面,介绍了哈佛大学生物医学信息学助理教授余坤兴团队开发的临床组织病理学成像评估基础模型(CHIEF),能够对19种癌症进行诊断,检测准确率接近94
3. 药物开发方面,介绍了浙江大学人工智能医学创新研究院开发的LEDAP模型,利用了基于LLM的生物文本特征编码来预测药物-疾病关联、药物-药物相互作用和药物-副作用关联。
4. 基因组学方面,介绍了布朗大学团队开发的多模态深度学习模型EPBDxDNABERT-2,使用包含690个ChIP-seq实验结果的染色沉淀测序(ChIP-Seq)数据进行训练,显著提高了60多个TF-DNA的预测。
5. 其他方面,介绍及合作者团队利用微调的LLMs和对话上下文,开发了一种名为SpeakFaster的文本输入用户界面,将高度缩写的英语文本扩展为所需的完整短语,具有非常高的准确性。
6. 文章还总结了LLM在医疗领域的优势,包括更准确的诊断和预测、促进早期疾病检测和个性化治疗计划的制定、为医生提供实时决策支持和更新的医学知识、优化临床决策过程、个性化治疗方案、为患者提供更精确的治疗选择和用药选择、增强患者管理和医疗流程、提高医疗效率和患者护理质量、支持医学教育和医疗知识的传播、促进医学生和从业者的持续学习和改进。
7. 文章最后指出了LLM在医疗领域面临的挑战,包括潜在的算法偏见、在人工智能辅助的临床决策中的知情同意、医疗责任和法律责任问题、对数据所有权和隐私的担忧。
人人都能学会的基于大模型的简易智能问答系统
文章概要:
1. 本文将讲解如何设计一个简单的基于大模型的智能问答>2. 构建知识库/向量,将已有文本数据使用大模型的向量化能力实现文本向量化,然后将原文本向量化数据存入向量数据库
. 提问向量化查找相似文本,当用户发起提问后,先使用上文提到的大模型的量化能力对的文本进行向然后利用向量化数据库的向量搜索能力找出个文本
4. 提问与相似文本组成Prompt,将提问与相似文本新的Prompt,给大模型等待大回答后给用户
5.AG,检索增强生成(Retrieval-augmented Generation)了语言模型信息检索,是模型前沿技术之一
6大模型 + RAG 是当下解决行业问题的一个不错的方案
7. 了解了AG的基本思想,搭建一个简易的智能问答系统就信手拈来了。接下来将为大家讲解如何利用开源向量数据库Milvus构建自己的问答系统
阅读原文
. 提问向量化查找相似文本,当用户发起提问后,先使用上文提到的大模型的量化能力对的文本进行向然后利用向量化数据库的向量搜索能力找出个文本
4. 提问与相似文本组成Prompt,将提问与相似文本新的Prompt,给大模型等待大回答后给用户
5.AG,检索增强生成(Retrieval-augmented Generation)了语言模型信息检索,是模型前沿技术之一
6大模型 + RAG 是当下解决行业问题的一个不错的方案
7. 了解了AG的基本思想,搭建一个简易的智能问答系统就信手拈来了。接下来将为大家讲解如何利用开源向量数据库Milvus构建自己的问答系统
全面解读AI大模型:智能时代的驱动力与创新利器
文章概要:
1. AI大模型包含数十亿到数万亿参数的深度学习模型,能够通过大量的数据训练,实现更高精度的任务处理。
2. AI大模型典型代表包括GPT、BERT、T5等语言模型,以及在图像领域广泛应用的DALL-E、Stable Diffusion等模型。
3. AI大模型的应用已经超越了传统的和学术领域,深入各行各业,成为各行业提升生产力、降低成本的关键工具。
4. 大模型带来的挑战与未来前景,尽管AI大模型带来了种种新机遇,但其大规模计算需求、数据隐私、安全性等问题也亟待解决。
阅读原文
2. AI大模型典型代表包括GPT、BERT、T5等语言模型,以及在图像领域广泛应用的DALL-E、Stable Diffusion等模型。
3. AI大模型的应用已经超越了传统的和学术领域,深入各行各业,成为各行业提升生产力、降低成本的关键工具。
4. 大模型带来的挑战与未来前景,尽管AI大模型带来了种种新机遇,但其大规模计算需求、数据隐私、安全性等问题也亟待解决。
“大模型+数据分析”产品怎么搞?——本文给你答案!
文章概要:
1. 本文介绍了“大模型+数据分析”产品的价值点与适合人群,包括互联网从业者、大模型行业从业者、产品经理、研发、解决方案架构师等。
2. 文章对阿里云的析言GBI产品进行了调研,包括产品概述、核心功能、高阶功能、产品版本对比、产品部署方案、落地案例等。
3. 文章对智谱清言的【数据分析】智能体进行了调研,包括官方API介绍、在线使用地址等。
4. 文章对阿里析言、智谱清言、通义千问2.5的GBI能力进行了测试,包括使用官方预置数据测试析言的数据问答能力、使用自定义数据测试析言的数据问答和分析能力、使用自定义数据测试智谱清言-数据分析智能体的数据问答和分析能力、使用自定义数据测试阿里-通义千问2.5的数据问答和分析。
5. 文章对测试结果进行了总结和启发,包括阿里析言、通义千问、智谱清言-数据分析智能体的处理逻辑和效果,以及借助大模型【AI模型】效果评估和打分的可行性。
阅读原文
2. 文章对阿里云的析言GBI产品进行了调研,包括产品概述、核心功能、高阶功能、产品版本对比、产品部署方案、落地案例等。
3. 文章对智谱清言的【数据分析】智能体进行了调研,包括官方API介绍、在线使用地址等。
4. 文章对阿里析言、智谱清言、通义千问2.5的GBI能力进行了测试,包括使用官方预置数据测试析言的数据问答能力、使用自定义数据测试析言的数据问答和分析能力、使用自定义数据测试智谱清言-数据分析智能体的数据问答和分析能力、使用自定义数据测试阿里-通义千问2.5的数据问答和分析。
5. 文章对测试结果进行了总结和启发,包括阿里析言、通义千问、智谱清言-数据分析智能体的处理逻辑和效果,以及借助大模型【AI模型】效果评估和打分的可行性。
最高200万元!天河区印发促进人工智能行业大模型产业高质量发展的若干政策措施
文章概要:
1. 天河区印发促进人工智能行业大模型产业高质量发展的政策措施,包括支持创新联合体建设、推进开源技术发展、打造公共算力强化算力要素供给、激励智能算法研发、完善数据要素体系等。
2. 措施明确了支持对象、扶持标准、资金来源、申报流程等内容。
3. 本措施自公布之日起30日后施行,有效期三年。
阅读原文
2. 措施明确了支持对象、扶持标准、资金来源、申报流程等内容。
3. 本措施自公布之日起30日后施行,有效期三年。
人工?智能?傻傻分不清楚!TeleAI 星辰语音大模型推出“超自然语音生成”技术
文章概要:
1 脱口秀节目中吐槽电商平台段子火,对智能“人情味儿”的讨论。
2.电信研究院(TeleAI)推出研发自然语音,语音大模型可以听懂用户说话,能以人的与之对话交流。
3 星辰大模型的“语音”技术基于离散的自回归方法,地对持续时间。>4. 在自然韵律处理及鲁棒,TeleAI还了“双连贯相加式”和“先”解码策略,从而大幅提升语音的真实br>5. 经过在智能客服真实测试,星辰语音大模型语音的大幅了GPT-4等通用模型。
6 在数字人应用场景,大可以根据形象匹配符合的声音,并赋予数字人在说话过程中以情感表达,使其形象更加鲜活。
7. 今年5月,AI以星辰自然语音生成大模型为底座,ICAGC0感染力可信音频生成挑战赛中,获得高感染力可信音频生成第一名。
阅读原文
2.电信研究院(TeleAI)推出研发自然语音,语音大模型可以听懂用户说话,能以人的与之对话交流。
3 星辰大模型的“语音”技术基于离散的自回归方法,地对持续时间。>4. 在自然韵律处理及鲁棒,TeleAI还了“双连贯相加式”和“先”解码策略,从而大幅提升语音的真实br>5. 经过在智能客服真实测试,星辰语音大模型语音的大幅了GPT-4等通用模型。
6 在数字人应用场景,大可以根据形象匹配符合的声音,并赋予数字人在说话过程中以情感表达,使其形象更加鲜活。
7. 今年5月,AI以星辰自然语音生成大模型为底座,ICAGC0感染力可信音频生成挑战赛中,获得高感染力可信音频生成第一名。
2024年11月8日多模态大模型论文推送
文章概要:
1. 本文推送了2024年11月8日的多模态大模型论文,包括VideoGLaMM、LLM2CLIP、TAP-VL、Analyzing The Language of Visual Tokens、Vision Language Models are In-Context Value Learners等。
2. 论文涵盖了多模态、视觉理解、语言模型、生成模型、基准测试等多个领域。
阅读原文
2. 论文涵盖了多模态、视觉理解、语言模型、生成模型、基准测试等多个领域。
天穹 | SDC 2024:大模型技术在恶意软件分析中的实践
文章概要:
1. 本文是星图实验室研究员刘璐、尹斌,在看雪SDC 2024上发表的议题《大模型技术在恶意软件分析中的实践》。
2. 该议题阐明了当前恶意软件分析方法面临的问题,针对分析难点和分析需求详细说明了借助大模型技术提高恶意软件分析效率及分析结果等方面的实践。<>3. 整体架构分为3层,首先通过模型微调获取一个大模型基座,然后搜集数据进行构造形成数据集,最后基于向量数据库实现对样本不同维度信息的检索。利用该架构实现对样本的深度疏理,达到智能问答和用户意图识别的精准易用目的。
4. 星图实验室提出了大模型技术应用于恶意软件分析的架构。
. 针对以上问题,星图实验室提出了大模型技术应用于恶意软件分析的架构设计。
6. 有了基座大模型,接下来要构造微调的数据集,简单讲就是做指令遵循,一般是一问一答式的数据。
7. 选择微调方法,首先是模型微调,我们采用的是一个国产化的微调框架叫LLaMA-Factory,它支持非常多的模型,也支持调和对齐的方法。
8. 模型测评时既要考虑loss收敛和使用传统的ROUGE等指标进行测评,也要考虑借助大模型加评分规则的打分方式,结合人工审计进行最终打分。
9. 大模型经过微调后,能够从直接描述样本行为递进为在样本行为基础上推理样本行为背后意图。
10. 针对这一想法,我们做了实际验证,如果直接把二进制输入给像GPT-4或者GPT-4o这一系列模型得到的效果是不好的,但是可以把模型在二进制做一些微调达到较好的效果。
11. 经过微调后的大模型能够直接对代码进行解读,我们将一些恶意或者非恶意的脚本代码输入给大模型后,它可以分析出代码块中比较关键的恶意行为。
12. 为了提高效率和准确性,我们采用多Agent组合的方式,利用ReAct Agent在执行任务时让模型去做推理和行动,理解上下文后去推理、规划、执行反馈和迭代,输出比较可信的结果。
13. 基座LLM样本分析能力弱,开源或商业基座模型一般在专业垂直领域上能力较弱,为了提高模型能力,需要LLM微调。同时为了提高模型的可解释性,需要传统分析工具辅助,例如,样本源码和逆向后的代码等,经过描述转换后输入给大模型进行分析。微调过程中需要构建大量高质量数据集。
14. 难以做到:实时性+准确性+可追溯,任何一个大模型的知识储备都具有滞后性例如,GPT-4的训练数据集只到2023年12月,2023年12月以后的信息它就不认识了,难以做到实时准确。借助RAG来补充最新知识库,就能提高整体结果的实时性,也能降低幻觉来提高答案的准确性。对模型的输出做引用标注,就能知道模型回复内容的来源,做到结果可追溯。
15. 整体自动化分析能力弱,在基础模型上做了微调后,大模型的自动化分析能力也是并不是很强,所以为了进一步提高它的自动化分析能力,用现有框架做工具调用,例如使用RAG和多个Agent组合的方式,用参数量比较小的模型就能做到比较好的效果。
16. RAG问答不够准确,为了提升大模型的准确性,我们采用了多种方式进行优化。在文本分块时根据语义信息使用不同的长度切块,相同的块必须要有相类似的语义,必须有相同分析工具所分析出来的结果,且同一个块保证它的信息完整。切出来的基础块做总结或关键词提取后变成小块,分别存储到不同的数据库中时就可以用多种不同的检索方式做多路召回,这样能够检索到更丰富的数据,提高模型的表现能力。语义检索上的不足,也可以对Embedding模型做微调来改进。
阅读原文
2. 该议题阐明了当前恶意软件分析方法面临的问题,针对分析难点和分析需求详细说明了借助大模型技术提高恶意软件分析效率及分析结果等方面的实践。<>3. 整体架构分为3层,首先通过模型微调获取一个大模型基座,然后搜集数据进行构造形成数据集,最后基于向量数据库实现对样本不同维度信息的检索。利用该架构实现对样本的深度疏理,达到智能问答和用户意图识别的精准易用目的。
4. 星图实验室提出了大模型技术应用于恶意软件分析的架构。
. 针对以上问题,星图实验室提出了大模型技术应用于恶意软件分析的架构设计。
6. 有了基座大模型,接下来要构造微调的数据集,简单讲就是做指令遵循,一般是一问一答式的数据。
7. 选择微调方法,首先是模型微调,我们采用的是一个国产化的微调框架叫LLaMA-Factory,它支持非常多的模型,也支持调和对齐的方法。
8. 模型测评时既要考虑loss收敛和使用传统的ROUGE等指标进行测评,也要考虑借助大模型加评分规则的打分方式,结合人工审计进行最终打分。
9. 大模型经过微调后,能够从直接描述样本行为递进为在样本行为基础上推理样本行为背后意图。
10. 针对这一想法,我们做了实际验证,如果直接把二进制输入给像GPT-4或者GPT-4o这一系列模型得到的效果是不好的,但是可以把模型在二进制做一些微调达到较好的效果。
11. 经过微调后的大模型能够直接对代码进行解读,我们将一些恶意或者非恶意的脚本代码输入给大模型后,它可以分析出代码块中比较关键的恶意行为。
12. 为了提高效率和准确性,我们采用多Agent组合的方式,利用ReAct Agent在执行任务时让模型去做推理和行动,理解上下文后去推理、规划、执行反馈和迭代,输出比较可信的结果。
13. 基座LLM样本分析能力弱,开源或商业基座模型一般在专业垂直领域上能力较弱,为了提高模型能力,需要LLM微调。同时为了提高模型的可解释性,需要传统分析工具辅助,例如,样本源码和逆向后的代码等,经过描述转换后输入给大模型进行分析。微调过程中需要构建大量高质量数据集。
14. 难以做到:实时性+准确性+可追溯,任何一个大模型的知识储备都具有滞后性例如,GPT-4的训练数据集只到2023年12月,2023年12月以后的信息它就不认识了,难以做到实时准确。借助RAG来补充最新知识库,就能提高整体结果的实时性,也能降低幻觉来提高答案的准确性。对模型的输出做引用标注,就能知道模型回复内容的来源,做到结果可追溯。
15. 整体自动化分析能力弱,在基础模型上做了微调后,大模型的自动化分析能力也是并不是很强,所以为了进一步提高它的自动化分析能力,用现有框架做工具调用,例如使用RAG和多个Agent组合的方式,用参数量比较小的模型就能做到比较好的效果。
16. RAG问答不够准确,为了提升大模型的准确性,我们采用了多种方式进行优化。在文本分块时根据语义信息使用不同的长度切块,相同的块必须要有相类似的语义,必须有相同分析工具所分析出来的结果,且同一个块保证它的信息完整。切出来的基础块做总结或关键词提取后变成小块,分别存储到不同的数据库中时就可以用多种不同的检索方式做多路召回,这样能够检索到更丰富的数据,提高模型的表现能力。语义检索上的不足,也可以对Embedding模型做微调来改进。
一文读懂剪枝(Pruner):大模型也需要“减减肥”?
文章概要:
1. 本文主要介绍了大模型剪枝技术的背景及原理、代表性方法和研究进展。大模型剪枝技术旨在降低模型的资源消耗,同时保持性能。文章首先介绍了大模型枝技术的背景和原理,然后详细介绍了一种代表性的方法——LLM-Pruner,最后讨论了大模型剪枝技术的研究进展和未来发展方向。
2. 大模型剪枝在保持性能的同时降低资源消耗,已成为亟待解决的难题。大模型剪枝技术通过减少模型中的参数数量,旨在降低这些需求,同时尽量保持模型的性能。br>3. 大模型剪枝技术的代表性方法:LLM-Pruner是首个针对大模型的结构化剪枝框架,它包括分组、评估和微调三个步骤。分组阶段根据依赖性准则将神经元划分为微调阶段使用LoRA中每个可学习的参数矩阵,以减轻剪枝带来的性能损失。
4. 大模型剪枝技术的研究进展:大模型剪枝技术已经成为近两年的研究热点,无论是在工业界还是学术界,都有许多研究人员投身于这一领域。随着研究的不断深入和技术的持续进步,我们有理由相信,剪枝将继续在大模型领域扮演重要的角色,并推动大模型技术的创新和发展。
阅读原文
2. 大模型剪枝在保持性能的同时降低资源消耗,已成为亟待解决的难题。大模型剪枝技术通过减少模型中的参数数量,旨在降低这些需求,同时尽量保持模型的性能。br>3. 大模型剪枝技术的代表性方法:LLM-Pruner是首个针对大模型的结构化剪枝框架,它包括分组、评估和微调三个步骤。分组阶段根据依赖性准则将神经元划分为微调阶段使用LoRA中每个可学习的参数矩阵,以减轻剪枝带来的性能损失。
4. 大模型剪枝技术的研究进展:大模型剪枝技术已经成为近两年的研究热点,无论是在工业界还是学术界,都有许多研究人员投身于这一领域。随着研究的不断深入和技术的持续进步,我们有理由相信,剪枝将继续在大模型领域扮演重要的角色,并推动大模型技术的创新和发展。
北京首座大模型"超级工厂"落户石景山!
文章概要:
1 石景举办人工智能大模型产业创新发展大会,超60家企业集聚区,前三季度人工智能产业收入7927亿元。
2. 百度智能云千帆大模型产业(北京)创新基地平台启动上线,为开发者提供全链条工具平台和技术服务。
3. 中关村数智产业联盟(北京)扶摇创新中心,致力于构建创新创业生态系统。
4 “智谱Z基金”,通过设立风险投资基金,服务大模型赛道上下游的技术研发与应用创新。
5. 超智算(北京)科技有限公司等完成算力伙伴签约,入驻大模型产业集聚区。
阅读原文
2. 百度智能云千帆大模型产业(北京)创新基地平台启动上线,为开发者提供全链条工具平台和技术服务。
3. 中关村数智产业联盟(北京)扶摇创新中心,致力于构建创新创业生态系统。
4 “智谱Z基金”,通过设立风险投资基金,服务大模型赛道上下游的技术研发与应用创新。
5. 超智算(北京)科技有限公司等完成算力伙伴签约,入驻大模型产业集聚区。
在Jetson上玩转大模型Day11:SAM2应用
文章概要:
1. 图像分割是一项基础的计算机视觉任务,传统上包括语义分割、实例分割和全景分割三个主要任务。
2. 在医疗、工程、、自动驾驶等很多使用价值的应用场景中,对于分割技术的需求 Meta所开源的SAM模型,是破局的技术,目前已经发展到SAM2版本。可以识别实时该对象的追踪与提取,视频编辑与特效制作高效辅助工作。<>. 现在我们就要在NVIDIA Jetsonin上执行SAM2的环境
阅读原文
2. 在医疗、工程、、自动驾驶等很多使用价值的应用场景中,对于分割技术的需求 Meta所开源的SAM模型,是破局的技术,目前已经发展到SAM2版本。可以识别实时该对象的追踪与提取,视频编辑与特效制作高效辅助工作。<>. 现在我们就要在NVIDIA Jetsonin上执行SAM2的环境
阅读原文
【技术分享】人工智能大模型多场景应用解析
文章概要:
1. 介绍了生成式人工智能的概念和元宇宙的概念,以及它们之间的关系。
2. 探讨了生成式人工智能如何促进元宇宙的实现,包括提供丰富的内容和创意、优化交互和用户体验、促进商业化和价值创造、加强安全和隐私保护等方面。
3. 分析了生成式人工智能的未来战略技术,包括从生成到推断、从平面到立体、数字人与世界模型交互等方面。
4 讨论了生成式人工智能在图像文档复杂结构建模、错字检测与错误定位的可视化分析、基于SEM
5. 介绍了合合信息公司在智能文档扫描、ROI提取、形变矫正、文档还原、图像恢复-阴影去除、质量增强、智能高清、去除摩尔纹框架、手写擦除架构、图像篡改检测等底层视觉技术方面的研究成果。
6. 总结了生成式人工智能的商业价值和普通人如何把握这次技术变革的浪潮。
阅读原文
2. 探讨了生成式人工智能如何促进元宇宙的实现,包括提供丰富的内容和创意、优化交互和用户体验、促进商业化和价值创造、加强安全和隐私保护等方面。
3. 分析了生成式人工智能的未来战略技术,包括从生成到推断、从平面到立体、数字人与世界模型交互等方面。
4 讨论了生成式人工智能在图像文档复杂结构建模、错字检测与错误定位的可视化分析、基于SEM
5. 介绍了合合信息公司在智能文档扫描、ROI提取、形变矫正、文档还原、图像恢复-阴影去除、质量增强、智能高清、去除摩尔纹框架、手写擦除架构、图像篡改检测等底层视觉技术方面的研究成果。
6. 总结了生成式人工智能的商业价值和普通人如何把握这次技术变革的浪潮。
首批、唯一网安企业!奇安信QAX-GPT安全机器人获公安部大模型安全认证
文章概要:
1. 116日,公安部网络安全等级保护评估中心对外发布首批大模型系统安全能力验证结果,奇安信QAX-GPT机器人系统和浪潮、百度、腾讯等四家大模型系统率先通过测评,成为首批获得安全测评报告及“大模型系统能力评价证书”的企业,同时也是唯一通过此项测评安全。
2. 为深入落实国家,大模型系统的安全评估体系建设大模型系统的安全风险防控能力,2025月,国家工程研究中心和公安部第三研究所组织开展首批“大模型系统安全能力验证活动
3. 本次大模型系统安全测评要求非常严格和详细,维度包括通用安全以及开发安全、测试安全、与运行安全、退役安全等模型生命周期等。
4. 奇安信QAX-GPT安全机器人系统是奇安信自研的领域大模型能够接入网络流量检测告警,甄选高价值告警,并提供的处置建议。
截至目前,QAX-GPT安全系统凭借优秀的表现,在多个权威机构屡获殊荣
6. 作为唯一一家网络安全企业,奇安信QAX-G安全机器人首批获得公安部三所大模型安全认证,势必将为推动大模型产业健康发展、共建大模型安全等贡献更多力量。
阅读原文
2. 为深入落实国家,大模型系统的安全评估体系建设大模型系统的安全风险防控能力,2025月,国家工程研究中心和公安部第三研究所组织开展首批“大模型系统安全能力验证活动
3. 本次大模型系统安全测评要求非常严格和详细,维度包括通用安全以及开发安全、测试安全、与运行安全、退役安全等模型生命周期等。
4. 奇安信QAX-GPT安全机器人系统是奇安信自研的领域大模型能够接入网络流量检测告警,甄选高价值告警,并提供的处置建议。
截至目前,QAX-GPT安全系统凭借优秀的表现,在多个权威机构屡获殊荣
6. 作为唯一一家网络安全企业,奇安信QAX-G安全机器人首批获得公安部三所大模型安全认证,势必将为推动大模型产业健康发展、共建大模型安全等贡献更多力量。
中科海光与柯基数据共同打造的多模态大模型科研一体机助力PharmCopilot人工智能新品发布!
文章概要:
1. 10月311.1日,第9届C医学市场年会宝华万豪酒店开幕
2 柯基数据联合中科海光共同举行了PharmCopilot基于GenAI的医学营销及HCP人工智能新产品
3. 柯基数据吴刚总上台讲解新品发布会的具体内容> 4. 柯基海合作伙伴,已完成海光认证打造了产品大模型一体机> 5. PharmCopilot基于GenAI的合规医学营销及CP科研人工智能基于与海光打造的多模态大模型科研一体机,主要针对医学应用场景设计,覆盖多模态医学图书馆、医学内容自动生成合规审核、内容多传递等方面
阅读原文
2 柯基数据联合中科海光共同举行了PharmCopilot基于GenAI的医学营销及HCP人工智能新产品
3. 柯基数据吴刚总上台讲解新品发布会的具体内容> 4. 柯基海合作伙伴,已完成海光认证打造了产品大模型一体机> 5. PharmCopilot基于GenAI的合规医学营销及CP科研人工智能基于与海光打造的多模态大模型科研一体机,主要针对医学应用场景设计,覆盖多模态医学图书馆、医学内容自动生成合规审核、内容多传递等方面
【技术分享】人工智能大模型多场景应用解析
文章概要:
1. 介绍了生成式人工智能和元宇宙的概念以及二者之间的关系,并阐述了如何通过生成式人工智能促进元宇宙的实现
2. 讲解了生成式人工智能的技术原理,如概率分布学习、神经网络渲染等
3. 介绍了生成式人工智能在文档智能处理领域的应用,如集外汉字生成、错字检测、表格识别等
4. 讲述了合合信息在文档图像处理领域的研究成果,如智能文档扫描、ROI提取、形变矫正、图像恢复等
5. 生成式人工智能在各个行业的应用都能够带来巨大的商业价值,普通人可以通过关注相关新闻、学习相关知识、参与相关社区、和实践等方式把握住这次技术变革的浪潮
阅读原文
2. 讲解了生成式人工智能的技术原理,如概率分布学习、神经网络渲染等
3. 介绍了生成式人工智能在文档智能处理领域的应用,如集外汉字生成、错字检测、表格识别等
4. 讲述了合合信息在文档图像处理领域的研究成果,如智能文档扫描、ROI提取、形变矫正、图像恢复等
5. 生成式人工智能在各个行业的应用都能够带来巨大的商业价值,普通人可以通过关注相关新闻、学习相关知识、参与相关社区、和实践等方式把握住这次技术变革的浪潮
大模型与大数据双向赋能,“WeData+AI”智能化升级
文章概要:
1. 大模型在全球范围内得到快速应用和发展,推动了相关行业的智能化转型,但也面临着数据问题和挑战,如数据幻觉、不一致、安全和多样性不足等。
2. WeData平台将大模型与大数据相互驱动与共融,加速企业的数据价值释放。
3. Data for AI部分的核心目标是让平台覆盖数据的全生命周期,并且通过数据治理措施协助企业构建专属的数据资产。
4. AI for Data部分将从四个方面介绍在WeData中如何利用大模型提高数据开发治理效率以及用户体验。
阅读原文
2. WeData平台将大模型与大数据相互驱动与共融,加速企业的数据价值释放。
3. Data for AI部分的核心目标是让平台覆盖数据的全生命周期,并且通过数据治理措施协助企业构建专属的数据资产。
4. AI for Data部分将从四个方面介绍在WeData中如何利用大模型提高数据开发治理效率以及用户体验。
大模型技术的重要特性与发展趋势
文章概要:
1. 大模型技术的重要特性与发展趋势
2. 转自:智能计算芯世界
阅读原文
2. 转自:智能计算芯世界
“大模型与网联智能”平行会议顺利举办
文章概要:
1. 2024年11月2日下午,中国自动化大会“大模型与网联智能”会议顺利召开。本次平行会议由中国自动化学会网联智能专委会举办。
2. 本次平行会议由中国自动化学会网联智能专委会主任、北京大学特聘教授翔,北京大学助理教授张嘉楠共同担任主席。
程翔教授首先在平行会议上介绍网联智能专,专题报告了机器联觉概念、通信与模态感知智能融合数据集以及利用大语言模型解决物理层设计中的信道预测问题。
5. 何中军教授结合百度在文心模型方面的工作,介绍知识增强的大语言模型技术,以及大模型多语言、多模态的能力,助力代码写作、工作分析汇报及体育赛事等应用。
6. 刘光灿教授介绍了智能模型的鲁棒性问题,对敏感性和稳定性权衡取舍,阐述了在线性数据和非线性数据复原领域取得的进展。
7. 马国俊总监介绍了大模型主流技术提升用户体验、辅助代码测试、多模态大模型抖音生态内容理解、推荐及特效性能预测等实践。
8. 王晖研究员重点阐述了鹏城实验室脑海团队在鹏城云脑上训练鹏城·脑海大工程,数据Scaling Law的最新探索,以及面向复杂电磁空间脑海信号大模型。
9. 魏平教授首先介绍了大心智推理能力,并介绍了基于视频的复杂任务意图理解、视频意图推理问答等研究进展,对大模型的心智推理研究工作进行了展望。
0. 于东晓教授介绍了边缘智能场景中如何基于设备利用轻量化技术实现大模型协同训练优化,阐述了面向动态开放复杂场景设计轻量化、高鲁棒、安全、自适应的分布式学习算法。
阅读原文
2. 本次平行会议由中国自动化学会网联智能专委会主任、北京大学特聘教授翔,北京大学助理教授张嘉楠共同担任主席。
程翔教授首先在平行会议上介绍网联智能专,专题报告了机器联觉概念、通信与模态感知智能融合数据集以及利用大语言模型解决物理层设计中的信道预测问题。
5. 何中军教授结合百度在文心模型方面的工作,介绍知识增强的大语言模型技术,以及大模型多语言、多模态的能力,助力代码写作、工作分析汇报及体育赛事等应用。
6. 刘光灿教授介绍了智能模型的鲁棒性问题,对敏感性和稳定性权衡取舍,阐述了在线性数据和非线性数据复原领域取得的进展。
7. 马国俊总监介绍了大模型主流技术提升用户体验、辅助代码测试、多模态大模型抖音生态内容理解、推荐及特效性能预测等实践。
8. 王晖研究员重点阐述了鹏城实验室脑海团队在鹏城云脑上训练鹏城·脑海大工程,数据Scaling Law的最新探索,以及面向复杂电磁空间脑海信号大模型。
9. 魏平教授首先介绍了大心智推理能力,并介绍了基于视频的复杂任务意图理解、视频意图推理问答等研究进展,对大模型的心智推理研究工作进行了展望。
0. 于东晓教授介绍了边缘智能场景中如何基于设备利用轻量化技术实现大模型协同训练优化,阐述了面向动态开放复杂场景设计轻量化、高鲁棒、安全、自适应的分布式学习算法。
具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队
文章概要:
1. 自变量机器人是国内唯一一家从第一天就选择端到端统一大模型技术路线的公司,其模型效果已达到惊人水准,体现在包括处理长序列复杂任务,以及泛化性、通用性等方面。
2. 自变量机器人认为,目前Great Wall系列的WALL-A类似于“GPT-2”,伴随着模型的不断迭代,机器人领域的“ChatGPT”时刻可能会在不久后来到。
3. 自变量机器人的技术团队由创始人兼CEO王潜和联合创始人兼CTO王昊组成,他们都是全球最早在神经网络中引入注意力机制的学者之一。
4. 端到端和统一模型是解决manipulation问题唯一可行的路径,本质上是因为manipulation和所有其他AI/机器人任务都有本质的区别,即涉及到过程的复杂性远远超过其他任务。
5. 数据质量在Scaling Law里才是最核心的要素,其次是数据的多样性,排在最后的才是数据量。
6. 2015年前后,深度学习开始系统引入机器人领域特别是manipulation领域,当时大家是抱有很大的期望的,但到了2018年左右,情况比较清楚了:单纯靠深度网络+强化学习做不成manipulation,核心问题还是在数据效率。
7. 谷歌RT-1的出现,可以说革新了机器人领域的研究范式。RT-1的革命性有几点,第一是突破了之前占据主流的RL(强化学习)+Sim2Real范式所面临的明显的天花板,人类第一次看到了通用机器人的希望;第二是指出了机器人模型同样可能具有Scaling Law,这一点在之后的RT-X中得到了确证。
8. ChatGPT的出现,让人们看到了In-Context Learning,或者可以叫Zero-Shot Learning的发生,这是最终出现的极致,就是我们所谓的“涌现”。 9. 人们基于自身的经验,本能的会觉得把数据集中在一个领域做专家模型的效果会更好今天我们看到通才模型才是真正能够打破天花板,在相同投入下达到更高能力的正确路径。
10. 自变量机器人的目标是“将人类从繁琐的体力劳动中解放出来”,让机器人能够脱离相对比较“笨”的状态。
11. 自变量机器人选择了轮式机器人这种产品形式,是因为底盘是最成熟的应用方式,综合考虑的话,要看具体场景究竟需要什么级别的通过性。
12. 未来,自变量机器人会拿自己的技术去赋能其他家的产品。
13. 对于机器人大模型,五年到十年内会有一个什么样的趋势?一般来说,人们特别容易低估中期的进展。我觉得可以把中期的,比如五年十年的想象力放大一些。在长一些的时间尺度上,我们已经接近于我们希望实现的通用机器人了,我比大部分人都更加乐观一点。
阅读原文
2. 自变量机器人认为,目前Great Wall系列的WALL-A类似于“GPT-2”,伴随着模型的不断迭代,机器人领域的“ChatGPT”时刻可能会在不久后来到。
3. 自变量机器人的技术团队由创始人兼CEO王潜和联合创始人兼CTO王昊组成,他们都是全球最早在神经网络中引入注意力机制的学者之一。
4. 端到端和统一模型是解决manipulation问题唯一可行的路径,本质上是因为manipulation和所有其他AI/机器人任务都有本质的区别,即涉及到过程的复杂性远远超过其他任务。
5. 数据质量在Scaling Law里才是最核心的要素,其次是数据的多样性,排在最后的才是数据量。
6. 2015年前后,深度学习开始系统引入机器人领域特别是manipulation领域,当时大家是抱有很大的期望的,但到了2018年左右,情况比较清楚了:单纯靠深度网络+强化学习做不成manipulation,核心问题还是在数据效率。
7. 谷歌RT-1的出现,可以说革新了机器人领域的研究范式。RT-1的革命性有几点,第一是突破了之前占据主流的RL(强化学习)+Sim2Real范式所面临的明显的天花板,人类第一次看到了通用机器人的希望;第二是指出了机器人模型同样可能具有Scaling Law,这一点在之后的RT-X中得到了确证。
8. ChatGPT的出现,让人们看到了In-Context Learning,或者可以叫Zero-Shot Learning的发生,这是最终出现的极致,就是我们所谓的“涌现”。
10. 自变量机器人的目标是“将人类从繁琐的体力劳动中解放出来”,让机器人能够脱离相对比较“笨”的状态。
11. 自变量机器人选择了轮式机器人这种产品形式,是因为底盘是最成熟的应用方式,综合考虑的话,要看具体场景究竟需要什么级别的通过性。
12. 未来,自变量机器人会拿自己的技术去赋能其他家的产品。
13. 对于机器人大模型,五年到十年内会有一个什么样的趋势?一般来说,人们特别容易低估中期的进展。我觉得可以把中期的,比如五年十年的想象力放大一些。在长一些的时间尺度上,我们已经接近于我们希望实现的通用机器人了,我比大部分人都更加乐观一点。
中科海光与柯基数据共同打造的多模态大模型科研一体机助力PharmCopilot人工智能新品发布!
文章概要:
1. 2024年18日,基数据宣布PharmCopilot新品发布
2. 该产品与海光打造的多模态大模型科研一体机,针对医学应用场景设计多模态医学图书馆、医学内容自动生成与合规审核、内容多渠道传递等方面
阅读原文
2. 该产品与海光打造的多模态大模型科研一体机,针对医学应用场景设计多模态医学图书馆、医学内容自动生成与合规审核、内容多渠道传递等方面
「通用大脑」来了!MIT何恺明用大模型思维玩出机器人预训练新花样
文章概要:
1. MIT的何恺明和Lirui Wang等人最近在“通用数据”上取得了进展,让机器人离拥有“通用大脑”的目标又近了一步。
2. 机器人数据的异质性问题一直是机器人训练的大难题,以往的训练方式导致数据难以通用,训练中存在大量重复劳动。
3. 为了应对这一问题,研究纷纷尝试新方法,如斯坦福大学的RoboTurk项目和依靠“数据”作为替代,但都存在一定的局限性。
4. MIT这支团队选择另辟蹊径,提出了名为“异构预训练Transformers”(Heterogeneous Pretrained Transformers,HPT)的新架构,将不同来源的数据对齐到一种共享“语言”,使得生成式AI模型能够“理解”这些数据。
5. HPT的优势不仅在于通用性高,还兼具高效、低成本的特点,在模拟和实际测试中均展现了出色的表现。
6. 研究团队从GPT-4等大语言模型中汲取了灵感,提出了“异构预训练Transformer”HPT)架构,分成了三个模块:Stem、Trunk和Head。
7. 本体感知赋予了机器人对关节角度、末端执行器位置、姿态等内部状态的把控力,研究团队将视觉和本体感知信号作为等同重要的数据源进行“通用”处理。
8. HPT架构把策略神经网络分为三个模块:Stem、Trunk和Head,分别对应特定的实例输入、通用的处理层和任务特定的输出。
9. 在预训练过程中,HPT的目标是最小化跨多个数据集的行为克隆损失。在迁移学习阶段,面对新的任务,HPT会重新初始化Head和Stem参数,并冻结Trunk权重
10. 实验初始设置中,研究团队选择了27个机器人遥操作的数据集用于预训练,在更大规模的实验中,研究团队扩展了数据来源,使用52个不同的数据集进行预训练。
11. 为增强数据多样性,研究团队还利用了7个模拟数据集和EPIC厨房及PoCo的互联网人类视频数据进行额外的预训练。
阅读原文
2. 机器人数据的异质性问题一直是机器人训练的大难题,以往的训练方式导致数据难以通用,训练中存在大量重复劳动。
3. 为了应对这一问题,研究纷纷尝试新方法,如斯坦福大学的RoboTurk项目和依靠“数据”作为替代,但都存在一定的局限性。
4. MIT这支团队选择另辟蹊径,提出了名为“异构预训练Transformers”(Heterogeneous Pretrained Transformers,HPT)的新架构,将不同来源的数据对齐到一种共享“语言”,使得生成式AI模型能够“理解”这些数据。
5. HPT的优势不仅在于通用性高,还兼具高效、低成本的特点,在模拟和实际测试中均展现了出色的表现。
6. 研究团队从GPT-4等大语言模型中汲取了灵感,提出了“异构预训练Transformer”HPT)架构,分成了三个模块:Stem、Trunk和Head。
7. 本体感知赋予了机器人对关节角度、末端执行器位置、姿态等内部状态的把控力,研究团队将视觉和本体感知信号作为等同重要的数据源进行“通用”处理。
8. HPT架构把策略神经网络分为三个模块:Stem、Trunk和Head,分别对应特定的实例输入、通用的处理层和任务特定的输出。
9. 在预训练过程中,HPT的目标是最小化跨多个数据集的行为克隆损失。在迁移学习阶段,面对新的任务,HPT会重新初始化Head和Stem参数,并冻结Trunk权重
10. 实验初始设置中,研究团队选择了27个机器人遥操作的数据集用于预训练,在更大规模的实验中,研究团队扩展了数据来源,使用52个不同的数据集进行预训练。
11. 为增强数据多样性,研究团队还利用了7个模拟数据集和EPIC厨房及PoCo的互联网人类视频数据进行额外的预训练。
当大模型升级速度变缓,AI Infra 创业还是一门「好生意」吗?
文章概要:
1. 推理究竟如何布局?
去年年底开始,大模型的发展重心变开始逐步从训练转向推理,而AI发布o1大模型后,大模型的Scaling Law从训练转向推理的趋势也更加明显。
2. 夹缝中能否觅得商机?
在海外,软件层创业似乎相对国内更容易:首先,海外市场有一套成熟的订阅软件付费方法,其次,由于英伟达统一了市场,基于英伟达去做会更简单。
3. 超越云厂
过往,关于创业AI Infra到底会不会和云厂产生正面冲突,也是被提及最多的疑问之一。
阅读原文
去年年底开始,大模型的发展重心变开始逐步从训练转向推理,而AI发布o1大模型后,大模型的Scaling Law从训练转向推理的趋势也更加明显。
2. 夹缝中能否觅得商机?
在海外,软件层创业似乎相对国内更容易:首先,海外市场有一套成熟的订阅软件付费方法,其次,由于英伟达统一了市场,基于英伟达去做会更简单。
3. 超越云厂
过往,关于创业AI Infra到底会不会和云厂产生正面冲突,也是被提及最多的疑问之一。
大模型之RAG:关键字检索的认识与实战(混合检索进阶储备)
文章概要:
1. 介绍了RAG系统搭建的基本流程,包括准备垂域资料、文档读取解析、文档切分、文本灌入检索引擎、封装检索接口和构建流程。
2. 解释了为什么需要了解关键字检索,以及关键字检索的概念和可能遇到的问题。
3. 分别英文文本和中文文本,提供了处理方法和示例代码,包括安装必要环境、文本处理、将文本灌入检索引擎、实现关键字检索、LLM接口封装和Prompt模板。
4. 展示了一个简单的RAG Pipeline的过程,包括检索、构建Prompt和调用LLM。
5. 总结了关键字检索的局限性,以及在实际应用中需要根据具体情况选择合适的检索方式。
阅读原文
2. 解释了为什么需要了解关键字检索,以及关键字检索的概念和可能遇到的问题。
3. 分别英文文本和中文文本,提供了处理方法和示例代码,包括安装必要环境、文本处理、将文本灌入检索引擎、实现关键字检索、LLM接口封装和Prompt模板。
4. 展示了一个简单的RAG Pipeline的过程,包括检索、构建Prompt和调用LLM。
5. 总结了关键字检索的局限性,以及在实际应用中需要根据具体情况选择合适的检索方式。
"与 Google Cloud 一起捍卫大模型安全" 之 "保护你的大模型训练"
文章概要:
1. 大模型安全面临多种威胁,包括对抗性攻击、数据投毒、模型窃取和恶意使用、隐私和安全、模型篡改等。
2. 大模型训练的安全风险包括基础设施、工具链、供应链、模型代码和配置等方面的风险。
3. Google Cloud提供了多种原生的手段来帮助应对大模型投毒的威胁,包括加强基础设施安全、使用可信的工具链、保护好模型代码和配置,并进行持续的监控和检测。
4. 保障大模型训练安全,需审查预训练模型、第三方数据和依赖库。
5. 业内大模型训练使用最多的基础设施平台是Kubernetes,Google Cloud托管的Kubernetes平台GKE,提供高度安全可扩展且易于管理的Kubernetes环境。
6. Google Cloud SAIF(Security AI Framework)是一个旨在保障AI系统安全的概念框架,它强调了默认安全、纵深防御持续监控和持续改进等关键原则。
阅读原文
2. 大模型训练的安全风险包括基础设施、工具链、供应链、模型代码和配置等方面的风险。
3. Google Cloud提供了多种原生的手段来帮助应对大模型投毒的威胁,包括加强基础设施安全、使用可信的工具链、保护好模型代码和配置,并进行持续的监控和检测。
4. 保障大模型训练安全,需审查预训练模型、第三方数据和依赖库。
5. 业内大模型训练使用最多的基础设施平台是Kubernetes,Google Cloud托管的Kubernetes平台GKE,提供高度安全可扩展且易于管理的Kubernetes环境。
6. Google Cloud SAIF(Security AI Framework)是一个旨在保障AI系统安全的概念框架,它强调了默认安全、纵深防御持续监控和持续改进等关键原则。
北京日报:本市首座大模型“超级工厂”落户石景山
文章概要:
1. 石景山区举办人工智能大模型产业创新发展大会,今年来已有超60家企业入驻石景山人工智能大模型产业集聚区,首期空间入驻率达90%,前三人工智能产业实现收入7927亿元。
2. 百度智能云千帆大模型产业(北京)创新基地服务平台在会上启动上线,可为大模型AI原生应用的开发者提供全链条工具平台,配套“管家式”技术服务。
3. 百度集团执行副总裁、百度智能云事业群总裁沈抖介绍,百度与石景山区联手打造这个创新基地,目前已经集聚了十余家具备行业大模型训练和垂直领域应用开发能力的企业。
4. 中关村数智人工智能产业联盟(北京创新中心启动,“智谱Z基金”同步启动,超智算(北京)科技有限公司、北京智谱华章科技有限公司、摩尔线程智能科技(北京)有限责任公司、北京市商汤科技开发有限公司完成算力伙伴签约,入驻人工智能大模型产业集聚区。
阅读原文
2. 百度智能云千帆大模型产业(北京)创新基地服务平台在会上启动上线,可为大模型AI原生应用的开发者提供全链条工具平台,配套“管家式”技术服务。
3. 百度集团执行副总裁、百度智能云事业群总裁沈抖介绍,百度与石景山区联手打造这个创新基地,目前已经集聚了十余家具备行业大模型训练和垂直领域应用开发能力的企业。
4. 中关村数智人工智能产业联盟(北京创新中心启动,“智谱Z基金”同步启动,超智算(北京)科技有限公司、北京智谱华章科技有限公司、摩尔线程智能科技(北京)有限责任公司、北京市商汤科技开发有限公司完成算力伙伴签约,入驻人工智能大模型产业集聚区。
腾讯TEG招聘:机器学习平台高级算法研究员-大模型应用
文章概要:
1. 腾讯TEG招聘机器学习平台高级算法研究员-模型岗位,工作地点在北京
2. 岗位职责包括负责大语言模型在捜广应用相关核心能力研发,在线推理性能优化和推理策略调优推荐场景应用算法研究和优化
3 岗位要求包括计算机相关专业,本科及以上学历4年及经验C/C++/Python等编程语言,熟练掌握常用算法和数据结构,熟悉TensorFlow/Pytorch等框架,有机器学习平台相关算法开发经验,熟悉推广搜常用模型算法,有强烈的自主学习能力,具备良好的沟通能力和优秀的团队能力
4. 邮箱:siaawang1002@tencent.com
5. 欢迎有需求朋友发布直招信息,可以发布在.nlpjob.com,也可以发布在AINLP相关交流> 6.加入AINLP招/招实习交流群,会从NLPJob网站或者求职群里选择招聘信息推送
7. 发布招聘信息或者求职进群请小助手微信 (idainlp2),备注社招/校招/实习+单位/学校+工作/研究方向
阅读原文
2. 岗位职责包括负责大语言模型在捜广应用相关核心能力研发,在线推理性能优化和推理策略调优推荐场景应用算法研究和优化
3 岗位要求包括计算机相关专业,本科及以上学历4年及经验C/C++/Python等编程语言,熟练掌握常用算法和数据结构,熟悉TensorFlow/Pytorch等框架,有机器学习平台相关算法开发经验,熟悉推广搜常用模型算法,有强烈的自主学习能力,具备良好的沟通能力和优秀的团队能力
4. 邮箱:siaawang1002@tencent.com
5. 欢迎有需求朋友发布直招信息,可以发布在.nlpjob.com,也可以发布在AINLP相关交流> 6.加入AINLP招/招实习交流群,会从NLPJob网站或者求职群里选择招聘信息推送
7. 发布招聘信息或者求职进群请小助手微信 (idainlp2),备注社招/校招/实习+单位/学校+工作/研究方向
【科技助残 · 前瞻科技】首个手语大模型SignLLM发布,或将打开无声世界的大门
文章概要:
1. SignLLM是全球首个多语种手语生成模型,能够将输入的文本或语音,转化对应的手语手势,包括美国手语(ASL)、德国手语(GSL)等8种不同国家手语>2.LLM的归功于两项关键创新:构建首个多语言手语数据集Prompt2Sign,为模型训练提供强大的数据基础;独创“视觉符号化“代码本重建”技术,将手语翻译任务转化为现有的文本翻译可以处理,有效利用语言模型 (LLM) 的强大语义和生成能力
3. SignLLM在八种不同的手语生成中目前,超越了过去传统方法开发的模型
阅读原文
3. SignLLM在八种不同的手语生成中目前,超越了过去传统方法开发的模型
人形机器人与AI大模型之Robot+AI的Transformer之旅
文章概要:
1. 从Transformer到模态大模型与应用Transformer推动了多大(MLLM)的
2 机器人现实世界至数据化的突破:RT-2、RoboCat与MimicGen
3 特斯拉SD,到端算法主流,为关键> 4. 英伟达Robocasa:具体智能关键节点,首次论证real-sim-real
5.演绎:在机器人real-s-real,存在scaling的基础上,推荐可执行化能力,迈向真正的AGI智能化
6.文后阅读原文,可下载的方法
阅读原文
2 机器人现实世界至数据化的突破:RT-2、RoboCat与MimicGen
3 特斯拉SD,到端算法主流,为关键> 4. 英伟达Robocasa:具体智能关键节点,首次论证real-sim-real
5.演绎:在机器人real-s-real,存在scaling的基础上,推荐可执行化能力,迈向真正的AGI智能化
6.文后阅读原文,可下载的方法
中国宝武、河钢集团、中国钢研同期发布钢铁行业大模型!
文章概要:
1. 中国宝武、河钢、中国研同期发布行业大模型,为应对市场挑战、竞争力以及实现可持续发展提供强有力的技术支持。
2. 10月23日,中国宝武了自主研发的“宝联登行业大模型”,该模型包括基础大模型、行业垂类大模型、应用场景领域模型三层架构,总体达到垂国内领先水平。
3. 10月24日,河钢自主研发的垂直领域钢铁行业人工智能大模型——“威赛博钢铁大模型,在2024中国国际经济博览会上发布。全国首发的垂直领域钢铁行业大模型,也是河北省首家通过国家生成式服务备案的模型。
4. 11月2日,国内首个行业智能决策大模型——中国钢研“冶金流程优化大模型”在CAC2024中国自动化大会主会场首发。
阅读原文
2. 10月23日,中国宝武了自主研发的“宝联登行业大模型”,该模型包括基础大模型、行业垂类大模型、应用场景领域模型三层架构,总体达到垂国内领先水平。
3. 10月24日,河钢自主研发的垂直领域钢铁行业人工智能大模型——“威赛博钢铁大模型,在2024中国国际经济博览会上发布。全国首发的垂直领域钢铁行业大模型,也是河北省首家通过国家生成式服务备案的模型。
4. 11月2日,国内首个行业智能决策大模型——中国钢研“冶金流程优化大模型”在CAC2024中国自动化大会主会场首发。
进阶丨《医疗健康行业大模型成熟度评估模型 第1部分:健康咨询》正式发布
文章概要:
1. 以大模型为代表的人工智能技术与医疗健康深度融合发展,赋能临床诊疗、患者管理等环节。中国信通院按照“标准先行”的工作路径在行业主管部门指导下,产学研用医各方共同研究医疗健康行业方法,开展医疗健康行业大模型技术要求、医疗健康行业大模型成熟度评估等系列,规范技术与医疗健康服务的融合路径,推动数字健康产业高质量发展。
2. 《医疗健康成熟度评估模型 第1部分:健康咨询》是成熟度评估系列的首个标准,中国信通海南网络技术有限公司(字节跳动旗下)、清华医疗机构、科研院所及信息技术企业共同研制,中国工程院院士AIIA医学人工智能委员会主席董家鸿指导并带领40余位医疗健康、信息技术等领域共同起草。
3. 《医疗健康行业大模型成熟度评估模型 第1部分:健康咨询》关注直接面向用户服务的健康咨询服务场景,在医疗专业能力方面,重点关注信息问询、疾病判断、健康建议等维度在交互能力方面,聚焦用户需求分析、语言能力、服务体验(用户价值、人文关怀)、安全能力等四个维度上述两个环节形成健康咨询场景下大模型应用的成熟度基准,提供定性定量相结合的评估细则初始级、受监督级级、可信级、可依赖级等五个级别
4. 标准将在互联网医疗健康产业联盟及产业发展联盟(AIIA)人工智能委员会范围内继续征求, 推动医疗健康模型行业标准转化,依托相关标准建立医疗人工智能行业专科评价数据库,推进不同专科大模型应用成熟度评估工作,欢迎相关领域专家,共同完善大模型体系,构筑健康新基建,打造健康、有序的产业生态,推动医疗健康大模型产业高质量发展。
阅读原文
2. 《医疗健康成熟度评估模型 第1部分:健康咨询》是成熟度评估系列的首个标准,中国信通海南网络技术有限公司(字节跳动旗下)、清华医疗机构、科研院所及信息技术企业共同研制,中国工程院院士AIIA医学人工智能委员会主席董家鸿指导并带领40余位医疗健康、信息技术等领域共同起草。
3. 《医疗健康行业大模型成熟度评估模型 第1部分:健康咨询》关注直接面向用户服务的健康咨询服务场景,在医疗专业能力方面,重点关注信息问询、疾病判断、健康建议等维度在交互能力方面,聚焦用户需求分析、语言能力、服务体验(用户价值、人文关怀)、安全能力等四个维度上述两个环节形成健康咨询场景下大模型应用的成熟度基准,提供定性定量相结合的评估细则初始级、受监督级级、可信级、可依赖级等五个级别
4. 标准将在互联网医疗健康产业联盟及产业发展联盟(AIIA)人工智能委员会范围内继续征求, 推动医疗健康模型行业标准转化,依托相关标准建立医疗人工智能行业专科评价数据库,推进不同专科大模型应用成熟度评估工作,欢迎相关领域专家,共同完善大模型体系,构筑健康新基建,打造健康、有序的产业生态,推动医疗健康大模型产业高质量发展。
再获两项殊荣认可!亚信安全信立方大模型斩获年度优秀案例奖 获得国家网信办备案认可
文章概要:
1. 亚信安全大荣获“2024大模型优秀案例奖,了其在人工智能与安全应用的相关安全事件
4. 信立方安全大模型在知识类、检测类、运营类场景中均有应用,能够提升安全运营的效率和,实现安全事件的自动化处理和响应。br>5. 信立方大模型此前在众多国家评选及活动中获得殊荣与肯定,亚信安全人工智能实验室将优化信立方安全大的技术架构核心能力大家提供更智能、便捷的网络安全垂域大模型方案,更将推动行业的智能化发展。
阅读原文
4. 信立方安全大模型在知识类、检测类、运营类场景中均有应用,能够提升安全运营的效率和,实现安全事件的自动化处理和响应。br>5. 信立方大模型此前在众多国家评选及活动中获得殊荣与肯定,亚信安全人工智能实验室将优化信立方安全大的技术架构核心能力大家提供更智能、便捷的网络安全垂域大模型方案,更将推动行业的智能化发展。
炸裂!大模型教程
文章概要:
1. 介绍了《大语言模型基础与前沿》这本书,包括作者背景和本书涵盖的内容。
2. 提供了免费领取本书资源的方式。
3. 介绍了大模型前沿系列课,包括课程内容和领取方式。
. 整理了QS前5大佬的现成顶会大模型idea。
5. 沃恩智慧研发的沃研Turbo大模型限时免费福利。
阅读原文
2. 提供了免费领取本书资源的方式。
3. 介绍了大模型前沿系列课,包括课程内容和领取方式。
. 整理了QS前5大佬的现成顶会大模型idea。
5. 沃恩智慧研发的沃研Turbo大模型限时免费福利。
AI赋能教育时代:教师应知应用的八个AI 大模型(带链接)
文章概要:
1 人工智能在教育领域展现出巨大的赋能潜力,文心一言、讯飞星火、通义千、天工 AI、百川 AI、豆包 AI、GPT-4、汤 AI 这八个 AI 大模型是当下备受关注的人工智能技术范例
2. 文心一言是百度推出的大规模语言模型,拥有强大的自然语言处理,可进行文本创作、翻译、答疑、任务
3. 讯飞星火是科大讯飞的产品,主要用于语音识别与合成,同时还支持多语种翻译、智能对话以及教育等功能
4. 通义千问是阿里巴巴达摩院推出的型 AI 大模型,支持多模态数据处理、智能问答以及个性化学习路径推荐教育应用场景
5 天工 是腾讯研发的,图像识别、自然语言以及机器学习领域均有,广泛应用于教育评估和智慧校园管理
6. 百川 AI 是京东研发的,主要在智能客服、知识图谱构建以及教育资源推荐等方面发挥作用
7. 豆包 AI 是豆包科技推出的,专注于情感计算与人机交互,在教育心理健康和智能辅导员方面独具优势
8. GPT-4O 是 OpenAI 的新一代大规模语言,以卓越的文本生成能力和深度理解能力著称
9. 商汤 AI 是商汤科技的在计算机视觉和深度学习方面优势显著,应用于智能监控、在线教育平台和虚拟实验室等领域
10. 上述八个 AI 大模型在教育,极大地了教学效率,为个性化、智能化教育提供强大支撑各个大模型的功能和特长各有侧重,教育工作者可根据实际需求合适 工具,更好地为教育
阅读原文
2. 文心一言是百度推出的大规模语言模型,拥有强大的自然语言处理,可进行文本创作、翻译、答疑、任务
3. 讯飞星火是科大讯飞的产品,主要用于语音识别与合成,同时还支持多语种翻译、智能对话以及教育等功能
4. 通义千问是阿里巴巴达摩院推出的型 AI 大模型,支持多模态数据处理、智能问答以及个性化学习路径推荐教育应用场景
5 天工 是腾讯研发的,图像识别、自然语言以及机器学习领域均有,广泛应用于教育评估和智慧校园管理
6. 百川 AI 是京东研发的,主要在智能客服、知识图谱构建以及教育资源推荐等方面发挥作用
7. 豆包 AI 是豆包科技推出的,专注于情感计算与人机交互,在教育心理健康和智能辅导员方面独具优势
8. GPT-4O 是 OpenAI 的新一代大规模语言,以卓越的文本生成能力和深度理解能力著称
9. 商汤 AI 是商汤科技的在计算机视觉和深度学习方面优势显著,应用于智能监控、在线教育平台和虚拟实验室等领域
10. 上述八个 AI 大模型在教育,极大地了教学效率,为个性化、智能化教育提供强大支撑各个大模型的功能和特长各有侧重,教育工作者可根据实际需求合适 工具,更好地为教育
大模型营销,主打一个“烧钱”......
文章概要:
1. 互联网的尽头是金融,明星的尽头是带货,大模型的尽头是营销。
. 大模型时代,跟着一起飞的不只有英伟达,还有卖的<>3. 今年暑假,大模型的纷纷砸钱,B站广告。
4. B站也直接在财报会上贴脸开大,上半年B 站广告主数量同比增长 50%。
5 AppGrowning的数据显示,从今年3月,imi每个月的广告投放都高达上千万元。
6 10月份,大模型应用的投流进入了,Kimi10月投高达1.99亿,第三季度的总和1.7亿,包App10投放了20万元;腾讯元宝1月了87万元;智谱清言投了13.78万元。> 通义千问排最后,大家都问义问咋这么抠”。br>. 不同于国外市场和年轻人和大谈恋爱对要求就是纯工具,变现模式就,卖会员要么单次充值。br> 一款AI 的App想要从上提高, 得让你这花钱的欲望啊,以前百团大战烧钱的时候起码用户会团购花钱,现在大模型吸引来了用户光靠卖会员的话,可能连预训练都不起来。br>10. 所以,大模型,真的任重而道。但是大钱,可两眼一就是烧。
阅读原文
. 大模型时代,跟着一起飞的不只有英伟达,还有卖的<>3. 今年暑假,大模型的纷纷砸钱,B站广告。
4. B站也直接在财报会上贴脸开大,上半年B 站广告主数量同比增长 50%。
5 AppGrowning的数据显示,从今年3月,imi每个月的广告投放都高达上千万元。
6 10月份,大模型应用的投流进入了,Kimi10月投高达1.99亿,第三季度的总和1.7亿,包App10投放了20万元;腾讯元宝1月了87万元;智谱清言投了13.78万元。> 通义千问排最后,大家都问义问咋这么抠”。br>. 不同于国外市场和年轻人和大谈恋爱对要求就是纯工具,变现模式就,卖会员要么单次充值。br> 一款AI 的App想要从上提高, 得让你这花钱的欲望啊,以前百团大战烧钱的时候起码用户会团购花钱,现在大模型吸引来了用户光靠卖会员的话,可能连预训练都不起来。br>10. 所以,大模型,真的任重而道。但是大钱,可两眼一就是烧。
领先OpenAI,国产视频生成大模型领跑商业化
文章概要:
1. 字节的AI助手“豆包”近日发布了视频生成内测,用户可以通过图文内容快速生成视频。
2. 近年来,国内AI视频生成呈现出蓬勃发展的势头,越来越多的科技公司入局。
. 国内视频生成大模型在生成质量和应用场景拓展方面不断进步企业也用户反馈市场需求的回馈持续产品。<>4. 尽管在技术进步方面取得了成就在商业化应用上视频生成模型仍面临着一系列挑战<>5. 随着技术的不断和商业化进程的,AI视频生成模型将为数字娱乐产业的活力。
阅读原文
2. 近年来,国内AI视频生成呈现出蓬勃发展的势头,越来越多的科技公司入局。
. 国内视频生成大模型在生成质量和应用场景拓展方面不断进步企业也用户反馈市场需求的回馈持续产品。<>4. 尽管在技术进步方面取得了成就在商业化应用上视频生成模型仍面临着一系列挑战<>5. 随着技术的不断和商业化进程的,AI视频生成模型将为数字娱乐产业的活力。
加快发展“文化+科技”新质生产力,多彩新媒发布AI大模型应用创新实践新布局
文章概要:
1. 131日,流媒体网主办的南宁论道上,新了自身的模型应用创新实践。
2. 来自广西、贵州、、、、浙江、湖北、、辽宁、江西11家省级新媒体以及大屏AI的领先企业开科技、运营商行业商帕科发起视听大模型创新应用产业合作联盟,并作为联盟首批核心成员共同签约。
3. 科技创新是新质生产力发展的驱动,作为被贵州省委宣传部明确定位成“+融合发展的平台型企业,科技创新一直是多彩媒的重要基因。
4 随着新一轮科技革命和产业变革深入发展,已成为驱动新生产力的重要引擎。AI大潮之下,新媒已完成智能推荐、智能播控、营销、智能用户运营等多项自主研发的“智能”行业解决方案,更是锚定“AIIP双轮驱动大方向,以AI+播控、AI+、AI+内容创作、AI+运营、AI+类、+运维安全等All in AI姿态进行科技布局br> 5.本届南宁道上多彩新媒携手酷开帕科科技,联合打造了展区,共同展出其大屏大模型应用合作落地成果。
6. 网络视听正成为数字经济新质的力量,文化消费信息消费的带动力、辐射、力持续增强。视听大模型创新应用产业合作联盟的目标是围绕总局视听大模型规划,共建、共享AI大模型技术能力体系——汇聚联盟技术力量和资源,推动新媒体行业数据的及语料库构建,共同打造高稳定、高扩展AI大模型技术基座平台。
阅读原文
2. 来自广西、贵州、、、、浙江、湖北、、辽宁、江西11家省级新媒体以及大屏AI的领先企业开科技、运营商行业商帕科发起视听大模型创新应用产业合作联盟,并作为联盟首批核心成员共同签约。
3. 科技创新是新质生产力发展的驱动,作为被贵州省委宣传部明确定位成“+融合发展的平台型企业,科技创新一直是多彩媒的重要基因。
4 随着新一轮科技革命和产业变革深入发展,已成为驱动新生产力的重要引擎。AI大潮之下,新媒已完成智能推荐、智能播控、营销、智能用户运营等多项自主研发的“智能”行业解决方案,更是锚定“AIIP双轮驱动大方向,以AI+播控、AI+、AI+内容创作、AI+运营、AI+类、+运维安全等All in AI姿态进行科技布局br> 5.本届南宁道上多彩新媒携手酷开帕科科技,联合打造了展区,共同展出其大屏大模型应用合作落地成果。
6. 网络视听正成为数字经济新质的力量,文化消费信息消费的带动力、辐射、力持续增强。视听大模型创新应用产业合作联盟的目标是围绕总局视听大模型规划,共建、共享AI大模型技术能力体系——汇聚联盟技术力量和资源,推动新媒体行业数据的及语料库构建,共同打造高稳定、高扩展AI大模型技术基座平台。
直面“AI 取代程序员”论,《新程序员 008:大模型驱动软件开发》正式上市!
文章概要:
1. 《新程序员 008:大模型驱动软件开发》正式上市,CSDN 特别策划推出该期特刊,旨在探讨 AI 时代软件开发的未来
2. 大模型为计算产业带来了计算范式、开发范式、交互范式的三大范式改变,AI 正在从简单的代码辅助生成,演进到能够实现自主处理和开发的阶段
3.新程序员 008》开篇邀请了四位在软件工程和 AI 领域具有深远影响力的专家,从技术演进、设计哲学、工程实践和语言发展四个维度,全方位解析大模型时代软件工程的新范式
4.“AGI 技术 50 人”专题,汇聚了人工智能领域最具影响力的技术专家,深度探讨了开源与闭源的权衡、大模型架构的演进博弈
5. 《新程序员 008》深入阿里云、腾讯云、字节跳动、蚂蚁集团、新浪、京东、360、美团、Thoughtworks 等头部企业,揭示他们在 AI 研发转型中的创新实践
6. 《新程序员 008》现已上市,即刻下单即可享受纸质书+电子书双重权益,原价 139 元,现享 55 元优惠价
阅读原文
2. 大模型为计算产业带来了计算范式、开发范式、交互范式的三大范式改变,AI 正在从简单的代码辅助生成,演进到能够实现自主处理和开发的阶段
3.新程序员 008》开篇邀请了四位在软件工程和 AI 领域具有深远影响力的专家,从技术演进、设计哲学、工程实践和语言发展四个维度,全方位解析大模型时代软件工程的新范式
4.“AGI 技术 50 人”专题,汇聚了人工智能领域最具影响力的技术专家,深度探讨了开源与闭源的权衡、大模型架构的演进博弈
5. 《新程序员 008》深入阿里云、腾讯云、字节跳动、蚂蚁集团、新浪、京东、360、美团、Thoughtworks 等头部企业,揭示他们在 AI 研发转型中的创新实践
6. 《新程序员 008》现已上市,即刻下单即可享受纸质书+电子书双重权益,原价 139 元,现享 55 元优惠价
大模型助力消费产业转型升级(上篇)
文章概要:
1. 近日,“大模型X新消费互动沙龙在杨浦区举办,百余位产业专家、大模型等齐聚一堂,共同探讨模型在零售及消费与挑战
2.甬平表示,百开放合作和自研探索,打造全场景人工智能商贸平台多维度探索新商业数智未来
3. 商汤科技数字文娱事业部副总裁李星冶认为,大模型技术与场景应用是捆绑的,商汤日日新大模型矩阵能服务大多新消费领域的需求场景。
4. 东方购物团委书记、市场营销部经理张萌表示,东方购物以大屏为基础,积极拓展在新媒体渠道的布局,逐步形成全媒体。
5. 数势科技O韩秀锋表示,国内茶饮连锁店市场竞争激烈,新消费企业进入数据+产品+运营三位一体的营销理念阶段。
6. 火山引擎大消费行业解决方案专家吴晓晨表示,字节是一家创立于移动互联网时代的公司,AI不仅仅是工具,更是可以改变世界的力量。
. 智谱华东地区商务总监李朝朋表示消费行业的面临流量贵、爆款卷、成本高等业务挑战,大模型技术从底座重塑“人”、“货”、“场”。
阅读原文
2.甬平表示,百开放合作和自研探索,打造全场景人工智能商贸平台多维度探索新商业数智未来
3. 商汤科技数字文娱事业部副总裁李星冶认为,大模型技术与场景应用是捆绑的,商汤日日新大模型矩阵能服务大多新消费领域的需求场景。
4. 东方购物团委书记、市场营销部经理张萌表示,东方购物以大屏为基础,积极拓展在新媒体渠道的布局,逐步形成全媒体。
5. 数势科技O韩秀锋表示,国内茶饮连锁店市场竞争激烈,新消费企业进入数据+产品+运营三位一体的营销理念阶段。
6. 火山引擎大消费行业解决方案专家吴晓晨表示,字节是一家创立于移动互联网时代的公司,AI不仅仅是工具,更是可以改变世界的力量。
. 智谱华东地区商务总监李朝朋表示消费行业的面临流量贵、爆款卷、成本高等业务挑战,大模型技术从底座重塑“人”、“货”、“场”。
大模型助力消费产业转型升级(上篇)
文章概要:
1. 由启迪之星(上海和小即是大创新伙伴联合CCF(上海)中国计算机学会、百联科创中心主办的“大模型X新消费”互动沙龙在杨举办<> 活动回顾将分为上下两篇推送,上篇聚焦主题演讲嘉宾干货。br>3. 百联集团郭甬平,百联合作和自研探索,全场景商贸平台,从运营管理用户体验、数据融合等多维度探索新商业数智未来。br>4. 商汤科技文娱事业部副总裁李冶表示,大模型技术与场景应用是深度捆绑的。
5. 东方购物团委书记、市场营销部经理张萌表示东方购物植根上海20年以大屏为基础,生产、营销服务、供应链管理经验为驱动,积极拓展在渠道的,形成全媒体沉淀。7. 火山引擎大消费行业解决方案专家吴晓晨表示字节是一家创立于移动时代的,AI不仅仅是工具,更是可以改变的力量。
. 智谱地区商务总监李朝朋消费行业的增长面临流量贵、爆款卷、成本高等业务挑战模型技术从底座重塑“人”“货”、“场”
阅读原文
5. 东方购物团委书记、市场营销部经理张萌表示东方购物植根上海20年以大屏为基础,生产、营销服务、供应链管理经验为驱动,积极拓展在渠道的,形成全媒体沉淀。
. 智谱地区商务总监李朝朋消费行业的增长面临流量贵、爆款卷、成本高等业务挑战模型技术从底座重塑“人”“货”、“场”
大模型赋能工业智能化的机遇与挑战
文章概要:
1. 大模型为工业智能化带来了重大机遇,有望解决长期困扰工业的复杂性和不确定性问题。
2. 大模型在认知能力方面,尚未完全具备专家级的复杂决策能力。
3. 在数据方面,大模型对专业性强、结构复杂的工业数据理解不足,且数据要素市场不健全、隐私保护要求等因素限制了高价值工业数据的使用。
4. 未来大的应用需要在提升认知能力、完善数据生态、确保安全合规等方面持续努力。同时,应注重人机协作,充分发挥大模型与人类专家各自的优势,共同推动工业智能化发展。
阅读原文
2. 大模型在认知能力方面,尚未完全具备专家级的复杂决策能力。
3. 在数据方面,大模型对专业性强、结构复杂的工业数据理解不足,且数据要素市场不健全、隐私保护要求等因素限制了高价值工业数据的使用。
4. 未来大的应用需要在提升认知能力、完善数据生态、确保安全合规等方面持续努力。同时,应注重人机协作,充分发挥大模型与人类专家各自的优势,共同推动工业智能化发展。
AI正在取代人类?真的假的?!
文章概要:
1. AI正在成为各领域的“新晋顶流”,引发网友热议。今天,联通主播带你深入了解AI大模型,探讨AI将如何取代人类。
2. AI就像是一个“超级大脑”,通过建立一个小小的神经元与神经网络,加以一系列复杂的训练,组建自己的人工神经网络,让自己变得越来越“聪明”。
3. 影响大模型智能水平最大的两个要素是参数和算力。数据是模型的基础,数据越多,模型就有更多的信息可以学习,但同样的需要大量资源来支撑。
4. 大模型一般具备学习与表达能力、理解与生成能力、化能力。
5. 大模型的分类有语言大模型、视觉大模型、多模态大模型。
6. 中国联通自主研发的联通元景“1+1+M大模型体系,就是一个庞大又智能的厨房系统。这个厨房中的“1+1+M”,指基础大、一个大模型平台、“M”种行业大模型。
7. 目前已形成30+行业大模型和100+标杆应用。
8. 元景了新型的人机协同工作模式,从传统的菜单式服务向引导式智慧交互演变。
9. 在元景服装大模型的支持下,通过在聊天框中输入关键词,只需要三秒钟,AI就能生成服装设计上身效果图。
10. AI能取代的或许是那些重复性高、可的,同样的,那些富有创造性、或是很难被标准化、程序化的岗位,是最难被AI取代的。
阅读原文
2. AI就像是一个“超级大脑”,通过建立一个小小的神经元与神经网络,加以一系列复杂的训练,组建自己的人工神经网络,让自己变得越来越“聪明”。
3. 影响大模型智能水平最大的两个要素是参数和算力。数据是模型的基础,数据越多,模型就有更多的信息可以学习,但同样的需要大量资源来支撑。
4. 大模型一般具备学习与表达能力、理解与生成能力、化能力。
5. 大模型的分类有语言大模型、视觉大模型、多模态大模型。
6. 中国联通自主研发的联通元景“1+1+M大模型体系,就是一个庞大又智能的厨房系统。这个厨房中的“1+1+M”,指基础大、一个大模型平台、“M”种行业大模型。
7. 目前已形成30+行业大模型和100+标杆应用。
8. 元景了新型的人机协同工作模式,从传统的菜单式服务向引导式智慧交互演变。
9. 在元景服装大模型的支持下,通过在聊天框中输入关键词,只需要三秒钟,AI就能生成服装设计上身效果图。
10. AI能取代的或许是那些重复性高、可的,同样的,那些富有创造性、或是很难被标准化、程序化的岗位,是最难被AI取代的。
求教0基础入门大模型的学习路线?java出身,数学良好,希望入局大模型算法,有无必要从cnn学起?
文章概要:
1. 本文介绍了0基础入门大模型学习路线,包括prompt工程、AI编程调用、模型应用开发、深水区(模型训练和微调)、和等方面。
2. 学习路线建议先从使用大模型开始,其背后的原理,再探索如何将其应用于实际问题。
3. 在大模型应用方面,需要学习如LangChain这样的开发库,以及如LIndex这样的数据索引和检索工具。
4 深水区(模型训练和微调)阶段,重点学习各种常见的预训练模型、模型结构及其主要的预训练。
5. 产品方面,需要关注用户需求、产品逻辑、产品形态和商业模式等方面。
阅读原文
2. 学习路线建议先从使用大模型开始,其背后的原理,再探索如何将其应用于实际问题。
3. 在大模型应用方面,需要学习如LangChain这样的开发库,以及如LIndex这样的数据索引和检索工具。
4 深水区(模型训练和微调)阶段,重点学习各种常见的预训练模型、模型结构及其主要的预训练。
5. 产品方面,需要关注用户需求、产品逻辑、产品形态和商业模式等方面。
AI大模型落地,为什么是央国企先行?
文章概要:
1. 2024年1-7月,央国企采购大模型项目数量已超过950个,且均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向
2. 自2023年三季度,央国企就已经开始紧锣密鼓地筹备智算中心建设,智算中心只是央国企落地AI的一个起点
3. 企业在云计算时代交得学费也并没有浪费,在AI大模型时代,央国企在政策引导、需求迫使和环境因素等多方作用下已经开始先行落地AI大模型
4. 阻挡大模型落地进程的还不仅仅是算力资源短缺,新的架构也迎来了一些新的挑战,比如从AI Infra到MaaS,再到上层的AI应用,涉及很多模型搭建的环节,这些都需要大模型服务商与企业一同探索落地路径
5. 随着AI应用走向深水区,数据安全、数据共享和数据溯源等问题则开始被一一搬到台面上
阅读原文
2. 自2023年三季度,央国企就已经开始紧锣密鼓地筹备智算中心建设,智算中心只是央国企落地AI的一个起点
3. 企业在云计算时代交得学费也并没有浪费,在AI大模型时代,央国企在政策引导、需求迫使和环境因素等多方作用下已经开始先行落地AI大模型
4. 阻挡大模型落地进程的还不仅仅是算力资源短缺,新的架构也迎来了一些新的挑战,比如从AI Infra到MaaS,再到上层的AI应用,涉及很多模型搭建的环节,这些都需要大模型服务商与企业一同探索落地路径
5. 随着AI应用走向深水区,数据安全、数据共享和数据溯源等问题则开始被一一搬到台面上
评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024
文章概要:
1. 上交大MIFA实验室提出了全新的大模型评估指标Diff-eRank,该方法从信息论和几何的视角,分析大模型的隐藏表征,量化大语言模型在训练前后如何剔除数据中的冗余信息,并以此作为衡量模型性能的指标
2. 研究团队引入了有效秩的概念(Effective Rank,简写为eRank),用于反应大模型表征空间的不确定性或混乱程度
3. 团队选择从几何和信息论的角度研究这些表征的秩,通过分析大模型表征的秩来进行模型评估
4. 研究团队使用OPT模型家族,在多个数据集上计算了Diff-eRank,实验结果发现,Diff-eRank和Reduced Loss都随着模型规模的扩大而上升
5. Diff-eRank背后的思想还可以拓展多模态大模型的评估,例如,在视觉-语言多模态大模型中,可以通过借助表征的有效秩分析视觉和语言表征的匹配程度来衡量模型的模态对齐性能
6. Diff-eRank作为一种全新的评估指标,提供了一个独特的理论视角去理解和分析大模型的一种工作原理。Diff-eRank不仅有助于评估大模型的「数据去噪」能力,还可能为模型压缩(如剪枝、量化、蒸馏等)等技术的发展提供新的视角
阅读原文
2. 研究团队引入了有效秩的概念(Effective Rank,简写为eRank),用于反应大模型表征空间的不确定性或混乱程度
3. 团队选择从几何和信息论的角度研究这些表征的秩,通过分析大模型表征的秩来进行模型评估
4. 研究团队使用OPT模型家族,在多个数据集上计算了Diff-eRank,实验结果发现,Diff-eRank和Reduced Loss都随着模型规模的扩大而上升
5. Diff-eRank背后的思想还可以拓展多模态大模型的评估,例如,在视觉-语言多模态大模型中,可以通过借助表征的有效秩分析视觉和语言表征的匹配程度来衡量模型的模态对齐性能
6. Diff-eRank作为一种全新的评估指标,提供了一个独特的理论视角去理解和分析大模型的一种工作原理。Diff-eRank不仅有助于评估大模型的「数据去噪」能力,还可能为模型压缩(如剪枝、量化、蒸馏等)等技术的发展提供新的视角
大语言模型技术
文章概要:
1. ChatGPT的技术发展历程:基于GPT-35,拥有强大的知识和文本生成能力,通过RLHF技术,实现与人类的自然对话和流畅的文本
2. 国内外主要大语言模型技术对比:ChatGPT参数量、训练数据更丰富、RLHF技术使其更符合人类预期,国内模型在参数量、训练数据、技术和工程积累等方面存在差距
3. 大模型应用对数字产业的影响:推动通用搜索引擎新布局,革新基础办公软件,提升对话式AI的知识储备和理解能力,于企业服务和垂直领域>4. 大模型带来的风险与挑战:算力瓶颈、主流大模型架构局限高质量训练不足、大模型爆款应用尚未出现
5. 中国AI大模型产业趋势展望:云侧与端侧模型满足不同需求,趋于通用化专用,广泛开源,芯片不断升级,产业生态体系将不断完善
阅读原文
2. 国内外主要大语言模型技术对比:ChatGPT参数量、训练数据更丰富、RLHF技术使其更符合人类预期,国内模型在参数量、训练数据、技术和工程积累等方面存在差距
3. 大模型应用对数字产业的影响:推动通用搜索引擎新布局,革新基础办公软件,提升对话式AI的知识储备和理解能力,于企业服务和垂直领域>4. 大模型带来的风险与挑战:算力瓶颈、主流大模型架构局限高质量训练不足、大模型爆款应用尚未出现
5. 中国AI大模型产业趋势展望:云侧与端侧模型满足不同需求,趋于通用化专用,广泛开源,芯片不断升级,产业生态体系将不断完善
有望减少所需计算资源,科学家提出新方法对齐大模型
文章概要:
1. ChatGPT、Pathways、Llama 等大模型在多种任务中展现出令人印象深刻的能力,但它们可能会无意中生成误导性信息和有害内容,因此需要将大模型与人类需求对齐
2. 美国佐治亚理工学院课题组提出通过表征编辑来对齐大模型,该已被人工智能顶会神经信息处理系统大会接收
3. 目前大模型对齐方法通常分为两类:微调和测试时对齐,该课题组采用了一种新方法,透过编辑模型的表征来对齐 LLM
4.实验中,该团队将方法与现有的测试阶段对齐技术进行了比较,发现这种方法能够显著提升模型的对齐能力
5. 大模型的应用日益广泛,正在不断改变我们的生活,该课题组提出的通过动态编辑大模型表征实现对齐的方法,具有许多前景广阔的应用
6. 该团队还将对该编辑模型表征做进一步提升,包括向控制策略中注入归纳偏差、多目标对齐、更先进的训练算法等
阅读原文
2. 美国佐治亚理工学院课题组提出通过表征编辑来对齐大模型,该已被人工智能顶会神经信息处理系统大会接收
3. 目前大模型对齐方法通常分为两类:微调和测试时对齐,该课题组采用了一种新方法,透过编辑模型的表征来对齐 LLM
4.实验中,该团队将方法与现有的测试阶段对齐技术进行了比较,发现这种方法能够显著提升模型的对齐能力
5. 大模型的应用日益广泛,正在不断改变我们的生活,该课题组提出的通过动态编辑大模型表征实现对齐的方法,具有许多前景广阔的应用
6. 该团队还将对该编辑模型表征做进一步提升,包括向控制策略中注入归纳偏差、多目标对齐、更先进的训练算法等
AI大模型:开启智能新时代的钥匙
文章概要:
1. AI大模型是推动智能技术发展的重要力量,正在逐步改变我们的和工作。
2. AI大模型卫星能够在天上自主作决策,无需将数据传回地面即可执行相关任务这大大提升了卫星的工作效率。
AI大模型字技术的广泛应用,将推动字体设计行业的。
4. 电商直播数字模型能够精准且快速地回复观众的提问,声音细节、以及回复内容都充满了个性化。
阅读原文
2. AI大模型卫星能够在天上自主作决策,无需将数据传回地面即可执行相关任务这大大提升了卫星的工作效率。
AI大模型字技术的广泛应用,将推动字体设计行业的。
4. 电商直播数字模型能够精准且快速地回复观众的提问,声音细节、以及回复内容都充满了个性化。
NeurlPS 2024 | 上交大、清华提出Diff-eRank,大模型评估的全新视角与方法
文章概要:
1. 传统的评估方法无法深入探究模型内部的信息处理过程,对于多模态大语言模型现有的评估无法给出更加重要维度上的评价。
2. 上海交通大学和清华大学等科研团队的研究者提出了一种全新的大模型评估指标Diff-eRank,这是一种基于模型表征的「有效秩」的评估指标,从信息论和几何学的角度分析并量化大语言模型在训练前后如何剔除冗余信息,并以此衡量模型性能。
3. 研究团队引入了有效秩的概念(Effective Rank,后面简写为eRank),用于反应大模型表征空间的不确定性或混乱程度。
4. 大模型在处理一系列输入时,它每个token生成一个高维表征;这些表征通常可以捕捉输入的语义和句法信息。因此,研究团队考虑分析这些表征来评估大模型的性能。
5. 通过在不同类型的数据集(如Wikipedia、openwebtext2、dolly-15k和hh-rlhf)上使用Diff-eRank和Reduced Loss对OPT模型家族进行评估,实验结果发现Diff-eRank和Reduced Loss都随着模型规模的扩大而上升。
6. 为了进一步验证Diff-eRank的有效性,作者在基准测试数据集上,引入准确率作为比较指标。实验结果显示,这三个指标在测试集上基本都在模型规模增加时变大。而且与Loss相比,Diff-eRank与准确率的趋势更加一致,说明Diff-eRank有效地用于评估语言模型。
7. Diff-eRank背后的思想还可以拓展用于多模态大模型的评估。例如,在视觉-语言多模态大模型中,我们可以通过借助表征的有效秩分析视觉和语言表征的匹配程度来衡量模型的模态对齐性能。
8. 研究团队还进行了额外的实验,计算了对图像进行顺时针旋转操作后的有效秩。结果表明,所有与图像相关的量在执行旋转后都会上升,这说明多模态模型能感知图像的细微语义变化,尤其是位置信息。图像旋转后,图像压缩比和图像-文本对齐分数均下降,表明连接器在压缩视觉信息方面效果变差,以及旋转后的图像与相应文本对齐性变差。
阅读原文
2. 上海交通大学和清华大学等科研团队的研究者提出了一种全新的大模型评估指标Diff-eRank,这是一种基于模型表征的「有效秩」的评估指标,从信息论和几何学的角度分析并量化大语言模型在训练前后如何剔除冗余信息,并以此衡量模型性能。
3. 研究团队引入了有效秩的概念(Effective Rank,后面简写为eRank),用于反应大模型表征空间的不确定性或混乱程度。
4. 大模型在处理一系列输入时,它每个token生成一个高维表征;这些表征通常可以捕捉输入的语义和句法信息。因此,研究团队考虑分析这些表征来评估大模型的性能。
5. 通过在不同类型的数据集(如Wikipedia、openwebtext2、dolly-15k和hh-rlhf)上使用Diff-eRank和Reduced Loss对OPT模型家族进行评估,实验结果发现Diff-eRank和Reduced Loss都随着模型规模的扩大而上升。
6. 为了进一步验证Diff-eRank的有效性,作者在基准测试数据集上,引入准确率作为比较指标。实验结果显示,这三个指标在测试集上基本都在模型规模增加时变大。而且与Loss相比,Diff-eRank与准确率的趋势更加一致,说明Diff-eRank有效地用于评估语言模型。
7. Diff-eRank背后的思想还可以拓展用于多模态大模型的评估。例如,在视觉-语言多模态大模型中,我们可以通过借助表征的有效秩分析视觉和语言表征的匹配程度来衡量模型的模态对齐性能。
8. 研究团队还进行了额外的实验,计算了对图像进行顺时针旋转操作后的有效秩。结果表明,所有与图像相关的量在执行旋转后都会上升,这说明多模态模型能感知图像的细微语义变化,尤其是位置信息。图像旋转后,图像压缩比和图像-文本对齐分数均下降,表明连接器在压缩视觉信息方面效果变差,以及旋转后的图像与相应文本对齐性变差。
开源大模型推理引擎现状及常见推理优化方法总结
文章概要:
1. 开源大模型推理引擎现状及常见推理优化方法。
2. 主流引擎现状:tgi存在吞吐差、调度串行、使用rust实现调度逻辑等问题;vllm对模型和硬件支持完善,功能齐全,但代码臃肿复杂;sglang性能最优,代码可拓展性高,但开发人员;lmdeploy调度策略最优,对多模态模型支持好,但功能较少;tensorrt-llm底层kernel有nvidia黑魔法加持,但不完全开源。
3. 大模型推理的主要优化技术:pagedattn、kv cache、Continous Batching、Flash Attention、Prefix Caching、Speculative Dec、量化、kv cache压缩、prefill-decode分离架构、chunked Prefill、constrained decoding、CUDA Graph、FlashInfer、多模态推理、大模型RAG、function call、多卡推理、nvidia GPU工作原理。
4. 全文总结:LLM的推理引擎处于摸索起步阶段,难点在于要面向各种模型和硬件平台,且各种不同角度的优化方法错综复杂需要去办法兼容。br> 5. 未来展望:如果V2版本能彻底解决CPU侧调度和各种功能之间的冲突兼容问题,那长远看vllm还是比sglang要有优势的。
阅读原文
2. 主流引擎现状:tgi存在吞吐差、调度串行、使用rust实现调度逻辑等问题;vllm对模型和硬件支持完善,功能齐全,但代码臃肿复杂;sglang性能最优,代码可拓展性高,但开发人员;lmdeploy调度策略最优,对多模态模型支持好,但功能较少;tensorrt-llm底层kernel有nvidia黑魔法加持,但不完全开源。
3. 大模型推理的主要优化技术:pagedattn、kv cache、Continous Batching、Flash Attention、Prefix Caching、Speculative Dec、量化、kv cache压缩、prefill-decode分离架构、chunked Prefill、constrained decoding、CUDA Graph、FlashInfer、多模态推理、大模型RAG、function call、多卡推理、nvidia GPU工作原理。
4. 全文总结:LLM的推理引擎处于摸索起步阶段,难点在于要面向各种模型和硬件平台,且各种不同角度的优化方法错综复杂需要去办法兼容。br> 5. 未来展望:如果V2版本能彻底解决CPU侧调度和各种功能之间的冲突兼容问题,那长远看vllm还是比sglang要有优势的。
AI大模型落地,为什么是央国企先行?
文章概要:
1. 央国企采购大模型项目数量已超过950个,均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向。
2. 政策推动是央国企纷纷落地大模型的决定性因素,国资委多次对中央企业发展人工智能提出要求。
3. 运营商、政务、能源抢先建设智算中心,政务和运营商对智算中心的出资更大。
4. AI大模型时代,央国企在政策引导、需求迫使和环境因素等多方作用下已经开始先行落地AI大模型。
5. 央国企在大模型落地方面,主要围绕智算中心和行业应用,后者包括大模型预训练,大模型开发,以及针对各别环节或特定场景构建大模型应用或解决方案。
6. 大模型落地进程行至,仍然有很多问题亟待解决,如算力资源短缺、模型搭建的环节需要探索落地路径、数据安全、数据共享和数据溯源等问题。
阅读原文
2. 政策推动是央国企纷纷落地大模型的决定性因素,国资委多次对中央企业发展人工智能提出要求。
3. 运营商、政务、能源抢先建设智算中心,政务和运营商对智算中心的出资更大。
4. AI大模型时代,央国企在政策引导、需求迫使和环境因素等多方作用下已经开始先行落地AI大模型。
5. 央国企在大模型落地方面,主要围绕智算中心和行业应用,后者包括大模型预训练,大模型开发,以及针对各别环节或特定场景构建大模型应用或解决方案。
6. 大模型落地进程行至,仍然有很多问题亟待解决,如算力资源短缺、模型搭建的环节需要探索落地路径、数据安全、数据共享和数据溯源等问题。
视频生成模型能否“理解”物理规律?豆包大模型团队公布系统性实验结论
文章概要:
1. 字节跳动豆包大模型团队近期发布成果《How Far is Video Generation from World Model: A Physical Law Perspective》,该成果系统性分析了主流DiT架构视频生成模型能否从数据集中抽象并理解物理规律,并为此进行了系统性实验
2. 研究深入探讨了视频生成模型在学习物理定律时的泛化能力,尤其是在三种不同的泛化情境下:分布内泛化(ID)、分布外泛化(OOD)和组合泛化
3. 实验结果表明,模型规模和数据量的增加对分布内泛化至关重要,而简单的数据量和模型规模的增加无法有效提升模型在OOD场景中的推理能力
4. 当训练集覆盖了更多组合场景时,模型能够在未见过的组合中展现出更强的泛化能力
5. 视频生成模型对于分布外泛化表现不佳,但在组合场景下,数据和模型Scaling可带来一定提升,这究竟来自于案例学习,还是对底层规律的抽象理解?进行了相关实验
6. 模型似乎更多依赖记忆和案例模仿,而非抽象出普遍的物理规则,实现分布外泛化(OOD)
7. 视频生成模型更习惯于通过“颜色”寻找相似参考生成物体运动状态,其次是大小,再次是速度,最后才是形状
8. 模型对案例匹配的依赖限制了其效果。在不了解底层规则的情况下,模型检索并组合片段,可能会生成不符合现实的结果
9. 单纯依赖视频表示不足以进行精确的物理建模两位一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作
阅读原文
2. 研究深入探讨了视频生成模型在学习物理定律时的泛化能力,尤其是在三种不同的泛化情境下:分布内泛化(ID)、分布外泛化(OOD)和组合泛化
3. 实验结果表明,模型规模和数据量的增加对分布内泛化至关重要,而简单的数据量和模型规模的增加无法有效提升模型在OOD场景中的推理能力
4. 当训练集覆盖了更多组合场景时,模型能够在未见过的组合中展现出更强的泛化能力
5. 视频生成模型对于分布外泛化表现不佳,但在组合场景下,数据和模型Scaling可带来一定提升,这究竟来自于案例学习,还是对底层规律的抽象理解?进行了相关实验
6. 模型似乎更多依赖记忆和案例模仿,而非抽象出普遍的物理规则,实现分布外泛化(OOD)
7. 视频生成模型更习惯于通过“颜色”寻找相似参考生成物体运动状态,其次是大小,再次是速度,最后才是形状
8. 模型对案例匹配的依赖限制了其效果。在不了解底层规则的情况下,模型检索并组合片段,可能会生成不符合现实的结果
9. 单纯依赖视频表示不足以进行精确的物理建模两位一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作
华鲲振宇AI合作伙伴大会:全面智能化时代 给出大模型实践最优解
文章概要:
1 华鲲振宇在AI合作伙伴大会中表示坚持AI解题思路,坚持为客户和伙伴创造价值,就是大模型实践的最优解。
2. 华鲲振宇提出AI超融合解决方案,从架构设计、基础设施、数据分析适配、应用开发到系统集成、运维的全链条,端到端企业克服技术和成本上的障碍,让大模型真正能跑起来,实现真正的数化转型br>3. 华鲲振宇GHCI AI超被形象地称为融多多”,降低企业初始投资35%以上,无需专业技术维护。目前,“融多多”正在晋云集团、中铁、南京燃气150余家企业规模部署,助推AI大模型在企业发挥价值和作用。
4. 华鲲振宇在本次大会上启动了HAPN伙伴计划。该计划致力于根据合作伙伴的不同类型和能力,构建一个更加紧密的合作生态系统,共同开发满足市场需求的产品和服务,助力客户快速实现全面智能化转型。
阅读原文
2. 华鲲振宇提出AI超融合解决方案,从架构设计、基础设施、数据分析适配、应用开发到系统集成、运维的全链条,端到端企业克服技术和成本上的障碍,让大模型真正能跑起来,实现真正的数化转型br>3. 华鲲振宇GHCI AI超被形象地称为融多多”,降低企业初始投资35%以上,无需专业技术维护。目前,“融多多”正在晋云集团、中铁、南京燃气150余家企业规模部署,助推AI大模型在企业发挥价值和作用。
4. 华鲲振宇在本次大会上启动了HAPN伙伴计划。该计划致力于根据合作伙伴的不同类型和能力,构建一个更加紧密的合作生态系统,共同开发满足市场需求的产品和服务,助力客户快速实现全面智能化转型。
LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
文章概要:
1 介绍了10篇有关大模型的最新研究进展,多模态AG、推理时对齐、多模态模型、大模型微调、大模型等研究
2. 探讨了如何将多模态模型集成RAG系统中,旨在找到多模态RAG的
3.了一种计算上可行的推理时对齐,Speculative Rejection,计算效率上可以高出6至2倍
4. 介绍了新型扩散模型架构OmniGen,具有统一性、简单性和知识迁移等特点
5. 提出了一个专门处理视频的模态语言模型:BL-3-Video它能有效视频帧之间时间信息
. 训练了一个多语言多模态模型:angea,该模型覆盖39种语言的600万指令数据集PangeaIns上进行训练
.了上下文学习(L)在不对模型进行微调训练的情况下提高语言模型执行复杂的能力>8. 为了提升RAG系统推理速度,本文作者提出了Block-Attention,该方法将检索到的文档划分为离散的,每个块独立键值KV状态
9. 提出了AgentStore,一个可扩展的平台,能够集成不同代理来自动化计算机任务
0. 总结了参数高效微调(PEFT)技术在大模型及其发展前景,并总结为一篇全面且前沿
阅读原文
2. 探讨了如何将多模态模型集成RAG系统中,旨在找到多模态RAG的
3.了一种计算上可行的推理时对齐,Speculative Rejection,计算效率上可以高出6至2倍
4. 介绍了新型扩散模型架构OmniGen,具有统一性、简单性和知识迁移等特点
5. 提出了一个专门处理视频的模态语言模型:BL-3-Video它能有效视频帧之间时间信息
. 训练了一个多语言多模态模型:angea,该模型覆盖39种语言的600万指令数据集PangeaIns上进行训练
.了上下文学习(L)在不对模型进行微调训练的情况下提高语言模型执行复杂的能力>8. 为了提升RAG系统推理速度,本文作者提出了Block-Attention,该方法将检索到的文档划分为离散的,每个块独立键值KV状态
9. 提出了AgentStore,一个可扩展的平台,能够集成不同代理来自动化计算机任务
0. 总结了参数高效微调(PEFT)技术在大模型及其发展前景,并总结为一篇全面且前沿
大模型核心技术说明
文章概要:
1. 大模型是指具有数千万甚至数亿参数的深度学习模型近年来在各个领域取得了显著成果。
2. ChatGPT是OpenAI研发的聊天机器人程序,于2022年11月30日发布,能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,甚至能完成撰写论文、邮件、脚本、文案、翻译、代码等任务。
3. ChatGPT的背后就是GPT-3、GPT-3.5、GPT-4、GPT-4o这样的大模型,大模型分为大语言模型LLM和大多模态大模型LMM等。
4. 大模型可以理解成函数y=f(x),x是输入,y是输出,f(x)就是机器学习算法在学习大量学习资料的基础上训练出的模型,根据得到的模型f(x),可以根据输入x得到输出结果值y。
5. 大模型的大体现在训练数据巨大,它的训练数据有多个互联网文本语料库,覆盖线上书籍、新闻、文章、科学论文、维基百科、社交媒体帖子等等海量的文本。
6. 大模型的训练参数同样巨大,GPT-4有170万亿个参数,训练出的参数决定了大模型如何对输入做出反应,用更多的数据和算力更多的参数,很多时候能够带来更佳的预测能力。
7. GPT-3.5有1750亿个参数,这样的大模型不再像小模型局限于简单或单项的任务,而是具有更广泛的能力。
8. 大语言模型的主流架构是Transformer架构,它有能力学习输入序列中所有词的相关性和上下文,不再受短时记忆的影响。
9. Transformer架构的另一项关键创新是位置编码,它可以同时处理输入序列中的所有位置,每个输出都可以是独立的计算,不再需要等待前面位置的计算结果。
10. 模型在训练过程中,通过大量的双语句子对进行学习,目标函数会指导模型生成正确的翻译。
阅读原文
2. ChatGPT是OpenAI研发的聊天机器人程序,于2022年11月30日发布,能够基于在预训练阶段所见的模式和统计规律,来生成回答,还能根据聊天的上下文进行互动,甚至能完成撰写论文、邮件、脚本、文案、翻译、代码等任务。
3. ChatGPT的背后就是GPT-3、GPT-3.5、GPT-4、GPT-4o这样的大模型,大模型分为大语言模型LLM和大多模态大模型LMM等。
4. 大模型可以理解成函数y=f(x),x是输入,y是输出,f(x)就是机器学习算法在学习大量学习资料的基础上训练出的模型,根据得到的模型f(x),可以根据输入x得到输出结果值y。
5. 大模型的大体现在训练数据巨大,它的训练数据有多个互联网文本语料库,覆盖线上书籍、新闻、文章、科学论文、维基百科、社交媒体帖子等等海量的文本。
6. 大模型的训练参数同样巨大,GPT-4有170万亿个参数,训练出的参数决定了大模型如何对输入做出反应,用更多的数据和算力更多的参数,很多时候能够带来更佳的预测能力。
7. GPT-3.5有1750亿个参数,这样的大模型不再像小模型局限于简单或单项的任务,而是具有更广泛的能力。
8. 大语言模型的主流架构是Transformer架构,它有能力学习输入序列中所有词的相关性和上下文,不再受短时记忆的影响。
9. Transformer架构的另一项关键创新是位置编码,它可以同时处理输入序列中的所有位置,每个输出都可以是独立的计算,不再需要等待前面位置的计算结果。
10. 模型在训练过程中,通过大量的双语句子对进行学习,目标函数会指导模型生成正确的翻译。
肖仰华丨大模型赋能工业智能化的机遇与挑战
文章概要:
1. 大模型为工业智能化带来了重大机遇,有望解决长期困扰工业领域的复杂性和不确定性问题。然而,大模型在认知能力方面,尚未完全具备专家级的复杂决策能力。在数据方面,大模型对专业性强、结构复杂的工业数据理解不足,且数据要素市场不健全、隐私保护要求等因素限制了高价值工业数据的使用。未来,大模型在工业领域的应用需要在提升认知能力、完善数据生态、确保安全合规等方面持续努力。同时,应注重人机协作,充分发挥大模型与人类专家各自的优势,共同推动智能化发展。
2. 大模型在工业中的新应用包括工业数据的理解与统一处理、工业文档智能化管理与应用、设备与的自然语言交互、设备与系统故障的智能诊断、专业与具身大模型提升研发效率、基于图像大模型的工业质检、工业数据库自然语言访问与分析、生成式仿真。
3. 生成式大模型的挑战包括认知能力和数据问题。认知能力方面,大模型仍然难以胜任工业领域的复杂决策任务,存在幻觉生成、缺乏领域忠实度专业知识匮乏、复杂推理能力有限、复杂规划能力有限、缺乏可解释性、评测体系不完善以及较高的推理成本等固有缺陷。数据问题方面,大模型在利用工业数据时仍面临着诸多挑战,包括技术层面和的挑战。技术层面的挑战集中体现在其数据理解与处理能力不足,限制了高价值工业数据的使用。数据生态方面,数据要素市场尚不健全,私域数据的汇聚和交易流通困难,使得大模型难以利用高质量私域数据。
阅读原文
2. 大模型在工业中的新应用包括工业数据的理解与统一处理、工业文档智能化管理与应用、设备与的自然语言交互、设备与系统故障的智能诊断、专业与具身大模型提升研发效率、基于图像大模型的工业质检、工业数据库自然语言访问与分析、生成式仿真。
3. 生成式大模型的挑战包括认知能力和数据问题。认知能力方面,大模型仍然难以胜任工业领域的复杂决策任务,存在幻觉生成、缺乏领域忠实度专业知识匮乏、复杂推理能力有限、复杂规划能力有限、缺乏可解释性、评测体系不完善以及较高的推理成本等固有缺陷。数据问题方面,大模型在利用工业数据时仍面临着诸多挑战,包括技术层面和的挑战。技术层面的挑战集中体现在其数据理解与处理能力不足,限制了高价值工业数据的使用。数据生态方面,数据要素市场尚不健全,私域数据的汇聚和交易流通困难,使得大模型难以利用高质量私域数据。
新模式!上海首个政务大模型在徐汇上线应用,真人窗口会被AI取代吗?
文章概要:
1. 上海徐汇区推出政务服务大模型,能提供全面知识支持和智能辅助,提升办事效率和收件准确率
2. 该模型基于通义政务大模型技术和徐汇区智能算力平台研发,汇聚39个涉企事项数据集、超过500个体系化知识点和2300多条高频咨询语料
3. 模型的研发背景是为了提升办事效率和收件准确率,减少企业跑动次数和等待时间
4. 模型的开发时间线为2023年年末启动研发,经过30多轮微调和模型链路优化、2万多轮对话测试,于今年3月底在法人事项受理综合受理大厅场景应用
5. 模型的垂类成长得益于窗口人员的日常训练、庞大的基础数据支撑、天然的高质量语料供给和动态学习与反馈机制
6. 模型的辅助作用是帮助窗口新人快速成长,提升窗口人员的办事效率和收件准确率
7. 模型的成效是在政务服务办理流程、申请材料、办事要素、特殊情况处理等涉企服务场景,能实现10轮以上的自然语言咨询能力,对于高频事项的咨询准确率超过90%
8. 模型不会取代一线窗口人员,未来推出“十八罗汉数字人”,相应的模型算法也将推广至徐汇的各街镇和功能区
9. 一窗研究院自主研发的“数字政务门牌”,已推出“智能客服”全新功能,为群众提供智能客服服务,实现群众和机器人的智能交互
10. 一窗研究院“数字政务门牌”上线,群众办事只需家门口“扫一扫”,即可畅享自主生成专属办事攻略、一键预约、精准地图导航、帮代办、虚拟远程窗口音视频、智能客服等更加高效的办事新体验
阅读原文
2. 该模型基于通义政务大模型技术和徐汇区智能算力平台研发,汇聚39个涉企事项数据集、超过500个体系化知识点和2300多条高频咨询语料
3. 模型的研发背景是为了提升办事效率和收件准确率,减少企业跑动次数和等待时间
4. 模型的开发时间线为2023年年末启动研发,经过30多轮微调和模型链路优化、2万多轮对话测试,于今年3月底在法人事项受理综合受理大厅场景应用
5. 模型的垂类成长得益于窗口人员的日常训练、庞大的基础数据支撑、天然的高质量语料供给和动态学习与反馈机制
6. 模型的辅助作用是帮助窗口新人快速成长,提升窗口人员的办事效率和收件准确率
7. 模型的成效是在政务服务办理流程、申请材料、办事要素、特殊情况处理等涉企服务场景,能实现10轮以上的自然语言咨询能力,对于高频事项的咨询准确率超过90%
8. 模型不会取代一线窗口人员,未来推出“十八罗汉数字人”,相应的模型算法也将推广至徐汇的各街镇和功能区
9. 一窗研究院自主研发的“数字政务门牌”,已推出“智能客服”全新功能,为群众提供智能客服服务,实现群众和机器人的智能交互
10. 一窗研究院“数字政务门牌”上线,群众办事只需家门口“扫一扫”,即可畅享自主生成专属办事攻略、一键预约、精准地图导航、帮代办、虚拟远程窗口音视频、智能客服等更加高效的办事新体验
AI时代来临,什么是真正的大模型?
文章概要:
1. 大模型大规模参数和复杂计算结构的模型,其设计目的是通过海量数据学习复杂的模式和特征,具备强大的泛化能力,能够对未见过的数据做出准确的预测。
2. 大模型产业生态与发展:大模型产业生态是一个复杂的系统,涉及多个层面的和环节,包括硬件层、软件层、模型层和应用层。大模型的商业化路径多样,不同的企业根据自身优势和市场需求探索不同的商业模式。
3. 国际5大模型:介绍了GPT-4、PaLM 2、Gemini 1、LLaMA 3和Mistral 7B这五个国际顶尖的大模型包括它们的、应用领域和技术优势。
4. 大模型未来趋势与:随着算力的提升和量的增加,大模型参数规模预计将持续增长,多模态能力将进一步深化,可解释性将提升,安全性和伦理问题将得到重视。大模型将在垂直行业、领域、公共服务与社会治理、创意产业与内容生成等领域得到更广泛的应用。
阅读原文
2. 大模型产业生态与发展:大模型产业生态是一个复杂的系统,涉及多个层面的和环节,包括硬件层、软件层、模型层和应用层。大模型的商业化路径多样,不同的企业根据自身优势和市场需求探索不同的商业模式。
3. 国际5大模型:介绍了GPT-4、PaLM 2、Gemini 1、LLaMA 3和Mistral 7B这五个国际顶尖的大模型包括它们的、应用领域和技术优势。
4. 大模型未来趋势与:随着算力的提升和量的增加,大模型参数规模预计将持续增长,多模态能力将进一步深化,可解释性将提升,安全性和伦理问题将得到重视。大模型将在垂直行业、领域、公共服务与社会治理、创意产业与内容生成等领域得到更广泛的应用。
大模型治理的重要性紧迫性凸显
文章概要:
1. 近一年来,以ChatGPT为代表的大模型技术引发通用人工智能发展热潮,成为改变世界格局的重要力量,与此同时,围绕人工智能治理的议题探讨显著增多人工智能治理加速构建。
大模型的是具有超大参数规模,建立在多头自注意力机制Transformer架构之上,以深度神经网络为基础,用海量文本数据训练而成的语言模型。<>3. 大模型实现了、高效率、多样化的内容生产,成为内容生产方式变革的重要力量。
4. 大模型是迈向通用人工智能的重要技术探索。
5. 大模型使得人类行为与机器运行之间的协作更加自然、高效和智能,拓展了广阔的人机交互空间。
6. 面对以ChatGPT为代表的大模型技术革命,麦田云网业务迎来了未有的发展机遇。
阅读原文
大模型的是具有超大参数规模,建立在多头自注意力机制Transformer架构之上,以深度神经网络为基础,用海量文本数据训练而成的语言模型。<>3. 大模型实现了、高效率、多样化的内容生产,成为内容生产方式变革的重要力量。
4. 大模型是迈向通用人工智能的重要技术探索。
5. 大模型使得人类行为与机器运行之间的协作更加自然、高效和智能,拓展了广阔的人机交互空间。
6. 面对以ChatGPT为代表的大模型技术革命,麦田云网业务迎来了未有的发展机遇。
AI大模型应用:政务大模型落地案例分析
文章概要:
1. AI大模型的发展可以说是科技进步中的一项重要里程碑分类上,大分为通用大模型和垂直大模型。
2. 政务领域的信息量庞大且复杂,的沟通机制难以。而大模型通过私有化部署,为政务网站、、App及办事大厅等平台提供了强大的支持。
3. “大模型+政务智能问答”是指利用大型人工智能模型来增强政务服务的水平,自然语言处理和机器学习技术,提供自动化的问答服务。
4. 某市工信局的案例展示了大模型技术在政务智能问答领域的应用,案例通过大模型能力,整合内外部公开信息,构建政务知识库,统一管理图文音。
5. 某市统战部的案例,展示了大模型技术在校对领域的,特别是针对日常文件通知和思想汇报等文字材料的自动化校对。
阅读原文
2. 政务领域的信息量庞大且复杂,的沟通机制难以。而大模型通过私有化部署,为政务网站、、App及办事大厅等平台提供了强大的支持。
3. “大模型+政务智能问答”是指利用大型人工智能模型来增强政务服务的水平,自然语言处理和机器学习技术,提供自动化的问答服务。
4. 某市工信局的案例展示了大模型技术在政务智能问答领域的应用,案例通过大模型能力,整合内外部公开信息,构建政务知识库,统一管理图文音。
5. 某市统战部的案例,展示了大模型技术在校对领域的,特别是针对日常文件通知和思想汇报等文字材料的自动化校对。
Sam Altman 最新万字访谈自曝:大模型必定贬值,但不投资反而是错?
文章概要:
1. 2024年,OpenAI规划三场重要的开发者大会,分别在旧金山、伦敦和新加坡举办。欧洲站在伦敦圆满落幕,展示了OpenAI最新模型对复杂设备的实时控制能力和快速构建应用的能力。
2. OpenAI CEO山姆·阿尔特曼(Sam Altman)在大会期间接受了20VC创始人Harry Stebbings的专访,分享了他对AI发展的深刻见解,涵盖了从模型演进到企业战略的诸多关键话题。
3. 主持人询问OpenAI未来的技术路线,Sam Altman表示希望在各方面都有所突破,但目前特别注重模型的推理能力。
4. 主持人询问OpenAI是否会开发无代码工具,Sam Altman表示这个目标肯定会实现,但第一步是开发工具,提高掌握编程技能的人的生产力。
5. 主持人询问OpenAI是否会在技术栈中走多远,Sam Altman表示会尽力而为,相信可以不断提高模型的能力。
6. 主持人询问OpenAI是否会在某些领域形成碾压之势,Sam Altman表示使用AI来构建以前很难或不可能实现的产品和服务将创造数万亿美元的新市场价值。
7. 主持人询问Sam Altman对软银集团孙正义关于超级人工智能每年能够产生9万亿美元价值的预测的,Sam Altman表示即使能达到这个预测值的一个零头,也已经是非常了不起的成就了。
8. 主持人询问Sam Altman对智能体的定义,Sam Altman表示AI智能体就是能够接受长期任务,且在执行过程中几乎不需要督导的存在。
9. 主持人询问Sam Altman是否需要为智能体应用专门构建模型,Sam Altman表示确实需要构建大量的基础设施和框架支持,但o1已经为>10. 主持人询问Sam Altman模型贬值的看法,Sam Altman表示模型确实是会贬值的资产,但并非不值得投入。
11. 主持人询问Sam Altman对OpenAI模型未来差异化发展的看法,Sam Altman表示推理能力是目前最关注的核心领域。
12. 主持人询问Sam Altman如何看待推理能力在多模态领域的应用,Sam Altman表示希望这会是一个水到渠成的过程。
13. 主持人询问Sam Altman如何在核心推理能力上取得突破,Sam Altman表示需要不断探索新的和未经证实的领域。
14. 主持人询问Sam Altman对人才的看法,Sam Alt表示需要在任何年龄坚持极高的人才标准。
15. 主持人询问Sam Altman对Anthropic的模型在编程任务上有时表现更出色的看法,Sam Altman表示这是非常令人印象深刻的工作。
16. 主持人询问Sam Alt对扩展定律(Scaling Law)还能在多少次模型迭代中保持有效的看法,Sam Altman表示在不透露具体细节的情况下,他相信答案是肯定的,而且这种趋势会持续相当长的时间。
17. 主持人询问Sam Altman对半导体供应链的担忧程度,Sam Altman表示这不是他最担心的问题,但确实位列所有忧虑的前10%。
18. 主持人询问Sam Altman最担心的是什么,Sam Altman表示是整个领域所做的事情的总体复杂性。
19. 主持人询问Sam Altman对OpenAI五年和十年内的愿景,Sam Altman表示如果他们的判断是正确的,五年后,技术本身会以不可思议的速度进步,而社会本身的变化程度可能小得惊人。
阅读原文
2. OpenAI CEO山姆·阿尔特曼(Sam Altman)在大会期间接受了20VC创始人Harry Stebbings的专访,分享了他对AI发展的深刻见解,涵盖了从模型演进到企业战略的诸多关键话题。
3. 主持人询问OpenAI未来的技术路线,Sam Altman表示希望在各方面都有所突破,但目前特别注重模型的推理能力。
4. 主持人询问OpenAI是否会开发无代码工具,Sam Altman表示这个目标肯定会实现,但第一步是开发工具,提高掌握编程技能的人的生产力。
5. 主持人询问OpenAI是否会在技术栈中走多远,Sam Altman表示会尽力而为,相信可以不断提高模型的能力。
6. 主持人询问OpenAI是否会在某些领域形成碾压之势,Sam Altman表示使用AI来构建以前很难或不可能实现的产品和服务将创造数万亿美元的新市场价值。
7. 主持人询问Sam Altman对软银集团孙正义关于超级人工智能每年能够产生9万亿美元价值的预测的,Sam Altman表示即使能达到这个预测值的一个零头,也已经是非常了不起的成就了。
8. 主持人询问Sam Altman对智能体的定义,Sam Altman表示AI智能体就是能够接受长期任务,且在执行过程中几乎不需要督导的存在。
9. 主持人询问Sam Altman是否需要为智能体应用专门构建模型,Sam Altman表示确实需要构建大量的基础设施和框架支持,但o1已经为>10. 主持人询问Sam Altman模型贬值的看法,Sam Altman表示模型确实是会贬值的资产,但并非不值得投入。
11. 主持人询问Sam Altman对OpenAI模型未来差异化发展的看法,Sam Altman表示推理能力是目前最关注的核心领域。
12. 主持人询问Sam Altman如何看待推理能力在多模态领域的应用,Sam Altman表示希望这会是一个水到渠成的过程。
13. 主持人询问Sam Altman如何在核心推理能力上取得突破,Sam Altman表示需要不断探索新的和未经证实的领域。
14. 主持人询问Sam Altman对人才的看法,Sam Alt表示需要在任何年龄坚持极高的人才标准。
15. 主持人询问Sam Altman对Anthropic的模型在编程任务上有时表现更出色的看法,Sam Altman表示这是非常令人印象深刻的工作。
16. 主持人询问Sam Alt对扩展定律(Scaling Law)还能在多少次模型迭代中保持有效的看法,Sam Altman表示在不透露具体细节的情况下,他相信答案是肯定的,而且这种趋势会持续相当长的时间。
17. 主持人询问Sam Altman对半导体供应链的担忧程度,Sam Altman表示这不是他最担心的问题,但确实位列所有忧虑的前10%。
18. 主持人询问Sam Altman最担心的是什么,Sam Altman表示是整个领域所做的事情的总体复杂性。
19. 主持人询问Sam Altman对OpenAI五年和十年内的愿景,Sam Altman表示如果他们的判断是正确的,五年后,技术本身会以不可思议的速度进步,而社会本身的变化程度可能小得惊人。
第一批被大模型气死的人…
文章概要:
1. 大模型在企业级严肃场景、垂直场景落地需进行精调
2. 大模型精调有难点,如已有预训练模型选择、高质量训练数据获取、算力消耗、模型部署等
3. 腾讯云TI平台可解决大模型精调难题,其打通全流程链路,预置多种模型和工具,提供完善的评估体系加速能力
4. 腾讯云混元Large模型性能出色,可在推理速度和参数规模间取得平衡
5. 腾讯云TI平台和混元Large模型强强联合,为企业提供更优解决方案
阅读原文
2. 大模型精调有难点,如已有预训练模型选择、高质量训练数据获取、算力消耗、模型部署等
3. 腾讯云TI平台可解决大模型精调难题,其打通全流程链路,预置多种模型和工具,提供完善的评估体系加速能力
4. 腾讯云混元Large模型性能出色,可在推理速度和参数规模间取得平衡
5. 腾讯云TI平台和混元Large模型强强联合,为企业提供更优解决方案
大模型的基因缺陷
文章概要:
1. 大模型的底层是多内层神经网络系统,而神经网络本身的数学假设就有问题,即常常把似然当成了先验。
2. 事实性先验与价值性先验往往有很大的区别。
3. 在很多没有或缺少先验知识的场景下,深度学习模型可能会面临一些挑战。
阅读原文
2. 事实性先验与价值性先验往往有很大的区别。
3. 在很多没有或缺少先验知识的场景下,深度学习模型可能会面临一些挑战。
中文大模型基准测评2024年10月报告
文章概要:
1. 2024年11月08日,SuperCLUE团队发布《中文大模型基准测评2024年10月报告》。
2. 报告核心内容摘要:OpenAI发布o1后,全球大模型竞争加剧;国内大模型第一梯队竞争激烈,持续迭代表现不俗;国内外大模型在不同任务上表现各有优势;端侧小模型表现惊艳。
3. 报告目录:国内大模型关键进展、SuperCLUE通用能力测评、SuperCLUE产品能力测评、SuperCLUE多模态能力测评、SuperCL专项与行业测评、优秀模型案例介绍。
4. 国内大模型关键进展:2023-2024年大模型关键进展、2024年值得关注的中文大模型全景图、2023-204年度国内外大模型技术发展趋势。
5. SuperCLUE通用能力测评:中文大模型基准SuperCLUE介绍、SuperCLUE测评体系及数据集说明、测评模型列表、SuperCLUE通用能力测评总分、SuperCLUE模型、CLUE通用能力测评一级维度分数、SuperCLUE通用能力测评二级细粒度分数、SuperCLUE测评方法说明、SuperCLUE开源榜单、10B级别小模型榜单、端侧5B级别小模型榜单、大模型对战胜率分布图、SuperCLUE成熟度指数、评测与人类一致性验证。
6. 优秀模型案例介绍。
7. 未来两个月基准发布计划:未来2-3个月SuperCLUE会持续完善大模型专项能力及行业能力的测评基准。现针对于所有及行业测评基准征集大模型,欢迎申请。有意愿参与测评的厂商可发送邮件至contact@superclue.ai,标题:SuperCLUE专项/行业测评,请使用单位邮箱,邮件内容包括:单位信息、大模型简介、联系人和所属部门、联系方式。预告:SuperCLUE通用基准测评024年度报告将在2024年12月日发布,欢迎反馈意见、参与测评。
阅读原文
2. 报告核心内容摘要:OpenAI发布o1后,全球大模型竞争加剧;国内大模型第一梯队竞争激烈,持续迭代表现不俗;国内外大模型在不同任务上表现各有优势;端侧小模型表现惊艳。
3. 报告目录:国内大模型关键进展、SuperCLUE通用能力测评、SuperCLUE产品能力测评、SuperCLUE多模态能力测评、SuperCL专项与行业测评、优秀模型案例介绍。
4. 国内大模型关键进展:2023-2024年大模型关键进展、2024年值得关注的中文大模型全景图、2023-204年度国内外大模型技术发展趋势。
5. SuperCLUE通用能力测评:中文大模型基准SuperCLUE介绍、SuperCLUE测评体系及数据集说明、测评模型列表、SuperCLUE通用能力测评总分、SuperCLUE模型、CLUE通用能力测评一级维度分数、SuperCLUE通用能力测评二级细粒度分数、SuperCLUE测评方法说明、SuperCLUE开源榜单、10B级别小模型榜单、端侧5B级别小模型榜单、大模型对战胜率分布图、SuperCLUE成熟度指数、评测与人类一致性验证。
6. 优秀模型案例介绍。
7. 未来两个月基准发布计划:未来2-3个月SuperCLUE会持续完善大模型专项能力及行业能力的测评基准。现针对于所有及行业测评基准征集大模型,欢迎申请。有意愿参与测评的厂商可发送邮件至contact@superclue.ai,标题:SuperCLUE专项/行业测评,请使用单位邮箱,邮件内容包括:单位信息、大模型简介、联系人和所属部门、联系方式。预告:SuperCLUE通用基准测评024年度报告将在2024年12月日发布,欢迎反馈意见、参与测评。
商汤科技董事长兼CEO徐立:大模型赋能下的人力资源能力跃迁
文章概要:
1. 人工智能技术推动了各行各业的变革,预示着一个充满无限可能的新纪元
2. 2012年是人工智能现实世界的重要时刻,AI 1.0感知智能时代拉开序幕
3. AI 2.0时代的三个重要标志:ChatGPT时刻、GPT-4o Sora时刻、OpenAI-o时刻> 4 人工智能过程中,底层算力非常重要已经取代人成为最重要的资源
5. 英伟达CEO黄仁勋表示,英伟达的使命是把算力的降低下一个10万倍> 6. 当行业的重要生产要素成本大幅度下降的时候,就产生改变世界的力量
7. 我们必将见证通用人工智能时代的到来
阅读原文
2. 2012年是人工智能现实世界的重要时刻,AI 1.0感知智能时代拉开序幕
3. AI 2.0时代的三个重要标志:ChatGPT时刻、GPT-4o Sora时刻、OpenAI-o时刻> 4 人工智能过程中,底层算力非常重要已经取代人成为最重要的资源
5. 英伟达CEO黄仁勋表示,英伟达的使命是把算力的降低下一个10万倍> 6. 当行业的重要生产要素成本大幅度下降的时候,就产生改变世界的力量
7. 我们必将见证通用人工智能时代的到来
汽车厂商“批量生产”大模型
文章概要:
1. 汽车电动化时代,造车曾被质疑无门槛,智能化时代,大模型成为车企竞争焦点,但实际应用场景有限。
2. 大模型上车面临两个困局:通用大模型上车难找场景,端到端大模型上车门槛太高。
3. 端到端大模型热潮下,车企成为算力“吞金兽”,多数车企选择与云服务厂商合作共建。
4. 大模型上车后,智驾进入数据驱动阶段,竞争关键在于高质量数据与训练算力,将降低智驾成本。
5. 新车研发周期长,AI技术发展快,车企需投入大量资金和人力,且汽车并非对AI人才需求量最大的行业。
6. 大部分传统车企选择“两条腿”走路,一边组建自研团队,一边与成熟的供应商合作。
7. 大模型是一项长期投入巨大,短期难对销量产生直接的技术,但对车企而言,跟进大模型技术是必答题。
阅读原文
2. 大模型上车面临两个困局:通用大模型上车难找场景,端到端大模型上车门槛太高。
3. 端到端大模型热潮下,车企成为算力“吞金兽”,多数车企选择与云服务厂商合作共建。
4. 大模型上车后,智驾进入数据驱动阶段,竞争关键在于高质量数据与训练算力,将降低智驾成本。
5. 新车研发周期长,AI技术发展快,车企需投入大量资金和人力,且汽车并非对AI人才需求量最大的行业。
6. 大部分传统车企选择“两条腿”走路,一边组建自研团队,一边与成熟的供应商合作。
7. 大模型是一项长期投入巨大,短期难对销量产生直接的技术,但对车企而言,跟进大模型技术是必答题。
计算成本减少5倍!NeurIPS 2024 | DeeR-VLA:高效机器人执行的多模态大模型推理
文章概要:
1. 多模态大语言模型(MLLMs)在复杂语言和视觉数据的理解和推理方面展现出卓越能力,但由于实际机器人平台通常计算和存储能力有限,为机器人开发MLLMs具有挑战性
2. 本文提出了一种用于机器人视觉-语言-动作模型的动态早退框架(简称DeeR-VLA或DeeR),该框架能够根据当前情境自动调整所激活MLLM的规模,使模型在激活适当规模后便可终止处理,从而避免冗余计算
3. DeeR-VLA的设计灵感源于一个有趣的观察:在控制机器人执行各种任务的过程中,“较简单”的情境构成了机器人所面对的大部分情况
4. 本文提出了一种机器人MLLM的DeeR框架,旨在根据具身智能体面临的每种情境自动配置MLLMs的规模
5. DeeR的性能在3个CALVIN长时间多任务语言控制(LH-MTLC)挑战中通过RoboFlamingo进行了评估,大量的机器人实验表明,DeeR在不牺牲性能的前提下将LLM的计算成本降低了5.2-6.5倍
6. 本文介绍了用于机器人MLLM的动态早退出(DeeR)框架,旨在根据机器人智能体遇到的具体情况动态调整MLLM的规模
阅读原文
2. 本文提出了一种用于机器人视觉-语言-动作模型的动态早退框架(简称DeeR-VLA或DeeR),该框架能够根据当前情境自动调整所激活MLLM的规模,使模型在激活适当规模后便可终止处理,从而避免冗余计算
3. DeeR-VLA的设计灵感源于一个有趣的观察:在控制机器人执行各种任务的过程中,“较简单”的情境构成了机器人所面对的大部分情况
4. 本文提出了一种机器人MLLM的DeeR框架,旨在根据具身智能体面临的每种情境自动配置MLLMs的规模
5. DeeR的性能在3个CALVIN长时间多任务语言控制(LH-MTLC)挑战中通过RoboFlamingo进行了评估,大量的机器人实验表明,DeeR在不牺牲性能的前提下将LLM的计算成本降低了5.2-6.5倍
6. 本文介绍了用于机器人MLLM的动态早退出(DeeR)框架,旨在根据机器人智能体遇到的具体情况动态调整MLLM的规模
AI大模型应用:上卫星、能带货,国人创新无限
文章概要:
1. 大型人工智能模型在人工智能领域通常指拥有庞大参数集的深度学习模型,去年见证了“百模大战”盛况,今年迎来了大型模型应用的元年,各类AI大模型应用广泛渗透至生产与生活之中。
2. 今年9月末,我国商业航天团队成功发射了全球首颗搭载大型人工智能模型的卫星,这颗卫星能够在太空中自主做出决策,显著提高了工作效率。
3. AI大模型卫星能够在太空中自主做出决策,显著提高了工作效率,融合了AI大模型技术的卫星,就像开启了自动驾驶功能的汽车,能够在太空中自主调整姿态并自主执行任务指令。
4. 为了将AI算力和系统部署至太空,团队需要攻克一系列技术难关,确保AI能力能够顺利“上天”。
5. 团队不仅成功将算力系统部署至太空,还制定了更为宏大的目标,他们已正式启动了“星算计划”,旨在到2030年前构建一个由2800颗算力卫星组成的全球覆盖“移动”算力网络。
6. 在我们日常生活的多个细分领域,大模型的应用正逐渐改变着传统行业的面貌,举例来说,大模型被用于创造多样化的字体,这一创新不仅极大地提升了工作效率,还显著降低了成本。
7. 这个年轻的创业团队利用AI技术,对字体设计行业进行了革新,他们的技术已经可以生成日、韩、拉丁字母等多种语言和符号的字库,甚至还在研究如何将传统书法家的毛笔字进行矢量化学习,设计成书法家字库,以传承和发扬传统的汉字文化。
8. 在电商直播领域,团队推出了国内首个电商直播数字人大模型,记者只需在工作室里录制一段几分钟的画面,上传到系统后,就可以在系统里任意编辑文字内容,然后在一两分钟内生成一段播报内容。
9. 为了推动模型的实际应用,我们采用了一种集成式的开发模式,这种模式在模型训练和推理过程中发挥了关键作用,实现了高效、快速、优质且经济的目标。
10. 随着AI大模型技术的不断成熟,它正在为各种硬件设备注入“智能”,使得“智能体”这一概念逐渐走进人们的视野并成为高频词汇。
11 智能体是将人工智能大模型与智能硬件相结合,形成的智能系统,与传统硬件相比,智能体能够按照预设的规则和目标,自主执行任务并理解、响应人类的需求。
12. 近期,中国信息通信研究院率先发布了全球首份《终端智能化分级研究报告》,该报告借鉴了汽车自动驾驶的分级标准,将终端智能化水平从低到高划分为L1至L5五个层级。
13. 按照当前的分级标准,智能终端的发展普遍处于L2至L3级别之间,这意味着它们能够感知用户的基本意图,并提供一定程度的个性化服务。
阅读原文
2. 今年9月末,我国商业航天团队成功发射了全球首颗搭载大型人工智能模型的卫星,这颗卫星能够在太空中自主做出决策,显著提高了工作效率。
3. AI大模型卫星能够在太空中自主做出决策,显著提高了工作效率,融合了AI大模型技术的卫星,就像开启了自动驾驶功能的汽车,能够在太空中自主调整姿态并自主执行任务指令。
4. 为了将AI算力和系统部署至太空,团队需要攻克一系列技术难关,确保AI能力能够顺利“上天”。
5. 团队不仅成功将算力系统部署至太空,还制定了更为宏大的目标,他们已正式启动了“星算计划”,旨在到2030年前构建一个由2800颗算力卫星组成的全球覆盖“移动”算力网络。
6. 在我们日常生活的多个细分领域,大模型的应用正逐渐改变着传统行业的面貌,举例来说,大模型被用于创造多样化的字体,这一创新不仅极大地提升了工作效率,还显著降低了成本。
7. 这个年轻的创业团队利用AI技术,对字体设计行业进行了革新,他们的技术已经可以生成日、韩、拉丁字母等多种语言和符号的字库,甚至还在研究如何将传统书法家的毛笔字进行矢量化学习,设计成书法家字库,以传承和发扬传统的汉字文化。
8. 在电商直播领域,团队推出了国内首个电商直播数字人大模型,记者只需在工作室里录制一段几分钟的画面,上传到系统后,就可以在系统里任意编辑文字内容,然后在一两分钟内生成一段播报内容。
9. 为了推动模型的实际应用,我们采用了一种集成式的开发模式,这种模式在模型训练和推理过程中发挥了关键作用,实现了高效、快速、优质且经济的目标。
10. 随着AI大模型技术的不断成熟,它正在为各种硬件设备注入“智能”,使得“智能体”这一概念逐渐走进人们的视野并成为高频词汇。
11 智能体是将人工智能大模型与智能硬件相结合,形成的智能系统,与传统硬件相比,智能体能够按照预设的规则和目标,自主执行任务并理解、响应人类的需求。
12. 近期,中国信息通信研究院率先发布了全球首份《终端智能化分级研究报告》,该报告借鉴了汽车自动驾驶的分级标准,将终端智能化水平从低到高划分为L1至L5五个层级。
13. 按照当前的分级标准,智能终端的发展普遍处于L2至L3级别之间,这意味着它们能够感知用户的基本意图,并提供一定程度的个性化服务。
回顾大模型在药物设计方面的应用
文章概要:
1. 文章介绍了204年10月在预印版arxiv上发表的利用大模型应用于药物设计的文章。作者提出一种多引导的大语言模型应用于药物设计领域,Y-Mol。
2. 作者从三个来源了与药物相关的数据,基于LLa27架构来设计研发的大语言模型Y-Mol。
3 作者进行了先导化合物优化的评估、药物相互作用预测、分子属性预测任务的实验,实验结果表明,Y-M在多个药物开发相关任务中的表现均优于现有的LLaMA-7b。
4. 作者提出将进一步推进Y-Mol在药物开发中更多的应用,提供更为有效的预测,从而加速药物设计的进程。
阅读原文
2. 作者从三个来源了与药物相关的数据,基于LLa27架构来设计研发的大语言模型Y-Mol。
3 作者进行了先导化合物优化的评估、药物相互作用预测、分子属性预测任务的实验,实验结果表明,Y-M在多个药物开发相关任务中的表现均优于现有的LLaMA-7b。
4. 作者提出将进一步推进Y-Mol在药物开发中更多的应用,提供更为有效的预测,从而加速药物设计的进程。
【CUDA编程】手撸一个大模型推理框架 FasterLLaMA
文章概要:
1. 本文介绍了FasterLLaMA v1.0版本,包括版本发布背景、整体架构、Decoder模块和Decoding模型。
2. 在版本发布背景中,作者提供了一个Decoder模块和一套推理方案Decoding模型,目前FasterLLaMA v1.0仅适配LLaMA2,至于LLaMA3及其他开源大模型的适配工作,将在后续版本逐步加入。
3. 在整体架构中,FasterLLaMA v1.0基于CUDA、cuBLAS、CUB等Nvidia官方库实现,目前仅提供C++ API,用户可以将它集成到本机C++中构建推理服务代码中。
4. 在Decoder模块中,作者提供了OpenDecoder类结构、ResNormQuantizedKernel、Q\K\V GEMM、QKRoteEmbeddingTranspose、DequantizedVTransposeKernel、StoreKVcacheKernel、Q*K乘法、Softmax、QK*V乘法、AttnQuantizedTransposeKernel、Attention Output GEMM、DequantizedResidualResNormQuantized、W1 GEMM和W3 GEMM、DequantizedSiluMultifyQuantized、W2 GEMM、DequantizedResidual等内容。
5. 在Decoding模型中,作者提供了DecodingSampling类结构、初始化Kernel、计算freqsCis矩阵、EmbeddingLookupKernel、ResNorm、Output GEMM、top-k采样等内容。
阅读原文
2. 在版本发布背景中,作者提供了一个Decoder模块和一套推理方案Decoding模型,目前FasterLLaMA v1.0仅适配LLaMA2,至于LLaMA3及其他开源大模型的适配工作,将在后续版本逐步加入。
3. 在整体架构中,FasterLLaMA v1.0基于CUDA、cuBLAS、CUB等Nvidia官方库实现,目前仅提供C++ API,用户可以将它集成到本机C++中构建推理服务代码中。
4. 在Decoder模块中,作者提供了OpenDecoder类结构、ResNormQuantizedKernel、Q\K\V GEMM、QKRoteEmbeddingTranspose、DequantizedVTransposeKernel、StoreKVcacheKernel、Q*K乘法、Softmax、QK*V乘法、AttnQuantizedTransposeKernel、Attention Output GEMM、DequantizedResidualResNormQuantized、W1 GEMM和W3 GEMM、DequantizedSiluMultifyQuantized、W2 GEMM、DequantizedResidual等内容。
5. 在Decoding模型中,作者提供了DecodingSampling类结构、初始化Kernel、计算freqsCis矩阵、EmbeddingLookupKernel、ResNorm、Output GEMM、top-k采样等内容。
免费可商用!腾讯混元大语言模型和3D模型正式开源!
文章概要:
1. 腾讯混元最新的MoE模型“混元Large“以及混元3D大模型“ Hunyuan3-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用
2. 腾讯混元Large是目前开源领域参数规模最大、效果最好MoE,腾讯混元3D生成大模型则是业界首个支持文字、图像生成3D的开源大模型
. 腾讯混元Large模型总参数量389B,激活参数量52B ,上下文长度高达256K,在MLU、MMLU、CEval、MATH等多学科综合评测以及中英文NLP任务、代码和数学等9大维度全面领先
4. 腾讯混元3D生成大模型的生成质量已达到开源模型的先进水平,在两个公开的3D数据集GSO与OmniObject3D上,效果优于主流开源模型,整体能力属于国际领先水平
5. 腾讯地图基于腾讯混元大模型,发布了自定义3D导航车标功能支持用户创作个性化的3D导航车标,相比传统的3D车标重建方案,速度提升了91%
阅读原文
2. 腾讯混元Large是目前开源领域参数规模最大、效果最好MoE,腾讯混元3D生成大模型则是业界首个支持文字、图像生成3D的开源大模型
. 腾讯混元Large模型总参数量389B,激活参数量52B ,上下文长度高达256K,在MLU、MMLU、CEval、MATH等多学科综合评测以及中英文NLP任务、代码和数学等9大维度全面领先
4. 腾讯混元3D生成大模型的生成质量已达到开源模型的先进水平,在两个公开的3D数据集GSO与OmniObject3D上,效果优于主流开源模型,整体能力属于国际领先水平
5. 腾讯地图基于腾讯混元大模型,发布了自定义3D导航车标功能支持用户创作个性化的3D导航车标,相比传统的3D车标重建方案,速度提升了91%
大模型(LLMs)学习笔记(2)——进阶知识
文章概要:
1. 介绍了生成式大模型的定义和特点,以及与普通深度学习模型的区别。
2. 从训练和推理角度分析了大模型的内在作用。
3. 解释了LLMs复读机问题的定义和出现原因,并提出了多种缓解方法,如Unlikelihood Training、引入噪声、Repetition Penalty、Contrastive Search、Beam Search定向搜索、Top-K Sampling采样、Nucleus sampler核取样器、Temperature温度、No repeat ngram size、重复率指标检测、后处理和过滤、人工干预和控制。
4. 探讨了llama系列模型在处理长句子时的限制和挑战,以及如何选择适合的大模型。
5. 分析了大模型在不同领域的作用和需求,以及如何处理更长的文本。
阅读原文
2. 从训练和推理角度分析了大模型的内在作用。
3. 解释了LLMs复读机问题的定义和出现原因,并提出了多种缓解方法,如Unlikelihood Training、引入噪声、Repetition Penalty、Contrastive Search、Beam Search定向搜索、Top-K Sampling采样、Nucleus sampler核取样器、Temperature温度、No repeat ngram size、重复率指标检测、后处理和过滤、人工干预和控制。
4. 探讨了llama系列模型在处理长句子时的限制和挑战,以及如何选择适合的大模型。
5. 分析了大模型在不同领域的作用和需求,以及如何处理更长的文本。