「企业观察」|希沃:击穿教育大模型的两个痛点
文章概要:
1. 2024年诺贝尔奖的ai之年,AI在前沿科学研究中扮演起越来越重要的关键,在应用领域,近三年内,AI大模型更是横扫千行百业。教育科技企业开始步入“深水区”。作为教育数字化应用及服务的提供者,希沃深耕教育年,近期发布的希沃教学大模型2.0,或许可以给我们一些启发。
2. 教育大模型行业的技术驱动特性显著,它基于通用智能大模型技术,也同样具有通用大模型的技术问题。应对这一问题,希沃教学大模型2.0在算力、数据、算法、场景方面做了通用的动作,即:大量的技术扩展和优化。
3. 希沃教学大模型2.0解决了教育大模型产品化路径上两个专有的痛点:精度问题和安全问题。
4. 大模型是一家科技企业的技术底座,最终还是需要以应用形式落地,实现具体的业务价值。其落地形式就是产品。产品是依托于大模型技术的,但产品力则不仅仅是技术的延伸,更是对市场心智的把握。
5. 希沃教学大模型2.0为教师提效减负,改善教学模式,穿透家庭教育的三层需求。
阅读原文
2. 教育大模型行业的技术驱动特性显著,它基于通用智能大模型技术,也同样具有通用大模型的技术问题。应对这一问题,希沃教学大模型2.0在算力、数据、算法、场景方面做了通用的动作,即:大量的技术扩展和优化。
3. 希沃教学大模型2.0解决了教育大模型产品化路径上两个专有的痛点:精度问题和安全问题。
4. 大模型是一家科技企业的技术底座,最终还是需要以应用形式落地,实现具体的业务价值。其落地形式就是产品。产品是依托于大模型技术的,但产品力则不仅仅是技术的延伸,更是对市场心智的把握。
5. 希沃教学大模型2.0为教师提效减负,改善教学模式,穿透家庭教育的三层需求。
大模型量化技术原理:QoQ量化及QServe推理服务系统
文章概要:
1. 大模型量化技术概述
2. QoQ算法的动机
3. QoQ算法的原理
4. QServe系统设计
5. 实验细节
6. 结语
阅读原文
2. QoQ算法的动机
3. QoQ算法的原理
4. QServe系统设计
5. 实验细节
6. 结语
35家央国企已落地66个大模型,国家队引领AI变革
文章概要:
1. 国资央企是国民经济的主体、国家科技创新的主力军、维护国家安全的核心力量,承担着统筹推进传统产业升级、新兴产业壮大、未来产业培育的战略任务。
2. 2023年以来,国资委多次对中央企业发展人工智能提出要求。在2024年2月的中央企业人工智能专题推进会上,提出中央企业要“开展AI+专项行动”,强化需求牵引,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能到解决方案的大模型赋能产业生态。
3. 国资央企正快马加鞭推动大模型布局,大模型落地的“新势力”。按照“数据为根、算力为本、以用促研”的思路,国资央企正在发挥各自之所长,挖掘场景之所需,探索中国特色的“大模型技术体系”。
4. 央国企已落地的66个AI大模型布局,服务于企业内部实现降本增效的同时为外部千行百业赋能。
5. 国资央企在大模型的相关投入上基于其自身能力承担不同的研发任务:在通用大模型(L0)的研发方面,三大通信运营商主力军。行业大模型(L1)和细分领域专用大模型(L2)是大部分央企的投入重点。
阅读原文
2. 2023年以来,国资委多次对中央企业发展人工智能提出要求。在2024年2月的中央企业人工智能专题推进会上,提出中央企业要“开展AI+专项行动”,强化需求牵引,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能到解决方案的大模型赋能产业生态。
3. 国资央企正快马加鞭推动大模型布局,大模型落地的“新势力”。按照“数据为根、算力为本、以用促研”的思路,国资央企正在发挥各自之所长,挖掘场景之所需,探索中国特色的“大模型技术体系”。
4. 央国企已落地的66个AI大模型布局,服务于企业内部实现降本增效的同时为外部千行百业赋能。
5. 国资央企在大模型的相关投入上基于其自身能力承担不同的研发任务:在通用大模型(L0)的研发方面,三大通信运营商主力军。行业大模型(L1)和细分领域专用大模型(L2)是大部分央企的投入重点。
重大突破:大语言模型在长文本推理能力上实现自我进化 | 深度揭秘:大语言模型也能"节能减排",激活稀疏性研究取得重大发现
文章概要:
1. 大语言模型在长文本推理能力上实现自我进化,研究人员提出SEALONG方法,让模型“自己教自己”,多个长文本推理任务显著提升模型性能,AI的自主能力提供了的可能性
2. 大语言模型也能节能减排”稀疏性研究取得重大发现,研究团队首创“PPL-p%稀疏性”评估指标发现使用ReLU激活函数的模型性能相当且能自动获得更高稀疏性,更深层模型架构能带来更好的稀疏性,模型的稀疏性与其参数规模关系不大,为构建更高效的语言模型提供了新思路
3.介绍了微信“LLM帝国”,将为读者揭示LLM世界的帝国格局,带来最前沿的技术洞察和行业趋势,助读者在M的时代中找准定位,属于自己的土
阅读原文
2. 大语言模型也能节能减排”稀疏性研究取得重大发现,研究团队首创“PPL-p%稀疏性”评估指标发现使用ReLU激活函数的模型性能相当且能自动获得更高稀疏性,更深层模型架构能带来更好的稀疏性,模型的稀疏性与其参数规模关系不大,为构建更高效的语言模型提供了新思路
3.介绍了微信“LLM帝国”,将为读者揭示LLM世界的帝国格局,带来最前沿的技术洞察和行业趋势,助读者在M的时代中找准定位,属于自己的土
大语言模型技术演进与启示!
文章概要:
1. 大模型在人工智能领域广泛应用,其背后的技术体系愈发复杂与精细,“2024全球机器学习技术大会”特设“大语言模型技术演进”分论坛,探讨从模型设计到实际落地的核心技术实践。
2. 王炳宁分享了Transformer效率优化的内容,包括其核心机制、面临的挑战、优化策略等。
3. Michael Wong分享了释放AI潜能的主题,包括AI领域的发展现状和未来方向。
4 刘广分享了Infinity Instruct项目的内容,包括其目的、两级标签体系、合成技术等。
5. 吴凌翔分享了紫东太初多模态大模型的内容,包括其发展历程、创新成果、应用领域等。
6. 鱼哲分享了生成式AI落地的机遇与挑战,包括其核心目标、应用场景、成功特征等。
7. 孟令公分享了大模型推理性能提升实践的内容,包括其核心模块、优化方法、部署方式等。
8. 彭厚文分享了腾讯混元多模态技术实践与思考的内容,包括其研发过程、技术思考、应用场景等。
9. 在最后的圆桌对话环节中,刘广、张少博、毛航宇、姜勇围绕“大模型系统技术实践”展开了深入分享。
阅读原文
2. 王炳宁分享了Transformer效率优化的内容,包括其核心机制、面临的挑战、优化策略等。
3. Michael Wong分享了释放AI潜能的主题,包括AI领域的发展现状和未来方向。
4 刘广分享了Infinity Instruct项目的内容,包括其目的、两级标签体系、合成技术等。
5. 吴凌翔分享了紫东太初多模态大模型的内容,包括其发展历程、创新成果、应用领域等。
6. 鱼哲分享了生成式AI落地的机遇与挑战,包括其核心目标、应用场景、成功特征等。
7. 孟令公分享了大模型推理性能提升实践的内容,包括其核心模块、优化方法、部署方式等。
8. 彭厚文分享了腾讯混元多模态技术实践与思考的内容,包括其研发过程、技术思考、应用场景等。
9. 在最后的圆桌对话环节中,刘广、张少博、毛航宇、姜勇围绕“大模型系统技术实践”展开了深入分享。
大模型提示工程技术和最佳实践
文章概要:
1. 介绍了人工智能的定义和生成型人工智能的概念。
2. 列举了各种流行的大型语言模型。
3. 通过示例解释了大型语言模型的工作原理。
4. 说明了提示的定义和应用。
5. 指出提示工程的重要性,并提供了一些实践和技术。
6. 介绍了零样本提示、少量样本提示、思维链提示、角色提示和风格提示等概念。
7. 讨论了大型语言模型的缺陷,包括偏见、伦理问题、幻觉、数学错误和提示破解等。
阅读原文
2. 列举了各种流行的大型语言模型。
3. 通过示例解释了大型语言模型的工作原理。
4. 说明了提示的定义和应用。
5. 指出提示工程的重要性,并提供了一些实践和技术。
6. 介绍了零样本提示、少量样本提示、思维链提示、角色提示和风格提示等概念。
7. 讨论了大型语言模型的缺陷,包括偏见、伦理问题、幻觉、数学错误和提示破解等。
焦点 | AI通用大模型的商业新纪元
文章概要:
1. AI通用大模型的研发和训练成本高,商业化成为分摊成本、实现稳定收入的关键
2. 国际市场,AI通用大模型企业在B端和C端有了较为亮眼的商业化进展
3. 在中国,AI通用大模型在B端的商业化模式已日渐清晰,主要以行业定制化解决方案和Maas模式为主
4. C端的商业化,如订阅付费,尚未预期的稳定收益并形成明朗的发展路径,商业化与非盈利之间的矛盾仍在发酵
5. 国内AI通用大模型的四大力量在过去两年中都在积极探索适合自己的商业化路径
6. AI通用大模型的方式分为B端和C端两类,在实际应用中,AI通用大模型的行业参与者通常混合使用多种商业模式
7. B端商业化处于早期阶段,利润微薄,MaaS模式“定制重、交付重”怪圈
8. C端产品同质化程度较高,缺乏差异化应用场景,C端用户习惯处于养成阶段,付费意愿低,商业化程度缓慢
9. 四大行业参与者正针对行业发展的共性与各自领域的特性,在商业模式上存“同”求“异”
10. 云厂商可借助生态优势,推动一体机和广告服务的增长;初创企业“六小龙”可通过深耕特定领域,实现专业化发展;高校研究院可通过开源合作,促进技术共享和人才培养;传统AI企业则可利用其领域专长,推动知识产权变现和C端市场的拓展
11. AI通用大模型的商业化之路依旧任重而道远,需要行业各参与者在技术持续创新、市场需求挖掘、与盈利模式探索等方面不懈努力,推动行业的持续发展
阅读原文
2. 国际市场,AI通用大模型企业在B端和C端有了较为亮眼的商业化进展
3. 在中国,AI通用大模型在B端的商业化模式已日渐清晰,主要以行业定制化解决方案和Maas模式为主
4. C端的商业化,如订阅付费,尚未预期的稳定收益并形成明朗的发展路径,商业化与非盈利之间的矛盾仍在发酵
5. 国内AI通用大模型的四大力量在过去两年中都在积极探索适合自己的商业化路径
6. AI通用大模型的方式分为B端和C端两类,在实际应用中,AI通用大模型的行业参与者通常混合使用多种商业模式
7. B端商业化处于早期阶段,利润微薄,MaaS模式“定制重、交付重”怪圈
8. C端产品同质化程度较高,缺乏差异化应用场景,C端用户习惯处于养成阶段,付费意愿低,商业化程度缓慢
9. 四大行业参与者正针对行业发展的共性与各自领域的特性,在商业模式上存“同”求“异”
10. 云厂商可借助生态优势,推动一体机和广告服务的增长;初创企业“六小龙”可通过深耕特定领域,实现专业化发展;高校研究院可通过开源合作,促进技术共享和人才培养;传统AI企业则可利用其领域专长,推动知识产权变现和C端市场的拓展
11. AI通用大模型的商业化之路依旧任重而道远,需要行业各参与者在技术持续创新、市场需求挖掘、与盈利模式探索等方面不懈努力,推动行业的持续发展
35家央国企已落地66个大模型,国家队引领AI变革
文章概要:
1. 国资委多次对中央企业发展人工智能提出要求,央国企在大模型浪潮中成为先行力量,推动国内大部分AI模型落地项目。
2. 国资央企在大模型的相关投入上基于其自身能力承担不同的研发任务,其中三大通信运营商承担通用大模型的研发主力军,行业大模型和细分领域专用大模型是大部分央企的投入重点。
3. 本文整理了央国企已落地的66个AI大模型,包括中核、中国核电、中国航天科工、中国船舶、中国电科、中国石油、中国石化、中国海油、国家电网、南方电网、中国三峡、国家能源、中国电信、中国联通、中国移动、中国电子、中国一汽、中远海运、中国中化、中国建科、国家开发投资集团、招商局集团、华润集团、中国商飞、中煤集团、中国煤科、铁科院、中国中铁一局、中国航信、中国广核集团、中国绿发、北大荒、上汽集团、河南省医学科学院、山东能源、西安光机所等企业的大模型。
阅读原文
2. 国资央企在大模型的相关投入上基于其自身能力承担不同的研发任务,其中三大通信运营商承担通用大模型的研发主力军,行业大模型和细分领域专用大模型是大部分央企的投入重点。
3. 本文整理了央国企已落地的66个AI大模型,包括中核、中国核电、中国航天科工、中国船舶、中国电科、中国石油、中国石化、中国海油、国家电网、南方电网、中国三峡、国家能源、中国电信、中国联通、中国移动、中国电子、中国一汽、中远海运、中国中化、中国建科、国家开发投资集团、招商局集团、华润集团、中国商飞、中煤集团、中国煤科、铁科院、中国中铁一局、中国航信、中国广核集团、中国绿发、北大荒、上汽集团、河南省医学科学院、山东能源、西安光机所等企业的大模型。
多模态大模型MLLM的架构发展及思考
文章概要:
1. 简介:GPT3问世以来,纯文本模态的大模型和多模态混合的大模型都获得了迅速发展。当前研究多模态大模型的主流方向是通过不同模态数据独有的编码器编码,然后将多模态信号同文本进行“语义”层面的对齐,再利用大语言模型的能力进行处理。但这种通用的处理方式是否最优,值得深入研究。
2. 关键词:多模态大模型、大语言模型、视觉编码器、音频编码器、模态对齐、端到端训练、视觉摘要、视觉问答、多模态理解、多模态生成、长视频理解
3. 文献综述:多模态模型的发展由来已久,从早期通过多模态数据的引入提升模型精度,到中期出现多种不同方式的无监督多模态对比学习,再到当前通过大语言模型强大的理解、推理、总结等能力来提升模型效果。本文将从多模态大模型的典型结构、与更多任务的结合、数据集及构建方式的演进、幻觉问题机理及解决思路、模态理解与生成任务统一等方面进行文献解读。
4. 可研究方向的思考:探讨如何持续提升多模态大模型的能力水平、扩展其能力边界、将其小型化,以及其在行业中的应用。
5. 行业应用:多模态大模型的潜在应用场景还有很多,比如医疗图像领域。未来也可能由于理解和生成模型的进一步统一,多模态大模型能够完成很多生成模型的工作。
阅读原文
2. 关键词:多模态大模型、大语言模型、视觉编码器、音频编码器、模态对齐、端到端训练、视觉摘要、视觉问答、多模态理解、多模态生成、长视频理解
3. 文献综述:多模态模型的发展由来已久,从早期通过多模态数据的引入提升模型精度,到中期出现多种不同方式的无监督多模态对比学习,再到当前通过大语言模型强大的理解、推理、总结等能力来提升模型效果。本文将从多模态大模型的典型结构、与更多任务的结合、数据集及构建方式的演进、幻觉问题机理及解决思路、模态理解与生成任务统一等方面进行文献解读。
4. 可研究方向的思考:探讨如何持续提升多模态大模型的能力水平、扩展其能力边界、将其小型化,以及其在行业中的应用。
5. 行业应用:多模态大模型的潜在应用场景还有很多,比如医疗图像领域。未来也可能由于理解和生成模型的进一步统一,多模态大模型能够完成很多生成模型的工作。