国产大模型独角兽,困在光环里
文章概要:
1. 11月16日,月之暗面举办媒体沟通会,发布了一款数学模型,并与OpenAI o1系列、GPT-4o、Anthropic Claude 3.5 Sonnet模型的测试分数做了对比。
2. 月之暗面是一家大模型公司,作风一贯有些另类,不聊技术,只推拳头产品Kimi。
3. Kimi在今年年初的热度冲到一个高峰,铺天盖地的广告投放轰炸使这款智能助手产品声名鹊起。
4. 快速攀升的Kimi用户数和影响力90后清华校友技术天才创业者”的创始人标签、阿里超10亿美元领投、Kimi概念股爆火……诸多光环叠加,将月之暗面捧成了一个新晋国产大模型“顶流”。
5. 但很快其命运陡转,口碑逐渐下滑,质疑声扑面而至,这些光环也变成了缚住月之暗面的茧。
6. 以前是好评如潮,但不知何时开始,月之暗面被冠以“大模型营销咖”的外号,模型乏善可陈,生态资源被大厂碾压,产品更新多为缝缝补补。
7. 一些针对产品效果的负面评价也声量渐起:“动不动让换个话题”、“有时会瞎编”、“整理资料糙”、“听不懂需求”、“幻觉和错误严重”、“指出它错了还犟嘴”……这些大模型通病,在用户心里埋下失望的种子。多位用户吐槽说,Kimi最近莫名地越用越差,感觉比以前变蠢了,甚至有人怀疑这是不是想逼用户付费。
8. 这是大模型竞赛中的一个缩影:当发展速度跟不上讲故事的高度,当免费和低价策略挟住每一个参赛者,当Scaling Law信仰开始动摇,此时的转折是潮前的过渡,凛冽寒冬的序曲?
9. 大模型独角兽们,集体走到逆风时刻。
阅读原文
2. 月之暗面是一家大模型公司,作风一贯有些另类,不聊技术,只推拳头产品Kimi。
3. Kimi在今年年初的热度冲到一个高峰,铺天盖地的广告投放轰炸使这款智能助手产品声名鹊起。
4. 快速攀升的Kimi用户数和影响力90后清华校友技术天才创业者”的创始人标签、阿里超10亿美元领投、Kimi概念股爆火……诸多光环叠加,将月之暗面捧成了一个新晋国产大模型“顶流”。
5. 但很快其命运陡转,口碑逐渐下滑,质疑声扑面而至,这些光环也变成了缚住月之暗面的茧。
6. 以前是好评如潮,但不知何时开始,月之暗面被冠以“大模型营销咖”的外号,模型乏善可陈,生态资源被大厂碾压,产品更新多为缝缝补补。
7. 一些针对产品效果的负面评价也声量渐起:“动不动让换个话题”、“有时会瞎编”、“整理资料糙”、“听不懂需求”、“幻觉和错误严重”、“指出它错了还犟嘴”……这些大模型通病,在用户心里埋下失望的种子。多位用户吐槽说,Kimi最近莫名地越用越差,感觉比以前变蠢了,甚至有人怀疑这是不是想逼用户付费。
8. 这是大模型竞赛中的一个缩影:当发展速度跟不上讲故事的高度,当免费和低价策略挟住每一个参赛者,当Scaling Law信仰开始动摇,此时的转折是潮前的过渡,凛冽寒冬的序曲?
9. 大模型独角兽们,集体走到逆风时刻。
阿里巴巴吴泳铭:面向AI时代,阿里巴巴专注做好两件事
文章概要:
1. 11月20日,阿里巴巴集团CEO吴泳铭在04世界互联网大会乌镇主论坛上表示,面向AI时代的生产力革命,阿里巴巴一直专注做好两件事:不断完善AI基础设施和相关支撑体系;坚持开源开放,与广大生态伙伴,把AI能力转化为行百业的生产力
2. 过去一年,阿里巴巴高强度投入AI基础设施,推动算力成本持续降低
3. 吴泳铭表示,阿里坚持把最新、最全的自研大模型向全行业、向全球,推动打造繁荣的>4. 截至目前开发者基于通义千问二次开发衍生模型突破7.8万个
. 大会授予阿里巴巴“2024年创新突破奖,“阿里云面向AI的云计算基础设施”荣获“领先科技奖”,成为大会历史上首个以AI基础设施整体获奖的科技成果
阅读原文
2. 过去一年,阿里巴巴高强度投入AI基础设施,推动算力成本持续降低
3. 吴泳铭表示,阿里坚持把最新、最全的自研大模型向全行业、向全球,推动打造繁荣的>4. 截至目前开发者基于通义千问二次开发衍生模型突破7.8万个
. 大会授予阿里巴巴“2024年创新突破奖,“阿里云面向AI的云计算基础设施”荣获“领先科技奖”,成为大会历史上首个以AI基础设施整体获奖的科技成果
国产大模型独角兽,困在光环里
文章概要:
1. 月之暗面举办沟通会,发布数学模型,并与其他模型进行测试分数对比
2. 月之暗面作风另类,不聊技术,只推拳头产品Kimi
3. Kimi在今年年初热度冲高,用户数和影响力快速攀升产品更新多为缝缝补补
4. 月之暗面面临产品竞争压力,陷入一系列舆情风波中
5. 国产格局生变,创业头部梯队从“四小龙”变为“六小虎”,资本密集汇向这几家大模型初创,将它们拱到独角兽身价
6. 大模型创企面临人才、技术、产品和财务困境,需要解决概念与产品之间的差距,并证明自身的造血能力
阅读原文
2. 月之暗面作风另类,不聊技术,只推拳头产品Kimi
3. Kimi在今年年初热度冲高,用户数和影响力快速攀升产品更新多为缝缝补补
4. 月之暗面面临产品竞争压力,陷入一系列舆情风波中
5. 国产格局生变,创业头部梯队从“四小龙”变为“六小虎”,资本密集汇向这几家大模型初创,将它们拱到独角兽身价
6. 大模型创企面临人才、技术、产品和财务困境,需要解决概念与产品之间的差距,并证明自身的造血能力
重磅!阿里云百炼上线Qwen百万长文本模型
文章概要:
1 Qwen2.5-Turbo上线阿里云百炼平台,模型上下文长度扩展至百万tokens,免费100万tokens额度
2 Qwen5-T1M长度的超长文本检索任务中的准确率达到100%,在长文本评测集RULER上获得93.1超越GPT-4> 3. Qwen2-Turbo可应用于长篇小说深入理解、仓库级别代码助手、论文阅读等场景
4. 通义千问稀疏注意力机制将注意力部分的计算压缩了12.5倍,将处理1M tokens上下文时的首字返回时间4.9分钟降低到68秒,实现了4.3倍的速度提升
5. Qwen2.-Turbo已正式在阿里云炼平台上线用户可在阿里云百炼调用Qwen.-Turbo API,平台免费1000万tokens额度,后续使用百万tokens仅需0.3
6 目前,阿里云上线Qwen、Llama、ChatM等超2国内外开源和闭源大模型用户可选择直接调用、训练微调或RAG应用
7. 目前,一汽、金山、哈啰集团、国家天文台等超30万企业在使用阿里云百炼
阅读原文
2 Qwen5-T1M长度的超长文本检索任务中的准确率达到100%,在长文本评测集RULER上获得93.1超越GPT-4> 3. Qwen2-Turbo可应用于长篇小说深入理解、仓库级别代码助手、论文阅读等场景
4. 通义千问稀疏注意力机制将注意力部分的计算压缩了12.5倍,将处理1M tokens上下文时的首字返回时间4.9分钟降低到68秒,实现了4.3倍的速度提升
5. Qwen2.-Turbo已正式在阿里云炼平台上线用户可在阿里云百炼调用Qwen.-Turbo API,平台免费1000万tokens额度,后续使用百万tokens仅需0.3
6 目前,阿里云上线Qwen、Llama、ChatM等超2国内外开源和闭源大模型用户可选择直接调用、训练微调或RAG应用
7. 目前,一汽、金山、哈啰集团、国家天文台等超30万企业在使用阿里云百炼
10万奖金!通义千问Qwen技术应用有奖征文
文章概要:
1. 魔搭ModelScope社区发布了通义千问wen技术应用的通知。
2. 99阿里云发布了新一代开源模型Qwen2.多种尺寸的大语言模型、多模态、及代码模型00版本。br>3. Qwen系列的下载量已经超过4000万,海内外开源社区中Qwen的衍生模型数量已突破7.万超越Llama为世界最大的生成式语言。
4. 在Hugging Face的Open LLMboard上,Qwen系列及其衍生模型包揽了前十的全部座次展现了其在全球开源大模型的重要影响力。
5. 为了探索Qwen在不同场景应用,通义千问Qwen联合阿里云开发者社区、魔搭社区发起征文活动,旨在鼓励开发者通过撰写技术和CookBook分享发现与见解,促进技术互动。
6. 即日起-12.31,围绕应用、微调/部署、行业应用、Qwenoder技术实践文章,有机会瓜分10万元奖金<>.稿期间,将组织多场直播分享,涵盖征文方向解读wen模型解析和技术文章撰写指导。11月210:00-21:3,将重点讲解Qwen-Coder方向的模型解读和应用拓展。
阅读原文
2. 99阿里云发布了新一代开源模型Qwen2.多种尺寸的大语言模型、多模态、及代码模型00版本。br>3. Qwen系列的下载量已经超过4000万,海内外开源社区中Qwen的衍生模型数量已突破7.万超越Llama为世界最大的生成式语言。
4. 在Hugging Face的Open LLMboard上,Qwen系列及其衍生模型包揽了前十的全部座次展现了其在全球开源大模型的重要影响力。
5. 为了探索Qwen在不同场景应用,通义千问Qwen联合阿里云开发者社区、魔搭社区发起征文活动,旨在鼓励开发者通过撰写技术和CookBook分享发现与见解,促进技术互动。
6. 即日起-12.31,围绕应用、微调/部署、行业应用、Qwenoder技术实践文章,有机会瓜分10万元奖金<>.稿期间,将组织多场直播分享,涵盖征文方向解读wen模型解析和技术文章撰写指导。11月210:00-21:3,将重点讲解Qwen-Coder方向的模型解读和应用拓展。
吴泳铭:面向AI时代,阿里巴巴专注做好两件事
文章概要:
1. 11月20日,阿里巴巴集团CEO吴铭在2024世界互联网大会乌镇峰会主论坛上表示,面向AI时代的生产力革命,完善和相关支撑体系;二坚持开源开放与广大生态伙伴一起,把AI能力转化为千行百的生产力
2. 过去一年,阿里巴巴投入AI基础设施建设,基于规模效应和进步,推动算力成本持续降低。通义千问API调用价格一年下降97%,token调用花费最低降至5毛钱
3. 吴泳铭表示阿里坚持把最新、最全的自研大模型向行业开源、向全球开源,推动打造繁荣的AI生态。截至目前,开发者基于通义千问二次开发的衍生模型突破7.8
4 大会授予阿里巴巴“204年创新突破奖,面向AI的云计算基础设施”荣获“领先科技奖”,成为大会历史首个以AI基础设施整体获奖的成果
阅读原文
2. 过去一年,阿里巴巴投入AI基础设施建设,基于规模效应和进步,推动算力成本持续降低。通义千问API调用价格一年下降97%,token调用花费最低降至5毛钱
3. 吴泳铭表示阿里坚持把最新、最全的自研大模型向行业开源、向全球开源,推动打造繁荣的AI生态。截至目前,开发者基于通义千问二次开发的衍生模型突破7.8
4 大会授予阿里巴巴“204年创新突破奖,面向AI的云计算基础设施”荣获“领先科技奖”,成为大会历史首个以AI基础设施整体获奖的成果
10万奖金!通义千问Qwen技术应用有奖征文
文章概要:
1 阿里云发布通义Qwen25,涵盖多种尺寸的大语言模型、多模态模型、数学及代码模型,每个尺寸都有基础版本、指令版本、量化版本,总计上架10多个模型。br> 2. Qwen系列模型的全球下载量超过4000万,海内外开源社区wen的衍生数量已突破7.8,超越Llama,通义千问Qwen成长为世界最大的生成式语言模型。br> 3.Hugging Face的Open LLM Leaderboard上,Qwen系列及其衍生模型一度包揽了前十的全部座,展现了在全球开源大模型领域的重要影响力。
4. 通义千问Qwen联合阿里云开发者社区、魔搭社区Model发起征文,旨在鼓励开发者通过撰写技术文章和CookBook分享与见解,促进技术交流互动。至2.31,围绕Agent应用、微调/部署、应用、Qwen-Coder应用技术实践文章,就有机会瓜分10万元奖金。
阅读原文
4. 通义千问Qwen联合阿里云开发者社区、魔搭社区Model发起征文,旨在鼓励开发者通过撰写技术文章和CookBook分享与见解,促进技术交流互动。至2.31,围绕Agent应用、微调/部署、应用、Qwen-Coder应用技术实践文章,就有机会瓜分10万元奖金。
Qwen2-Math:重新定义数学问题解决的未来
文章概要:
1. Qwen2-Math 是由通义千问开发的模型系列,解决复杂数学问题而生,包含 1.5B、7B 和 7B 三个版本。
2. 与市场上其他的开源或闭源模型相比,Qwen2-Math 的表现尤为亮眼,尤其是在多步骤复杂推理上更是技高一筹。
3. Qwen2-Math 在诸如 GSM8K、Math 和 MMLU-STEM 等国际基准测试表现优异,在数学竞赛中取得了不错的。
4. 对于 Qwen2-Math 的评价,网友们褒贬不一,人称赞它为“数学小助手”,解决了很多以往难以攻克的问题,然而,也有网友提出了一些担忧
5. 未来即将推出的中英文双语版本,无疑将进一步提升 Qwen2-Math 的实用性。
6 Qwen2-Math 的潜在应用远不止于数学,它可以作为高效工具辅助企业和科研机构的日常工作。
阅读原文
2. 与市场上其他的开源或闭源模型相比,Qwen2-Math 的表现尤为亮眼,尤其是在多步骤复杂推理上更是技高一筹。
3. Qwen2-Math 在诸如 GSM8K、Math 和 MMLU-STEM 等国际基准测试表现优异,在数学竞赛中取得了不错的。
4. 对于 Qwen2-Math 的评价,网友们褒贬不一,人称赞它为“数学小助手”,解决了很多以往难以攻克的问题,然而,也有网友提出了一些担忧
5. 未来即将推出的中英文双语版本,无疑将进一步提升 Qwen2-Math 的实用性。
6 Qwen2-Math 的潜在应用远不止于数学,它可以作为高效工具辅助企业和科研机构的日常工作。
昨日行业动态丨支持100万tokens上下文!阿里Qwen2.5-Turbo AI模型开源
文章概要:
1. 老师利用AI功能生成学生梦想的职业,将梦想具象化,学习。
2. 阿里通义千问发布Qwen2.-Turbo开源AI模型,支持100tokens长度,处理速度提升4.3倍,性能优于GPT-4等竞品。
3. Google Workspace新增AI图像生成功能,Gemini模型在Google Docs中快速创建视觉素材。
4. 由北京大学、清华大学等机构的LLaVA-o1视觉AI模型发布,拥有10亿参数多模态推理基准测试中性能提升8.9%,在多个基准测试中表现出色,超越了许多现有模型。
5. 微软在Ignite大会上推出Copilot Actions,该功能通过简单提示自动执行日常重复性,如总结会议、周报等。
6. AI搜索引擎Perplexity新增购物功能,用户可以通过该平台直接购物,享受一键结账和AI产品推荐的便捷服务。
. 202年世界大会乌镇峰会推出AI智能体桐小,由桐乡市政府与支付宝联合打造
阅读原文
2. 阿里通义千问发布Qwen2.-Turbo开源AI模型,支持100tokens长度,处理速度提升4.3倍,性能优于GPT-4等竞品。
3. Google Workspace新增AI图像生成功能,Gemini模型在Google Docs中快速创建视觉素材。
4. 由北京大学、清华大学等机构的LLaVA-o1视觉AI模型发布,拥有10亿参数多模态推理基准测试中性能提升8.9%,在多个基准测试中表现出色,超越了许多现有模型。
5. 微软在Ignite大会上推出Copilot Actions,该功能通过简单提示自动执行日常重复性,如总结会议、周报等。
6. AI搜索引擎Perplexity新增购物功能,用户可以通过该平台直接购物,享受一键结账和AI产品推荐的便捷服务。
. 202年世界大会乌镇峰会推出AI智能体桐小,由桐乡市政府与支付宝联合打造
看图说话(编故事),9家AIGC平台哪家强?
文章概要:
1. 文章介绍了用目前国内知名度较高的AIGC平台,完成小学生的“看图说话”作业,来测试它们编故事的能力如何。
2. 文章对百度文心一言、阿里通义千问、腾讯元宝、智谱清言、抖音豆包、讯飞星火、kimi.ai、海螺AI、跃问这9家AIGC平台编故事的能力进行了测试。
3. 文章对这9家AC平台编故事的能力进行了简评。
阅读原文
2. 文章对百度文心一言、阿里通义千问、腾讯元宝、智谱清言、抖音豆包、讯飞星火、kimi.ai、海螺AI、跃问这9家AIGC平台编故事的能力进行了测试。
3. 文章对这9家AC平台编故事的能力进行了简评。
AI 大模型
文章概要:
1. 随着科技发展,人工智能在教育领域展现出巨大赋能潜力。
2 文心一言、讯飞星火、通义、天工AI、百川AI、豆包AI、-O、商汤AI这八个AI大模型是当下备受关注的人工智能技术范例。
3. 百度推出的文心一言属于大规模语言模型,拥有强大的自然语言处理本领,可进行文本创作、、写作等多项任务。
4. 科大讯飞的讯飞星火主要用于语音识别与合成,还支持多语种翻译、智能对话以及教育测评等功能。
5. 阿里巴巴达摩院推出的通义千问是一款综合型大模型支持多模态数据处理、智能问答以及个性化学习路径推荐等应用场景br>. 腾讯研发的天工AI图像识别、自然语言以及机器学习领域均有出色表现,广泛应用于教育评估和智慧校园管理。
7. 京东研发的百川AI主要在智能客服、知识图谱以及教育资源推荐等方面发挥作用
8 豆包推出的豆包AI专注于情感计算与人机交互,教育心理健康辅导和智能辅导员方面独具优势。
9. OpenAI的GPT-4O是新一代大规模语言模型,以卓越的文本生成能力和深度理解能力著称
10. 商汤商汤AI在计算机视觉和方面显著,应用于智能监控、在线教育和虚拟实验室等领域。
阅读原文
2 文心一言、讯飞星火、通义、天工AI、百川AI、豆包AI、-O、商汤AI这八个AI大模型是当下备受关注的人工智能技术范例。
3. 百度推出的文心一言属于大规模语言模型,拥有强大的自然语言处理本领,可进行文本创作、、写作等多项任务。
4. 科大讯飞的讯飞星火主要用于语音识别与合成,还支持多语种翻译、智能对话以及教育测评等功能。
5. 阿里巴巴达摩院推出的通义千问是一款综合型大模型支持多模态数据处理、智能问答以及个性化学习路径推荐等应用场景br>. 腾讯研发的天工AI图像识别、自然语言以及机器学习领域均有出色表现,广泛应用于教育评估和智慧校园管理。
7. 京东研发的百川AI主要在智能客服、知识图谱以及教育资源推荐等方面发挥作用
8 豆包推出的豆包AI专注于情感计算与人机交互,教育心理健康辅导和智能辅导员方面独具优势。
9. OpenAI的GPT-4O是新一代大规模语言模型,以卓越的文本生成能力和深度理解能力著称
10. 商汤商汤AI在计算机视觉和方面显著,应用于智能监控、在线教育和虚拟实验室等领域。
大模型有那些?
文章概要:
1. 介绍了国外的 AI 大模型,包括 GPT-4o、Gemini 2、Gemma 2、Claude-3 2、Llama 3 2 等,它们具有多模态输入输出、实时响应能力强、音频输入响应时间短等特点。
2. 介绍了国内的 AI 大模型,包括讯飞星火认知大模型、文心一言大模型、通义千问大模型、智谱 GLM-4(智谱清言)、盘古大模型、赤兔大模型、文修大模型、YonGPT 大模型等,它们具有文本生成、语言理解、知识逻辑推理、数学、代码能力和多模态能力等特点。<>3. 介绍了 AI 大模型的应用领域,包括自然语言处理、图像识别、编程辅助、智能客服、内容生成、计算机视觉、自动驾驶、教育和培训、医疗、制造业、农业等。
4. 介绍了不同 AI 大模型的特色,包括通义千问、星火大模型、文心一言、豆包、ChatGPT、Claude、Gemini 等。
5. 介绍了 AI 大模型的发展趋势,包括模型规模将会继续扩大、AI 将更加注重可解释性、AI 将更加注重公平性和保护、AI 大模型将更加注重自监督学习、多模态融合也是未来发展趋势之一、AI 大模型在应用场景上将会更加广泛和多样化等。
阅读原文
2. 介绍了国内的 AI 大模型,包括讯飞星火认知大模型、文心一言大模型、通义千问大模型、智谱 GLM-4(智谱清言)、盘古大模型、赤兔大模型、文修大模型、YonGPT 大模型等,它们具有文本生成、语言理解、知识逻辑推理、数学、代码能力和多模态能力等特点。<>3. 介绍了 AI 大模型的应用领域,包括自然语言处理、图像识别、编程辅助、智能客服、内容生成、计算机视觉、自动驾驶、教育和培训、医疗、制造业、农业等。
4. 介绍了不同 AI 大模型的特色,包括通义千问、星火大模型、文心一言、豆包、ChatGPT、Claude、Gemini 等。
5. 介绍了 AI 大模型的发展趋势,包括模型规模将会继续扩大、AI 将更加注重可解释性、AI 将更加注重公平性和保护、AI 大模型将更加注重自监督学习、多模态融合也是未来发展趋势之一、AI 大模型在应用场景上将会更加广泛和多样化等。
国产优质免费AI推荐
文章概要:
1. 近年来,国产免费人工智能技术取得显著进步,文章将继续探索更多优秀的国产AI工具。
2. 文章回顾了之前介绍的国产免费AI工具,包括讯飞星火、通义千问、豆包心一言、腾讯元宝、kimi、智谱清言。
3. 文章继续推荐了一些亲测的国产AI,包括小浣熊助手、天工AI、360脑、WPS AI、海螺AI。
. 这些国产AI工具在多个领域展现出强大的功能和,能够提升工作效率用户处理日常任务,并在专业领域提供深度支持。
阅读原文
2. 文章回顾了之前介绍的国产免费AI工具,包括讯飞星火、通义千问、豆包心一言、腾讯元宝、kimi、智谱清言。
3. 文章继续推荐了一些亲测的国产AI,包括小浣熊助手、天工AI、360脑、WPS AI、海螺AI。
. 这些国产AI工具在多个领域展现出强大的功能和,能够提升工作效率用户处理日常任务,并在专业领域提供深度支持。
Qwen2.5-Turbo: 将上下文长度扩展至百万 Tokens !
文章概要:
1. Qwen2.-Turbo上下文长度扩展百万 Tokens,拥有超长上下文支持、高效推理速度、经济实惠等核心优势。
2. Q25-Turbo性能评估中展现出惊人的细节捕捉能力和卓越的处理长文本任务能力。
3. Qwen2.5-Turbo代码生成与辅助、文本生成与创作、企业应用等中有广泛的应用前景。
4. 可以在HugFace和ModelScope上在线体验Qwen2.5-Turbo模型,也可以结合API文档通过API进行。
阅读原文
2. Q25-Turbo性能评估中展现出惊人的细节捕捉能力和卓越的处理长文本任务能力。
3. Qwen2.5-Turbo代码生成与辅助、文本生成与创作、企业应用等中有广泛的应用前景。
4. 可以在HugFace和ModelScope上在线体验Qwen2.5-Turbo模型,也可以结合API文档通过API进行。
DistilQwen2 蒸馏小模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
文章概要:
1. 阿里云的人工智能平台PAI对DistilQwen2模型系列提供了全面的技术支持,本文详细介绍在PAI平台使用DistilQwen2蒸馏小模型的全链路最佳实践。
2. 介绍了PAI-QuickStart的功能和运行环境要求。
3. 开发者可以在PAI控制台的“快速开始”入口,找到DistilQwen2系列模型,以DistilQwen2-1.5B-Instruct为例,模型卡片如下图所示。
4. 介绍了通过PAI-QuickStart使用模型的方法,包括模型部署和调用、模型微调训练、模型评测、模型压缩。
阅读原文
2. 介绍了PAI-QuickStart的功能和运行环境要求。
3. 开发者可以在PAI控制台的“快速开始”入口,找到DistilQwen2系列模型,以DistilQwen2-1.5B-Instruct为例,模型卡片如下图所示。
4. 介绍了通过PAI-QuickStart使用模型的方法,包括模型部署和调用、模型微调训练、模型评测、模型压缩。
Qwen2大模型微调入门实战
文章概要:
1. 本文介绍了Qwen2大模型微调入门实战,包括环境安装、准备数据集、加载模型、配置训练可视化工具、完整代码、训练结果演示和推理训练好的模型。
2. 文章以Qwen2作为基座大模型,通过指令微调的方式做高精度文本分类,是学习LLM微调的入门任务。
3. 文章使用了Qwen2-1.5b-Instruct模型在复旦中文新闻数据集上做指令微调训练,同时使用Swan监控训练过程、评估模型效果。
4. 文章采用了Lora方法,所以显存要求不高,10GB左右就可以跑。
5. 文章提供了完整代码,包括环境安装、准备数据集、加载模型、配置训练可视化工具、完整代码、训练结果演示和推理训练好的模型。
阅读原文
2. 文章以Qwen2作为基座大模型,通过指令微调的方式做高精度文本分类,是学习LLM微调的入门任务。
3. 文章使用了Qwen2-1.5b-Instruct模型在复旦中文新闻数据集上做指令微调训练,同时使用Swan监控训练过程、评估模型效果。
4. 文章采用了Lora方法,所以显存要求不高,10GB左右就可以跑。
5. 文章提供了完整代码,包括环境安装、准备数据集、加载模型、配置训练可视化工具、完整代码、训练结果演示和推理训练好的模型。
11.20超互联日报
文章概要:
1 阿里通义千问发布 Qwen2.5-Turbo AI 模型,支持 1 万 上下文,时间缩短至 68 秒。
2. 快手可灵 AI API 能力免费升级,并将提供测试额度,同时视频生成、图像生成、虚拟试穿三项能力也全面开放。
3. 华为 Mate 70 系列正式官宣,AI 功能或将迎来革命升级,将在 AI 影像、AI安全以及 AI 手势技术三大方面进行突破。br>4. 智能手机 OS 比拼“懂你来了,各家厂商都在系统级 AI 上疯狂输出,誓要打造最懂你的智能手机。
5. Mistral 发布 Pixtral Large 多模态 AI 模型,在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试表现出色。
6. PerplexityAI 推出新功能,AI 搜索直达购买,轻松购物体验升级。
阅读原文
2. 快手可灵 AI API 能力免费升级,并将提供测试额度,同时视频生成、图像生成、虚拟试穿三项能力也全面开放。
3. 华为 Mate 70 系列正式官宣,AI 功能或将迎来革命升级,将在 AI 影像、AI安全以及 AI 手势技术三大方面进行突破。br>4. 智能手机 OS 比拼“懂你来了,各家厂商都在系统级 AI 上疯狂输出,誓要打造最懂你的智能手机。
5. Mistral 发布 Pixtral Large 多模态 AI 模型,在 MathVista、DocVQA 和 VQAv2 等标准多模态基准测试表现出色。
6. PerplexityAI 推出新功能,AI 搜索直达购买,轻松购物体验升级。
AI赋能教育时代:讯飞星火、通义千问、天工AI、豆包AI、GPT-4O、商汤AI、文心一言8个AI大模型应用(带链接)
文章概要:
1. 随着科技的发展,人工智能在教育领域展现出巨大的赋能潜力。
2. 文章详细剖析了文心一言、讯飞星火、通义千问、天工AI、AI、豆包AI、GPT-4O、商汤AI这八个AI大模型的功能特点与优势所在,并给出了它们的官方链接。
3. 文章最后指出,各个大模型的功能和特长各有侧重教育工作者可根据实际需求选择最为合适的AI工具,更好地为教育赋能。
阅读原文
2. 文章详细剖析了文心一言、讯飞星火、通义千问、天工AI、AI、豆包AI、GPT-4O、商汤AI这八个AI大模型的功能特点与优势所在,并给出了它们的官方链接。
3. 文章最后指出,各个大模型的功能和特长各有侧重教育工作者可根据实际需求选择最为合适的AI工具,更好地为教育赋能。