Kimi的双胞胎弟弟,一个像林志颖,一个更像妈咪
文章概要:
1. 文章提到了K的双胞胎弟弟,一个像林志颖,一个更像妈妈。
2.杰(Jenson)性格活泼外向,长得更像妈妈。
阅读原文
2.杰(Jenson)性格活泼外向,长得更像妈妈。
kimi数学版 | k0-math用公式勾勒了一个新的数学世界
文章概要:
1. kimi最近动作频繁,自不久前kimi创始人被前司投资人提起仲裁,杨植麟现身k0发布会,可谓跌宕起伏
2. 在中考、高考、考研以及包含入门级别竞赛题的MATH等数学基准测试中,k0超过了o1i和1,位居榜首
3. kimi数学版不只会数学,imi会用理科思维来解释生活中的> 4. 绛烨,enfp/infp,AI科技自媒体博主,公众号“AC新知”主理人(目前粉丝量1000+)
5.在一家教育公司做AI产品运营agent开发
6. 公众号文章合作,可友情or付费or资源置换
7.相关资源> 8. AI头部KOL>. 教育/agent开发等方面讨论
10. AI教育相关/资源
11. AI agent开发定制,课程培训合作等
12. 商务合作可直接联系,期待多多交流共同进步
13. 知识星球沉淀了很多AI的素材集,欢迎加入
阅读原文
2. 在中考、高考、考研以及包含入门级别竞赛题的MATH等数学基准测试中,k0超过了o1i和1,位居榜首
3. kimi数学版不只会数学,imi会用理科思维来解释生活中的> 4. 绛烨,enfp/infp,AI科技自媒体博主,公众号“AC新知”主理人(目前粉丝量1000+)
5.在一家教育公司做AI产品运营agent开发
6. 公众号文章合作,可友情or付费or资源置换
7.相关资源> 8. AI头部KOL>. 教育/agent开发等方面讨论
10. AI教育相关/资源
11. AI agent开发定制,课程培训合作等
12. 商务合作可直接联系,期待多多交流共同进步
13. 知识星球沉淀了很多AI的素材集,欢迎加入
如何让kimi辅助阅读,提高10倍践行效率?
文章概要:
1. 提出阅读中遇到的问题,如方法不会用、与其他方法不同等,这些问题会影响阅读兴趣和深度。
2以自己的问题为例,说明可以用AI问题。
3询问kimi关于小标题的使用问题,kimi给出了回答,解决了作者的疑惑。
阅读原文
2以自己的问题为例,说明可以用AI问题。
3询问kimi关于小标题的使用问题,kimi给出了回答,解决了作者的疑惑。
豪掷10亿元,Kimi、豆包上演的烧钱大战
文章概要:
1. 2024年AI投放大战进入白热化阶段,豆包等产品纷纷砸钱,单月最高投入达2。
2AI类产品面临用户留存率低的问题,如何留住用户成为挑战。
3.跳动和腾讯成为AI投放战的幕后推手,公司只能通过砸钱增长。
4. 国内AI产品多以工具属性为主很难成为超级应用,适合细分市场br> 5. 一些公司已经开始减少广告投入资源产品和用户粘性
阅读原文
2AI类产品面临用户留存率低的问题,如何留住用户成为挑战。
3.跳动和腾讯成为AI投放战的幕后推手,公司只能通过砸钱增长。
4. 国内AI产品多以工具属性为主很难成为超级应用,适合细分市场br> 5. 一些公司已经开始减少广告投入资源产品和用户粘性
Kimi数学模型小学奥数基准测评公布!超4o,落后o1近20分
文章概要:
1. Kimi发布了趋近OpenAI o1系列水平的新一代数学推理模型k0-math
2 专业第三方测评机构SuperCLUE,基于SuperCLUE-Math6o奥林匹克数学竞赛基准,k0-math进行了专项数学能力评估> 3. 与Kimi.ai(网页版本)相比,数学模型k-math在SC-math6o竞赛基准上取得了0分的提升
4. 与o1-preview相比,数学模型k0-math在SC-m6o上仍有1分的差距,尚有较大的提升空间,目前排名国内第2
5. 数学模型k-math在数学任务中表现对应用题和计算较强的能力在问题和几何任务上略显
6. 小于500的Q型为6
阅读原文
2 专业第三方测评机构SuperCLUE,基于SuperCLUE-Math6o奥林匹克数学竞赛基准,k0-math进行了专项数学能力评估> 3. 与Kimi.ai(网页版本)相比,数学模型k-math在SC-math6o竞赛基准上取得了0分的提升
4. 与o1-preview相比,数学模型k0-math在SC-m6o上仍有1分的差距,尚有较大的提升空间,目前排名国内第2
5. 数学模型k-math在数学任务中表现对应用题和计算较强的能力在问题和几何任务上略显
6. 小于500的Q型为6
Kimi陷入ofo式处境,杨植麟会是下一个戴威吗?
文章概要:
1. Kimi陷入ofo式处境,杨植麟下一个戴威吗?
2. 淘汰赛加速,Kimi打不擅长的仗
3. 如何跳出ofo式弃子命运?
4. 杨植麟必须回答的难题
阅读原文
2. 淘汰赛加速,Kimi打不擅长的仗
3. 如何跳出ofo式弃子命运?
4. 杨植麟必须回答的难题
一手体验Kimi版“o1”模型,这就是最通人性的数学AI。
文章概要:
1. kimi上线一周年,发布了全面对标o1的数学推理模型k0-math
2. 作者深度体验k0-math,认为其在数学能力上直接拉满,推理、逻辑能力非常强,有种偏科的好玩,像一个刻板印象上的“直男理科大拿”在用数学解决生活中一切问题
3. k0-math超高难度的竞赛题上,相对的能力不足是客观已经是在作者测过的AI大模型里,数学题答得仅次于o1的了
4. k0-math最让作者觉得有趣的,不是本身“做数学题的能力”,而是kimi强大的数学逻辑和思维,以及那很“通人性”的感觉
5. 作者用一个的问题,获得了最抽象的一个结果,感受到了k0ath的“抽象”思维能力
6. k0-math的回答很独特,很有趣,甚至有种“万物皆能认为,现在的k0-math,像一个充满探索欲的数学家,在整个思维链的絮絮叨叨里,也能明显感觉到Kimi的个性
8. 作者期待着,看到AI大模型与我们人类,一起书写这首诗的一天
阅读原文
2. 作者深度体验k0-math,认为其在数学能力上直接拉满,推理、逻辑能力非常强,有种偏科的好玩,像一个刻板印象上的“直男理科大拿”在用数学解决生活中一切问题
3. k0-math超高难度的竞赛题上,相对的能力不足是客观已经是在作者测过的AI大模型里,数学题答得仅次于o1的了
4. k0-math最让作者觉得有趣的,不是本身“做数学题的能力”,而是kimi强大的数学逻辑和思维,以及那很“通人性”的感觉
5. 作者用一个的问题,获得了最抽象的一个结果,感受到了k0ath的“抽象”思维能力
6. k0-math的回答很独特,很有趣,甚至有种“万物皆能认为,现在的k0-math,像一个充满探索欲的数学家,在整个思维链的絮絮叨叨里,也能明显感觉到Kimi的个性
8. 作者期待着,看到AI大模型与我们人类,一起书写这首诗的一天
Kimi罗生门:创始人、投资人,谁的错?
文章概要:
1. 月之暗面是一家估值超过30亿美元的明星创业公司,其创始人杨植麟和张宇韬被指控在没有拿到循环智能投资方的同意豁免书之前,就创立月之暗面并启动融资。
2. 月之暗面公司和两位创始人没有公开回应这一指控,而在不少媒体报道中,前述5家投资方被描述成“见利忘义”、“狮子大开口”的形象。
3. 争议双方(直接/间接)自说自话,表达的“事实”、“观点”和他们的立场一样,截然对立。
4. 杨植麟和张宇韬另起炉灶做大模型存在一定的合理性,但也因此带来了不少麻烦。
5. 同意豁免书是这个争议的核心,有没有拿到“同意豁免书”会成为决定创业者和投资人孰是孰非的最关键问题。
6. 老股东申请仲裁,月之暗面派出律师抗辩,表面上看双方要通过法律手段解决矛盾。但从业者认为,这更像是一场舆论战。
7. 双方都是从自身利益出发,老股东看到创业者的新公司估值猛涨,给自己和LP都带来了严重损失,自然想要争取更多权益,而创业者创立一家新公司,也是为了获得更大利益。
8. 故事的最终结果可能是,双方坐到谈判桌前重新商讨股份,然后做出、接受条件,一方维护了自身的品牌和形象,一方获得了更多权益。
阅读原文
2. 月之暗面公司和两位创始人没有公开回应这一指控,而在不少媒体报道中,前述5家投资方被描述成“见利忘义”、“狮子大开口”的形象。
3. 争议双方(直接/间接)自说自话,表达的“事实”、“观点”和他们的立场一样,截然对立。
4. 杨植麟和张宇韬另起炉灶做大模型存在一定的合理性,但也因此带来了不少麻烦。
5. 同意豁免书是这个争议的核心,有没有拿到“同意豁免书”会成为决定创业者和投资人孰是孰非的最关键问题。
6. 老股东申请仲裁,月之暗面派出律师抗辩,表面上看双方要通过法律手段解决矛盾。但从业者认为,这更像是一场舆论战。
7. 双方都是从自身利益出发,老股东看到创业者的新公司估值猛涨,给自己和LP都带来了严重损失,自然想要争取更多权益,而创业者创立一家新公司,也是为了获得更大利益。
8. 故事的最终结果可能是,双方坐到谈判桌前重新商讨股份,然后做出、接受条件,一方维护了自身的品牌和形象,一方获得了更多权益。
Kimi、豆包领跑,国产AI迎来新格局
文章概要:
1. 11月16日,月之暗面创始人杨麟发布了数学推理模型k0-math,其初代模型在中考、高考、考研及包含竞赛题的MATH等数学基准测试中超过o1-mini和o1-preview
2. Kimi数学版能像数学天才解题,如在40秒内一道硬币翻转问题的全套解题流程,能思维链推理
3. 全新技术范式带来的推理能力提升可泛化到更多日常任务上,Kimi探索版在处理复杂“找有条件的学区房”测试中在搜索量等方面明显
. Kimi用户涵盖学生、科研人员知识需求型人群,探索版程序员等专业人群喜爱
5.今年10月国内68款AI智能助手产品中仅豆包和imi迈过“5000万大关”,豆包累计下载破亿Kimi超5700万,排名3、4位产品下载量超200万
6. 10月imi新增用户1400万,有望进入“破亿br>7. 10月ChatGPT、豆包和Kimi位列全球 APP苹果端下载量前三,占比51%
8. 用户黏性方面豆和Kimi稳居前二,三日留存率超27%,七日新增留存率18%,产品均在5%以下
9. Kim的10月日活用户量仅次于豆包
10. 从各方面来看,豆包和Kimi已处于第一领跑集团,与其他梯队有明显分水岭
11. 杨植麟在k0发布会上表示,竞争应注重给用户价值,模型思考推理能力,而非专门追求不同。他和团队将继续聚焦向前迈进
阅读原文
2. Kimi数学版能像数学天才解题,如在40秒内一道硬币翻转问题的全套解题流程,能思维链推理
3. 全新技术范式带来的推理能力提升可泛化到更多日常任务上,Kimi探索版在处理复杂“找有条件的学区房”测试中在搜索量等方面明显
. Kimi用户涵盖学生、科研人员知识需求型人群,探索版程序员等专业人群喜爱
5.今年10月国内68款AI智能助手产品中仅豆包和imi迈过“5000万大关”,豆包累计下载破亿Kimi超5700万,排名3、4位产品下载量超200万
6. 10月imi新增用户1400万,有望进入“破亿br>7. 10月ChatGPT、豆包和Kimi位列全球 APP苹果端下载量前三,占比51%
8. 用户黏性方面豆和Kimi稳居前二,三日留存率超27%,七日新增留存率18%,产品均在5%以下
9. Kim的10月日活用户量仅次于豆包
10. 从各方面来看,豆包和Kimi已处于第一领跑集团,与其他梯队有明显分水岭
11. 杨植麟在k0发布会上表示,竞争应注重给用户价值,模型思考推理能力,而非专门追求不同。他和团队将继续聚焦向前迈进
Kimi的隐藏技能!这8个高阶用法,90%的人都没发现!
文章概要:
1. 介绍Kimi的常用语功能,可将日常频繁使用的场景或优质提示词进行存储。
2. 联网搜索功能,Kimi会自动判定是否需要联网查询信息。<> 3. 图片识别功能,Kimi精准地识别图片上的文字,并可需求图片进行整理总结。<> 4 处理长文本功能,Kimi具备处理2长文件的能力。
5. 自动提示词功能,Kimi+中,官方提供的提示词专家可一键提示。
6. 生成PPT功能,Kimi+的PPT助手功能十分实用。br> 7 绘制图表功能,Kimi能够直接绘制多种图表。
8. 长文本生成功能,+的长文器在创作小说等长文本内容方面表现出色
阅读原文
2. 联网搜索功能,Kimi会自动判定是否需要联网查询信息。<> 3. 图片识别功能,Kimi精准地识别图片上的文字,并可需求图片进行整理总结。<> 4 处理长文本功能,Kimi具备处理2长文件的能力。
5. 自动提示词功能,Kimi+中,官方提供的提示词专家可一键提示。
6. 生成PPT功能,Kimi+的PPT助手功能十分实用。br> 7 绘制图表功能,Kimi能够直接绘制多种图表。
8. 长文本生成功能,+的长文器在创作小说等长文本内容方面表现出色
Kimi与准实验设计的结合能擦出怎样的火花?
文章概要:
1. 准实验设计是一种介于实验与观察研究之间的研究方法,在无法完全控制实验的情况下进行因果关系的探索。
2. 准实验设计不具备随机分配实验对象到各处理组的能力,受限于实际条件或伦理考量。
3. 在准实验设计中,可以选择一个自然存在的环境或情境,并在这些条件的基础上实施特定的干预措施。
4. 准实验设计无法提供与随机实验相同的内部效度,但它在现实世界的研究中具有重要的应用价值。
5. 本文以“采用Kimi学习英语的效率会更高”为例,展示了如何使用Kimi设计一个准实验研究。
阅读原文
2. 准实验设计不具备随机分配实验对象到各处理组的能力,受限于实际条件或伦理考量。
3. 在准实验设计中,可以选择一个自然存在的环境或情境,并在这些条件的基础上实施特定的干预措施。
4. 准实验设计无法提供与随机实验相同的内部效度,但它在现实世界的研究中具有重要的应用价值。
5. 本文以“采用Kimi学习英语的效率会更高”为例,展示了如何使用Kimi设计一个准实验研究。
一个悄然崛起的国产项目
文章概要:
1. 文章介绍了一个悄然崛起的国产项目——月之暗的Kimi大模型,它在数学能力上有了质的突破,引入了“C思维链”技术,能像人脑一样思考解题步骤。br>2. 文章通过三个场景展示了imi的数学能力,包括帮助学生理解解题思路、解决生活中的数学问题和在游戏博弈中提高胜算。
. 文章认为Kimi的k0-math模型不仅能提高数学能力,还能带来不同的生活体验。
阅读原文
. 文章认为Kimi的k0-math模型不仅能提高数学能力,还能带来不同的生活体验。
差点没下来台,还好有Kimi。。。
文章概要:
1. 作者的小姑给作者发了一道高一数学题,作者尝试用Kimi进行解答。
2. Kimi对题目进行分析后,将解题过程一步一步地列了出来。
3. 作者又向Kimi提出了“9.11和9.9哪个大”和“1+1=?”的问题,Kimi经过深思熟虑后给出了答案。
4. 作者让Kimi根据自己每周运动三天的运动习惯,设计一个健康饮食计划。
5. Kimi分别计算了男女的基础代谢率(BMR),并根据BMR计算出作者的总消耗大概为2046.4/天。
6. Kimi根据作者的卡路里摄入量来制定计划,并为了确保营养均衡,告诉作者每餐应包含蛋白质、碳水化合物脂肪。
7. 作者认为Kimi的数学推理能力很强,但对普通人作用不大,因为大多数人毕业后很少用到高中数学。
8. 作者认为Kimi可以运用到金融、财经、生活等方面,并且可以从不同角度看待和思考问题。
9. 作者让Kimi分析清华大学的录取书和1000w应该怎么选,Kimi建议作者选择接受清华大学的录取通知书。
阅读原文
2. Kimi对题目进行分析后,将解题过程一步一步地列了出来。
3. 作者又向Kimi提出了“9.11和9.9哪个大”和“1+1=?”的问题,Kimi经过深思熟虑后给出了答案。
4. 作者让Kimi根据自己每周运动三天的运动习惯,设计一个健康饮食计划。
5. Kimi分别计算了男女的基础代谢率(BMR),并根据BMR计算出作者的总消耗大概为2046.4/天。
6. Kimi根据作者的卡路里摄入量来制定计划,并为了确保营养均衡,告诉作者每餐应包含蛋白质、碳水化合物脂肪。
7. 作者认为Kimi的数学推理能力很强,但对普通人作用不大,因为大多数人毕业后很少用到高中数学。
8. 作者认为Kimi可以运用到金融、财经、生活等方面,并且可以从不同角度看待和思考问题。
9. 作者让Kimi分析清华大学的录取书和1000w应该怎么选,Kimi建议作者选择接受清华大学的录取通知书。
差点没下来台,还好有Kimi。。。
文章概要:
1. 作者的表妹遇到一道高一数学题不会做,作者发现Kimi的推理能力在数学方面不错,于是将输入Kimi进行解答。
2. Kimi给出了详细解题步骤包括分析、推导和结论。
3. 作者又测试了Kimi对9.11和9.比较的问题,Kimi表现出了谨慎的态度了多种方法进行
4. 作者还测试了1+1=?的问题,Kimi使用了、几何分数、模运算和逻辑推理等多种方式进行。
5.imi的数学推理能力很强,但对普通人作用不大,因为大多数人很少用到高中数学。br>6 Kimi可以运用到、财经、生活等方面,作者让Kimi根据运动习惯设计健康饮食,Kimi给出了详细的饮食计划。
7. 过去的大模型像是一个答案库,现在的AI学会了真正的思考,从简单的what进化到whathow->why。
8. 作者测试了Kimi对通知书和100w的选择问题,Kimi建议作者选择接受清华大学的录取通知书
阅读原文
2. Kimi给出了详细解题步骤包括分析、推导和结论。
3. 作者又测试了Kimi对9.11和9.比较的问题,Kimi表现出了谨慎的态度了多种方法进行
4. 作者还测试了1+1=?的问题,Kimi使用了、几何分数、模运算和逻辑推理等多种方式进行。
5.imi的数学推理能力很强,但对普通人作用不大,因为大多数人很少用到高中数学。br>6 Kimi可以运用到、财经、生活等方面,作者让Kimi根据运动习惯设计健康饮食,Kimi给出了详细的饮食计划。
7. 过去的大模型像是一个答案库,现在的AI学会了真正的思考,从简单的what进化到whathow->why。
8. 作者测试了Kimi对通知书和100w的选择问题,Kimi建议作者选择接受清华大学的录取通知书
Kimi探索版发布,模拟人类思考,10倍搜索量,可精读超过 500 个页面
文章概要:
1. Kimi探索版发布,模拟人类思考,10倍搜索量,可精读超过500个页面。
2. Kimi探索版定位精准,针对知识工作者和大学生等对AI工具核心需求较高的群体。
3. Kimi探索版在产品功能上做出了大胆创新,具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务。
4. Kimi探索版在市场营销方面,采取了一系列成功的策略。通过社交媒体和其他数字平台进行广泛宣传,迅速提升了品牌的曝光率与关注度。
5. Kimi探索传统搜索引擎相比,具有明显的优势。传统搜索引擎通常只是对用户的关键词进行简单的匹配和搜索,然后给出一个聚合页面,其中可能包含大量无关或低质量的信息,用户需要花费大量时间进行筛选。而Kimi探索版则采用了不同的思路,让AI自主去搜索。
6. Kimi探索版的功能优势主要体现在自主规划策略,步步为营;自动化大规模信息检索,穷尽海量权威信源;即时反思搜索结果,补充信息。
7.02年有众多优秀的AI搜索工具,如ChatGPT、Claude、Perplexity、Google、360AI、秘塔AI、天工AI、iAsk.Ai、Lepton Search、百度、博查AI、夸克、钉钉AI、Miku AI等。
阅读原文
2. Kimi探索版定位精准,针对知识工作者和大学生等对AI工具核心需求较高的群体。
3. Kimi探索版在产品功能上做出了大胆创新,具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务。
4. Kimi探索版在市场营销方面,采取了一系列成功的策略。通过社交媒体和其他数字平台进行广泛宣传,迅速提升了品牌的曝光率与关注度。
5. Kimi探索传统搜索引擎相比,具有明显的优势。传统搜索引擎通常只是对用户的关键词进行简单的匹配和搜索,然后给出一个聚合页面,其中可能包含大量无关或低质量的信息,用户需要花费大量时间进行筛选。而Kimi探索版则采用了不同的思路,让AI自主去搜索。
6. Kimi探索版的功能优势主要体现在自主规划策略,步步为营;自动化大规模信息检索,穷尽海量权威信源;即时反思搜索结果,补充信息。
7.02年有众多优秀的AI搜索工具,如ChatGPT、Claude、Perplexity、Google、360AI、秘塔AI、天工AI、iAsk.Ai、Lepton Search、百度、博查AI、夸克、钉钉AI、Miku AI等。
黑神话悟空攻略神器 Kimi,震撼登场!
文章概要:
1. 《黑神话:悟空》游戏火爆,但玩家可能会遇到关卡难题和攻略难找的问题br> Kimi 是一款由清华学霸团队打造的免费 AI,其创始人杨植麟是个“ 天才少年”。
3. Kimi 具有智能搜索信息整合、高效阅读与文档处理、整理与分析、辅助创作与内容生成、编程助手与技术支持等功能。
4. Kimi 可以帮助玩家在《黑》中荆斩棘,也可以在其他方面为用户提供帮助。
阅读原文
3. Kimi 具有智能搜索信息整合、高效阅读与文档处理、整理与分析、辅助创作与内容生成、编程助手与技术支持等功能。
4. Kimi 可以帮助玩家在《黑》中荆斩棘,也可以在其他方面为用户提供帮助。
一手体验Kimi版“o1”模型,这就是最通人性的数学AI。
文章概要:
1. 介绍了Kimi上线一周年的线下媒体会,发布了全面1的数学推理模型k0-math
2. 从kimi官方的测试结果来看,k0-math在数学的表现上超过了o1-mini和o1-preview
3. 作者测试了k0-math的数学能力,发现其在高难竞赛题上正确率比o1低,但在其他方面表现出色
4. k0-math在数学能力上直接拉满,在推理、逻辑能力上非常强,有种偏科的好玩,用上去就感觉像是一个刻板印象上的“直男理科大拿”在用数学给你解决生活中一切问题
5. 作者认为k0-math最有趣的是其强大的数学逻辑思维,以及那很“通人性”的感觉
6. 作者测试了k0-math的数学思维,发现其能从多个角度思考问题,甚至计算中思考和自我怀疑
7. 作者认为k0-math的这种思考能力是人类能研究自然科学的基础
8. 作者测试了k0-math的数学思维在其他方面的应用,如计算“拼夕夕砍一刀成功率”、判断明天要不要出门玩、推算《再见爱人4》中麦琳和李行亮的离婚概率等
9. 作者认为现在的k0-math像一个充满探索欲的数学家整个思维链的絮絮叨叨里,也能明显感觉到Kimi的个性
10. 作者期待着看到AI模型与人类一起书写这首诗的一天
阅读原文
2. 从kimi官方的测试结果来看,k0-math在数学的表现上超过了o1-mini和o1-preview
3. 作者测试了k0-math的数学能力,发现其在高难竞赛题上正确率比o1低,但在其他方面表现出色
4. k0-math在数学能力上直接拉满,在推理、逻辑能力上非常强,有种偏科的好玩,用上去就感觉像是一个刻板印象上的“直男理科大拿”在用数学给你解决生活中一切问题
5. 作者认为k0-math最有趣的是其强大的数学逻辑思维,以及那很“通人性”的感觉
6. 作者测试了k0-math的数学思维,发现其能从多个角度思考问题,甚至计算中思考和自我怀疑
7. 作者认为k0-math的这种思考能力是人类能研究自然科学的基础
8. 作者测试了k0-math的数学思维在其他方面的应用,如计算“拼夕夕砍一刀成功率”、判断明天要不要出门玩、推算《再见爱人4》中麦琳和李行亮的离婚概率等
9. 作者认为现在的k0-math像一个充满探索欲的数学家整个思维链的絮絮叨叨里,也能明显感觉到Kimi的个性
10. 作者期待着看到AI模型与人类一起书写这首诗的一天
独家探秘 Kimi 版“o1”模型,邂逅最懂你的数学 AI !
文章概要:
1. Kimi 推出了数学模型 k0-math,号称数学能力可以媲美 OpenAI 的 o1-mini 和 o1。
2. k0-math 模型创新性地运用 Self-play RL 强化学习与 Cot 思维链技术,能够模拟人类的思考与反思流程,在数学问题以及推理难题攻克方面表现卓越。
3. 作者实测了 9 个问题,包括计算自媒体博主达到 100 万粉丝所需时间、双色球中奖概率、拼夕夕砍一刀成功率等,k0-math 的回答独特有趣。
4. k0-math 像一个充满探索欲的数学家,持续地自我诉说、深入思考反思。
5. 作者认为数学对于宇宙的阐释意义非凡,开启殿堂大门的关键钥匙。
阅读原文
2. k0-math 模型创新性地运用 Self-play RL 强化学习与 Cot 思维链技术,能够模拟人类的思考与反思流程,在数学问题以及推理难题攻克方面表现卓越。
3. 作者实测了 9 个问题,包括计算自媒体博主达到 100 万粉丝所需时间、双色球中奖概率、拼夕夕砍一刀成功率等,k0-math 的回答独特有趣。
4. k0-math 像一个充满探索欲的数学家,持续地自我诉说、深入思考反思。
5. 作者认为数学对于宇宙的阐释意义非凡,开启殿堂大门的关键钥匙。
今天起,Kimi也有自己的o1了
文章概要:
1. Kimi推出了类o1模型的0-math模型Self-play RL强化学习和Cot思维链技术,可模拟人类的思考和反思过程,擅长解决数学问题、推理问题,智力程度可比博士
2. 作者实测9个问题,包括计算自媒体博主达到100万粉丝所需时间、双色球中奖概率、设计饮食计划、鸡吃完米山和狗舔完面的速度比较、统计字母数量、小红的兄弟有几个姐妹、地球所有人同时起跳落地的结果、齿轮转动方向、本科金融题等
3. 数学是一切科学的基础,AI的发展来到了可解数学问题的新高度,基于Cot思维链和Self-play RL强化学习技术提升的LLM数学推理能力AI在各个领域和场景的推理能力和智能水平进一步提升,Kimi率先完成Cot技术布局,推出数学模型k0-m,并开放可用,表现亮眼
阅读原文
2. 作者实测9个问题,包括计算自媒体博主达到100万粉丝所需时间、双色球中奖概率、设计饮食计划、鸡吃完米山和狗舔完面的速度比较、统计字母数量、小红的兄弟有几个姐妹、地球所有人同时起跳落地的结果、齿轮转动方向、本科金融题等
3. 数学是一切科学的基础,AI的发展来到了可解数学问题的新高度,基于Cot思维链和Self-play RL强化学习技术提升的LLM数学推理能力AI在各个领域和场景的推理能力和智能水平进一步提升,Kimi率先完成Cot技术布局,推出数学模型k0-m,并开放可用,表现亮眼
体验Kimi最新推理模型,我已经分辨不出是人还是AI
文章概要:
1. Monitor可可视化观察大语言模型内部计算,发现模型在数字比较问题上出错因为将数字联想为其他概念;2. 解决问题的在提示词中加入“一步步思考”,但这不是万能的;3. 大模型引入人类反馈强化学习,imi的k0-math模型就是在这种技术训练有思考的大模型;4.0-math可以解答高考数学题、推导算法、识别视频中的动作等;5.imi持续押注模型智力的提升,期待未来能更多方向结合,做出强大的应用国内大迈向AGI。
阅读原文
一手体验Kimi版“o1”模型,这就是最通人性的数学AI。
文章概要:
1. kimi上线一周年,发布全面对标o1的数学推理模型k0-math
2. kimi数学版在数学能力上直接拉满,在推理、逻辑能力上非常强> 3. kimi数学版在超高难度的竞赛题上正确率比o1,但在普通高数题和其他考题上正确率较高
4. kimi数学版最有趣的是其强大的数学逻辑思维,以及“通人性”的感觉
5. kimi数学版在计算过程中会思考和自我怀疑,从多个角度思考问题
6. kimi数学版在计算“拼夕夕砍一刀成功率”、判断明天要不要出门玩、推算离婚概率等问题时,都用了数学公式
7. kimi数学版像一个充满探索欲的数学家,不断独白、思考、反思
8. 过去的大模型更像是一个答案库,现在的AI大模型在尝试让AI学会真正的思考
9. 数学是打开思维之门的钥匙,期待看到AI大模型与人类一起书写诗的一天
阅读原文
2. kimi数学版在数学能力上直接拉满,在推理、逻辑能力上非常强> 3. kimi数学版在超高难度的竞赛题上正确率比o1,但在普通高数题和其他考题上正确率较高
4. kimi数学版最有趣的是其强大的数学逻辑思维,以及“通人性”的感觉
5. kimi数学版在计算过程中会思考和自我怀疑,从多个角度思考问题
6. kimi数学版在计算“拼夕夕砍一刀成功率”、判断明天要不要出门玩、推算离婚概率等问题时,都用了数学公式
7. kimi数学版像一个充满探索欲的数学家,不断独白、思考、反思
8. 过去的大模型更像是一个答案库,现在的AI大模型在尝试让AI学会真正的思考
9. 数学是打开思维之门的钥匙,期待看到AI大模型与人类一起书写诗的一天
林志颖现在为什么不让Kimi露脸了?看到他14岁的近照后,网友直呼:都懂了!
文章概要:
1. 林志颖现在Kimi脸了
2. 看到他14的近照后,网友直呼都懂了
阅读原文
2. 看到他14的近照后,网友直呼都懂了
能这么玩的只有Kimi!GPT、Claude往后站~
文章概要:
1. 作者4月份用Kimi分析了咪蒙的,包括写作方向、语言特色和标题特点等
2. 作者原本打算用Claude或GPT进一步分析咪蒙的文章,但它们支持的文件有限,还是只能靠Kimi
3. 作者投喂了50篇文章给Kimi,分析了咪蒙文章的网络用语、互动词汇、经典句子和写作主题等
4.认为仿写文章不需要投喂过多素材,一对一仿写,并以咪蒙的文章为例了分析
5. 作者整理了咪蒙之前几乎所有的内容,有需要的可以识别二维码免费获取,记得备注(咪蒙)
阅读原文
2. 作者原本打算用Claude或GPT进一步分析咪蒙的文章,但它们支持的文件有限,还是只能靠Kimi
3. 作者投喂了50篇文章给Kimi,分析了咪蒙文章的网络用语、互动词汇、经典句子和写作主题等
4.认为仿写文章不需要投喂过多素材,一对一仿写,并以咪蒙的文章为例了分析
5. 作者整理了咪蒙之前几乎所有的内容,有需要的可以识别二维码免费获取,记得备注(咪蒙)
林志颖现在为什么不让Kimi露脸了?看到他14岁的近照后,网友直呼:都懂了!
文章概要:
1. 林志颖现在为什么不让Kimi露脸了?看到他14的近照后,网友直呼:都懂!
2 三环故事发布于2024年11月26日1:17
3. 来源于中小学微课资料视频时长为05:02
4 可以通过微信扫一扫关注该公众号
阅读原文
2 三环故事发布于2024年11月26日1:17
3. 来源于中小学微课资料视频时长为05:02
4 可以通过微信扫一扫关注该公众号
林志颖现在为什么不让Kimi露脸了?看到他14岁的近照后,网友直呼:都懂了!
文章概要:
1. 林志现在不让Kimi脸的原因猜测
2. 看到他14近,网友似乎明白了原因
阅读原文
2. 看到他14近,网友似乎明白了原因
实测Kimi+提示词专家,撰写爆款小红书文案
文章概要:
1. 掌握AI提示词和AI指令的技巧至关重要。2. 选择Kimi的原因中文能力出色,更准确;支持上下文对话,能够持续优化;充足,性价比高;对小红书平台调性有很好的理解。3. 爆款文案的核心要素:标题党但不;内容结构清晰互动元素丰富。4详解:美食探店、护肤分享、旅游打卡。5. 进阶技巧分享:表达情感共鸣;优化细节。6. 常见问题解答AI的会不会太机械;如何让文案更有感染力;应该怎么选择。7 写在最后:AI写作工具确实能大大提升我们的创作,但最终的价值还是在于内容本身。
阅读原文
Kimi的长文本能力:为何优于其他大模型
文章概要:
1. Kimi作为一款自研的大模型产品受到广泛关注和讨论
2 大多数厂商在基座大模型的开发上选择了OpenAI的路线,增加参数规模和引入多模态来提升模型的推理能力
3. Kimi选择了专注于提升上下文长度的技术路线,使其在长文本长上下文方面走在了世界前列
4. 长上下文的处理能力带来了显著的优势,尤其是在实际的阅读和写作场景中,但也带来上的挑战
5. Kimi能够在保持长上下文的同时,提供大量的免费对话量,这在业界是相当的
6. Kimi的成功在于对长文本处理能力的重视和投入,这种策略不仅提升了用户体验,也使得Kimi在竞争激烈的人工智能市场中脱颖而出
阅读原文
2 大多数厂商在基座大模型的开发上选择了OpenAI的路线,增加参数规模和引入多模态来提升模型的推理能力
3. Kimi选择了专注于提升上下文长度的技术路线,使其在长文本长上下文方面走在了世界前列
4. 长上下文的处理能力带来了显著的优势,尤其是在实际的阅读和写作场景中,但也带来上的挑战
5. Kimi能够在保持长上下文的同时,提供大量的免费对话量,这在业界是相当的
6. Kimi的成功在于对长文本处理能力的重视和投入,这种策略不仅提升了用户体验,也使得Kimi在竞争激烈的人工智能市场中脱颖而出
我问Kimi何时涨到100万粉丝,它的回答是…
文章概要:
1. Kimi版o1上线,推出k0-math数学模型,采用Self-play RL强化学习和Cot链技术,可模拟人类思考和反思,擅长解决问题、推理,智力程度可比博士,思维链全暴露。
2. 作者实测9个问题,包括计算达到100万粉丝所需时间、双色球中奖概率、设计健康饮食计划、鸡吃完米山和狗舔完面山的速度比较、统计字母数量、小红兄弟的姐妹数量、齿轮转动方向、投资回报率等imi数学版均能准确回答。
. 数学是一切科学的基础,的数学推理能力不断提升,Kimi率先完成ot布局,推出数学模型k0-math,在MATH中拿到93.8分,超过o1-mini、o1-preview,思维链全透明,表现亮眼。
阅读原文
2. 作者实测9个问题,包括计算达到100万粉丝所需时间、双色球中奖概率、设计健康饮食计划、鸡吃完米山和狗舔完面山的速度比较、统计字母数量、小红兄弟的姐妹数量、齿轮转动方向、投资回报率等imi数学版均能准确回答。
. 数学是一切科学的基础,的数学推理能力不断提升,Kimi率先完成ot布局,推出数学模型k0-math,在MATH中拿到93.8分,超过o1-mini、o1-preview,思维链全透明,表现亮眼。
杨植麟发布Kimi新模型数学对标OpenAI,中考高考考研成绩全第一!
文章概要:
1. 杨植发布Kimi新模型k0-math,在数学取得突破,对标OpenAIo1系列,超过o1-mini和1-preview,在MATH、、高考、四个基准测试中为第一
2. k0-math具有深入思考,解决复杂数学问题时会不断尝试思路甚至会进行多角度的验证>3. k0ath在简单问题上的过度思考是机遇也是局限,预计在下一阶段的模型迭代中会逐步改善
4. Kimi版的推理能力得到显著,主要体现在意图增强、信源、链式思考三个方面
5. 杨麟强调思考将决定模型的上限,模态是必要的,但思考能力的提升才是
6. 作者认为k0-math模型和imi探索了AI在数学领域强大能力,也为未来的AI发展指明
阅读原文
2. k0-math具有深入思考,解决复杂数学问题时会不断尝试思路甚至会进行多角度的验证>3. k0ath在简单问题上的过度思考是机遇也是局限,预计在下一阶段的模型迭代中会逐步改善
4. Kimi版的推理能力得到显著,主要体现在意图增强、信源、链式思考三个方面
5. 杨麟强调思考将决定模型的上限,模态是必要的,但思考能力的提升才是
6. 作者认为k0-math模型和imi探索了AI在数学领域强大能力,也为未来的AI发展指明
很不错,我喜欢!Kimi,又悄悄咪咪的进化了!
文章概要:
1. Max同学给作者出了一道事业单位考试的笔试题:137/213和139/218比谁大,作者正准备用计算器计算时,Max同学表示这题可以直接“秒杀”,并通过胜率法得出137/213大于139/218的结论
2. 作者认为自己可以辅导孩子学习到初中数学,但到了高中可能就会有些吃力,Max同学表示就算是高中数学她也没有问题,因为现在AI很厉害
3. 作者提到Kimi发布了一个关于数学模型的产品,打开Kimi后发现它给自己打广告,介绍了自己可以搞定高考数学
4. 作者用2024年新课标全国I卷数学真题试卷的第一道选择题测试Kimi数字版Kimi不仅给出了答案,还给出了解题过程
5. Kimi数字版完成了CoT技术和数学模型的结合,走在了大部分模型的前面,“CoT+其他”也是一个非常值得期待的
6. 作者用普通版Kimi做演示,发现普通版给出的答案是错误的,数字版则能清晰、正确地处理这一类数学问题
7. Kimi数字版的解题思考过程,常常会让数学高手也受到启发,它会在思考的过程中发现问题并进行调整
8. 作者咨询了关于跑步的问题,Kimi数字版站在数学的角度,给出了每个月需要提升的配速,并提出了训练计划建议和潜在问题
9. 作者问了一个简单问题,Kimi数字版有一个过度分析的过程,考虑到了不同进制之间的处理
10. Kimi的数学版让作者联想到了美剧《生活大爆炸》中的谢尔顿·库,他使用“逻辑和数学”方法寻找理想的伴侣,但忽略了人际关系中的情感和化学反应这些无法量化的因素
11. 如果谢尔顿拥有大模型,利用大模型的数学能力,对自己的算法进行不断的迭代,最后形成一个非常牛逼的筛选算法,那他能找到一个“最好的朋友”?肯定还是不能的,数学是绝对理性的,生活是充满感性的
阅读原文
2. 作者认为自己可以辅导孩子学习到初中数学,但到了高中可能就会有些吃力,Max同学表示就算是高中数学她也没有问题,因为现在AI很厉害
3. 作者提到Kimi发布了一个关于数学模型的产品,打开Kimi后发现它给自己打广告,介绍了自己可以搞定高考数学
4. 作者用2024年新课标全国I卷数学真题试卷的第一道选择题测试Kimi数字版Kimi不仅给出了答案,还给出了解题过程
5. Kimi数字版完成了CoT技术和数学模型的结合,走在了大部分模型的前面,“CoT+其他”也是一个非常值得期待的
6. 作者用普通版Kimi做演示,发现普通版给出的答案是错误的,数字版则能清晰、正确地处理这一类数学问题
7. Kimi数字版的解题思考过程,常常会让数学高手也受到启发,它会在思考的过程中发现问题并进行调整
8. 作者咨询了关于跑步的问题,Kimi数字版站在数学的角度,给出了每个月需要提升的配速,并提出了训练计划建议和潜在问题
9. 作者问了一个简单问题,Kimi数字版有一个过度分析的过程,考虑到了不同进制之间的处理
10. Kimi的数学版让作者联想到了美剧《生活大爆炸》中的谢尔顿·库,他使用“逻辑和数学”方法寻找理想的伴侣,但忽略了人际关系中的情感和化学反应这些无法量化的因素
11. 如果谢尔顿拥有大模型,利用大模型的数学能力,对自己的算法进行不断的迭代,最后形成一个非常牛逼的筛选算法,那他能找到一个“最好的朋友”?肯定还是不能的,数学是绝对理性的,生活是充满感性的
kimi AI从新手到高手,一篇文章全搞定
文章概要:
1. 作者介绍自己是10年程序员,3年项目经理,对AI有深入研究。
2. 我们正站由人工智能驱动的新时代门槛上,AI的发展已经达到了难以置信的程度
3 当前AI的发展已经达到了非常惊人的程度如在围棋中战胜世界冠军、在医疗诊断中的应用、在艺术创作中的表现等。
4. kimi是由月之暗面开发的助手产品,是一款国产AI模型具有结构化提示词支持友好、长文本能力强等特色功能。
6.+中有非常多强大的智能体,包括办公效、辅助写作、社交娱乐、生活实用等类型。br> 7. kimi AI具有办公工具、智能助理、家庭教育等特色应用。
阅读原文
2. 我们正站由人工智能驱动的新时代门槛上,AI的发展已经达到了难以置信的程度
3 当前AI的发展已经达到了非常惊人的程度如在围棋中战胜世界冠军、在医疗诊断中的应用、在艺术创作中的表现等。
4. kimi是由月之暗面开发的助手产品,是一款国产AI模型具有结构化提示词支持友好、长文本能力强等特色功能。
6.+中有非常多强大的智能体,包括办公效、辅助写作、社交娱乐、生活实用等类型。br> 7. kimi AI具有办公工具、智能助理、家庭教育等特色应用。
林志颖现在为什么不让Kimi露脸了?看到他14岁的近照后,网友直呼:都懂了!
文章概要:
1. 林志颖现在为什么不让Kimi露脸看到他1的近后网友直呼:都懂了!
2 文章来源于中小学微课资料
3. 时长05:2
阅读原文
2 文章来源于中小学微课资料
3. 时长05:2
Kimi陷入ofo式处境,杨植麟会是下一个戴威吗?
文章概要:
1. Kimi创始人杨植麟深陷仲裁风波,他发布了一款数学模型k0-math,试图挽回公众形象,暗示Kimi在技术上仍领先,并获得资本的持续信任。
2. 进入2024年,杨植麟似乎一直在坐过山车,3月Kimi凭借长文本能力快速出圈,4月传出杨植麟套现,5月阿里投资,8月腾讯入局,10月Kimi因烧钱登上热搜,引发仲裁风波。
3. 在业务层面上,杨植麟砍掉多元发展,从多产品回归Kimi,也成了他亲口承认的近年来最大的教训。
4. 进入2024年,AI赛道已经开始走向了明显的分歧,在英伟达不断刷新新高,以及大厂盈利开始兑现之时,一大批曾经AI创业的明星企业,正在面临危机。
5. Kimi在今年先后进行了多重商业化尝试,但从结果来看,这些尝试短期难以支撑企业的发展。而造血能力不足的Kimi随即改变策略,开始寻求增长。
6. 同样是顶尖名校的创业新星,同样是热门赛道的快速崛起,同样是大厂资本的权力博弈,今天Kimi与杨植麟的困境,似乎可以从多年前ofo与戴威身上找到相似的影子。
7. 从技术路线来看,当今的AI虽然在高速发展过程之中,但单从国内大模型企业来看,差距正在被拉齐。
8. 商业化诉求在今后,很可能Kimi寻求突破的主要方向,但杨植麟是否擅长关于商业化效率管理,从当前的报道来看,好消息是杨植麟已然意识到这个方向上的重要性。
9. 金沙江创投创始合伙人朱啸虎,在近日的表态中提到“美国一线大模型公司中,前面四家确实融了很多钱,而且每一家都抱了大腿。而美国二线大模型公司,今年或许还有收购团队价值,明年可能就毫无价值了。”
10. 在中国,情况似乎更加复杂,Kimi虽说眼前抱上了两条大腿,但没有良性商业模式的持续输血,而大腿之上还有自身的子公司,竞争似乎没有变得容易,反而更加困难。
阅读原文
2. 进入2024年,杨植麟似乎一直在坐过山车,3月Kimi凭借长文本能力快速出圈,4月传出杨植麟套现,5月阿里投资,8月腾讯入局,10月Kimi因烧钱登上热搜,引发仲裁风波。
3. 在业务层面上,杨植麟砍掉多元发展,从多产品回归Kimi,也成了他亲口承认的近年来最大的教训。
4. 进入2024年,AI赛道已经开始走向了明显的分歧,在英伟达不断刷新新高,以及大厂盈利开始兑现之时,一大批曾经AI创业的明星企业,正在面临危机。
5. Kimi在今年先后进行了多重商业化尝试,但从结果来看,这些尝试短期难以支撑企业的发展。而造血能力不足的Kimi随即改变策略,开始寻求增长。
6. 同样是顶尖名校的创业新星,同样是热门赛道的快速崛起,同样是大厂资本的权力博弈,今天Kimi与杨植麟的困境,似乎可以从多年前ofo与戴威身上找到相似的影子。
7. 从技术路线来看,当今的AI虽然在高速发展过程之中,但单从国内大模型企业来看,差距正在被拉齐。
8. 商业化诉求在今后,很可能Kimi寻求突破的主要方向,但杨植麟是否擅长关于商业化效率管理,从当前的报道来看,好消息是杨植麟已然意识到这个方向上的重要性。
9. 金沙江创投创始合伙人朱啸虎,在近日的表态中提到“美国一线大模型公司中,前面四家确实融了很多钱,而且每一家都抱了大腿。而美国二线大模型公司,今年或许还有收购团队价值,明年可能就毫无价值了。”
10. 在中国,情况似乎更加复杂,Kimi虽说眼前抱上了两条大腿,但没有良性商业模式的持续输血,而大腿之上还有自身的子公司,竞争似乎没有变得容易,反而更加困难。
行业丨硬核!Kimi宣布正式发布新一代数学推理模型k0-math,给出解题思路
文章概要:
1. 月之暗面Kimi发布新一代强化模型k0-math,是国内首个对标OpenAI o1模型的强化推理大模型。
2 k0模型采用了创新的强化学习链(CoT)技术,让Kimi学会了数学,并且在美国竞赛题、中国⾼考、考研等场景下可与o1模型媲美。
3. k0-math模型可以解决难度的数学问题,以及⼤模型极难完成的⼀些边界问题。
4. 在业界最常使用的数学能力基准测试MATH中,k0-math模型得分为93.8,o1-mini和o1-preview则分别为90分和的85.5分。
5. AI助手初现两强格局,toC应用端的格局稳定,已形成2+N的格局——综合用户规模、增长、、留存等多项指标,K在创业公司中脱颖而出而豆包则是巨头公司中的领先者,且逐渐拉开了与后面玩家的。
6. 拥有着字节巨大流量和娱乐基因的豆包擅长聊天,而Kimi更像一个踏实干活儿的理性助手。
7. 目前k0-math数学模型升级后的Kimi探索版已陆续上线网页版,后续也将上线手机客户端。
阅读原文
2 k0模型采用了创新的强化学习链(CoT)技术,让Kimi学会了数学,并且在美国竞赛题、中国⾼考、考研等场景下可与o1模型媲美。
3. k0-math模型可以解决难度的数学问题,以及⼤模型极难完成的⼀些边界问题。
4. 在业界最常使用的数学能力基准测试MATH中,k0-math模型得分为93.8,o1-mini和o1-preview则分别为90分和的85.5分。
5. AI助手初现两强格局,toC应用端的格局稳定,已形成2+N的格局——综合用户规模、增长、、留存等多项指标,K在创业公司中脱颖而出而豆包则是巨头公司中的领先者,且逐渐拉开了与后面玩家的。
6. 拥有着字节巨大流量和娱乐基因的豆包擅长聊天,而Kimi更像一个踏实干活儿的理性助手。
7. 目前k0-math数学模型升级后的Kimi探索版已陆续上线网页版,后续也将上线手机客户端。
国产AI,两强初现
文章概要:
1. 月之暗面Kimi发布新一代强化模型k0-math,也是国内首个对标OpenAI o1模型的强化推理大模型。
2. k0-math模型采用了创新的强化学习和思维链(CoT)技术,这让Kimi学会了数学,并且在美国竞赛题、中国、考研等场景下可o1模型媲美。
3. 在业界最常使用的数学能力基准测试MATH中,k0-math模型得分为93.8,o1-mini和o1-preview则分别为90分和的85.5分。
4. 自2022年冬天ChatGPT掀起生成式AI狂潮以来,众多企业纷纷下场,国内AI大模型赛道一度十分拥挤。如今,经过一年多的角逐,toC端的格局趋于稳定,已形成2+N的格局——综合用户规模、增长、活跃、留存等多项指标,imi在创业公司中脱颖而出,而豆包则是公司中的领先者,逐渐拉开了与后面玩家的差距。
阅读原文
2. k0-math模型采用了创新的强化学习和思维链(CoT)技术,这让Kimi学会了数学,并且在美国竞赛题、中国、考研等场景下可o1模型媲美。
3. 在业界最常使用的数学能力基准测试MATH中,k0-math模型得分为93.8,o1-mini和o1-preview则分别为90分和的85.5分。
4. 自2022年冬天ChatGPT掀起生成式AI狂潮以来,众多企业纷纷下场,国内AI大模型赛道一度十分拥挤。如今,经过一年多的角逐,toC端的格局趋于稳定,已形成2+N的格局——综合用户规模、增长、活跃、留存等多项指标,imi在创业公司中脱颖而出,而豆包则是公司中的领先者,逐渐拉开了与后面玩家的差距。
Kimi 数学版全面测评,测完有点小惊喜
文章概要:
1. 强化学习的范式已成为业界共识,最近有三家公司推出对标o1的模型,其中k0-math最早发布,重点优化了数学方面,在多项考试类测试集中超过了o1。
2. 作者参与了Kimi的内测,分享了测试例子,包括比较大小、购物问题、减肥问题和用户增长问题。
3. 在测试过程中,发现Kimi数学版一些问题,如不支持文件和图片输入、只支持一轮、有时会陷入过度思考等。
4. Kimi走的是高智商生产力工具,数学版应该只是对标o1的第一个版本,后续应该会有代码方面的优化。
阅读原文
2. 作者参与了Kimi的内测,分享了测试例子,包括比较大小、购物问题、减肥问题和用户增长问题。
3. 在测试过程中,发现Kimi数学版一些问题,如不支持文件和图片输入、只支持一轮、有时会陷入过度思考等。
4. Kimi走的是高智商生产力工具,数学版应该只是对标o1的第一个版本,后续应该会有代码方面的优化。
Kimi的数学模型来了,这次甚至能挑战高考。
文章概要:
. Kimi推出数学模型k0-math,号称数学能力可与OpenAI的o1-mini和o1-preview,能应对中高考、考研及入门竞赛题
2. 作者在哥们儿帮助下提前体验Kimi数学版,目前只能在网页版使用,且内测时仅支持一轮对话(现已开放多轮)
3. 作者测试了Kimi数学版的数学能力,包括比较数值大小、解答高考数学题、概率题和AMC数学竞赛题等,发现其解题过程展现出思考和推理能力,但也存在一些错误
4. Kimi的k0-math模型能有较大突破,可能归功于COT(Chain of Thought)思维链技术,该技术可提高模型对复杂任务的推理能力
5. 除k0-math外,国内的幻方DeepSeek也推出了推理模型DeepSeek-R1-Lite,同样在纸上水平媲美o1
6. 传统的拼算力、拼数据在大模型领域遇到瓶颈,强化学习提高大模型的推理能力成为新方向
阅读原文
2. 作者在哥们儿帮助下提前体验Kimi数学版,目前只能在网页版使用,且内测时仅支持一轮对话(现已开放多轮)
3. 作者测试了Kimi数学版的数学能力,包括比较数值大小、解答高考数学题、概率题和AMC数学竞赛题等,发现其解题过程展现出思考和推理能力,但也存在一些错误
4. Kimi的k0-math模型能有较大突破,可能归功于COT(Chain of Thought)思维链技术,该技术可提高模型对复杂任务的推理能力
5. 除k0-math外,国内的幻方DeepSeek也推出了推理模型DeepSeek-R1-Lite,同样在纸上水平媲美o1
6. 传统的拼算力、拼数据在大模型领域遇到瓶颈,强化学习提高大模型的推理能力成为新方向
Kimi的数学模型来了,这次甚至能挑战高考。
文章概要:
1. Kimi推出了数学模型k0-math,号称数学能力可与OpenAI的o1-mini和o1-preview媲美。
2. 世超提前体验了Kimi数学版,并对其进行了测试,包括数值大小比较、高考数学题、概率题、AMC数学竞赛题等。
3. Kimi数学版在解题过程中展现出了思考和推理能力,但在几何题上表现不佳。
4. Kimi的k0-math模型能有如此大的突破,可能归功于COT(Chain of Thought)思维链技术。
5. 思维链技术可以提高模型对任务的推理能力,例如统计字母“e”的数量、解决“我有一块1米长的面包,每天吃一半,需要几天才能把这块面包吃完?”的问题等。
6. 除了k0-math外,国内的幻方DeepSeek也推出了推理模型DeepSeek-R1-Lite,同样在纸上水平媲美o1。
7. 强化学习可以提高大模型的推理能力,已经成为大模型领域的新方向。
阅读原文
2. 世超提前体验了Kimi数学版,并对其进行了测试,包括数值大小比较、高考数学题、概率题、AMC数学竞赛题等。
3. Kimi数学版在解题过程中展现出了思考和推理能力,但在几何题上表现不佳。
4. Kimi的k0-math模型能有如此大的突破,可能归功于COT(Chain of Thought)思维链技术。
5. 思维链技术可以提高模型对任务的推理能力,例如统计字母“e”的数量、解决“我有一块1米长的面包,每天吃一半,需要几天才能把这块面包吃完?”的问题等。
6. 除了k0-math外,国内的幻方DeepSeek也推出了推理模型DeepSeek-R1-Lite,同样在纸上水平媲美o1。
7. 强化学习可以提高大模型的推理能力,已经成为大模型领域的新方向。
测测Kimi新开的k0-math,你是数学模型,但我就测文本
文章概要:
1. kimi更新了模型k0-math,数学上的效果对标openai-o1,官方表示在数学能力上较强。
2. 作者测试了k0ath在文本推理上的效果,包括数据能力、文本问题等。
3. 整体效果不错,能力较强,文本推理还有改进空间。
阅读原文
2. 作者测试了k0ath在文本推理上的效果,包括数据能力、文本问题等。
3. 整体效果不错,能力较强,文本推理还有改进空间。