今日AI-OpenAI-2024年10月12日

发现全网最新的AI内容

论文:OpenAI o1模型的规划能力

文章概要:

1. 本文评估了OpenAI的o1模型在多种基准任务中的规划能力,包括可行性、最优性和泛化性等方面。
2. 作者通过实证评估发现,o1-preview在自我评估和遵循约束方面表现出色,但在决策和记忆管理中存在瓶颈,特别是在需要强大空间推理的任务中。
3. 作者提出了未来基于LLM的规划器的改进方向,包括最优性和资源利用、抽象空间中的泛化、处理动态和不可预测的环境、通过自我评估提高约束遵守、利用多模态输入、扩展到复杂的多智能体规划和通过人类反馈进行持续学习等。
阅读原文

OpenAI今天Open了一下:开源多智能体框架Swarm

文章概要:

1. OpenAI开源多智能体框架Swarm,这是一个实验性质的多智能体编排框架,主打特征是工效与轻量,它使用了两种原语抽象:智能体和交接。 2. Sw的核心组件包括client、Agent、Function,运行Swarm就是从实例化一个client开始的,client.run()类似于Chat Completions API中的chat.completions.create()函数,接收消息并返回消息,并且在调用之间不保存任何状态。 3. Agent就是将一组指令与一组函数封装在一起,并且其有能力将执行过程交接给另一个Agent。 4. Swarm Agent可以直接调用Python函数,如果一个函数返回了一个Agent,则执行过程将转交给该Agent。 5. 通过在返回的函数中包含一个Agent,可将执行过程交接给这个Agent,它还可以通过返回更完整的Result对象来更新context_variables。 6. Swarm会自动将函数转换为JSON模式,然后将其传递给聊天补全工具。 7. Swarm也支持流式处理。
阅读原文

AI公司“烧钱太猛” OpenAI后年亏损将达140亿美元

文章概要:

1. 根据AI巨头Open的预测,直到2029年,该公司才能实现盈利届时公司收入将达到1000亿美元。
2. OpenAI在20年的亏损可能会高达140亿美元几乎是今年预期亏损三倍。
3. OpenAI预计2024年的收入将达到37,将亏损50亿美元。
4. OpenAI预测2025年收入将增长两倍多,达到116亿美元,并最终在20年达到1000亿美元。
5. OpenAI收入增长一部分将来自ChatGPT用户支付费用的增加。
阅读原文

OpenAI玩转AI,Canvas上线引爆新潮!

文章概要:

1. OpenAI的Canvas上线,认为是今年ChatGPT最具影响力的更新之一,可能标志着OpenAI在用户交互体验上一次重大升级。
. OpenAI研究主管Karina Nguyen表示,Canvas代表了她心目中“终极AGI界面”的雏形。
3. 在具体功能层面,OpenAI过去更专注于底层技术的研发,主要致力于提升大模型能力。
4. OpenAI语言、交互方式,甚至底层逻辑上都起到了引领作用
5. 以对话为主要交互方式了所谓的L语言用户界面),但UI并不总是比GUI(用户)更精确直观。
6. OpenAI的技术不仅是基础更是推动各行业数字化转型的重要引擎。
阅读原文

2029年才能盈利?留给OpenAI的时间不多了

文章概要:

1. OpenAI 预计到 2029 年才能实现盈利,届时收入将达到 1 亿美元,但到 206亏损可能高达4 亿美元。
2 OpenAI 预计未来几年模型训练的计算成本可能会上升,到 2026 年或将高达每年 95 亿美元。
3. OpenAI 目前除了向用户收取订阅费之外,还尚未找到另一个验证的营收渠道。<>4.AI 的月活用户陷入几乎停滞的状态,维持在 2.5 亿用户不再有大的突破。br>. OpenAI 内部动荡,先后失去了训练负责人 Barret Zoph, o1 推理模型的贡献者 Luke Metz。
阅读原文

给小学数学题加句「废话」,OpenAI o1就翻车了,苹果新论文质疑AI推理能力

文章概要:

1. 苹果新论文质疑AI推理能力,通过给小学数学题添加随机额外信息,使大模型成功率大幅下降。3. OpenAI的研究者认为模型的表现遵循的预期行为,而非缺乏推理能力。
4. 论文提出了GSM-Symbolic,这是一个增强的基准,它使用符号模板生成GSM8K问题的多样化变体。
5. 作者质疑了当前在GSM8K上报告的结果的可靠性,并证明LLM的性能在处理同一问题的不同表述时其的波动性是不合理的。 作者展示了LLM对表面元素(如专有名词)的变化更具稳健性,但对数值变化非常敏感。 阅读原文

OpenAI o1带来了什么?|普通人能读懂的AIGC ⑤

文章概要:

1. 2024年9月12日,OpenAI公司发布全新系列大模型o1,其被定义为推理模型,用于应对复杂问题。
2. o1的工作机制是在给出回答之前,经过复杂的分析和推理,尝试寻找合理的方案解决用户提出的问题。
3. 通过一个官方示例,展示1能够解决复杂的解密问题,而GPT-4o未能成功。
4. 官方文档对o1的能力进行了总结,其在编程竞赛、数学奥林匹克竞赛和物理、生物和化学问题的基准测试中表现出色。
5. o1的潜在应用领域是科学研究,可能对多个学科的科学研究起到巨大的促进作用。
阅读原文

OpenAI营收将达千亿美元,前提是活过5年

文章概要:

1. OpenAI已成功获得66亿美元融资,估值突破1500亿美元,但预计今年亏损幅度为50亿美元。
2. OpenAI受到众多投资者青睐,但亏损幅度不断增大,竞争对手越来越多。
3. OpenAI的AI大模型训练成本约10亿美元,未来三年内这一数字将飙升至10亿美元,甚至达到1000亿美元。
4. OpenAI的核心技术人员纷纷离职,外部压力剧增,内部人才流失严重,内忧外患之下,OpenAI急需开源与节流。
5. OpenAI在To B和To C场景都冠绝全球,并且与微软、苹果等全球头部互联网企业达成了合作。
6. OpenAI可以尝试开发参数量更少的端侧大模型,将推理任务所需的资源和成本转移到本地。
7. OpenAI当前面临的形势虽然严峻,却能够让投资者看到盈利的希望。
8. OpenAI的营收能力也在不断提高,2026年的亏损高峰后,027年、2028年亏损幅度将大幅收窄。
9. 预计2030年前后,AI行业将进入成长期,可供选择且体验出色的AI大模型产品日益增多,企业之间的竞争也促使AI工具提升体验、降低价格,消费者也将切实享受到AI带来的便利性。
阅读原文

ChatGPT大佬o1模型作者离职!140亿的亏损黑洞,OpenAI这次真要完了?

文章概要:

1. OpenAI核心技术大佬纷纷离职,o1模型贡献者之一的Luke Metz。
2. OpenAI面临巨额亏损,预计到202年亏损将高达10。
3. OpenAI需要在管理、技术创新和上进行,以应对员工离职潮和困境。
阅读原文

被马斯克称作“魔鬼”,OpenAI终于露出了它的“獠牙”

文章概要:

1 OpenAI推出全新协作平台Canvas,基于GPT-4框架处于测试阶段,向ChatGPT Plus和Team用户开放,版和版用户将在下周获得访问权限,计划在测试结束后所有ChatGPT用户开放。
2. OpenAI完成66亿美元融资,刷新全球创业公司融资规模纪录,估值跃升至1570亿美元跻身全球第三大独角兽之列。
3. OpenAI在融资过程中,向投资者表示不要向包括Anthropic、埃隆·马斯克xAI在内的五人工智能初创公司提供资金,引起了这些公司的不满。
4. OpenAI在融资时提出的“排他性”,触动了马斯克的“蛋糕,引发了他在X平台上对于OpenAI讨。
5. OpenAI商业化探索之路荆棘满地,内部存在分歧,今年已有11位高管相继离职。
6. OpenAI正在谋划对其核心业务进行重组,转变为一家营利性公益企业,更好地适应的需求。>7. OpenAI在商业化方面取得了显著的进展,推出了多种收费服务,与微软的合作是其商业化战略的重要组成部分。
8. OpenAI近一年来在技术方面取得一些进展,但似乎并不能回应行业的预期,备受期待的下一代基础模型-5,则始终活在行业猜测之中。
阅读原文

突发!OpenAI官方开源多智能体框架「Swarm」

文章概要:

1. OpenAI官方开源多智能体框架「Sw」,OpenAI终于自己下场做多智能体框架了,虽然还只是实验性的,但是很有用;
2 Swarm 里面定义了两个核心「Agents」 和「Handoffs」;
3. 不能逮住一个牛马就使劲薅,智能体也,术业有;
4. 多智能体核心难题其实是不同智能体的通信问题,传递,传哪些信息,这些都很;
5. Swarm的「Handoffs」了交接的逻辑。
阅读原文

OpenAI canvas一夜封神!超强AI编码研究神器,ChatGPT再次颠覆人机交互

文章概要:

1. ChatGPT界面全新升级,推出canvas,可与ChatGPT并肩作战,代表着终极AGI人机交互形态
2. canvas基于GPT-4o构建,目前在测试阶段,可在所有模型中手动选择,Plus用户不用等待,直接可用
3. canvas不仅可以让你与ChatGPT一起做研究,还能写代码、邮件等等,最重要的是还能帮你一起脑洞
4. canvas可以添加emoji,还多了一个快捷菜单,让协作更加轻易便捷了
5. 在Canvas界面助力下,GPT-4o编码性能飞跃18%
6. canvas项目负责人Karina Nguyen表示,我对终极AGI界面的愿景,是一张空白的画布
7. canvas可以帮人类研究、写代码、创作
8. canvas的推出,是OpenAI对最大劲敌Anthorpic的Claude artifacts最大的回击
9. OpenAI在博客中表示,如果要让人工智能变得更有用、更易用,就需要重新思考我们如何与它互动
10. 为了让模型更适应canvas模式,团队也对GPT-4o进行了必要的修法,添加了一些核心行为
11. canvas一经发布,已在全网掀起热议
12. canvas背后核心团队也随之全部公布
阅读原文

OpenAI终于Open!Swarm开源震撼来袭!

文章概要:

1. OpenAI开源了Swarm框架,它让构建和管理多代理系统变得轻松灵活
2. 多代理系统可以让多个AI小助手一起解决问题,提高效率
3. Swarm目前还是一个实验性项目,但它给多代理系统开发带来了更多想象空间
4. GPT4o功能有:文本对话、实时联网查询、AI绘画、文档分析、图像分析
5. 进入ChatGPT4o网址:https://ck4.tenglangai.com/,点击文末阅读原文,即可进入GPT4o
阅读原文

OpenAI发布新模型,你必须要知道的5件事

文章概要:

1. OpenAI发布新模型o1,是OpenAI最强水平,未来可能不会再有GPT5
2. o1拥有真正的通用推理能力,能在博士级别的科学问答环节上超越人类专家
3. o1更像人类,会展示思考过程,思考时间
. OpenAI o1 是经过强化,它可以在响应用户之前产生一个很长的内部思维链
. 推理能力的进步,可能会减少AI的知识幻觉,很多高精领域真的可以用到AI了
阅读原文

突发!OpenAI官方开源多智能体框架「Swarm」

文章概要:

1. OpenAI官方开源多智能体「Swarm」,虽然还只是实验性的,但是很有用。
2. Swarm里面定义了两个核心「Agents」和「andoffs」
3. 文章介绍了构建不同类型的Agent来满足不同的需求,复杂度从易到,分别是:纯Prompt对话、单个工具、多个工具调用、通过workflow来执行复杂流程、Multi-Agent多智能体协同。
4. 多智能体的核心难题是不同智能体之间的通信问题,Swarm的「Handoffs」处理了交接。
阅读原文

OpenAI今天Open了一下:开源多智能体框架Swarm

文章概要:

1. Open体编排框架 Swarm,这是框架,主打工效与轻量
2arm 关注的重点是让智能体协作和执行变得轻量、高度可控且易于测试。
3. Swarm 最适合处理存在大量独立功能和指令的情况——这些功能和指令很难编码成单个提示词。
4. Swarm 的核心组件包括 client(客户端)、Agent(智能体)、Function(函数)。
阅读原文

OpenAI终于open了,Swarm开源来袭~

文章概要:

1 OpenAI推出了Swarm框架,用于构建、协调和部署多智能体系统
2. Swarm智能体和两个原始抽象,使Agent协调和执行变得轻量级、高度且易于测试
3. Swarm的run()函数类似于Chat Completions API中的chat.completions()函数,它接收消息并返回,但在调用之间不保存任何状态
4. Agent简单地封装一组指令和一组函数,并且有能力将执行交接给另一个
5. Swarm智能体可以直接调用Python函数,如果一个函数返回一个Agent,执行将转移到那个Agent
阅读原文

OpenAI终于open了,Swarm开源来袭~

文章概要:

1. Swarm是由OpenAI Solutions团队管理的用于构建、协调和部署多智能体系统的框架
2. Swarm专注于使Agent协调和执行变得轻量级、高度可控且易于测试,它通过两个原始抽象来实现这一点:智能体和交接
3. Swarm的multi-agent使用示例
4. Swarm 的 run() 函数类似于 Chat Completions API 中的 chat.completions.create() 函数——它接收消息并返回消息,但调用之间不保存任何状态
5. Agent简单地封装了一组指令一组函数,并且有能力将执行交接给另一个Agent
. Swarm智能体可以直接调用 Python 函数
阅读原文

奥特曼准备用o1来训练AI了?OpenAI最新论文验证该方法可行性!

文章概要:

1. OpenAI发布具有强推理功能的o1后,奥特曼提出让AI训练自己的设想。为验证设想,OpenAI推出MLE-BENCH工具。
2 MLE-BENCH由75gle组成,涵盖多领域,目标是衡量AI Agent在机器学习工程方面的表现
3. 研究发现,将前沿语言模型与开源辅助框架结合,以及给Agent更多尝试机会,提高AI训练表现。
. 研究存在局限性,模型可能记住答案,导致高估能力,且MLE-BENCH需定期更新。
5. AI作为“副驾”参与模型开发可能成为日常,MLE-BENCH为进展提供新视角。
阅读原文

OpenAI 官方宣布正式开源多Agent编排框架 Swarm!

文章概要:

1. OpenAI官方宣布正式开源多Agent编排框架Swarm> 2. OpenAIarm是由OpenAI Solutions团队开发的一个实验性框架,专注于构建、编排和部署多Agent系统
3. Swarm可以被视为一个多Agent编排框架,每个Agent(智能体)都具备特定的任务能力能够执行的操作
4. Swarm通过智能体和交接两个核心概念实现多智能体的协调与执行
5. Swarm适用于多个步骤或多个任务协同完成的复杂工作场景
6.arm目前还不成熟,但是肯定是o1的广泛应用作铺垫,可以持续关注看看会不会有新东西,当前多Agent还是继续用CrewAI
阅读原文

OpenAI canvas一夜封神,ChatGPT再次颠覆 !

文章概要:

1. ChatGPT迎来界面全新升级,推出canvas,它基于GPT-4o构建,目前仍在测试阶段,可在所有模型中手动选择,Plus用户不用等待,直接可用,未来还计划向所有免费用户全面推出。
2. canvas可以让用户与ChatGPT一起做研究、写代码、邮件等,还能帮用户一起脑洞,并且可以添加emoji。
3. canvas面板中,还多了一个快捷菜单,让协作更加轻易便捷了。
4. 在Canvas界面助力下,GPT-4o编码性能飞跃18%。
5. canvas项目负责人Karina表示,我对终极AGI界面的愿景,是一张空白的画布。
6. canvas可以帮助用户完成艺术史研究报告、搜索餐厅并写邮件、生成代码并编辑、创造发明新的idea等。
7. canvas的推出,为写作和编码任务提供了新的界面,能让ChatGPT更好地理解用户提供的任务上下文。
8. OpenAI在博客中表示,如果要让人工智能变得更有用、更易用,就需要重新思考我们如何与它互动。
9. 为了让模型更适应canvas模式,团队也对GPT-4o进行了必要的修法,添加了一些核心行为。
10. canvas一经发布,已在全网掀起热议。
11. canvas背后核心团队也随之全部公布。
阅读原文

OpenAI Canvas用户反馈:并不如外界传言般“炸裂”,更不是“AGI的终极交互形态” | LeetTalk Daily

文章概要:

1. OpenAI Canvas通过与ChatGPT结合提升用户协作能力和创作效率,介绍其功能包括实时编辑和建议能力等,讨论其在AI工具竞争格局中的地位及对OpenAI未来方向的潜在影响
2. OpenAI Canvas是一种全新和编码方式,通过与ChatGPT互动提升用户创作体验理念是将写作和编码过程分开多种便捷和工具,具备版本控制功能,用户可选择是否允许AI使用其上传内容进行模型训练
3. 用户对Open Canvas的和体验显示出该工具在写作和编码方面的潜力,同时也暴露出一些需要的地方,界面和功能的限制、对不同编程语言的支持等> 4. OpenAI的Canvas利用了最新的1模型,能够根据用户的输入生成初步草稿,并允许用户与AI共同编辑,这种协作方式不仅限于文本,还扩展到代码的生成和调试
5. OpenAI Canvas的推出标志着人机协作的一个重要进展,提供了一种新的方式,让用户能够与ChatGPT进行更为直观互动的合作,提高了工作效率,也人机协作变得更加和流畅
阅读原文

震惊!爆料AI巨头OpenAI,预计2026年亏损将超140亿美元。

文章概要:

1. 爆料AI巨头OpenAI预计2026年亏损将超140亿美元,2029年支出总额将超过2000亿美元,其中每年60%到80%的支出用于模型训练或运行
2. OpenAI的现金流和亏损数字存在鸿沟,原因是会计准则对股权补偿和计算信用的处理方式
3. OpenAI预计到209年的收入与英伟达和过去12个月的收入相当。
4. 微软从OpenAI的收入中提取20%的份额。
阅读原文

OpenAI大揭秘:5位作家用ChatGPT创作的成功秘诀与技巧

文章概要:

1. 作者为了兼顾公众号写作和视频更新,利用AI写文章。
2. 作者针对AI进行简单训练,将OpenAI分享的位作家用ChatGPT创作的成功与技巧融入到写作算法中。
3 编辑反馈:写作本质上是孤独的,而这种孤独有一个缺点:困于自己的视角,很难对自己的保持客观。,作家需要编辑来提供新的,指出哪些部分有效,哪些需要改进。
4. 词汇查找:要想写得好,你需要找到合适的词语。但几乎正确的但含糊,方向正确但不准确)以惊人的精确度传达含义的词语(福楼拜称之为“ le mot juste ”)之间存在明显差异。br> 5. 反向面试:大多数人认为 ChatGPT 是一台问答机:提出问题,得到答案。作家创始人 Stew Fortier 发现,当他自己给出答案时,ChatGPT 最有用。
6.写作:好的似乎毫不费力,但写笑话实际上需要研究。幽默依赖于背景,正如喜剧作家 Sarah Rose Siskind 所解释的那样,敲门笑话之所以失败,正是因为它们脱离了背景。
7. 研究世界建设:研究是作家通向新世界的大门。建议作家写他们所知道东西,但正如汤姆·沃尔夫所观察到的,仅仅依靠第一手经验会限制他们的范围
阅读原文

AI革命的下一步——深入解析OpenAI最新推出的“高级语音模式”!

文章概要:

1. OpenAI宣布其全新的“高级语音模式”( Voice Mode,AVM)正在向更多的ChatGPT付费用户开放
2. OpenAI推出的高级语音(AVM),则进一步模糊了人与机器之间的界限>3. OpenAI还对AVM的语音理解能力进行了升级,尤其是在对不同的识别和处理,变得更加精确
4. 为了增强用户个性化体验,OpenAI将之前广受好评的“自定义”(Custom Instructions)功能也扩展到了AVM中
5. OpenAI早前展示的另一个引人瞩目的——视频和共享,依然未在此次更新中亮相
阅读原文