今日AI-OpenAI-2024年10月2日

发现全网最新的AI内容

被撕裂的OpenAI

文章概要:

1. OpenAI因公司价值观争议和高层争斗,高管和研究人员纷纷离职,包括首席技术官米拉·穆拉提等20多位员工。
2. 公司正准备转型为营利性公司,内部矛盾公开化,包括产品发布和安全测试过快、CEO日常事务脱离等问题。
3. 一些人认为这些变化是必要的,而另一些人则认为资金和利润前景腐蚀了公司文化。
4. OpenAI在改进ChatGPT等产品方面取得成效,但面临竞争加剧和技术优势保持的挑战。
5. OpenAI动荡的时间线包括奥特曼被罢免和复职、联合创始人辞职、高管休假等事件。
6. 内部紧张局势升级,如GPT-4o模型的开发和发布引发安全问题和员工不满。
7. 除了其他高管的离职,奥特曼的关键助手Brockman也在休假,公司领导层减员。
阅读原文

震荡之后的OpenAI发布会:没有惊喜,还是奥特曼的男频爽文

文章概要:

1. OpenAI举办今年巡回式DevDay的第一场发布会,发布了一系列功能更新,包括一些价格优惠
2. 主打低延迟、多模态的Realtime API开放公测,由4o模型支持,配备六种预设声音进行自然的语音对话> 3. OpenAI还发布了微调,在文本微调的基础上,又多了一项更可控的实现模型自主微调的方式
4 OpenAI引入提示缓存,通过记住常用的,来加速推理模型生成输出,从而加快使用时间、降低成本
5. OpenAI亮相模型蒸馏功能,基于GPT-4o和o1-preview等高级模型,可以出更小、更便宜的模型
6 这次的开发者大会相比去年低调了不少评论说这是给OpenAI未来的路线定调了:要更专注开发者服务,而不再于做终端应用
7. Sam Altman对于AGI的宏伟愿望,在他的愿景里,人工智能不仅“有助于修复气候危机,建立太空殖民,以及能够发现和研究物理现象
8. 舆论对OpenAI转型发出尖锐爆鸣,并不是没有理由的:曾经扬言要改变一切,同时又守护人类的超酷团队,彻彻底底变了
阅读原文

OpenAI 旧金山开发者大会发布五大创新功能 实时语音、视觉微调、模型蒸馏...

文章概要:

1. OpenAI旧金山开发者大会发布五大创新功能,包括实时语音API、提示词缓存、模型蒸馏、视觉微调、新Playground
2. 实时语音API允许开发者创建具有低延迟、AI生成的语音响应功能的应用程序,提供近乎实时的语音到语音互动体验
3. 提示词缓存功能允许开发者在多个API请求之间缓存常用的上下文信息,减少重复计算和成本
4. 模型蒸馏是通过使用更强大模型的输出对较小且成本效益高的模型进行微调,使其在特定任务上以更低成本达到高级模型的性能
5. 视觉微调功能使开发者能够通过图像和文本微调模型的视觉理解能力,从而提升其视觉理解能力
6. 新Playground可以通过简单地描述你想使用模型实现的功能,自动为你生成提示和有效的schema
阅读原文

乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜

文章概要:

1. OpenAI宫斗后的DevDay开发者大会,没有什么惊喜,他们没有推出重大产品,而是选择对其现有的AI工具和API进行增量改进。
2. 在这次活动中,OpenAI发布了四大API新功能:视觉微调(Vision Fine-Tuning)、实时API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。
3. OpenAI在开发者大会上正式推出实时API的公测版,允许开发者在他们的应用程序中构建低延迟、多模态的体验。
4. OpenAI宣布为GPT-4o引入视觉微调功能,允许开发者使用图像和文本来自定义模型的视觉理解能力,从而实现增强的视觉搜索功能改进自动驾驶汽车或智能城市的物体检测,以及更准确的医学图像分析等应用。
5. OpenAI引入了提示缓存(Prompt Caching),这是一个旨在降低开发者成本和延迟的功能。
6. Open此次还引入了模型蒸馏(Model Distillation),这种集成的工作流程允许开发者使用o1-preview和-4o等高级模型的输出,来提高像GPT-4o mini更高效模型的性能。
7. 今年OpenAI的开发者大会稍显低调,甚至可以说是乏善可陈。
阅读原文

OpenAI DevDay推实时通话API 与 视觉微调等4项新能力

文章概要:

1. OpenAI今天在旧金山举行开发者日活动,了其API服务的一系列更新,包括模型提炼、快速缓存、视觉微调,以及推出名为RealTime的新服务
2.ime API使开发人员能够构建语音转语音的应用,处理文本和音频的费用不同,微软的Azure也推出了这一能力
3. 即时缓存是降低调用AI成本非常有效的方法,OpenAI的API将自动保存或“缓存长前缀长达一小时,对输入成本应用50的折扣
4. 模型蒸馏是通过使用较大模型的输出对GPT-4 mini等较小模型进行微调,从而增强其功能OpenAI在其API平台中构建一个模型蒸馏套件
5.微调功能的推出,标志着OpenAI在模态AI领域迈出了重要一步,使得开发人员除了可以使用文本微调之外,还可以使用图像对GPT-4进行微调
6. OpenAI此次API更新无疑是AI技术发展的一个重要里程碑它不仅展示了AI技术的快速进步也预示着更多创新应用的到来
阅读原文

OpenAI开发者日发布重磅API,语音和视觉能力再升级

文章概要:

1 OpenAI其年度开发者日活动中发布一系列重磅API更新,包括实时语音API、视觉微调API、提示词缓存和模型蒸馏等,推动了AI在多模态交互、语音处理、视觉微调和模型蒸馏等的进一步发展。
2. Realtime API是本次发布的焦点之一,它支持自然的语音,且能够自动处理用户中断,使交互更加流畅和人性化。
3. 视觉微调API允许开发者将图像数据集用于GPT-4o的微调,这项技术使得模型在任务中的表现显著提升。
4. Prompt Caching是OpenAI此次推出的另一项备受瞩目的功能,允许开发者通过缓存模型最近见过的提示词来降低推理成本并减少延迟。
5 模型蒸馏API为开发者提供了一个整合的工作流程能够利用模型(如GPT4o)的输出对更小、更高效的模型(如GPT-4o mini)进行微调。
阅读原文

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

文章概要:

1. OpenAI开发者大会发布了给开发者的一些福利,包括API的功能更新以及降价。<>2. OpenAI今年在GPT-4o上引入了的功能,开发者们已经开始利用文本对模型进行微调以适应下游任务。
3. OpenAI宣布将引入-4o的视觉微调功能,允许开发者结合图像和文本来定制模型的视觉理解能力。
4. OpenAI还宣布了要开放实时API的公测版,所有开发者在自己的应用程序中使用GPT的实时、低延时、多模态的功能。br>5. OpenAI还提出了一种用前沿、高级的模型的输出微调GPT-4o mini的模式,例如用o1-preview 和 GPT-4o 等高级模型的输出,微调GPT-4o mini这类的小模型,实现更高效模型的性能。
6. OpenAI推出了“提示缓存”(Prompt Caching)功能。该功能能够自动识别并缓存模型最近处理过的输入tokens,从而提高效率并减少不必要的重复处理,有效地为开发者节省和资源。
阅读原文

OpenAI开发者大会4大新功能

文章概要:

1. OpenAI在美国旧金山召开了第二届开发者大会,发布了4大新的API功能,包括实时API、视觉功能引入微调API、API提示缓存以及API模型蒸馏。
2. 实时API提供类似最近新开放的ChatGPT的高级语音模式,支持使用API中已经支持种预设声音进行自然的语音到语音。
3.引入微调API,除了文本之外,还可以通过图像进行微调。
. API提示缓存,允许开发者降低成本和延迟。
5. API模型蒸馏为开发者提供一个集成的工作流程,直接在AI内管理整个蒸馏流程。
阅读原文

内乱后的OpenAI,开发者大会带来惊喜了吗?

文章概要:

1. OpenAI宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届DevDay开发者大会,他们没有推出重大产品,而是选择对其现有的AI工具和API进行增量改进。
2. OpenAI在开发者大会上正式推出实时API的公测版,允许所有付费开发者在他们的应用程序中构建低延迟、多模态的体验。
3. OpenAI宣布为GPT-4o引入视觉微调功能,允许开发者使用图像和文本来自定义模型的视觉理解能力,从而实现增强的视觉搜索功能、改进自动驾驶汽车或智能城市的物体检测,以及更准确的医学图像分析等应用。
4. OpenAI引入了提示缓存(Prompt Caching),这是一个旨在降低开发者成本和延迟的功能。
5. OpenAI此次还引入了蒸馏(Model Distillation)。这种集成的工作流程允许开发者使用o1-preview和GPT-4o等高级模型的输出,来提高像GPT-4o mini这样更高效模型的性能。
阅读原文

OpenAI超车谷歌的第一性原理是什么?

文章概要:

1. OpenAI在AI上的勇猛精进,有根本的第一性原理支撑,《理解图灵》的作者尼克与@东东枪老师一起,拉尼克做了次深,放在了小宇宙播客“科技修道院”中
2. 学习的定义是图灵机逆,也可以表达为学习是计算的逆,学习是图灵机的逆”这个数学定义,为后续跟学习相关原理工作,准备了一个坚实的零公里出发点
3. 60年代,所罗门诺夫得出了一个重要而又不太为人所知的结论:学习,等价于“next prediction”,也就是“下一个”,OpenAI的工程师将这些原理谙熟于心,在他们的研究过程中起到了定海神针的作用
4. 谷歌用的BERT,是从一串词里抠掉一个,从两个方向的“完形填空”,比起所罗门诺夫说的“猜猜下一个”,消耗的算力要高得多
5. 在同样的算力下,BERT和GPT的效果差距会很明显,如果按照现在的算力速度来看,如果坚持BERT,那大约在十年以后,他也会赶上现有的GPT水准
6. 人工智能的可解释性是不可能人类要追求比自己强大的认知能力,就一定是自己无法直观理解的
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI 第二届开发者大会推出了实时 API、微调 API 中融入的视觉能力、API 提示的缓存机制以及 API 模型的蒸馏技术四大全新的 API 功能。
2. 实时 API 提供了类似于最近推出的 ChatGPT 的高级语音功能,支持使用 API 内置的 6预设声音进行流畅的语音对话。
3.AI 为 GPT4o API 增加了视觉微调,允许通过图像数据定制模型,增强图像理解能力用于搜索、自动驾驶、智能城市和医学图像分析等。
. OpenAI 推出 API 提示缓存功能,以降低成本和延迟,重用输入 token 享 50折扣处理更快。
5. OpenAI 推出了一站式模型蒸馏服务,流程。
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI举办了第二届开发者大会,推出了实时API、微调API中融入的能力、API提示的缓存机制以及API模型的技术全新的API功能。
2. 实时API提供了最近推出的ChatGPT的高级语音功能,支持使用API内置的6种预设声音进行流畅语音。
3. OpenAI为GPT-4o API增加了微调,允许通过图像数据定制模型,增强图像理解能力,用于视觉搜索、自动驾驶、智能城市和医学图像分析等。<>4. OpenAI推出API提示缓存功能,以降低成本和延迟,重用输入token享5%折扣,处理更快。
5.AI推出了一站式模型蒸馏服务,简化流程。
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI于美国旧金山举办了开发者,推出了实时API、微调API中融入的视觉能力、API提示的机制以及APImodel的蒸馏技术四大全新的API功能。
2. 实时API提供了类似于最近推出的ChatGPT的高级语音功能,支持使用API内置的6种声音进行流畅的语音对话。
3. OpenAI为GPT-4o API增加了视觉微调,允许通过数据模型,增强图像理解能力,视觉搜索、自动驾驶智能城市和图像分析等。
4. OpenAI推出API提示缓存功能,以降低成本和延迟,重用输入token享50折扣,处理更快。<> 5. OpenAI推出了一站式模型服务,简化流程。
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI 第二届开发者大会推出了四项的 API 功能,包括实时 API、微调 API 中融入的视觉能力、API 提示的缓存机制以及 API 模型的蒸馏技术。
2. 实时 API 提供了类似于最近推出的 ChatGPT 的高级语音功能,使用 API 内置的 6 种预设声音进行流畅的语音对话。
3. OpenAI 为 GPT-4o API 增加了视觉微调,允许通过数据定制模型,增强图像理解能力。
4. API 提示词缓存功能可以降低成本和延迟,重用输入 token 享 50%折扣,处理更快。 阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI举办第二届开发者大会,推出API、微调API中融入的视觉能力、API提示的缓存机制以及APImodel的蒸馏技术极大地简化了模型调用、调和蒸馏等步骤,几乎达到了“一键式”操作。
2. 实时API提供了类似于最近推出的ChatGPT的高级语音功能,支持使用API内置的6种预设声音进行流畅的语音。
. OpenAI为GPT-4oAPI增加了视觉,允许通过图像数据定制模型,增强图像理解能力,用于视觉搜索、自动驾驶、智能城市医学图像分析等。
4.AI推出API提示缓存功能,以降低成本和延迟,重用输入token享50%折扣,处理更快。
5.AI推出了一站式模型蒸馏服务,简化流程。
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI于美国旧金山第二届开发者大会,推出了实时API、微调API中融入的视觉能力、API提示的缓存机制以及API模型的蒸馏技术四项全新的API功能
2 OpenAI正式推出了实时的公开测试版,现在所有付费开发者都可以在自己的应用中实现低延迟、多模态的生成式AI功能
3. OpenAI为GPT-4o API增加了视觉微调,允许通过数据定制模型,增强图像理解能力,用于视觉搜索、自动驾驶、城市和图像分析等
4. OpenAI推出API提示缓存功能,以降低成本和延迟,重用输入token享50%折扣,处理更快
5. OpenAI推出了一站式模型服务,简化流程
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI于美国旧金山举办了第二届开发者大会,推出了实时API、微调API中融入的视觉能力、API提示的缓存机制以及API模型的技术四项全新的API功能。
2. 实时API提供了类似于最近推出的ChatGPT的高级语音,支持使用API内置的种预设声音流畅的语音对话。
3.AI为GPT-4o API增加了微调,允许通过数据定制模型,图像理解能力,用于视觉搜索、自动驾驶、智能城市和医学图像分析等。
4 OpenAI推出API提示缓存功能,以降低成本和延迟,重用输入token享50%折扣,处理更快br>5. OpenAI推出了一站式模型服务,简化流程。
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI第二届开发者大会推出了四项全新的API功能,实时API、微调API中融入的视觉能力、API提示的缓存机制以及API模型的蒸馏技术。
2. 实时API提供了最近推出的ChatGPT的语音功能,使用API内置的6种声音进行流畅的语音
3 视觉功能引入微调API,允许通过图像定制模型,增强图像理解能力。
4. API提示词缓存功能可以降低成本和延迟,重用输入token享50%折扣,处理更快。
5. API模型蒸馏服务可以将大型模型输出用于微调小型模型,以降低成本并保持性能。
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI第二届开发者大会在旧金山举办,推出四项全新API功能,包括实时API、微调API中融入的视觉能力、API提示的缓存机制以及APImodel的蒸馏技术
2. 实时API提供了类似于ChatGPT的高级语音,支持使用API内置的6种预设声音进行流畅的语音对话
3. 视觉功能引入微调API,允许通过图像数据定制模型,增强图像理解能力
4. API提示词缓存功能降低成本和延迟,重用输入token享50%折扣,处理更快
5. API模型蒸馏服务简化流程,包括存储完成、评估集和微调
阅读原文

成本降低98%!OpenAI开发者大会4大新能力,处理token猛增50倍!

文章概要:

1. OpenAI 第二届开发者大会在旧金山举办,推出了实时 API、微调 API 中融入的视觉能力、 提示的缓存机制以及 API 模型的蒸馏技术等四项全新的 API 功能
2. 实时 API 提供了最近推出的 ChatGPT 的高级语音功能,支持使用 API 内置的 6预设声音流畅的语音对话
3. OpenAI 为 GPT-4o API 增加了微调,允许图像数据定制模型,增强图像理解能力,用于视觉搜索、自动驾驶、智能和医学图像分析等
4. API 提示词缓存功能可以降低和延迟,输入 token 享 50%折扣,处理更快
5. OpenAI 推出了一站式模型蒸馏服务,简化流程,包括存储完成、评估集、微调等步骤
阅读原文

OpenAI DevDay公布五项重大创新,AI实时语音的时代来了!成本比GPT-3降低近1000倍!

文章概要:

1. OpenAI在DevDay上公布了五项重大创新,包括实时API、提示词缓存、模型蒸馏、视觉微调、新广场玩法。这些新能力预示了OpenAI的战略重心的变化,加大投入基础建设、增强其不是直接「AI应用领域」争夺终端用户。
2. OpenAI现场演示使用o1在30秒内构建iPhone iOS应用程序,展现了一种“人人都是开发者”的可能性。语音实时对话的效果感到惊叹,X上也出现了一批基于纯语音交互的创业idea。
3. OpenAI发布的Realtime API,目前处于公开测试阶段。这项新产品使开发人员能够创建低延迟、多模式,尤其是在语音转语音应用程序中。
4. “提示词缓存”功能,旨在降低开发人员的成本和延迟。该系统自动对模型最近处理的输入标记应用50%的折扣,这会为经常重复使用上下文的应用程序带来。5. 引入了「模型蒸馏」,这种集成的工作流程,允许开发人员使用o1-preview和GPT-4o等高级模型的输出来提高GPT-4o mini等更高效模型的性能。
6. 为OpenAI最新的大型语言模型GPT-4o引入视觉微调。此功能允许开发人员使用图像和文本自定义模型的视觉理解能力。
7. 对提示词的结构框架以及其他用法作出了更多说明。主要包括:“了解任务:掌握主要目标、目标、要求、约束和预期输出。”
阅读原文

震荡之后的 OpenAI 发布会:没有惊喜,还是奥特曼的男频爽文

文章概要:

1. OpenAI在原始初创高管全部出走后质疑,在一片唱衰声中打起精神举办今年巡回式DevDay的第一场发布会,发布了一系列功能更新,包括价格优惠。
2.发布会主打低延迟、多模态的Realtime API开放公测,由4o模型支持,配备六种预设声音进行自然的语音对话,类似于“每个人自己的ChatGPT高级语音模式”。
3. OpenAI还发布了微调功能,在文本微调的基础上,又多了一项更可控的模型自主微调的方式。
4. OpenAI了提示功能,通过记住常用的提示,来加速推理模型生成输出,从而加快使用时间、降低成本。
. OpenAI还亮相了模型蒸馏功能,基于GPT-4o和o1-preview等高级模型,可以定制出更小、更便宜的定制模型,有利于在过程中平衡和成本。
6. 此次开发者大会相比去年低调了不少,不少评论说这是给OpenAI未来的定调了:要更专注开发者服务,而不再纠结于终端应用。
7. 实际上,OpenAI一直以来就是这个路线去年的开发者大会,除了推出GPT-4 Turbo之外,其它的包括Assistance API、自然语言编程、GPT商店,都是更多在面向开发者的。
8. OpenAI将面临成为一家营利性公司的转身,Vox称之为“OpenAI崇高愿景最后的丧钟”。
阅读原文

OpenAI开发者日,马斯克带领xAI高调入驻OpenAI 原总部!

文章概要:

1. OpenAI开发者日活动中,Elon Musk领导的xAI公司高调入驻OpenAI原总部,这一举动为两家公司之间的竞争火上浇油,将硅谷的AI战争推向了新的高潮
2. OpenAI的开发者日活动展现了公司的包容性文化,而xAI则选择在OpenAI开发者日当天搬入后者的原总部,这一时间点的选择绝非巧合,而是一次精心策划的"反击"。
. OpenAI强调安全、道德和开放合作,而xAI追求突破性创新,可能更倾向于"无拘无束"AI发展。
4. 这场AI巨头之战的影响远超两家公司本身,包括技术路线之争、伦理与创新的平衡人才争夺、投资热点转移和公众认知的改变。
5.AI与xAI的对抗,不仅是两家公司之间的较量,更是两种AI发展理念交锋,这场硅谷AI战争的,很可能决定了人工智能的未来走向。
阅读原文

成本降低98%!OpenAI开发者大会4大新功能,处理量爆增50倍!

文章概要:

1. OpenAI召开了第二届开发者大会,发布了4大新的API功能
2. OpenAI正式推出实时API的公测版,允许所有付费开发者在他们的应用程序中构建低延迟、多模态的体验
3. OpenAI为GPT-4o引入视觉微调功能,允许开发者使用图像和文本来自定义模型的视觉理解能力
4. OpenAI引入了提示缓存,这是一个旨在降低开发者成本和延迟的功能
5. OpenAI引入了模型蒸馏,这种集成的工作流程允许开发者使用o1-preview和GPT-4o等高级模型的输出,来提高像GPT-4o mini这样更高效模型的性能
6. 微软Azure OpenAI服务可以合规、稳定地提供企业用户使用ChatGPT的可能。出于合规角度,建议国内企业可以选择微软的Azure OpenAI服务来使用接口
7. 全云在线可为企业开通绿色申请通道!包括最新版本GPT-4o、o1、Dalle-3等,只要企业有需求,全云在线都能协助快速开通
阅读原文

OpenAI DevDay利好AI开发者的五大创新!

文章概要:

1. OpenAI在旧金山举行的开发者日活动上宣布了API服务的一系列更新,包括模型提炼、提示词缓存、视觉微调、RealTime的新API服务以及新玩法
2 Open了一种新方法,通过使用较大模型的输出对GPT-4o mini等较小模型进行微调,从而增强其功能,这种方法称为模型蒸馏
3. OpenAI一直致力于降低其API服务的通过“提示缓存”这个方向迈出了新的一步,新功能使开发人员使用常见的提示,每次都支付全价> 4. 开发人员除了使用文本之外,使用图像对GPTo进行微调,OpenAI表示,这将增强模型理解和识别图像的能力
5. OpenAI正在帮助开发人员利用其技术构建语音转应用程序
6. 新的功能主要包括生成提示词,Functions和Schemas,对提示词的框架以及其他用法作出了更多
阅读原文

OpenAI DevDay 大会发布4款重磅API功能,处理量增加50倍!

文章概要:

1. OpenAI在美国旧金山召开了第二届开发者,发布了4大新的API功能,实时语音API、微调API、自动提示词缓存、模型蒸馏API。br>2.AI发布的链接有https://openai.com/index/introducing-realtime-api/、httpsopenai.com/index/introducing-vision-to-the-fine-tuning-api/、httpsai.com/index/api-prompt-caching/、https://ai.com/index/api-model-distillation/。
3. OpenAI表示,通过这些全新的API能开发出强大且多元化的生成式AI、应用,同时将GPT-4、GPT-o mini模型的成本降低98%,同时处理token的数量暴涨50倍。
4. OpenAI在开发者大会上已经正式发布了实时API的公开测试版,允许所有付费开发者在他们的应用程序中构建低延迟、多的生成式AI功能。6. OpenAI平台产品负责人Olivier Godement表示“我们一直高负荷运转。两年前,GPT-3还大获成功。现在,我们已将成本降低了近1000倍。我试图举出一个在两年内将成本降低近100倍的技术例子——但我”
7. OpenAI推出了新的集成工作流程,可自动获得前沿模型生成的-输出对、运行自定义评估、以及完成微调。
阅读原文

众大佬出走后的OpenAI DevDay发布了什么新内容?实时API可能颠覆CallCenter市场格局

文章概要:

1. OpenAI推出实时API的公开测试版,允许付费开发者在应用中构建低延迟多模态的体验,支持自然的语音对话,与ChatGPT的高级语音模式类似,可使用六种预设语音,并引入了音频输入和输出功能
2. OpenAI推出Prompt Caching技术,允许开发者重复使用最近见过的输入token,从而获得50%的折扣和更快的处理时间
3. OpenAI推出全新的模型蒸馏工具套件,包括存储完成、评估和微调三大核心功能,简化了AI模型优化流程
4. OpenAI推出GPT-4o的视觉微调功能,允许开发者在图像和文本数据上进行微调,增强模型的能力
5. OpenAI推出新的ground功能,只需要描述你使用模型的目的,ground会自动生成提示以及函数和结构化输出的有效模式
阅读原文

OpenAI DevDay大会发布4款重磅API功能,把AI应用开发者放在了更重要的位置上

文章概要:

1. OpenAI在旧金山举办了DevDay开发者大会面向开发者发布了四款API:实时API,视觉微调API,提示缓存 API以及模型蒸馏API。
2. OpenAI发布目前处于公开测试阶段的实时API,使开发者能够创建低延迟、多模态的体验,尤其是在语音到语音的应用场景中。
3. OpenAI为最新的AI模型GPT-4o引入视觉微调API,允许开发者图像文本来自定义模型的视觉理解能力。
4. OpenAI发布提示缓存API功能,旨在降低开发者的成本和延迟。
5. OpenAI发布模型蒸馏API,允许开发者高级模型的输出来提高更高效模型的性能。
阅读原文

苹果不在投资OpenAI,OpenAI面临破产危机

文章概要:

1. 苹果不再投资OpenAI,OpenAI面临破产危机
2. OpenAI开发了ChatGPT、DALL-E、Sora
3. OpenAI在训练AI模型和人员开销上花费巨大,收入难以覆盖运营成本
4. OpenAI正在商谈新一轮融资,微软、英伟达等公司有意参与
5. 苹果放弃投资的原因可能与关键人物离职和财务状况有关
6.AI遭遇高层变动,CTO、首席研究官、研究副总裁相继离职
. OpenAI赚钱的速度远远赶烧钱”的速度,今年营收为37亿美元,亏损约50亿美元
阅读原文

280页PDF,全方位评估OpenAI o1,Leetcode刷题准确率竟这么高

文章概要:

1. OpenAI 的 o1-preview 模型已经发布两周了,网上也有了很多零星的测评。大部分测评都侧重于某一个方面,对于 o1-preview 的系统评估目前还比较匮乏。在一篇长达 280 页的论文中,来自加拿大阿尔伯塔大学等机构的研究者报告了他们对 o1-preview 的系统评估结果。
2. 这项综合研究评估了 o1-preview 在各种复杂推理任务中的性能,涵盖多个领域,包括计算机科学、数学、自然科学、医学、语言学和社会科学。通过严格的测试,o1-preview 展示了非凡的能力。
3. 作者对 o1-preview 在不同领域的全面评估揭示了几个主要观点:高级推理能力、特定领域知识、创造性和实际应用、自然语言理解、科学与医学推理、局限和有待改进的地方、现实世界的应用潜力。
阅读原文

奥特曼:自认比o1聪明请举手🤚到o2还这么想么🤨?|OpenAI开发者日

文章概要:

1.AI开发者一个环节奥特曼炉边奥特曼对未来作出:上下文长度将发生;o1,人们将一小时内完成以前人类数月或数年的工作;然后每个人将拥有10个智能体,再然后拥有1000担心科幻(Sci-fi)事之一。2. 活动上宣布了Open大量重磅更新,、词缓存、模型蒸馏。3. 围绕这些精彩现场演示,也引起众人围观。比如GPT-4o驱动的实时io发布也操控无人机,现场芜湖起飞5. 刚刚离职的几位中,前研究VP Barret Zoph已决定要成立公司。前CTO Mira Murati还没宣布下一步要干什么,但投资人开始围追堵截她,希望她尽快成立自己的公司一位此前已离职的OpenAI联合创始人Durk Kingma,宣布加入隔壁Anthropic。6. OpenAI开发者日与去年相比,今年的OpenAI开发者日活动不再现场直播,并拆分成三部分在不同地点举办(美国、英国、新加坡)。刚刚在旧金山举办的第一场,宣布了多项API更新。7. 实时语音API为公开测试版,所有开发者都能在自己的APP中构建与ChatGPT高级语音模式类似的体验。价格也不贵,每分钟音频输入约0.06美元,每分钟音频输出约0.24美元。8. 视觉微调可以用来增强视觉搜索功能、改进自动驾驶汽车或智能城市的物体检测以及更准确的医学图像分析等应用。在UI设计上,微调过的GPT-4o生成的网页区域也能更好匹配整个页面的风格。9. 提示词缓存功能可以在降低成本的同时降低推理延迟。从今天起,提示词缓存已适配最新版本的GPT-4o、GPT-4o mini、o1-preview和o1-mini,以及这些模型的微调版本。只要是AI见过的token,自动统统打五折。10. 模型蒸馏让开发者可以用o1-preive和GPT-4o等前沿模型的输出,对GPT-4o mini等小模型微调。11. OpenAI持续发布新模型、新功能的压力,让OpenAI内部研究和安全团队疲于奔命,难以跟上步伐。12. 离职的OpenAI研究人才中,有相当一部分去了隔壁Anthropic。联合创始人John Schulman、超级对齐负责人Jan Leike跳槽加入之后,Anthropic又吸引来一位早年已经离职的OpenAI联创Durk Kingma。
阅读原文

奥特曼:自认比o1聪明请举手🤚到o2还这么想么🤨?|OpenAI开发者日

文章概要:

1. OpenAI开发者日活动上,奥特曼表示o1正在推动智能体应用,人们将要求AI在一小时内完成以前人类数月或数年的工作,然后每个人将拥有10个智能体,再然后拥有000个,担心科幻(Sci-fi)是我们最重要的事之一。
2. OpenAI宣布了OpenAI API大量重磅更新,包括实时语音API、视觉微调API、自动提示词缓存、模型蒸馏API。
3. OpenAI开发者日活动不再现场直播,并拆分成三部分在不同地点举办(美国、英国、新加坡)。
4. OpenAI持续发布新模型新功能的压力,让OpenAI内部研究和安全团队疲于奔命,难以跟上步伐。
5. OpenAI高层持续动荡,已经流失不少研究和管理人才。
阅读原文

OpenAI DevDay新功能4连发,有请开发者登场!

文章概要:

1 OpenAI举行了024年度开发者大会DevDay,推出了一系列实用新功能提示词缓存、视觉微调、实时API、模型蒸馏。
2. 实时的公开测试版,允许所有付费开发者在其低延迟多模态的体验。
. OpenAI推出了提示缓存功能,允许开发者降低成本和延迟。
. OpenAI引入了新的模型蒸馏服务,开发者提供了一个集成的工作流程直接在OpenAI平台上整个蒸馏管道。 阅读原文

OpenAI DevDay公布五项重大创新,AI实时语音的时代来了!成本比GPT-3降低近1000倍!

文章概要:

1. OpenAI在DevDay上公布了五项重大创新,包括实时API、提示词缓存、模型蒸馏、视觉微调、新广场玩法,这些新能力预示了OpenAI的战略,而不是直接在「AI应用领域」争夺终端用户。
2. OpenAI现场演示使用o1在30秒内构建iPhone iOS应用程序,让APP开发的门槛进一步降低,更是展现了一种“人人都是开发者”的可能性。
3. OpenAI发布的Realtime API,目前处于公开测试阶段,这项新产品使开发人员能够创建低延迟、多模式体验,尤其是在语音转语音应用程序中。
4. 提示词缓存功能,旨在降低开发人员的成本和延迟,该系统自动对模型最近处理的输入标记应用50%的折扣,这可能会为经常重复使用上下文的应用程序带来大量节省。
5. 模型蒸馏是引入了「模型蒸馏」,这种集成的工作流程,允许开发人员使用o1-preview和GPT-4o等高级模型的输出来提高GPT-4o mini等更高效模型的性能。
6. 视觉微调是为OpenAI最新的大型语言模型GPT-4o引入视觉微调,此功能允许开发人员使用图像和文本自定义模型的视觉理解能力。
7. 新广场功能对提示词的结构框架以及其他用法作出了更多说明。
8. OpenAI的2024,而没有发布引人注目的新产品,比如Sora。
阅读原文

乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜

文章概要:

1. OpenAI宫斗后的DevDay开发者大会,没有什么惊喜,他们没有推出重大产品,而是选择对其现有的AI工具和API进行增量改进。
2. OpenAI发布了四大API新功能:视觉微调(Vision Fine-Tuning)、实时 API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。
3. OpenAI在开发者大会上正式推出实时API的公测版,允许所有付费开发者在他们的应用程序中构建低延迟、多模态的体验。
4. OpenAI宣布为GPT-4o引入视觉微调功能,允许开发者使用图像和文本来自定义模型的视觉理解能力,从而实现增强的视觉搜索功能、改进自动驾驶汽车或智能城市的物体检测,以及更准确的医学图像分析等应用。
5. OpenAI引入了提示缓存(Prompt Caching),这是一个旨在降低开发者成本和延迟的功能。
6. OpenAI引入了模型蒸馏(Model Distillation)。这种集成的工作流程允许开发者使用o1-preview和GPT-4o等高级模型的输出,来提高像GPT-4o mini这样更高效模型的性能。
7. 今年OpenAI的开发者大会稍显低调,甚至可以说是乏善可陈。
阅读原文

OpenAI大礼包:实时语音、模型蒸馏都上了,要卖最好的货赚最多的钱

文章概要:

1. OpenAI 2024年首场DevDay在旧金山2号码头的Gateway Pavilion低调举办,今年开发者日的消息只在两月前OpenAI Developers 的X账号出现过参会者基本是受邀客户和筛选出的一线开发者,地点保密至最后一刻,直至当天才透露的神秘日程,且没有直播。
2. OpenAI在这个名副其实的“开发者日”上,打包带来了实时API、提示缓存、模型蒸馏、视觉微调、Playground优化,以及扩大o1 API范围、提升速率限制等一系列面向开发者的重要工具更新。
3. 实时API(Realtime API)允许开发者调用ChatGPT高级语音模式的底层模型gpt-4o-realtime-preview,在应用中构建快速、自然的语音到语音对话体验。支持6种预设语音,实现低延迟的语音交互。
4. 提示缓存能够自动保存开发者最近使用的输入内容,并在这些内容再次被调用时提供50%的费用折扣,同时加快处理速度。
5. 模型蒸馏是一项新功能,旨在通过使用大型、强大的模型(如GPT-4o或o1-preview)的输出,来微调更小、更具成本效益的模型(如GPT-4o mini),以在特定任务上接近高级模型的性能,但成本大大降低。
6. GPT-4o的API新增了视觉微调功能,允许开发者除文本外,还可以使用图像进行模型定制。从而增强模型的图像理解能力,使其在诸如视觉搜索、物体检测、自动驾驶、智慧城市管理以及医学影像分析等领域更加擅长。
7. OpenAI还为Playground新增了提示词优化功能:只需描述想用模型实现的功能,Playground就能自动生成提示词,以及有效的函数和结构化输出模式,快速将你的想法转化为实用原型。
8. 新发布的o1 API继续宽限:扩大了第3层开发者的访问权限,提升各级别速率限制(tier 3每分钟5000),以使应用更快进入生产环境。
9. OpenAI首席执行官Sam Altman与6月新上任的首席产品官Kevin Weil登台,开始45分钟的炉边对话环节,对白天征集的与会者问题进行解答。
10. OpenAI正在全力争取开发者,从今天的高级语音、视觉微调、蒸馏等各种功能引入API,到整体价格降低和各种鼓励政策,再到排满的客户用例展示....足以看出,OpenAI正在广大开发者,自己仍然是构建AI应用的最佳平台。
阅读原文

OpenAI官方AI指南: 5位职业作家的实战经验,帮你提高与AI沟通效率

文章概要:

1. OpenAI分享了5位专业作家利用AI辅助写作的案例和,引发了广泛关注
2. 这些经验丰富的作家明确表示,他们并不是简单地用AI替代传统的写作过程。相反,他们巧妙地将AI工具整合到创作中,用以激发灵感、探索新的创意方向,同时保持自己独特的声音和风格
3. 编剧David Cornue:24小时编辑团队
4. 《纽约时报》专栏作家Farhad Manjoo :精确选词
5. 作家及公司创始人Stew Fortier:逆向提问法
6. 喜剧作家Sarah Rose Siskind:喜剧的艺术
7. 小说家Elle Griffin:构建虚拟世界
8. AI技术的不断进步,正在重塑所有与文字相关的行业。从新闻报道到营销文案,从学术论文到法律文书,AI工具如ChatGPT、Claude、文心一言和通义千问正在成为各的得力助手。这些不仅提高了效率,还开辟了创新的可能性
9. 然而,AI的价值在于增强而非取代人类专业技能。无论行业如何,关键学会将AI智慧与洞察力相结合。未来属于那些能够巧妙运用AI,同时保持独特专业判断的人
10. 在这个AI与人类协作的新时代,我们期待看到更多创新和突破。让我们以开放和审慎的态度拥抱这一变革,共同探索AI辅助下的文字工作新范式
阅读原文

OpenAI DevDay:Realtime 实时多模态 API、缓存折扣、视觉微调,全是利好开发者的

文章概要:

1. OpenAI在DevDay上公布了五项重大创新,包括实时API、提示词缓存、模型蒸馏、视觉微调、新广场玩法,预示了其战略重心的变化,加大投入基础建设、增强其「开发者生态」。
2. OpenAI首席产品官凯文·韦尔表示,首席技术官米拉·穆拉蒂和首席研究官鲍勃·麦格鲁的离职不会影响公司的发展。
3. OpenAI指出,过去两年来,它已将开发人员访问其API的成本降低了99%。
4. OpenAI发布的Realtime API,目前处于公开测试阶段,使开发人员能够创建低延迟、多模式体验,尤其是在语音转语音应用程序中。
5. OpenAI的「提示词缓存」功能,旨在降低开发人员的成本和延迟,该系统自动对模型最近处理的输入标记应用50%的折扣。
6. OpenAI引入了「模型蒸馏」,允许开发人员使用o1-preview和GPT-4o等高级模型的输出来提高GPT-4o mini等更高效模型的性能。
7. OpenAI为其最新的大型语言模型GPT-4o引入视觉微调,允许开发人员使用图像和文本自定义模型的视觉理解能力。
8. OpenAI对提示词的结构框架以及其他用法作出了更多说明,包括「了解任务」「最小更改」「结论前推理」「推理顺序」「结论、分类或结果」。
9. OpenAI的2024 DevDay标志着该公司的战略转折点,优先考虑生态系统开发,而没有发布引人注目的新产品。
阅读原文

OpenAI DevDay发布了什么?会引发什么变化?

文章概要:

1. OpenAI举行了低调的DevDay大会,专注于现有AI工具和API的改进,重点是赋能开发者并展示社区故事。
2. 活动中公布了四项重大创新:视觉微调、实时API、模型蒸馏和提示缓存。
3. 提示缓存功能旨在为开发人员减少成本和延迟,对于频繁重用上下文的应用程序,这可能带来显著的节省。
4. 视觉微调功能允许开发人员通过图像和本来定制模型的视觉理解能力,会影响诸如自动驾驶车辆、医疗成像和视觉搜索功能等领域。
5. 实时API使开发人员能够创建低延迟、多模态体验,尤其是在语音到语音应用程序中,为跨行业语音启用应用打开了广泛的可能性。
6. 模型蒸馏的引入使开发人员能够利用高级模型的,以提高更高效模型的性能,解决了人工智能长期存在的分歧。
7. OpenAI的202 DevDay标志着公司的战略转向,优先发展生态,而不是追求吸引眼球的产品发布。
阅读原文

OpenAI在DevDay推出新的多模态处理和AI微调工具

文章概要:

1. OpenAI旧金山的DevDay产品活动上推出新的多模态处理和AI微调工具,包括实时API和视觉微调功能。
2. 实时API支持创建能够理解语音命令并大声读出其响应的AI应用程序,简化开发并减少模型延迟
3. OpenAI还为现有的Chat Completions API引入了处理语音的类似功能,适用于不需要实时API提供的低音频处理用例。
4. 视觉微调功能可提高GPT-4o在计算机视觉任务中的表现,只需100张图像即可提高性能。
5. OpenAI推出了两项旨在降低客户推理成本的功能,包括模型蒸馏和提示缓存。
6. 模型蒸馏通过知识蒸馏的AI方法实现节约,提示缓存允许公司的模型在某些情况下重复使用用户输入,从而避免重复已完成的计算。
阅读原文

苹果反水:OpenAI的1500亿“史上最大”融资轮,难了

文章概要:

1. OpenAI高层变动频繁,多位高层领导宣布辞职
2. OpenAI正在努力改变公司,成为一家面向盈利的公司
3 苹果决定不参与OpenAI最新一轮65亿美元的融资
4. OpenAI员工对公司的发展方向存在分歧
5. OpenAI的产品重点不再是纯粹的研究
6. OpenAI的内部斗争和清洗让投资者感到担忧
7. OpenAI的技术优势面临挑战
8. OpenAI的管理层曾努力挽留Ilya Sutskever,但最终失败
9. OpenAI的技术落地过程中存在安全问题
10. OpenAI的内部冲突和管理问题让员工感到沮丧
阅读原文

OpenAI公司再掀炸裂狂潮!开发者大会一些现场照片。重磅发布4大黑科技,成本狂降98%,处理量飙升50倍!

文章概要:

1. OpenAI在旧金山举行的第二届开发者大会上,发布了4大全新API功能:实时API、引入微调的视觉API、API提示缓存、以及API模型蒸馏
2. OpenAI首席执行官Sam Altman表示,API不仅能助力开发者打造功能强大、多元化的生成式AI应用,还-4GPT-4o mini模型的成本降低8%,并使得处理token数量激增至5倍
3. OpenAI此次发布的实时API允许付费开发者在其应用中构建延迟模态生成式AI功能,ChatGPT的高级语音模式
4. OpenAI在GPT-4o上首次加入了图像微调功能,开发者不仅可以使用文本数据集,通过图像微调模型,进一步增强其图像理解能力
5. OpenAI推出了API提示缓存功能,开发者通过重用输入token来减少成本和延迟
6. OpenAI此次推出了全新的模型蒸馏服务,为开发者提供从生成数据集到微调再到性能评估的一站式解决方案>7. OpenAI此次推出的四大API功能,显著提升了开发者效率与模型性能,同时大幅降低了开发成本
阅读原文

处于多事之秋的OpenAI,决定拯救开发者预算|甲子光年

文章概要:

1. OpenAI在旧金山举办DevDay,发布了视觉微调、实时API、模型蒸馏和提示缓存四项创新
2. 实时API的公开测试版能让开发者制作应用程序,并让其能够快速生成AI语音响应,还提供了六种不同的声音选项
3. 提示缓存功能用于降低开发人员的成本和延迟,自动对模型最近处理的输入标记应用50%的折扣
4. 视觉微调功能可以对图像进行微调,或将可能会改变自动驾驶汽车、医学成像和视觉搜索功能等领域
5. 实时API目前处于公开测试阶段,能让开发人员能够创建低延迟、多模式体验,尤其是在语音转语音应用程序中
6. 模型蒸馏集成的工作流程能让开发人员使用o1-preview和GPT-4o等高级模型的输出来提高GPT-4o mini等更高效模型的性能
7. OpenAI在战略上的重要转折是更加注重于生态系统的开发而非单纯追求引人注目的产品发布
阅读原文

处于多事之秋的OpenAI,决定拯救开发者预算|甲子光年

文章概要:

1. OpenAI在旧金山举办了DevDay,发布了视觉微调、实时API、模型蒸馏和提示缓存四项创新。
2. 实时API的公开测试版能让开发者制作应用程序,并让其能够快速生成AI语音响应。
3. 提示缓存功能用于降低开发人员的成本和延迟,成本的显著降低为各类企业开发以往因成本过高而难以实现新应用提供了机会。
4. 视觉微调功能或将可能会改变自动驾驶汽车、医学成像和视觉搜索功能等领域。
5. 实时API目前处于公开测试阶段,能让开发人员能够创建低延迟、多模式体验,尤其是在语音转语音应用程序中。
6. 模型蒸馏集成的工作流程能让开发人员使用o1-preview和GPT-4o等高级模型的输出来提高GPT-4o mini等更高效模型的性能。
阅读原文

成本降低98%!OpenAI开发者大会4大新功能,处理量爆增50倍!

文章概要:

1. OpenAI 召开第二届开发者大会,发布 API、视觉功能引入微调 API、API 提示缓存以及 API 模型蒸馏 4 大新功能,将模型成本降低 9%,处理 token 数量暴涨 50 倍
2. 实时 已发布公开测试版提供类似 ChatGPT 的高级语音模式,支持语音到语音对话,引入了音频输入和输出,以支持不需要实时 API 低延迟优势的用例
3. 视觉功能引入微调 API,除了文本之外,还可以通过图像进行微调,开发者可以定制模型,使其具有更强的图像理解能力
4. API 提示缓存功能允许开发者降低和延迟,通过重用最近看到的输入 token,开发者可以享受 50%的折扣和更快的提示处理>5. API 模型蒸馏服务为开发者提供一个集成的工作流程,直接在 OpenAI 平台内整个蒸馏流程
阅读原文

OpenAI开发者日:实时API、模型蒸馏、视觉微调重磅发布!

文章概要:

1. OpenAI开发者日发布了多项更新,包括ChatGPT高级语音功能、实时API、聊天补全API新增音频输入和输出功能、模型蒸馏工作流、GPT-4o视觉微调功能、Playground新功能等
2. ChatGPT高级语音功能全球上线,所有ChatGPT企业版、教育版和版用户现在都可以使用高级语音功能,普通Plus和Free用户也能尝鲜高级语音功能
3. 实时API测试版发布,开发者可以用OpenAI的API在自己的应用中构建低延迟、多模态的语音对话体验
4. 聊天补全API新增音频输入和输出功能,开发者现在可以向GPT-4o输入文本或音频,并让模型以文本音频或两者结合的方式进行回复
5. 模型蒸馏工作流上线,开发者可以直接在OpenAI平台上使用o1-preview和GPT-4o等前沿模型的输出来微调更经济高效的模型
6. GPT-4o视觉微调功能上线,开发者可以用图像和文本对GPT-4o进行微调,以提高其视觉理解能力
7. Playground新功能,快速构建原型!Playground现在可以根据你的描述自动生成提示和模式
8. OpenAI o1 API扩展访问权限和提高速率限制,o1 API现在对更多开发者开放,速率限制也提高到了与GPT-4o相同的水平
9. OpenAI还提供了一些实用工具和服务,包括与LiveKit和Agora合作创建了音频组件的客户端库,与Twilio合作,将Realtime API与Twilio的语音API集成
10. OpenAI计划为Realtime API和其他功能引入更多更新,包括更多模态、更高的速率限制、官方SDK支持、扩展模型支持、提示缓存
阅读原文

OpenAI 创始人Greg Brockman:AI真正能发光的地方在于启发性

文章概要:

1. OpenAI创始人Greg Brockman认为AI真正能发光的地方在于启发性,它更像是‘帮手’,帮助人们产生创意,为人们提供基于这些创意的想法,并且只要人们愿意,随时可以帮助人们实施这些想法。
2. ChatGPT是一款由OpenAI开发的人工智能聊天机器人,基于大型语言模型名为GPT-3。2022年11月发布后,这款软件在两个月内积累了超过1亿用户,成为历史上增长最快的软件应用。
3. ChatGPT的未来,Greg Brockman认为最重要的一件事是,绝不做任何看起来有点可疑的事情,只要不能在三天内关闭它。
4. OpenAI的联合创始人艾隆、萨姆、伊利亚和其他人都在那里。问题在于,现在是否还为时过晚来组建一家实验室,汇集一些顶尖人才?
5. OpenAI最初是一家非营利组织,因为有一个宏大的使命,但不知道如何把它具体化。
6. OpenAI最终设计了一个量身定做的结构,非常独特,有一个私人合伙公司,所有文档都是量身定制的。
7. OpenAI的激励措施与理想的结果相一致,这到底意味着什么?
8. OpenAI的模型比的更可靠,可以判断出它是正确还是错误的,但目前正在销毁这些信息,所以在一些训练过程中会这样做。
9. OpenAI的初步答案是有一个团队正在努力解决这些问题,而且那些建立在之上的开发者在不同的方式定制技术。
10. OpenAI的未来,Greg Brockman认为人工智能代表了前所未有的可能性,当然,这可能伴随着新的挑战。
阅读原文

OpenAI创始团队几乎全员退出,公司内部撕裂的真相是...

文章概要:

1. 苹果原本有意投资OpenAI,但在最后关头决定退出,OpenAI本轮融资预计高达65亿美元,估值更是要冲破1500亿美元大关,OpenAI需要在两年时间内转变为一家营利性,新一轮融资的投资者们将有权利撤回资金。
2. OpenAI从内部高层到普通员工,似乎都陷入了不安和混乱之中,其内部的主要矛盾在于OpenAI准备转型为一家营利性企业,这与公司创立时想为公众利益开发AI的非营利性目标背道而驰。
3. OpenAI年来凭借ChatGPT等产品火速,但成功的背后,也许多问题,公司为了在竞争先机,忽视了产品的安全性,尤其是在AI技术潜在风险方面做得远远不够。
阅读原文

OpenAI演讲:可预测的扩展与基础设施(PPT)

文章概要:

1. OpenAI在2024年Hot Chips大会上构建可扩展AI基础设施进行了一小时主题演讲《可预测的扩展基础设施》(Predictable Scaling and Infrastructure)。
2. ChatGPT的工作原理包括收集文本、代码、图像、音频、数学数据集,训练模型以预测下一个词元,后续训练模型,例如遵循指令、进行对话、工具。
3. OpenAI通过在产品评论上训练字符级神经网络,观察到有一个神经元编码了情感实现了最的情感分析。
4. 自2018年起,GPT-1初具雏形,GPT-连贯性,GPT-3实现上下文学习,GPT-4达到实用水平。预计将具实用性并展现新行为。
5. OpenAI通过观察发现,每当计算量翻倍结果会改善。图表显示即使计算量增加四个数量级,模型性能仍在提升。
6. MMLU基准测试旨在成为机器学习的终极标准,但由于对数进展,GPT-4已在该测试中获得约90%得分。
7. 行业前沿模型训练计算量增长图显示,自2018年起,该计算量每年约增加4倍。
8. OpenAI认为AI需要大规模投资,因为计算量增加已带来超过八个数量级的效益。
9. OpenAI强调必须为大规模部署设计,例如RAS(可靠性、可用性、可服务性)。集群规模庞大,硬件和软件故障频发。无声数据损坏可能发生,有时即使隔离GPU也无法重现。集群故障影响范围广泛。
10. OpenAI表示需降低维修成本,缩小故障影响范围,组件间相互影响。
11AI认为电力将成为主要挑战,因全球电力资源有限。GPU启停给数据中心负载管理带来挑战。
阅读原文

吃完OpenAI的瓜,我发现奥特曼塌房了。

文章概要:

1. 作为OpenAI的创始人之一,奥特曼的口碑今年以来有所下降,每逢新模型新功能发布,后续铁定要跟着各种公司内幕。br>2. OpenAI的首席技术官Mira突然离职,结果一连串的高管也跟着出走,接着又传出OpenAI要重组成营利性,公司下一轮的融资苹果还跳票了。
3. OpenAI的另外两位小,Bob McGrew和Barret Zoph也在同一天宣布离职,网友怀疑他们是因为斗不过奥特曼而集体离职。
4. OpenAI的11位创始人,现在只剩下3个人还留在公司里了。
. OpenAI正计划重组成营利性组织,这可和公司成立的初衷背道而驰
6. 为了让GPT-4o能在谷歌开发者大会之前出来,奥特曼只留了9天时间给安全团队做测试,结果GPT-4o发布的第一天,就让人给攻破了。
7. OpenAI内部的阵营大致可以分为以奥特曼为首的激进派,和以Ilya(已离职)为首的保守派。
8. 奥特曼想要建设大量的晶圆厂和全球数据中心,以后就是想实现算力的自产自销、自给自足。
阅读原文