OpenAI重金出手!从今天起,ChatGPT入口就是chat.com!
文章概要:
1. OpenAI买下了chat.com域名,了150-200万美金进入ChatGPT,只需/8个字符可以
2. chat.com在202年初,曾被Spot创始人兼CEO Dharmesh Shah以550万美金买下,两个月后,宣布了出售域名,卖出了高于当时自己支付的0万美元。
3. chat.com是网上较的之一,1996年9月注册,去年,Dharmesh Shah买下chat.com域名时,曾对外公开解释了它的意义和价值。
4. OpenAI早在202年便斥资1100万美金买下了高度象征人工智能的域名——ai.com,并在去年2月定向ChatGPT。
阅读原文
2. chat.com在202年初,曾被Spot创始人兼CEO Dharmesh Shah以550万美金买下,两个月后,宣布了出售域名,卖出了高于当时自己支付的0万美元。
3. chat.com是网上较的之一,1996年9月注册,去年,Dharmesh Shah买下chat.com域名时,曾对外公开解释了它的意义和价值。
4. OpenAI早在202年便斥资1100万美金买下了高度象征人工智能的域名——ai.com,并在去年2月定向ChatGPT。
OpenAI 以股票交易形式获得价值 1 亿元的 Chat.com 域名
文章概要:
1. OpenAI以股票交易形式获得价值1亿元的Chat.com域名,该域名目前被设置为重定向至OpenAI的产品ChatGPT。
2. Chat.com最近的是HubSpot的联合创始人兼CT Dharm,在22年以1550万美元(约1亿元)的价格购得此域名。
3. Shah在X平台上确认了Chat.com已出售给OpenAI的,并透露交易是以股票形式的
4 Chat.com是一个悠久历史的域名,注册于996年9月
5..com作为重定向至ChatGPT的,这一可能与OpenAI的战略调整相关。
6. OpenAI以股票交易形式Chat.com域名,不仅是对现有品牌的一次重要升级,也是对未来技术趋势战略性布局。
阅读原文
2. Chat.com最近的是HubSpot的联合创始人兼CT Dharm,在22年以1550万美元(约1亿元)的价格购得此域名。
3. Shah在X平台上确认了Chat.com已出售给OpenAI的,并透露交易是以股票形式的
4 Chat.com是一个悠久历史的域名,注册于996年9月
5..com作为重定向至ChatGPT的,这一可能与OpenAI的战略调整相关。
6. OpenAI以股票交易形式Chat.com域名,不仅是对现有品牌的一次重要升级,也是对未来技术趋势战略性布局。
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
文章概要:
1. 近日,一篇利用纯提示方法让普通LLM变身成为OpenAI o1的文章在推特上。
2. OpenAI o1专注于复杂的推理任务,在数学编码、科学任务中表现出色价格昂贵。
3. 作者创建了新的提示范式,结合动态思维链、反思和语言强化,让GPT-4、Claude 3.net和Llama 3.1 8B在复杂问题的推理上获得了相当大的提升。
4. 作者创建了用于基准测试评估的数据集,包含来自JEE(Joint Entrance Examination)Advanced和UPSC prelims的问题,结果表明,动态CoT、反射和语言学习技术的应用显著提高了大多数模型的性能。
5. OpenAI表示o1能够在IMO上获得83%的分数,作为对比,使用本文提示技术的Claude 3.5 Sonnet在首次测试中达到了50%,而如果多次测试就会反超o1。
6. 作者从2013到2023年的试卷中选取了28道题目,结果Llama3.1 70B、Claude Sonnet和o1 mini解决了4个问题,o1模型解决了13个问题,GPT-4o解决了9个问题。
7. 人们可以利用这种推理能力来构建强大的工作流程自动化,以解决IT、网络安全、汽车等各个领域的问题。
阅读原文
2. OpenAI o1专注于复杂的推理任务,在数学编码、科学任务中表现出色价格昂贵。
3. 作者创建了新的提示范式,结合动态思维链、反思和语言强化,让GPT-4、Claude 3.net和Llama 3.1 8B在复杂问题的推理上获得了相当大的提升。
4. 作者创建了用于基准测试评估的数据集,包含来自JEE(Joint Entrance Examination)Advanced和UPSC prelims的问题,结果表明,动态CoT、反射和语言学习技术的应用显著提高了大多数模型的性能。
5. OpenAI表示o1能够在IMO上获得83%的分数,作为对比,使用本文提示技术的Claude 3.5 Sonnet在首次测试中达到了50%,而如果多次测试就会反超o1。
6. 作者从2013到2023年的试卷中选取了28道题目,结果Llama3.1 70B、Claude Sonnet和o1 mini解决了4个问题,o1模型解决了13个问题,GPT-4o解决了9个问题。
7. 人们可以利用这种推理能力来构建强大的工作流程自动化,以解决IT、网络安全、汽车等各个领域的问题。
清北博士亲测!OpenAI新模型震撼登场,智商直逼博士水平!
文章概要:
1. OpenAI推出新模型OpenAI o1模型,被宣传为OpenAI的巅峰技术
2. 新o1在国际数学奥林匹克竞赛、编程竞赛到博士级别的科学问题等各方面都比提升了近8倍
3. o1在物理上的表现特别突出,分数92.8> 4. o1更新的主要特点是了长思维链(CoT),该模型不再是简单的问答,而是通过推导和来解答问题
5. 在一些日常问题中,思维链可能会导致AI失误,当我们测试它时,o1有时会无限循环,但一旦意识到错误,它会纠正并重新推理
阅读原文
2. 新o1在国际数学奥林匹克竞赛、编程竞赛到博士级别的科学问题等各方面都比提升了近8倍
3. o1在物理上的表现特别突出,分数92.8> 4. o1更新的主要特点是了长思维链(CoT),该模型不再是简单的问答,而是通过推导和来解答问题
5. 在一些日常问题中,思维链可能会导致AI失误,当我们测试它时,o1有时会无限循环,但一旦意识到错误,它会纠正并重新推理
OpenAI融资70亿,只剩孤家寡人?
文章概要:
1. OpenAI融资70亿,只剩孤家寡人?
2. OpenAI专注于稳步改进ChatGPT和其他产品的策略已经硕果累累。
3. 昔日OpenAI已死?<> 4. 奥特曼“算力帝国”,被台积电高管嘲笑
5. Greg怀念,马斯克出言嘲讽
6. 权斗太多、太累、给钱太少,员工纷纷流失
7. 奥特曼:OpenAI将“变得更强”
阅读原文
2. OpenAI专注于稳步改进ChatGPT和其他产品的策略已经硕果累累。
3. 昔日OpenAI已死?<> 4. 奥特曼“算力帝国”,被台积电高管嘲笑
5. Greg怀念,马斯克出言嘲讽
6. 权斗太多、太累、给钱太少,员工纷纷流失
7. 奥特曼:OpenAI将“变得更强”
Chat.com归于OpenAI,再次搅动互联网风云!
文章概要:
1. OpenAI的山姆·推文,内容只有一个字——“chat.com该域名被设置跳转到ChatGPT网站,AI拿下了chat.com这个霸气的域名
2. 回顾chat.com域名的龙脉,从196注册,经历多次高价易,20年3月HubSpot创始人Dharmesh Shah豪掷了1550万美元其收入囊中,外界估摸着这次OpenAI收购价在1500万到0万美元之间
3 OpenAI早就暗中布局,202年它花1100万美元了AI.com,2023年2月OpenAI还把AIChatGPT还是.com都能直接来到GPT,提升了用户便捷性,巩固了形象> 4.GPT自上线,凭借其的AI对话能力,已经赢得了大量用户青睐,这样的域名不单单是为了用户懒得打复杂网址的,更是打好品牌战
6. OpenAI不仅买了,更是整合了,做到每个细节都尽善尽美,这不仅是手法实力的一种
7. 回顾整个域名手事件,从Dharmesh拥有Chat.com到OpenAI接手,是一场互联网品牌和商业战略的高端对决,AI不仅提升了品牌影响力还为用户提供了更加便捷的服务入口
阅读原文
2. 回顾chat.com域名的龙脉,从196注册,经历多次高价易,20年3月HubSpot创始人Dharmesh Shah豪掷了1550万美元其收入囊中,外界估摸着这次OpenAI收购价在1500万到0万美元之间
3 OpenAI早就暗中布局,202年它花1100万美元了AI.com,2023年2月OpenAI还把AIChatGPT还是.com都能直接来到GPT,提升了用户便捷性,巩固了形象> 4.GPT自上线,凭借其的AI对话能力,已经赢得了大量用户青睐,这样的域名不单单是为了用户懒得打复杂网址的,更是打好品牌战
6. OpenAI不仅买了,更是整合了,做到每个细节都尽善尽美,这不仅是手法实力的一种
7. 回顾整个域名手事件,从Dharmesh拥有Chat.com到OpenAI接手,是一场互联网品牌和商业战略的高端对决,AI不仅提升了品牌影响力还为用户提供了更加便捷的服务入口
OpenAI新动作:GPT Search能否颠覆谷歌?
文章概要:
1. OpenAI推出新搜索引擎ChatGPT Search,是SearchGPT原型的进化版。<> 2. ChatGPT基于GPT-4o模型,能提供及时答案,用户可提出后续问题搜索。
3. 其用户界面简洁直观,包含内联和侧边栏对新闻发布者和其他数据源的归属。
4. ChatGPT Plus和团队用户将首先在移动设备上获得访问权限,企业和教育客户随后,免费用户最后。
5. OpenAI计划继续改进搜索,特别是在购物和旅行等领域,并利用其“推理“更深入的研究”。
6. 一些出版商抗议AI生成概览会蚕食它们网站的流量,OpenAI表示已纳入反馈。
阅读原文
3. 其用户界面简洁直观,包含内联和侧边栏对新闻发布者和其他数据源的归属。
4. ChatGPT Plus和团队用户将首先在移动设备上获得访问权限,企业和教育客户随后,免费用户最后。
5. OpenAI计划继续改进搜索,特别是在购物和旅行等领域,并利用其“推理“更深入的研究”。
6. 一些出版商抗议AI生成概览会蚕食它们网站的流量,OpenAI表示已纳入反馈。
研究实锤:别让大模型「想」太多,OpenAI o1准确率竟下降36.3%
文章概要:
1. 思维链(CoT)已被证明可以在许多任务上显著提升大模型的性能,但在某些情况下会降低大模型的性能,普林斯顿大学和的研究团队对此进行了研究
2. 研究团队提出可以参照思考对人类“性能”产生负面影响的情况,假定思考会对模型产生负面影响的环境,并从心理学中选择了6项任务类型探讨CoT对LLM性能的影响
3. 研究方法框架基于言语思考或深思熟会损害人类“性能”的情况和将制约人类“性能”的因素推广到语言模型的情况两个关键条件
4. 实验结果表明,CoT在隐性统计学习、面部识别、含例外模式的数据分类三种情况下会使各种SOTA模型的性能明显下降,在解释逻辑不一致、空间直觉、特征聚合决策三种情况下对模型性能无影响
阅读原文
2. 研究团队提出可以参照思考对人类“性能”产生负面影响的情况,假定思考会对模型产生负面影响的环境,并从心理学中选择了6项任务类型探讨CoT对LLM性能的影响
3. 研究方法框架基于言语思考或深思熟会损害人类“性能”的情况和将制约人类“性能”的因素推广到语言模型的情况两个关键条件
4. 实验结果表明,CoT在隐性统计学习、面部识别、含例外模式的数据分类三种情况下会使各种SOTA模型的性能明显下降,在解释逻辑不一致、空间直觉、特征聚合决策三种情况下对模型性能无影响
阅读原文
“Chat 才是 AGI 的灵魂!” OpenAI 斥资超 1500+ 万美元股份收购 chat.com 顶级域名
文章概要:
1. OpenAI斥资超1500万美元股份收购chat.com顶级域名。
2. 2022年,Dharmesh Shah以1550万美元收购chat.com域名,他看好基于对话的用户界面会成为软件发展的下一个重要方向。
3. 在持有chat.com数月后,Shah决定出售这个域名选择了部分股权支付的方式。
4. OpenAI收购chat.com是一步意义重大.com,连输入ai.com也会跳转到chatgpt.com。
5. Shah开发的AI工具Chat.ai虽然也使用了“chat”这个关键词,但他表示并没有计划将其更名为chat.com。
阅读原文
2. 2022年,Dharmesh Shah以1550万美元收购chat.com域名,他看好基于对话的用户界面会成为软件发展的下一个重要方向。
3. 在持有chat.com数月后,Shah决定出售这个域名选择了部分股权支付的方式。
4. OpenAI收购chat.com是一步意义重大.com,连输入ai.com也会跳转到chatgpt.com。
5. Shah开发的AI工具Chat.ai虽然也使用了“chat”这个关键词,但他表示并没有计划将其更名为chat.com。
OpenAI 推出了 Canvas 和 SearchGPT
文章概要:
1. ChatGPT推出了Canvas和撰写和书写代码的体验,SearchGPT可以访问实时网络数据。
2. Canvas的杀手级功能是使用它来编辑代码或文档中特定的部分,还可以直接在Canvas中手动编辑内容。
3. 使用Canvas进行写作是一项巨大的生产力进步,可以在Canvas中自行进行较小的调整和句子结构的更改,而无需将它们复制粘贴回左侧的聊天栏。
4. SearchGPT可以访问实时网络数据,与Perplexity的运行机制类似,它使用大语言模型来搜索网络,为您提供实时的回答,同时也会提供回答所引述的来源。
5. 使用SearchGPT有两种方式,一种是使用ChatGPT的Web版客户端访问,另一种是使用Chrome的ChatGPT Search插件。
阅读原文
2. Canvas的杀手级功能是使用它来编辑代码或文档中特定的部分,还可以直接在Canvas中手动编辑内容。
3. 使用Canvas进行写作是一项巨大的生产力进步,可以在Canvas中自行进行较小的调整和句子结构的更改,而无需将它们复制粘贴回左侧的聊天栏。
4. SearchGPT可以访问实时网络数据,与Perplexity的运行机制类似,它使用大语言模型来搜索网络,为您提供实时的回答,同时也会提供回答所引述的来源。
5. 使用SearchGPT有两种方式,一种是使用ChatGPT的Web版客户端访问,另一种是使用Chrome的ChatGPT Search插件。
小鹏汽车发布AI机器人;OpenAI推出「预测输出」功能,GPT-4o速度提升约5倍
文章概要:
1. 小鹏AI机器人Iron发布,仿人结构设计,身高178cm,体重70kg,62个自由度,大脑」采用图灵AI芯片,能够像人一样思考记忆,同时也让手脚自主活动,双手采用1:1人类双手尺寸,有15个双手自由度。
2. OpenAI推出「预测输出」将GPT-4o速度提升约5,通过参考字符串来加快处理速度,使GPT-4o更适合用于实时任务。<>3. 字节推出单图视频驱动模型X-Portrait 2,该模型不仅能保留原图的ID,还能捕捉并迁移从细微到夸张的表情和情绪了现有动作捕捉、角色和。br>4. Instagram将借助AI技术识别青少年谎报年龄行为,朋友祝贺生日的帖子也能推测真实年龄。
5. 英伟达发布视觉AI Agent,能用AI总结真实世界,AI Blueprint主要用于开发视觉AI Agent,几乎任何行业都开发出用于分析视频、图像的AI Agent来提升工作、监控效率等。br>6. 三星计划通过自研知识图谱技术,提升Galaxy AI个性化体验,同时确保用户数据的安全
7. 达摩院发布八观气象大模型,精度达1小时1公里,率先落地新能源,通过大幅提升对温度、辐照、风速等气象指标的预测性能观气象大模型率先落地新能源占比高的新型电力系统。
8. Bossjob上线AI智能招聘助手产品「AI简历分析」是东南亚招聘市场预训练大模型实现广泛的招聘场景产品
9. 沙特酝酿一个1000亿美元的AI项目,将与阿联酋的科技中心竞争,「Project Transcendence」沙特政府支持,会把钱重点投资在数据中心、初创企业,还有一些可以让AI发展的上。
阅读原文
2. OpenAI推出「预测输出」将GPT-4o速度提升约5,通过参考字符串来加快处理速度,使GPT-4o更适合用于实时任务。<>3. 字节推出单图视频驱动模型X-Portrait 2,该模型不仅能保留原图的ID,还能捕捉并迁移从细微到夸张的表情和情绪了现有动作捕捉、角色和。br>4. Instagram将借助AI技术识别青少年谎报年龄行为,朋友祝贺生日的帖子也能推测真实年龄。
5. 英伟达发布视觉AI Agent,能用AI总结真实世界,AI Blueprint主要用于开发视觉AI Agent,几乎任何行业都开发出用于分析视频、图像的AI Agent来提升工作、监控效率等。br>6. 三星计划通过自研知识图谱技术,提升Galaxy AI个性化体验,同时确保用户数据的安全
7. 达摩院发布八观气象大模型,精度达1小时1公里,率先落地新能源,通过大幅提升对温度、辐照、风速等气象指标的预测性能观气象大模型率先落地新能源占比高的新型电力系统。
8. Bossjob上线AI智能招聘助手产品「AI简历分析」是东南亚招聘市场预训练大模型实现广泛的招聘场景产品
9. 沙特酝酿一个1000亿美元的AI项目,将与阿联酋的科技中心竞争,「Project Transcendence」沙特政府支持,会把钱重点投资在数据中心、初创企业,还有一些可以让AI发展的上。
OpenAI豪掷1500万美元拿下Chat.com!
文章概要:
1AI万美元域名交易Open Altman 和 HubSpot联合创始人 Shah,是超过十年的
2. Chat.com被OpenAI收入囊中,是因为这个域名战略意义、品牌重塑和未来趋势等方面的 3.man前Twitter一条推文揭露了交易细节,买家正是OpenAI
4.PT4o功能有:文本对话、实时联网查询、AI绘画、文档分析、图像分析。
阅读原文
2. Chat.com被OpenAI收入囊中,是因为这个域名战略意义、品牌重塑和未来趋势等方面的 3.man前Twitter一条推文揭露了交易细节,买家正是OpenAI
4.PT4o功能有:文本对话、实时联网查询、AI绘画、文档分析、图像分析。
OpenAI 收购 chat.com,AI 访问再添新路径
文章概要:
1. OpenAI收购chat.com,目前访问chat.com已开始定向至OpenAI的AI聊天ChatGPT。
2. chat.com是互联网早期的之一,于1996年。去年,HubSpot联合创始人兼CTO Dharm以1550万美元价格购得chat.com
4. 文章还提到了关于域名销售价格的,以及ChatGPT目前拥有多个访问入口。
5. 文章介绍了重定向的概念和常见应用场景,以及实现URL重定向的方式。
阅读原文
2. chat.com是互联网早期的之一,于1996年。去年,HubSpot联合创始人兼CTO Dharm以1550万美元价格购得chat.com
4. 文章还提到了关于域名销售价格的,以及ChatGPT目前拥有多个访问入口。
5. 文章介绍了重定向的概念和常见应用场景,以及实现URL重定向的方式。
“Chat 才是 AGI 的灵魂!” OpenAI 斥资超 1500+ 万美元股份收购 chat.com 顶级域名
文章概要:
1. OpenAI斥资超150万美元股份收购chat.com顶级域名,首席执行官Sam Altman在社交媒体平台X上发布推文,该域名直接跳转到ChatGPT官方网站。
2. 唯一的线索是HubSpot联合创始人CTO、连续创业者Dharmesh Shah在社交媒体发布的内容,用一段GPT提示词讲述了。
3. 2022年,Dharmesh Shah以1550万美元的天价收购了chat.com域名,他看好基于对话的用户界面会成为的下一个重要方向。
4. 在最初收购chat.com后,Shah还承诺将部分收益捐赠给可汗学院,这是一家致力于为全球提供免费教育非营利组织
5. 在持有chat.com仅仅数月之后,Shah就决定出售这个域名,他选择部分股权的方式。
. 对于OpenAI来说收购chat.com是一步意义重大的棋子,很多人吐槽Sam Altman是乱花钱,但其实一直都有人吐槽ChatGPT这个词既不好打,又不好念。
7. 如今,不仅是chat.com,连输入ai.com也会跳转到gpt.com。
8. Shah开发的AI工具ChatSpot.ai虽然也使用了“chat”这个关键词,但他表示并没有计划将其更名为.com。
9. 在这桩域名交易的深层意义上,或许还透露出Sam Altman对AI发展。
阅读原文
2. 唯一的线索是HubSpot联合创始人CTO、连续创业者Dharmesh Shah在社交媒体发布的内容,用一段GPT提示词讲述了。
3. 2022年,Dharmesh Shah以1550万美元的天价收购了chat.com域名,他看好基于对话的用户界面会成为的下一个重要方向。
4. 在最初收购chat.com后,Shah还承诺将部分收益捐赠给可汗学院,这是一家致力于为全球提供免费教育非营利组织
5. 在持有chat.com仅仅数月之后,Shah就决定出售这个域名,他选择部分股权的方式。
. 对于OpenAI来说收购chat.com是一步意义重大的棋子,很多人吐槽Sam Altman是乱花钱,但其实一直都有人吐槽ChatGPT这个词既不好打,又不好念。
7. 如今,不仅是chat.com,连输入ai.com也会跳转到gpt.com。
8. Shah开发的AI工具ChatSpot.ai虽然也使用了“chat”这个关键词,但他表示并没有计划将其更名为.com。
9. 在这桩域名交易的深层意义上,或许还透露出Sam Altman对AI发展。
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
文章概要:
1. OpenAI声称,推理让模型更好的遵守安全政策,提升模型安全的新路径,,上海交大和上海人工智能实验室论文提出了质疑>2. 这篇题为《Derail Yourself: Multi-turn LLM Attack through Self-discovered Clues》的揭示了AI大模型在多轮对话场景下安全,并开源了第一个多轮安全对齐数据集
3 研究人员了多轮算法ActorAttack,Harmbench上对o1的成功率达到了60%,推理能力带来的安全提升在多轮攻击面前「失效」了
4. ActorAttack的核心思想是受拉图尔的「行动者-网络理论」启发的,人员通过将有害意图隐藏在对网络节点的「无害」询问中逐渐诱导模型越狱
5. ActorAttack实现了高效和多样攻击,相比于单次攻击,它可以从不同的路径找到更优路径,生成更高质量的攻击
6. 为了缓解AI大模型在多轮对话场景下的安全风险,研究人员基于ActorAttack构造了第一个多轮对话安全对齐数据集
7. 研究人员基于ActorAttack,构造出了高质量的多轮对话安全对齐数据,提升了AI模型应对多轮的鲁棒为提升人机交互的安全可信迈出了坚实的一步
阅读原文
3 研究人员了多轮算法ActorAttack,Harmbench上对o1的成功率达到了60%,推理能力带来的安全提升在多轮攻击面前「失效」了
4. ActorAttack的核心思想是受拉图尔的「行动者-网络理论」启发的,人员通过将有害意图隐藏在对网络节点的「无害」询问中逐渐诱导模型越狱
5. ActorAttack实现了高效和多样攻击,相比于单次攻击,它可以从不同的路径找到更优路径,生成更高质量的攻击
6. 为了缓解AI大模型在多轮对话场景下的安全风险,研究人员基于ActorAttack构造了第一个多轮对话安全对齐数据集
7. 研究人员基于ActorAttack,构造出了高质量的多轮对话安全对齐数据,提升了AI模型应对多轮的鲁棒为提升人机交互的安全可信迈出了坚实的一步
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
文章概要:
1. 以OpenAI o1为代表的AI大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI声称,推理可以模型更好的安全政策,是提升模型安全的新路径。然而,能力的提升真的能解决问题吗?能力越强,模型的安全性会越好吗,上海交大和上海人工智能实验室的一篇论文提出了质疑。
2. 这篇题为《ail Yourself: Multi-turn LLM Attack through Self-discovered Clues》论文揭示了AI大模型在多轮对话场景下的风险,并开源了第一个多轮对齐数据集。
3. 为了且高效地挖掘这些攻击线索,研究人员设计了多轮攻击算法ActorAttack。受拉图尔的行动者网络理论启发,研究人员构建了一个概念网络,每个节点代表了不同类别的攻击线索。研究进一步提出利用大模型的先验知识来初始化网络,自动化地发现攻击线索。在危险问题评测集Harmbench上的实验结果表明,ActorAttack在LClaude、等大模型上都取得了0%左右攻击。
4. 最后,研究人员基于ActorAttack开源了第一个多轮对话对齐数据集。使用多轮对话数据集微调的AI,极大提升了其应对多轮攻击的鲁棒性。
阅读原文
2. 这篇题为《ail Yourself: Multi-turn LLM Attack through Self-discovered Clues》论文揭示了AI大模型在多轮对话场景下的风险,并开源了第一个多轮对齐数据集。
3. 为了且高效地挖掘这些攻击线索,研究人员设计了多轮攻击算法ActorAttack。受拉图尔的行动者网络理论启发,研究人员构建了一个概念网络,每个节点代表了不同类别的攻击线索。研究进一步提出利用大模型的先验知识来初始化网络,自动化地发现攻击线索。在危险问题评测集Harmbench上的实验结果表明,ActorAttack在LClaude、等大模型上都取得了0%左右攻击。
4. 最后,研究人员基于ActorAttack开源了第一个多轮对话对齐数据集。使用多轮对话数据集微调的AI,极大提升了其应对多轮攻击的鲁棒性。
OpenAI答网友问!萨姆奥特曼终于解释了伊利亚看到什么,还顺便透露了其2025年工作重点
文章概要:
1. OpenAI CEO萨姆·奥特曼(Sam Altman)最近在Reddit上进行了一次AMA(Ask Me Anything,问我任何事),其中,有10个重要的问题透露了OpenAI在2025年的计划
2. 通用人工智能(AGI)是否能够用已知的硬件实现,目前还没有一个确定的答案,这仍然是一个活跃的研究和讨论领域
3. 完整的o1模型确实比预览版有所改进
4. OpenAI的首席产品官表示不会只选择其中一个方向,而是会采取两者兼顾的策略
5. OpenAI的研究首席产品官正在努力减少模型中的幻觉现象
7. 伊利亚看到的是一个超越了当前未来的视野
8. 由于大多数人可能不会像最初预期的那样频繁使用它,因此他们认为这项功能的回报并不高
9. 看起来下一个更新将值得等待,但我们还没有发布计划
10. OpenAI首席产品官表示正在努力解决这个问题
阅读原文
2. 通用人工智能(AGI)是否能够用已知的硬件实现,目前还没有一个确定的答案,这仍然是一个活跃的研究和讨论领域
3. 完整的o1模型确实比预览版有所改进
4. OpenAI的首席产品官表示不会只选择其中一个方向,而是会采取两者兼顾的策略
5. OpenAI的研究首席产品官正在努力减少模型中的幻觉现象
7. 伊利亚看到的是一个超越了当前未来的视野
8. 由于大多数人可能不会像最初预期的那样频繁使用它,因此他们认为这项功能的回报并不高
9. 看起来下一个更新将值得等待,但我们还没有发布计划
10. OpenAI首席产品官表示正在努力解决这个问题
OpenAI买了一个域名,花了1000万美金?
文章概要:
1. OpenAI购买了一个价值1500万美元的域名chat.com,该域名最早注册于996年9月,此前曾被HubSpot联合创始人兼首席技术官Dharmesh以150万美元收购。
2. Shah在转售域名之前chat.com曾地重定向他的LinkedIn页面。除了chat.com之外,.com也自动跳转到ChatGPT。
3 Shah在去年3月宣布,他已经将.com出售给了一位未透露的买家。今天稍晚在平台上的一条帖子中确认,OpenAI就是这位买家,暗示他通过OpenAI的股票支付的款项。
4. OpenAI近期的品牌重塑方向是去掉“”,而chat.com域名与这一方向一致。
阅读原文
2. Shah在转售域名之前chat.com曾地重定向他的LinkedIn页面。除了chat.com之外,.com也自动跳转到ChatGPT。
3 Shah在去年3月宣布,他已经将.com出售给了一位未透露的买家。今天稍晚在平台上的一条帖子中确认,OpenAI就是这位买家,暗示他通过OpenAI的股票支付的款项。
4. OpenAI近期的品牌重塑方向是去掉“”,而chat.com域名与这一方向一致。
OpenAI距离谷歌还有很大差距?谷歌在 AI 搜索大战中占据领先地位
文章概要:
1. 尽管ChatGPT的出现曾让人担忧搜索引擎的未来,但谷歌用实力证明了自己依旧是霸主,最新的财报显示,不仅成功地将生成式AI技术融入到搜索引擎中,而且其搜索业务依旧强劲,市场地位稳固
2. 苹果的野心:Apple Intelligence携全新Siri AI助手强势登场,并计划整合ChatGPT,为iPhone用户提供新的搜索方式
3. Meta的扩张:Meta高管表示,他们正在扩展自家AI助手Meta AI的网络搜索功能
4. OpenAI的突袭:最的挑战来自OpenAI,他们开始搜索功能整合到ChatGPT中,用户可以直接在聊天过程中获取最新的新闻资讯和相关链接> 5. 谷歌目前采取了双管齐的策略:一方面,它将AI Overviews(由AI生成网页摘要)添加到搜索引擎,并将其扩展到100多个国家和地区,10用户;另一方面,它推出了的聊天机器人Gemini
6. 谷歌在搜索领域的海量数据也是其在AI时代的重要优势
7. 用户习惯的改变也需要时间,谷歌作为主流通用搜索引擎的地位目前看来依然。但随着搜索功能扩展到新一代的AI聊天机器人、助手和代理,谷歌需要更加积极地应对挑战,才能保持其在领域领先地位
阅读原文
2. 苹果的野心:Apple Intelligence携全新Siri AI助手强势登场,并计划整合ChatGPT,为iPhone用户提供新的搜索方式
3. Meta的扩张:Meta高管表示,他们正在扩展自家AI助手Meta AI的网络搜索功能
4. OpenAI的突袭:最的挑战来自OpenAI,他们开始搜索功能整合到ChatGPT中,用户可以直接在聊天过程中获取最新的新闻资讯和相关链接> 5. 谷歌目前采取了双管齐的策略:一方面,它将AI Overviews(由AI生成网页摘要)添加到搜索引擎,并将其扩展到100多个国家和地区,10用户;另一方面,它推出了的聊天机器人Gemini
6. 谷歌在搜索领域的海量数据也是其在AI时代的重要优势
7. 用户习惯的改变也需要时间,谷歌作为主流通用搜索引擎的地位目前看来依然。但随着搜索功能扩展到新一代的AI聊天机器人、助手和代理,谷歌需要更加积极地应对挑战,才能保持其在领域领先地位
OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品
文章概要:
1. 奥特曼在OpenAI伦敦开发者日上的最新采访释出,内容涉及OpenAI未来模型发展方向、Agent、Scaling Law等问题。
2. 奥特曼表示,OpenAI将对o1进行多模态改进,预计基于图像的模型将迅猛发展。
3. 奥特曼认为,模型是贬值的资产,但这并不意味着它们不值训练投入的成本。
4. 奥特曼表示,OpenAI将在核心推理方面取得突破,除了Transformer之外,还需要开始推动强化学习作为一种途径或其他新技术。
5. 奥特曼认为,人才是被浪费的,因为这个世界不擅长建立这样的组织。
6. 奥特曼表示,OpenAI将在未来两年内开始制造系统,帮助科学进步。
阅读原文
2. 奥特曼表示,OpenAI将对o1进行多模态改进,预计基于图像的模型将迅猛发展。
3. 奥特曼认为,模型是贬值的资产,但这并不意味着它们不值训练投入的成本。
4. 奥特曼表示,OpenAI将在核心推理方面取得突破,除了Transformer之外,还需要开始推动强化学习作为一种途径或其他新技术。
5. 奥特曼认为,人才是被浪费的,因为这个世界不擅长建立这样的组织。
6. 奥特曼表示,OpenAI将在未来两年内开始制造系统,帮助科学进步。
「Sparks of AGI」作者加入OpenAI,或将推进端侧AGI?
文章概要:
1. OpenAI动作频频,推出SearchGPT,挖来微软AI大牛Sébastien Bubeck
2. Bubeck发表的「Sparks of AGI」论文是AI领域的里程碑之作,他还是微软Phi系列小型语言模型的主要开发者之一
3. OpenAI与著名设计师Jony Ive合作,致力于开发一款AI驱动的硬件设备
4. 小型语言模型可能成为通向AGI的重要途径,边缘计算的重要性隐私和实时性、定制化和个性化、能耗成本效益等都是其优势
5. OpenAI并非唯一看好小型语言模型的公司,整个AI行业都在这个方向上发力
6. Bubeck的或将为OpenAI新的和方向,我们可以期待更高效的边缘AI解决方案、OpenAI硬件项目的发展、小型语言模型与大型模型的协同创新
阅读原文
2. Bubeck发表的「Sparks of AGI」论文是AI领域的里程碑之作,他还是微软Phi系列小型语言模型的主要开发者之一
3. OpenAI与著名设计师Jony Ive合作,致力于开发一款AI驱动的硬件设备
4. 小型语言模型可能成为通向AGI的重要途径,边缘计算的重要性隐私和实时性、定制化和个性化、能耗成本效益等都是其优势
5. OpenAI并非唯一看好小型语言模型的公司,整个AI行业都在这个方向上发力
6. Bubeck的或将为OpenAI新的和方向,我们可以期待更高效的边缘AI解决方案、OpenAI硬件项目的发展、小型语言模型与大型模型的协同创新
什么原因?OpenAI o1准确率竟下降36.3%!
文章概要:
1. 普林斯顿大学和纽约大学的研究团队发现,思维链(CoT)在某些情况下会降低大模型的性能,这为优化LLM的提示策略提供了新思路。
2. 研究团队从心理学中选择了6项已被充分研究的任务类型来探讨CoT对LLM性能的影响,并验证了CoT在一些任务中甚至可能导致模型准确率下降。
3. 研究方法基于两个关键条件:言语思考或深思熟虑会损害人类“性能”的情况,以及将制约人类“性能”的因素推广到语言模型的情况。
4. 实验结果表明,CoT在隐性统计学习、面部识别、含例外模式的数据分类三种情况下,各种SOTA模型的性能都会明显下降。
5. 研究团队表示,未来还需要更多的跨学科合作,通过将自然语言处理方法、心理学见解与人类和模型表现比较的相关研究相结合,可以形成更全面的AI评估和改进策略。
阅读原文
2. 研究团队从心理学中选择了6项已被充分研究的任务类型来探讨CoT对LLM性能的影响,并验证了CoT在一些任务中甚至可能导致模型准确率下降。
3. 研究方法基于两个关键条件:言语思考或深思熟虑会损害人类“性能”的情况,以及将制约人类“性能”的因素推广到语言模型的情况。
4. 实验结果表明,CoT在隐性统计学习、面部识别、含例外模式的数据分类三种情况下,各种SOTA模型的性能都会明显下降。
5. 研究团队表示,未来还需要更多的跨学科合作,通过将自然语言处理方法、心理学见解与人类和模型表现比较的相关研究相结合,可以形成更全面的AI评估和改进策略。
OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品
文章概要:
1. 奥特曼在OpenAI伦敦开发者日上接受采访,分享了OpenAI未来模型发展方向、Agent、Scaling Law、半导体供应链、基础模型竞争成本、该雇佣什么年龄段的员工等问题的看法
2. 奥特曼表示,OpenAI将尽最大努力让推出的模型变得越来越好,希望提供真正高质量的无代码工具,创造出数万亿美元的市值
3. 奥特曼认为,开源模型在生态中非常重要,提供良好的服务和API也是有意义的,Agent可以做一些人类不会或不能做的事,模型确实是贬值的资产,但这并不意味着它们不值训练投入的成本
4. 奥特曼表示,推理是OpenAI当前最重要的关注领域,将在各个方面改进模型,进行多模态工作,并添加其他功能
5. 奥特曼认为,世界上有很多有才的人因为他们在糟糕的公司工作,或者一些其它原因吧,没办法充分发挥他们的潜力
6. 奥特曼表示,自己在领导方式上最不同寻常的就是事情变化的速度,在一家常规的公司,你有充足的时间去实现从0到1亿美元的营收,再从1亿到10亿,一直到100亿。你无需在两年内达成这个过程。我们确实并非传统意义上的硅谷初创公司,我们不得不如此迅速地达成这一目标,有很多东西我本该花费更多时间去学习(但没有去学习)
7. 奥特曼表示,自己对AI最兴奋的一个点,就是希望它能让我们更好地帮助每个人来发挥最大潜力
8. 奥特曼表示,自己对半导体供应链的担忧在所有担忧的前10%之内,在某种程度上,这一切都会顺利进行,但现在感觉有一个非常复杂的系统,每个层面都各自运作
9. 奥特曼表示,在基础模型领域竞争的成本将不到1000亿美元,人们常用来类比AI的例子特别糟糕,显而易见的,互联网和AI非常不同
10. 奥特曼表示,自己尊敬目前这个领域的每个人,整个领域充满了才华横溢、非常努力的人
11. 奥特曼表示,自己最喜欢的OpenAI API是新的实时API,非常棒,我们现在有一个庞大的API业务,里面有很多好东西
12. 奥特曼表示,自己最希望改进的领导力领域是产品策略,自己对我们产品策略的细节比过去还要不确定
13. 奥特曼表示,如果OpenAI是对的,我们可以轻松地在接下来两年内开始制造,帮助科学进步。五年后,OpenAI的技术进步速度会快到令人难以置信,完全可以用疯狂来描述
阅读原文
2. 奥特曼表示,OpenAI将尽最大努力让推出的模型变得越来越好,希望提供真正高质量的无代码工具,创造出数万亿美元的市值
3. 奥特曼认为,开源模型在生态中非常重要,提供良好的服务和API也是有意义的,Agent可以做一些人类不会或不能做的事,模型确实是贬值的资产,但这并不意味着它们不值训练投入的成本
4. 奥特曼表示,推理是OpenAI当前最重要的关注领域,将在各个方面改进模型,进行多模态工作,并添加其他功能
5. 奥特曼认为,世界上有很多有才的人因为他们在糟糕的公司工作,或者一些其它原因吧,没办法充分发挥他们的潜力
6. 奥特曼表示,自己在领导方式上最不同寻常的就是事情变化的速度,在一家常规的公司,你有充足的时间去实现从0到1亿美元的营收,再从1亿到10亿,一直到100亿。你无需在两年内达成这个过程。我们确实并非传统意义上的硅谷初创公司,我们不得不如此迅速地达成这一目标,有很多东西我本该花费更多时间去学习(但没有去学习)
7. 奥特曼表示,自己对AI最兴奋的一个点,就是希望它能让我们更好地帮助每个人来发挥最大潜力
8. 奥特曼表示,自己对半导体供应链的担忧在所有担忧的前10%之内,在某种程度上,这一切都会顺利进行,但现在感觉有一个非常复杂的系统,每个层面都各自运作
9. 奥特曼表示,在基础模型领域竞争的成本将不到1000亿美元,人们常用来类比AI的例子特别糟糕,显而易见的,互联网和AI非常不同
10. 奥特曼表示,自己尊敬目前这个领域的每个人,整个领域充满了才华横溢、非常努力的人
11. 奥特曼表示,自己最喜欢的OpenAI API是新的实时API,非常棒,我们现在有一个庞大的API业务,里面有很多好东西
12. 奥特曼表示,自己最希望改进的领导力领域是产品策略,自己对我们产品策略的细节比过去还要不确定
13. 奥特曼表示,如果OpenAI是对的,我们可以轻松地在接下来两年内开始制造,帮助科学进步。五年后,OpenAI的技术进步速度会快到令人难以置信,完全可以用疯狂来描述
总统大选落幕,五大模型即将发布!
文章概要:
1. 2024年11月07日大选落幕,五大AI巨头即将发布新产品;
2. OpenAI可能会本月带来两大重磅产品:完整版o1SORA;
3.正在为Llama 4准备史无前例的训练资源;
4. 马斯克放出豪言:Grok 3将在12月发布;
5. 法国AI新秀Mistral AI计划推出两个前沿级别的模型;
6. Google显然也在酝酿某些新动作;
7. 本文同步自知识星球《AGI Hunt》;
8. 星球实时采集和监控推特、油管、discord、电报等平台的热点AI内容,并基于数个资讯处理的AI agent挑选、审核、翻译、总结到星球中;
9. 星球非免费,定价99元/年,.27元。
阅读原文
2. OpenAI可能会本月带来两大重磅产品:完整版o1SORA;
3.正在为Llama 4准备史无前例的训练资源;
4. 马斯克放出豪言:Grok 3将在12月发布;
5. 法国AI新秀Mistral AI计划推出两个前沿级别的模型;
6. Google显然也在酝酿某些新动作;
7. 本文同步自知识星球《AGI Hunt》;
8. 星球实时采集和监控推特、油管、discord、电报等平台的热点AI内容,并基于数个资讯处理的AI agent挑选、审核、翻译、总结到星球中;
9. 星球非免费,定价99元/年,.27元。
研究实锤:别让大模型「想」太多,OpenAI o1准确率竟下降36.3%
文章概要:
1. 思维链(CoT)能提升大模型性能,但在某些情况下会降低性能。
2. 普林斯顿大学和纽约大学的研究团队,参照思考对“人类性能”的影响,提出了新的见解。
3. 研究团队从心理学中选择了6项任务类型探讨CoT对LLM性能的影响,并验证了CoT在一些任务中甚至可能导致模型准确率下降。
5. 实验结果表明,CoT在隐性统计学习、面部识别、含例外模式的数据分类三种情况下,各种SOTA模型的性能都会明显下降。
6. 研究存在一些局限性,如inference-time推理的类型、应用范围、关于CoT未能复制人类结果的替代解释。
阅读原文
2. 普林斯顿大学和纽约大学的研究团队,参照思考对“人类性能”的影响,提出了新的见解。
3. 研究团队从心理学中选择了6项任务类型探讨CoT对LLM性能的影响,并验证了CoT在一些任务中甚至可能导致模型准确率下降。
5. 实验结果表明,CoT在隐性统计学习、面部识别、含例外模式的数据分类三种情况下,各种SOTA模型的性能都会明显下降。
6. 研究存在一些局限性,如inference-time推理的类型、应用范围、关于CoT未能复制人类结果的替代解释。