这是 GPT-4 发布后,AI 圈最疯狂的一周

APPSO
发布于:2024-05-19
文章内容来源于公众号:APPSO,点此可查看原文,内容版权归相关企业所有,本网站仅供交流学习。若涉及版权问题或存在侵权情况,请及时与我们联系,我们将第一时间进行删除处理。
摘要:AI 一小步,人类一大步。
![]()
虽然过去一年应接不暇的 AI 产品,已经不断提高我们对新技术兴奋的阈值,但这周的 AI 界依然疯狂。GPT-4o 让 AI 与人类的对话水平像科幻电影一样、Google 发布「AI 超级全家桶」、字节跳动豆包大模型祭出「白菜价」,「app 工厂」要以抖音的方式席卷 AI 市场。这一周,我们目睹了 AI 加速走向落地应用,也隐约窥见通用人工智能(AGI)的轮廓。首席科学家 Ilya Sutskever 的离职靴子落地,牵扯出 OpenAI 内部更大的矛盾。「超级对齐」团队的解散,离职协议的曝光,都说明去年的宫斗并没有随 Sam Altman 回归而剧终。
Sam Altman 曾表示,从 OpenAI 成立到创造出 AGI,中间注定会有一连串疯狂爆炸的事情发生,当中也被包括了对管理权的争夺,而且未来也许还会有更多疯狂爆炸的事情发生。这一系列的爆炸性事件,或许只是 AGI 诞生前的插曲。ChatGPT 狂飙一年半,仍是无数 AI 企业的对标对象,没有之一。在成立一周年之际,零一万物发布了全球 SOTA 千亿参数闭源模型 Yi-Large,多项指标超越 GPT-4。并且,李开复还透露该公司下一代 Yi-XLarge MoE 模型训练。在开源领域,零一万物将早先发布的 Yi-34B、Yi-9B、6B 中小尺寸开源模型版本升级为 Yi-1.5 系列,每个版本达到同尺寸中 SOTA 性能最佳。我觉得今天我们至少对齐 GPT-4,而且多项指标超过 GPT-4,这是绝对真实的事实,欢迎各位去各个不同的场景测试。
我们深深了解国外的大厂都在做更新的产品更新,包括 OpenAI 可能不久之后也会有发布,我们也不会认为今天并列世界第一已是终局,它其实只是一个开始。
正当全世界 AI 模型还在「赶超 GPT-4」,OpenAI 从武器库掏出了点真家伙——全新 AI 模型 GPT-4o。后缀的「o」代表「omni」(即全面、全能的意思),这个模型同时具备文本、图片、视频和语音方面的能力,甚至就是 GPT-5 的一个未完成版。新的 GPT-4o 模型打通任何文本、音频和图像的输入,相互之间可以直接生成,无需中间转换。且 GPT-4o 语音延迟大幅降低,能在 232 毫秒内回应音频输入,平均为 320 毫秒,这与对话中人类的响应时间相似。GPT-4o 将向所有用户开放,并且未来几周内先向 ChatGPT Plus 推送。如同电影《她》里的萨曼莎,它不只是产品,甚至比人类更懂人类,也更像人类自己 。在与 GPT-4o 的交流中,我们或许将逐渐忘记,它原来是一个 AI。值得注意的是,在 GPT-4o 发布的当天,英伟达高级科学家 Jim Fan 发文表示:OpenAI 正在吃掉 Character AI 的午餐,形态重叠度几乎达到 100%,并且有巨大的分发渠道。
这是向具有强烈个性的更情感化的 AI 转变,这是 OpenAI 过去似乎一直在积极压制的。GPT-4o 更多细节,点击以下文章了解👇
深夜重磅!GPT-4o 正式发布:视频语音交互丝滑到吓人,还免费可用
GPT-4o 尝鲜!发布会里没说的,我们先体验了
Google 的反击
GPT-4o 前脚刚发布,后脚压力便给到了晚一天召开的 Google I/O 大会。顶着整个 AI 圈的冷嘲热讽,Google 近两个小时的暴力输出颇有些要以量取胜的味道。Project Astra 对轰 GPT-4o,打造通用 AI 助手;Veo 模型对标 Sora,支持生成 60 秒 1080p 规格视频;Google Search AI 加强 AI 搜索概要功能;Imagen 3 创建逼真的画像;Gemini 1.5 Pro 支持 2M 上下文窗口……老大哥 Google 在和 OpenAI 的同场竞技中,整体的路数显得有些局促谨慎。例如,在实际的演示过程中,GPT-4o 是实时进行的,而 Project Astra 为了避免出错仅仅放出录制的视频,生怕自家的股价重蹈覆辙,再次上演一夜闪崩。又或者,同样采用女声,两个语音助手在「性格」上也截然不同。GPT-4o 加持下的 AI 语音助手主打的就是幽默风趣,力求做到比人更像人,仿佛电影《Her》里的萨曼莎走入现实。而雷厉风行的 Project Astra 则更务实,专注于解决实际的任务,甚至在 Google 介绍 Astra 时,用到最频繁的词汇就是「助理」,这实际上也反映了两家企业对于语音助手的不同定位。如果产品的较量还只是潜藏于水面之下的激流,那么 OpenAI CEO Sam Altman 发布的推文则将「矛盾」摆在了明面上:我尽量不去想太多竞争对手,但我却无法停止思考 OpenAI 和 Google 之间的审美差异
Altman 言语之间按捺不住的得意也引起了 Google DeepMind 内部研究工程师的反呛:我尽量不去想太多关于竞争对手的事情,但有趣的是,你所有的发布都与我们保持同步。其言外之意正是暗讽 OpenAI 定点狙击 Google 新品发布的「绿茶」行为。实际上,面对 OpenAI 的挑衅,Google CEO 皮查伊在发布会召开前的态度就已经展露无疑:我们是搜索领域的先行者,也是电子邮件或浏览器的开创者。我相信,我们仍处于人工智能发展的初期阶段。
翻译过来就是,流水不争先,争的是滔滔不绝。OpenAI 在这场 AI 竞赛中只是一时的领跑,而手握全球数十亿用户、拥有最广泛消费场景的 Google 已经做好了长跑的准备。GPT-4o 的问世,不仅代表着 OpenAI 新生代的崭露头角,也触发了新一轮人事地震。不要再问 Ilya Sutskever 在哪儿了,因为刚为 GPT-4o 作出贡献的他已经正式宣布从 OpenAI 离职。不过,他口中所说的奔赴「下一个极具个人意义的项目」仍旧是个谜语。连带着 Ilya 亲信 Leopold Aschenbrenner、超级对齐团队负责人 Jan Leike 等人的相继离职,AI 领域也将掀起新的波澜。遗憾的是,我们至今都不知道 Ilya 究竟「看到」了什么?「超级对齐」运动推行一个月后,大洋彼岸的字节跳动才刚刚开始小范围邀请测试 AI 聊天机器人「豆包」。就在超级对齐负责人 Jan Leike 宣布离职的当天,字节跳动火山引擎则正式宣布推出筹备许久的豆包大模型家族,涵盖豆包通用模型 pro、通用模型 lite、角色扮演模型等九款模型。并且,火山引擎直接化身「价格屠夫」,给大模型市场带来了亿点点震撼。举例来说,市面上同规格模型的定价一般为 0.12元/千 Tokens,而豆包通用模型 pro-32k 模型推理输入价格仅为 0.0008 元/千Tokens,比行业价格低 99.3%。字节跳动或许不是生成式 AI 领域技术上最领先的企业,但作为移动互联网最懂产品形态和交互方式的互联网巨头,亲自下场 AI 大模型,其所掀起的波澜注定举足轻重。而让曾担任 TikTok 产品技术负责人的朱文佳,来领军字节跳动大模型,也足以窥见字节对 AI 产品的重视程度,以及野心。迄今为止,字节已经推出了 11 款 AI 应用,其中豆包是字节跳动重点投入的大模型应用。在苹果 App Store 和各大安卓应用市场,豆包 APP 的下载量在 AIGC 类应用中均排名第一。现在字节发起「卷上加卷」的价格战,显然接下来是要在 B 端持续发力,无疑将进一步搅浑整个大模型竞争的市场格局。Stability AI 面临资金危机,或考虑出售人类的悲欢并不相通,有的企业刚刚亮相出场,春风得意;有的企业早已名声在外,却风雨飘扬。据 The Information 报道,文生图「扛把子」Stability AI 最近几周至少与一些潜在买家展开了关于出售的讨论。报道称,Stability AI 在 2024 年第一季度的营收不到 500 美元,亏损超过 3000 万美元,并且还拖欠云计算供应商和其他公司近 1 亿美元的账单。前不久,Stability AI 宣布宣布公司 CEO Emad Mostaque辞职。不过网友似乎更关心的是,说好开源的 Stable Diffusion 3 的事不会「泡汤」了吧。那时,世界最大开源 AI 社区 HuggingFace 的联合创始人 Clément Delangue 半开玩笑地说:要不我们把 Stability 买下来,顺带把 Stable Diffusion 3 给开源了?世界最大开源 AI 社区免费提供 1000 万美元共享 GPU在这场 AI 浪潮中,总有一些企业在变革的浪潮中挣扎求存,而另一些也可以依靠社区的力量互助共进。为了帮助开发者在 AI 创新更进一步,Hugging Face 日前宣布提供 1000 万美元的免费共享 GPU 资源。具体来说,该公司的目标是通过推出一项「ZeroGPU」的新计划,将这些共享 GPU 捐赠给社区,目的是帮助中小型初创企业对抗大型 AI 公司,避免 AI 进步陷入「集中化」。Clément Delangue 在接受 The Verge 采访时提到,公司之所以能够做出这样的投资,是因为 Hugging Face「已经实现了盈利,或正处于盈利的边缘」。仅用半年时间完成亿元天使轮融资的星动纪元也为技术上的创新打下了基础。本周五,这家国产人形机器人公司发布了一个名为 XHand 的机器人手。据介绍,新发布的 XHand 拥有 12 个主动自由度,比特斯拉机器人 Optimus 手还多一个。同时,其灵活程度也十分惊人,可以像人类一样温柔地抚摸猫咪、精确地操作剪刀、轻松拿捏鸡蛋以及执行各种复杂的任务,原速演示流畅程度堪比人类。而在本周,宇树科技也正式发布 Unitree G1 人形机器人,售价 9.9 万元起。在官方发布的展示视频中,Unitree G1 不仅能做「鲤鱼打挺」,还能耍金箍棒、缩骨、砸核桃、颠勺、焊接。谈及距离设想中的通用机器人还有多远时,宇树科技创始人兼 CEO 王兴兴表示:目前大家在做的事情很简单,就是把 AI 技术拿过来给机器人用。但我觉得目前 AI 跟机器人结合的技术临界点还没到,可能整个技术方案还没跑通。
正当你以为这疯狂的一周要过去时,OpenAI 的「宫斗大戏」突然开启第二季。OpenAI 「超级对齐」团队的负责人 Jan Leike 在离职后,没有像 Ilya 那样留下看似友好的告别,而是连发 13 条小作文自述在内部遭遇的打压,包括被砍掉计算资源, Jan Leike 表示:放弃这份工作是我人生中最艰难的决定之一,因为我们必须尽快找到方法来引导和控制那些远比我们智能的 AI 系统。
与此同时,OpenAI 的离职协议也被媒体 Vox 曝光,协议禁止他们终生批评他们的前雇主,甚至承认 NDA 的存在也是违反协议的。如果离职员工拒绝签署文件,或违反文件,他们可能会失去在公司期间获得的所有归属权益,这可能价值数百万美元,报道中一位不愿透露姓名的公司内部人士表示:这是一个信任一点一点崩溃的过程,就像多米诺骨牌一张一张倒下。
眼看事情要失控,Sam Altman 紧急发文回应。包括图灵奖得主 Yann LeCun 也加入了这场关于人类命运安全的大论战。这些回应在今天凌晨也已经发布。Altman 在回应中承认了离职协议中确实包含股权取消的条款,但实际上从未收回过股权,自己此前也并不知情,同时表示可以为前员工修正这些离职协议。每天来自四面八方的 AI 新闻如同密集的鼓点,都在持续不断地敲打我们的神经。一系列落地产品的推出传达了最朴素却深刻的道理——应用为王,落地为本。在技术的狂潮中,那些能够真正解决现实问题、服务于人类生活的应用,才是检验 AI 价值的最终标准,也让我们的思维在这场狂轰滥炸的洗礼中逐渐变得清晰。疯狂还没结束,下周的微软 Build 开发者大会,下个月的苹果 WWDC,还会带来更多惊叹,我们或许正在见证又一个科技史的转折点。![]()