gay 最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
发布日期:2024-08-14 20:16 点击次数:128
梦晨 发自 凹非寺gay
量子位 | 公众号 QbitAI要是你这几天在/推特上关爱AI音书,那很大致率见过这个“草莓哥”账号。
头像是电影《Her》里的男主,昵称是三颗草莓,身分拉满。不知疲钝一天24小时在线水贴,推行多是OpenAI下一代模子爆料音书,时准时不准……
自从OpenAI奥特曼和草莓哥配合互(炒)动(作)过之后,岂论你酣畅不肯意看,推选算法齐会确保ta出面前你的技巧线上。
昨天,草莓哥宣称OpenAI将有大算作,各人瑕瑜常期待的。
何况刚好又到了谷歌迷惑布会的技巧,OpenAI拿出什么音书来抢头条亦然很合理的吧。
但技巧到了各人发现,莫得GPT-5,也莫得草莓/Q*,也莫得Sora公测……OpenAI仅仅发了新版大模子代码才略测试基准。
就在网友们的耐烦被耗光的时候,剧情回转来了。
创业公司MultiOn AI的首创东谈主Div Garg现身认领:
草莓哥账号其实是咱们家最先进的AI Agent拆除的,快来和它在线互动吧。
网友一下子炸锅了:
“要么这即是现时最佳的AI Agent,要么这家公司参与炒作,把公司声誉全毁了。”
斯坦福博士休学创业,估值7亿元先来说说MultiOn AI这家公司,专注于构建AI智能体。
旨在自动化平日任务和操作网页,举例从电商平台买手纸或安排日程表。
本年6月,有音书称MultiOn将完成2000万好意思元(约1.4亿元)融资,估值约1亿好意思元(约7.1亿元)。
首创东谈主Div Garg,斯坦福大学读CS博士技巧休学创业,在Uber、谷歌、苹果、英伟达齐有实习经验。
他们最新推出的智能体家具Agent Q,堪称领有作念权略和雠校我方作假的才略,不错跨站点浏览、填写表单,偷拍走光zero-shot进展比Llama 3基线普及340%。
丝袜制服与此同期,也发布了与斯坦福团队协作的相干商榷论文,
要道革命点是AlphaGo同款蒙特卡洛树搜索算法集结DPO微调。
总之呢,家具和论文看起来还挺庄重的。
即是CEO宣称草莓哥账号是AI拆除的这少许,网友们如故不太买账。
最近围绕AI的音书太多太乱,各人还是不知谈该敬佩什么了。
不外也有东谈主以为,草莓哥的账号与MultiOn公司树当场间对的上,用户名iruletheworldmo终末的“mo”不错是MultiOn的缩写。
但即使是真实,也有许多东谈主月旦这家公司的作念法,莫得带来什么好影响,而是铺张了许多东谈主技巧。
AI逃狱各人Pliny看不惯这种作念法,发出了终末通牒:
给你们15分钟技巧,要不拿出决定性的凭证,要么精辟真相,否则就把你家智能体的系统请示词公布在GitHub上。
技巧到了,Div Garg并莫得回话,反而删除了其中一条宣称草莓哥账号由AI拆除的两条发言,另一条还保留着。
Pliny也如约发布了请示词。
One More Thing在国内各人寝息的这段技巧,AI圈发生了许多事。
除了MultiOn的闹剧以外,谷歌发布了对标GPT-4o高档语音格式的Gemini Live语音聊天机器东谈主。
OpenAI则出了两招来往话:
发布最新代码才略基准测试SWE-Bench Verified,给“AI要领员”们出了一套更妥贴的考试题。
OpenAI在测试中发现原版基准中有一些AI不能能或很难料理的任务,从而导致基准多数低估了现时模子的自主软件工程才略。
此前SWE-Bench原版作家姚班学霸姚顺雨还是毕业入职OpenAI,此次OpenAI也和普林斯顿原始团队进行了协作,在新版块中修正了这些问题,不错提供更准确的评估。
面前新版基准测试还是开源在GitHub上。
同期在大模子竞技场上,GPT-4o的最新版块反超谷歌Gemini-1.5-Pro的磨练版块,重新夺回第一的位置。
OpenAI和谷歌的AI大战,还将链接……
参考联接:
[1]https://x.com/MultiOn_AI/status/1823412701441482959[2]https://x.com/ai_for_success/status/1823447309008490730[3]https://openai.com/index/introducing-swe-bench-verified/— 完 —
量子位 QbitAI · 头条号签约gay