GPT-4是8x2200亿参数的混合模型?这个小道消息今天传疯了
机器之心报道
编辑:吴昕
George Hotz:除了苹果之外,大部分公司保密的原因都不是在隐藏什么黑科技,而是在隐藏一些「不那么酷」的东西。「GPT-4 的参数量高达 100 万亿。」相信很多人还记得这个年初刷屏的「重磅」消息和一张被病毒式传播的图表。
(相关资料图)
不过很快,OpenAI 的 CEO Sam Altman 就出来辟谣,证实这是一条假消息,并表示,「关于 GPT-4 的谣言都很荒谬。我甚至不知道这从何而起。」
实际上,许多人相信并传播这样的谣言是因为近年来 AI 社区不断在增加 AI 模型的参数规模。谷歌在 2021 年 1 月发布的 Switch Transformer 就把 AI 大模型参数量拉高到了 1.6 万亿。在此之后,很多机构也陆续推出了自己的万亿参数大模型。据此,人们有充分的理由相信,GPT-4 将是一个万亿参数的巨量模型,100 万亿参数也不是不可能。
虽然 Sam Altman 的辟谣帮我们去掉了一个错误答案,但他背后的 OpenAI 团队一直对 GPT-4 的真实参数量守口如瓶,就连 GPT-4 的官方技术报告也没透露任何信息。
直到最近,这个谜团疑似被「天才黑客」乔治・霍兹(George Hotz)捅破了。
乔治・霍兹因 17 岁破解 iPhone、21 岁攻陷索尼 PS3 而闻名,目前是一家研发自动驾驶辅助系统的公司(comma.ai)的老板。
最近,他接受了一家名为 Latent Space 的 AI 技术播客的采访。在采访中,他谈到了 GPT-4,称 GPT-4 其实是一个混合模型。具体来说,它采用了由 8 个专家模型组成的集成系统,每个专家模型都有 2200 亿个参数(比 GPT-3 的 1750 亿参数量略多一些),并且这些模型经过了针对不同数据和任务分布的训练。
在这段播客播出之后,PyTorch 创建者 Soumith Chintala 表示自己似乎听过同样的「传闻」,很多人可能也听过,但只有 George Hotz 在公开场合将其说了出来。
「混合模型是你在无计可施的时候才会考虑的选项,」George Hotz 调侃说,「混合模型的出现是因为无法让模型的参数规模超过 2200 亿。他们希望模型变得更好,但如果仅仅是训练时间更长,效果已经递减。因此,他们采用了八个专家模型来提高性能。」至于这个混合模型是以什么形式工作的,George Hotz 并没有详细说明。
为什么 OpenAI 对此讳莫如深呢?George Hotz 认为,除了苹果之外,大部分公司保密的原因都不是在隐藏什么黑科技,而是在隐藏一些「不那么酷」的东西,不想让别人知道「只要花 8 倍的钱你也能得到这个模型」。
对于未来的趋势,他认为,人们会训练规模较小的模型,并通过长时间的微调和发现各种技巧来提升性能。他提到,与过去相比,训练效果已经明显提升,尽管计算资源没有变化,这表明训练方法的改进起到了很大作用。
目前,George Hotz 关于 GPT-4 的「爆料」已经在推特上得到了广泛传播。
有人从中得到了灵感,声称要训练一个 LLaMA 集合来对抗 GPT-4。
还有人说,如果真的像 George Hotz 说的那样,GPT-4 是一个由 8 个 2200 亿参数的专家模型组合的混合模型,那很难想象背后的推理成本有多高。
需要指出的是,由于 George Hotz 并未提及消息来源,我们目前无法判断以上论断是否正确。有更多线索的读者欢迎在评论区留言。
责任编辑:
关键词:
相关阅读
-
GPT-4是8x2200亿参数的混合模型?这个小...
在采访中,他谈到了GPT-4,称GPT-4其实是一个混合模型。具体来说,它采 -
观天下!618趋势品类手机备受青睐 京东...
落到具体的行动上,京东在每款电竞手机新品发布之初,都会给厂商精准的 -
环球头条:最新动作!多国央行宣布→
6月22日,瑞士央行、英国央行、土耳其央行、挪威央行宣布加息。瑞士央 -
奔驰AMG GT S及奔驰E320L 4MATIC怎么样 焦点简讯
这其实已经是我们第三次“接触”AMGGTS了。但是前两次在国内的试驾... -
苏州相城区人社局在哪里(相城区人力资...
1、是的相城区人力资源和社会保障局:苏州市相城区阳澄湖东路8号。本文 -
全球热议:被子放久了为啥有黄斑 被子放...
1、睡眠时,身体排出的汗水等排泄物含有有机成分,比如蛋白质(已经变 -
微信群通知怎么发(微信群通知怎么发,然...
1、在手机的主界面找到微信图标;2、进入微信界面后,用手指将微信向下 -
跑步地滑解决小妙招 跑步地面
1、防滑垫:铺设防滑垫,卫生难打扫,有异味,影响美观。2、瓷砖打磨: -
新动态:【能力作风建设】大庆市公安局...
日前,大庆市公安局东光分局接到接到辖区群众报警称:王某以能够办理国 -
“云办案”巧调解 万里对话化纠纷_天天速读
图为经办法官线上开庭现场。张作安摄中新网福州6月21日电(林莹)近日, -
热议:鲩鱼尾怎么做好吃——红烧鲩鱼尾...
鱼,是我家小妞最喜欢吃的,现在LG受她影响也爱上了,连吃了几天鱼尾都 -
如何养潮虫? 潮虫防治方法
1、每次换土时,最好保留一部分原来的土壤;对换出的土壤要细心检查, -
中金:维持中国动向(03818) “跑赢大市...
中金维持中国动向目标价0 39港元及“跑赢大市”评级不变。 -
港股异动 | 中金公司(03908)跌超4%创...
中金公司(03908)早盘跌超4%,创年内新低。截至发稿,跌4 35%,报13 2港 -
环球新资讯:今日份安利:怎么用ai绘画?
当艺术遇见人工智能,创造出了一个全新的领域——ai绘画网站。这些... -
当前报道:证券之星IPO周报:节后将有9只...
国内造车新势力们正承受着残酷竞争带来的重压,威马汽车、雷丁汽车和拜 -
即时:向阳湖镇:“粽”夏好时光 共话...
向阳湖镇开展“‘粽’夏好时光共度传统情”端午主题活动 -
抖音发布新规 严厉打击仿冒新闻媒体...
近日,抖音官方账号发布了《治理“仿冒假冒账号”的公告》和《抖音... -
三大指数集体杀跌 AI全线退潮
今日盘面大盘全天低开低走,创业板指领跌,沪指失守3200点。截至收盘, -
COMEX 8月黄金期货收跌1.09%,报1923.7...
每经AI快讯,纽约商品交易所黄金期货市场交投最活跃的8月黄金期价22日