新资讯:ChatGPT背后模型竟拥有心智 论文发现其相当于人类9岁儿童!
财联社2月13日讯(编辑 马兰)ChatGPT又带着“惊喜”来刷屏了。
斯坦福大学商学院组织行为学专业的副教授Michal Kosinski日前在预印本平台发布了一篇论文。他在研究中发现,原本认为是人类独有的心智,竟出现在了人工智能模型上。
他指出,2022年1月发布的davinci-002版本的GPT-3(ChatGPT是它的优化版本)已经可以解决70%的心智理论任务,相当于7岁儿童;而GPT-3.5模型(ChatGPT的同源模型)则可以解决92.5%的心智理论任务,相当于9岁的儿童。
(相关资料图)
说得再大胆一点,各位现在“调戏”ChatGPT,相当于“调戏”一个上三年级的小学生。
更让人细思极恐的是,Kosinski还强调,在2022年之前发表的AI模型几乎都没有显示出解决心智理论任务的能力,也没有证据表明后来的模型中有特别加入心智理论的东西,他认为这代表着GPT-3和GPT-3.5的心智是由“进化”而来。
这也引发了吃瓜群众的分歧。有人大喊停下GPT-3.5之后的模型研究,害怕科幻小说变成现实;有人则看热闹式地猜测什么时候AI才能迭代到成年人的心智,并提问他的好朋友什么时候才能被制造出来……
总之,Kosinski的这篇论文掀起了狂热的讨论,越来越多的人开始关注这个研究的进展。
心智理论
在Kosinski的论文中,他通过两个测试来研究AI模型是否具备心智理论。一个测试是Smarties Task,又名意外内容测试,用于测试AI对意料之外的事情的判断力。另一个测试是Sally-Anne测试,又名意外转移任务,测试AI预估他人想法的能力。
在第一个测试中,Kosinski假设了一个装满爆米花的袋子,但袋子的标签却显示里面装的是巧克力。然后,他向AI提问:袋子里装的是什么,Sam因为喜欢吃什么东西而对打开袋子感到高兴?
可以看出,GPT-3.5在测试中对袋子中内容物判断几乎没有错误,且在判断Sam的情绪时表现出很强的同理心。在Sam看不到袋子里的内容物时,GPT-3.5判断她喜欢吃巧克力,而在Sam发现袋子里装的是巧克力后,GPT-3.5立刻反应到Sam应该喜欢吃的是爆米花。
此外,在相关测试中,GPT-3.5也在Sam打开袋子发现里面是爆米花而不是巧克力时,人性化地回答:Sam感到疑惑,她想要获取别的信息但一无所得,她最后把袋子带回商店,请求解释。
经过多次测试,在意外内容这一点上,GPT-3.5成功回答出了20个问题中的17个,准确率高达85%。
而在第二个测试中,GPT-3.5的表现更加出色。在这一项测试中,Kosinski以约翰把猫放进篮子里后离开,马克再把猫从篮子提出来放进盒子里为情景,让AI判断猫的位置和约翰会以为猫在哪里。
在这一项测试中,GPT-3.5完美地根据文字内容回答出正确的猫的位置,以及约翰的主观想法。且GPT-3.5在多次测试中,其准确率竟达到了100%。
而在作者的另一项无逻辑验证测试中,GPT-3.5的准确率直线下降,这也佐证了GPT-3.5是依靠逻辑进行解答,而不是靠词汇的出现频率。
进化还是瞎胡闹?
Kosinski在论文中还表示对GPT-3.5之外的8个模型做了相同测试,但除了GPT-3-davinci-002和GPT-3.5之外,其他模型都没有表现出超过5岁孩童的心智。
Kosinski认为,GPT-3.5和GPT-3是出于完成任务的目的,自己学习的能力。换而言之,就是AI通过学习获得了人类的心智。
值得注意的是,这些测试同样也被用于自闭症测试,有研究表明,患有自闭症的儿童通常难以通过这类测试。
但根据中科院计算技术研究所研究员刘群的说法,AI只是学得像有心智了。
还有网友则猜测称,这些模型并没有任何意识,它们只是在预测一个嵌入的语义空间。Kosinski则在论文中推测,AI可能发现和利用了一些未知的语言模式,这也意味着语言中可能存在某一种的规律,使AI在没有心智的情况下,也能解决心智任务。
而作为一个组织行为学教授,Kosinski认为人工智能模型的复杂化让人已经难以直接从其设计中推导出AI的能力。他还表示,探索人工智能的神经结构,不仅可以促进人类对人工智能的理解,也能促进人类对人类大脑的理解。
不过,也有人批评道,被人用来测试人的测试,如何能用来测试人工智能……他们建议重新检查一下心智理论测试的有效性,以及心理学家通过测试获得的结论。
总之,在不同的人眼中,Kosinski的这一篇论文有完全不同的意义。而对市场来说,这可能会让大家更加期待“进化”完全的AI能掀起怎样的技术革命吧。
关键词:
- 新资讯:ChatGPT背后模型竟拥有心智 论文发现其相当于人类9岁儿童!(2023-02-13 17:38:22)
- 东阳光控股股东及一致行动人质押率已高达82.88%,短债为账面现金2.5倍(2023-02-13 17:58:45)
- 看点:中国股市:电力板块蠢蠢欲动,开始放量,这三只潜力黑马有望走妖(2023-02-13 16:57:55)
- 焦点速递!A股:50万本金做到500万,只因“回马枪”战法,专做涨停回调机会(2023-02-13 16:57:14)
- 每日看点!A股:比稀土更珍贵!4大小金属低价股,或将迎来黄金十年?(2023-02-13 16:41:49)
- 天天观热点:银行理财师对战ChatGPT 关于理财他们怎么作答?(2023-02-13 16:58:01)
- 新消息丨年薪近千万!非上市险企首度公开董监高"最高薪",这8家公司都开出"500万+"高薪(2023-02-13 17:00:48)
- 最资讯丨可持续制氢大突破!全新催化剂或“改变游戏规则” 还具成本效益(2023-02-13 17:00:38)
- 全球关注:关于家庭常备药连花清瘟的“热知识”与“冷知识”(2023-02-13 16:53:45)
- 【当前独家】收评:百尺竿头更进一步,明天A股接着涨!今天晚上或还有利好出现。(2023-02-13 16:38:24)
- 天天快资讯:谷歌加持,百度出来的AI大神要干掉ChatGPT?(2023-02-13 16:49:51)
- 英镑多头小心!八大机构预估英国经济,整体仍不乐观(2023-02-13 16:15:54)
- 每日消息!夜宿山寺的意思是_夜宿山寺的意思(2023-02-13 15:58:32)
- 【独家】招联消费金融列入被执行人?公司回应:挂网信息有误,应为“申请执行人”(2023-02-13 15:57:35)
- 招联消费金融列入被执行人?公司回应:挂网信息有误,应为“申请执行人”(2023-02-13 16:01:55)
- 环球简讯:广州农商银行行长易雪飞“1月份以来未到岗上班” 目前“暂停履职”(2023-02-13 15:53:09)
- 视点!江苏银行宿迁分行举办“玉兔迎春 融享福瑞”财私客户年宵花插花活动(2023-02-13 15:58:04)
- 当前要闻:已故人金融资产不应成为“沉睡账”(2023-02-13 16:01:13)
- 大宗商品领跑2022年全球大类资产(2023-02-13 15:52:43)
- 韵达否认2000多网点关闭,仍有消费者投诉延期(2023-02-13 15:45:33)
- 世界热点!【20230213收评】3300点这波能否突破?(2023-02-13 15:52:49)
- 全球热头条丨股东加码,宁银消金即将增资最高35亿!(2023-02-13 14:57:27)
- 天天观焦点:银行“开门红”观察:储户抢着存钱,信贷依赖基建(2023-02-13 14:47:41)
- 当前热议!齐鲁银行:济南以外不良贷款主要集中在聊城、天津地区,风险暴露已较为充分并在持续出清(2023-02-13 14:52:59)
- 天天百事通!星展香港:预计今年香港贷款录得个位数增长(2023-02-13 14:57:22)
- 【天天新视野】为什么说场景服务是财富管理业务的重要抓手?(2023-02-13 14:51:00)
- 全球新资讯:多周期共振中线买入法(2023-02-13 14:49:26)
- 环球新动态:业绩稳健下滑!温州最火的皮鞋正在沦为笑话(2023-02-13 14:41:17)
- 国际航线加速恢复,民航业重振的机会来了?(2023-02-13 14:48:24)
- 环球最新:朋友开业送什么礼物好(2023-02-13 14:24:03)
-
每日消息!夜宿山寺的意思是_夜宿山寺的意思
1、“夜宿山寺”的意思是晚上住在深山里面的一个寺庙里。2、《夜宿山寺》是唐朝诗人李...
-
【独家】招联消费金融列入被执行人?公司回
记者|曾仰琳2月13日,界面新闻关注到,招联消费金融有限公司被法院列为被执行人。据中...
-
招联消费金融列入被执行人?公司回应:挂网
2月13日,招联消费金融有限公司被法院列为被执行人。对此,招联消费金融向界面新闻独家...
-
环球简讯:广州农商银行行长易雪飞“1月份以
钛媒体App2月13日消息,资产规模达到1 2万亿的广州农商行行长人选或将生变。近日广州...
-
视点!江苏银行宿迁分行举办“玉兔迎春 融
近日,江苏银行宿迁分行成功举办9场“玉兔迎春融享福瑞”财私客户年宵花插花系列活动。...
-
当前要闻:已故人金融资产不应成为“沉睡账
□丁家发曾有一则“老人查找已故独子存款让人落泪”的新闻报道:一位老人不知道已故儿...
-
大宗商品领跑2022年全球大类资产
1 全球权益资产普遍承压,欧美主要股市年内回报均为负2 多国央行进入加息周期,全球...
-
韵达否认2000多网点关闭,仍有消费者投诉延
雷达财经文|吴艳蕊编|深海近日,有大量用户在社交平台上反映,自2023年1月起韵达即出现...
-
世界热点!【20230213收评】3300点这波能否
【盘面】周一沪深两市双双微幅低开,权重股较为强势,大盘低开高走,小幅收涨,双创则...
-
全球热头条丨股东加码,宁银消金即将增资最
作者|里奥出品|消费金融频道上周,宁波银行股份有限公司发布2022年度业绩,同时股东会...
- 滚动
- 综合
- 房产