您的当前位置：首页>软件 > 正文

大语言模型中的涌现现象是不是伪科学？

2023-05-19 23:36:09 来源：程序员客栈

Datawhale干货

【资料图】

作者：平凡@知乎，诺桑比亚大学，在读博士

今天晚上，花了一点儿时间看了两篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf

2.https://arxiv.org/pdf/2301.05217.pdf

标签：

大语言模型中的涌现现象是不是伪科学？

Datawhale干货作者：平凡@知乎，诺桑比亚大学，在读博士今天晚上，花了一点儿时间看了两篇文章：《Emergent

令朝鲜人自豪的两个工程，中国游客看后说很一般，和中国的有差距

朝鲜民族是一个自尊心很强的民族，朝鲜人在方方面面也非常爱面子，他们希望在国际上能得到人们的尊敬。因此

强降雨来了！柳州下周这两天雨势较强，还有雷暴大风

5月18日，柳州市区最高气温达33℃，虽然在5月19日半夜普降大雨，当天上午体感温度较为凉爽，但到了午后，柳

全球即时看！皇马拒绝变革？安帅继续执教，低价签本泽马替身，续约3大老将

皇马0-4惨败在曼城脚下，普遍认为银河战舰今夏将有一场革命。不过对此弗洛伦蒂诺却显得很谨慎，他认为要在

当前热议!人教版五年级上册数学期中试卷

1、永宁乡明德小学2011—2012学年度上学期五年级期中水平测试试卷数学（考试时间：90分钟满分：100分）一、真

在我国内蒙古宁城县发现1.25亿年前“宁城中华草”

土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏

我国车联网产业发展进入快车道，智能网联汽车数量快速增加

腾讯与奥迪宣布达成战略合作，“微信车载版”上线

“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力

自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持

半导体厂商一季度业绩向好，国产替代进程加速

据预测：2025年，全球卫星网络接入设备将达2亿台套

我国海上风电总装机容量仅次于英国，位居第二

里程碑式突破！揭示高能宇宙线起源之谜

青海省开启“集控站+无人值守”运维新模式提高设备运行水平

安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域达世界先领先水平

加快推进“双千兆”网络建设，聚焦网络质量提升

英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%

2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办

ASO-S“探日”有望于2022年发射升空！探索太阳磁场

超高速互联网将普及计算助力缩小数字鸿沟

1至2月，我国规模以上互联网企业完成业务收入同比增长达29%

数字化转型找准“方向感”，打造国内商业数字化发展高地

加快5G网络规模化部署，打造数字经济新优势

探索5G行业融合应用 5G专网将进一步推动融合应用发展

中国移动香港5G商用一周年开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响

7709米！哈工程“悟空”号创中国AUV潜深新纪录

人工智能领域新算法发布数据传输更高效精准

科技创新技术加持，我国船舶制造已达到世界前列

我国5G网络要坚持适度超前原则，探索5G应用发展

我国汽车自动变速器技术创新按下“快进键” 加速行业转型升级

AMR智能物流机器人，推动汽车行业智慧物流应用和发展

小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?

我国可再生能源技术装备水平大幅提升，开发利用规模稳居世界第一

吉利帝豪S正式开启预售 8.67万元-11.07万元

科技助力智能生活垃圾分类投放点全新亮相

“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布

《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布

第一门户搜索网站雅虎旗下知名问答平台“雅虎问答”将于5月4日关闭

乐视贾跃亭回国有望？FF已提交上市文件

国内首个“5G+北斗”高速公路智能护栏预警系统上线

LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统

新一轮科技革命和产业变革持续演进，提高制造业生产效率

“能联全球”平台正式发布，推动全球能源电力发展合作

网曝拯救者电竞手机2 Pro真机谍照：采用RGB呼吸灯

雷军开启个人第三场直播：小米进军智能电动汽车行业

700MHz 5G网络共建共享落地实施！着重建设5G“黄金频段”

2021年底，5G网络基本实现县级以上区域、部分重点乡镇覆盖

腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价

苹果文档曝光：新一代Apple TV将发布配置大幅升级

智能机器人完成多项智能巡视任务，作业效率提高三倍

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品，均转载自其它媒体，转载目的在于传递更多的信息，并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权，如发现本站文章存在内容、版权或其它问题，烦请联系。联系方式：8 86 239 5@qq.com，我们将及时沟通与处理。

大语言模型中的涌现现象是不是伪科学？

推荐阅读

猜您喜欢

科技快讯更多>

资讯

创新

子站