科技爱好者周刊(第 390 期):没有语料,大模型就是智障

作者: 阮一峰

日期: 2026年3月27日

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

山东日照某住宅小区的彩色风雨连廊,入口处树林还设了咖啡馆。(via

没有语料,大模型就是智障

如果现在做一个问卷调查,问大家"你觉得大模型是否具有智能?"

我相信,大多数人会是肯定的回答。

哪怕现在只是 AI 的初级阶段,大模型已经能够替代很多的人类智力劳动,确实非常神奇。

但是,我们不要忘记真实情况,大模型不是魔法,更不是具有自主智能的"硅基智能体",而是基于统计规律的语言模型,它的一切行为都基于数学计算。

最好的证据就是,如果让它解决没有训练过的题目,也就是不存在统计规律的话,它根本解不出来。

这就是我今天想分享的一个实验

两位国外的研究者找了五个主流的大模型:GPT-5.2、O4-mini、Gemini 3 Pro、Qwen3-235B、Kimi K2。

他们让大模型使用五种小众的编程语言----Brainfuck、Befunge-98、Whitespace、Unlambda 和 Shakespeare----来编程解决各种问题。

这些小众语言的共同特征是,网上很少有它们的资料,因此不能用来训练大模型。大家猜猜看,结果怎么样?

实验结果用一句话总结,就是大模型的表现一塌糊涂。

这五个大模型的平均答题正确率仅为3.8%,即100道题可以答对3.8道。相比之下,它们处理 Python 问题的正确率可以达到90%。

更尴尬的是,仅有的那几道答对的题目,都是入门级。更难的级别(初级、中级、高级),所有五个大模型的正确率都为0。

这个实验充分说明了,大模型的表现(智能程度)首先由训练材料决定:训练的语料越多,表现越好,比如 Python 的语料遍地都是,大模型因此极其擅长解决 Python 问题;训练的语料越少,大模型表现就越差,简直跟智障一样,没什么用处。

那么,一个让人好奇的问题就来了:如果某种冷门语言没有语料,但有一本很详尽的《使用手册》,我们让大模型学习这本手册,它是否就能学会这种冷门语言编程呢?

MAI-Image-2

本周,微软公司发布了自家的图像生成模型 MAI-Image-2

这个模型生成的图像质量非常高,有评论认为,目前仅次于谷歌的 nano-banana-2。

微软开放了网站 MAI Playground(下图),现在可以免费生成图片。

我试用后,图像质感确实很好,非常逼真。比如,一只狗在海里骑自行车。

但是,它的使用限制很多:(1)有争议的、可能冒犯的图片,都会拒绝生成;(2)每天的免费额度是15张,每次生成的间隔时间是30秒;(3)它只能生成长宽比 1:1 的图片,其他分辨率都不支持;(4)不提供图像编辑和加工,只能用来"文生图"。

如果你需要通过文本生成高质量图片,可以试试它。

科技动态

1、可玩的封面

红牛公司推出了一本纸质的游戏杂志《GamePop》。

它的封面有一个可以玩的"俄罗斯方块",是世界首本封面可以玩游戏的书。

奥秘就是封面里面,嵌入了一块非常薄的柔性电路板。

这块板配备了180个 RGB LED 灯、7个电容式触摸按钮、一颗32位 ARM 芯片。

它还包含一块可充电电池,可以通过 Type C 充电。

可惜的是,这个封面是限量版,不公开出售。它得到了俄罗斯方块公司的官方授权,全球仅发行150套,每套均有独立编号。

2、收费的真人客服

企业都不喜欢提供真人的电话客服,因为成本很高,更希望改成机器应答的电话客服。

惠普公司想出了一个点子,将用户往机器客服赶。

用户打惠普的客服电话,会听到一段语音提示,要你访问官网自己去寻找答案。如果你坚持要真人客服,就要在线等待15分钟。

如果中途挂了电话,再打就需要重新等待15分钟。系统还会分别在第5、第10和第13分钟提醒你,可以访问网站或发邮件联系。

虽然这种做法很可恶,但未来可能成为常态:免费就只有 AI 客服或机器人客服,额外付费才有真人客服。

3、飞盘的玩法

怎样扔飞盘,才能又快又远?

一个美国的物理学家,找了几十个学生进行实验,使用不同手势和角度扔出飞盘。他测量了飞行速度和扭矩,把结果写成了论文。

他发现,将拇指放置在距飞盘外缘约3厘米的位置,可以获得平均转速和初始速度的最佳结果。

他还发现,转速与初始速度存在线性相关,转速越高,初始速度也越高。

所以,下次玩飞盘的时候,你要放对拇指的位置,然后用足力气,反手甩出,就可以取得最佳结果。

文章

1、MkDocs 的缓慢崩溃(英文)

MkDocs 是著名的文档网站生成工具,但是主要贡献者之间有激烈矛盾,互相对抗,导致这个项目四分五裂。本文就梳理这件事。

2、大模型预测咖啡散热(英文)

作者让各种大模型给出咖啡散热时间的公式,然后测量了实际的散热时间,得到了一个排行榜。

3、下一个 App 很可能是无头应用(英文)

如果我们未来都通过 AI 助手使用手机,那么各种 App 就不需要显示模块了(无头),只需向 AI 助手提供数据接口。

4、网页前端数据压缩的一种方法(英文)

本文介绍如何在前端,通过 canvas(画布)将数据压缩成一张图片。

5、Ruby 是构建 AI 应用的最佳语言(英文)

作者使用 Python、JavaScript、Ruby 三种语言写一个 AI Agent,比较后认为 Ruby 写 AI 应用最方便。

6、古罗马的混凝土建筑(英文)

古罗马人发现了混凝土,学会了用它浇筑建筑物。结果就是,古罗马建筑有古代最大的室内面积,并且非常坚固,保留到了今天。

工具

1、proxychains-rs

proxychains4 的 Rust 实现,指定某个进程走代理链。(@tianrking 投稿)

2、Flare Stack Blog

一个基于 Cloudflare Worker 的博客系统,集成 D1、R2、KV、Workflow 等服务。(@du2333 投稿)

3、Tunelo

一行命令将本地服务暴露到公网,只需要单个 4MB 二进制文件,使用 QUIC 协议。(@jiweiyuan 投稿)

4、ReadAny

桌面端 + 安卓端的电子书阅读工具,自带 AI 功能、语音朗读和多端同步。(@codedogQBY 投稿)

5、RaTeX

纯 Rust 实现的 KaTeX 兼容的数学渲染引擎,原生解析、排版 LaTeX 数学公式,支持各种环境。(@erweixin 投稿)

6、Work Review

开源的 Win/Mac 桌面应用,在后台持续记录当天使用过的应用、访问过的网站等,便于整理成个人的工作轨迹。(@wm94i 投稿)

7、Valdi

SnapChat 发布的 UI 框架,可以用类似 React 的语法编写组件,然后编译成 iOS、Android 和 macOS 的原生应用。

8、Npflared

架设私有 NPM 镜像的工具,适合企业用来提供内部的 JS 软件包。

9、Chokidar

一个 Node.js 模块,用来监听文件系统的各种事件(新增、删除、编辑等),比原生的 fs.watch / fs.watchFile 功能强。

AI 相关

1、微信的龙虾接口

微信官方本周发布了龙虾接口,AI 机器人可以向微信发消息了。

很多项目利用这个接口做二次开发,便于各种 Bot 和 Agent 网关的接入。

2、AI CLI Complete Notify

跨平台桌面应用,AI 命令行任务(Claude code/Codex/Gemini)完成后,发出任务完成提醒,支持各种渠道(飞书/钉钉/企微 Webhook、Telegram、邮件、桌面/声音提示)。(@ZekerTop 投稿)

3、Claude Config Manager

macOS 的 Claude 资源(Skills、MCP、Agent)桌面管理工具,提供一个图形化的中央控制台。(@Daydayoneup 投稿)

4、TrustClaw

龙虾 OpenClaw 的修改版,尽量消除代码的风险点。

资源

1、Project N.O.M.A.D.

一个 Linux 应用,集成了各种人类知识(维基百科、全球地图、在线课程、本地 AI 助手)等等,用于在断网时查阅。(@15x3 投稿)

2、用于数据分析的 AI Coding Agent(英文)

著名开发者 Simon Willison 的培训班讲课资料,通过 AI 工具进行数据分析,有详细步骤。

3、TypeScript 简洁之书

一本开源的 TypeScript 教程,有中文版。

图片

1、苹果壁纸彩蛋

苹果公司最近发布了新笔记本 MacBook Neo,跟以前一样,配一张特别的壁纸。

壁纸里面嵌入了产品名,以前的壁纸也有这个彩蛋。

iMac

MacBook Pro

iPad Air

MacBook Air

iPad Mini

iPad Pro

1、儿童死亡率

现代人很难想象的是,人类历史的大部分时间里,儿童死亡率(在成年前死亡)一直接近50%。

上图中,红线就是婴儿死亡率,一直稳定在50%左右。直到19世纪后期,才开始快速下降。

2020年,全球平均婴儿死亡率是4.3%,最低的国家已经达到了0.3%。

文摘

1、别变成机器

我最近看到一句话:"只有奴隶才通过生产力来量化自身的存在价值。"

是啊,生产力越高,奴隶越有价值。

这让我想到,如今的社交媒体上充斥着大量的奋斗文化,许多人展示自己是多么努力在提高个人生产力。

在我看来,这就是将自己跟机器做比较。大家认定,如果能像机器一样,接收指令并高效地完成某个目标,自己就越有价值,就能取得人生成功。

社交媒体上,这种"奋斗文化"有很多表现形式:(1)你还不够努力。(2)你得早上五点起床。(3)你得第一个到,最后一个走。

这种文化的背后,就是要求人变成机器

机器确实很高效,但有一个问题:它是刚性的,以既定的模式和线性速度运转,无法自动适应环境变化,也无法学习游戏规则。

你不是机器,你是人。你的特点应该是灵活应变,快速适应。你不要追求极致的努力,而是要找到最有价值的解决方案。你要专注于真正重要的因素:速度、效率或质量,不要迷恋枯燥乏味的工作。

言论

1、

我们创造了一个文明,其中最重要的元素都深深地依赖于科学技术,但是我们还让科学技术变得如此难懂。这会带来灾难,我们可能暂时侥幸逃脱,但迟早,这种无知和权力的易燃混合物会爆炸。

-- 卡尔·萨根

2、

巴黎以前总是堵车,市长想出一个办法,大幅减少停车位,后来果然少有人开车了。

-- CNN

3、

一项研究发现,远程教学下,外形出众学生的作业成绩,要比面对面教学时更低。

-- 《经济学快报》

4、

这些年对我影响最大的事情,就是我变成了一个"白天型"的人。

我以前经常熬夜,有时会到天亮。最近五年,我强迫自己养成早起的习惯。现在,我的生活都在白天,亲眼看到黎明和黄昏,让我感到心安,生命与自然循环和谐一致。

-- 《成为一个白天生活的人》

5、

AI 很擅长将清晰的想法转化为可运行的代码。真正耗时的是弄清楚我到底想开发什么。

-- lustin.fr

往年回顾

如何阻止 AI 爬虫(#343)

一周是一年的2%(#293)

与孔子 AI 聊天(#243)

前端与后端,谁更难?(#193)

(完)

留言(40条)

如果让它解决没有训练过的题目,也就是不存在统计规律的话,它根本解不出来。

不同意。

如果某种冷门语言没有语料,但有一本很详尽的《使用手册》,我们让大模型学习这本手册,它是否就能学会这种冷门语言编程呢?

肯定的,人能学会,大模型就能学会。本质是因为coding task对人来说也是在符号空间工作,这正是大模型的领域。

极致的努力找到最有价值的解决方案

是不是 机器人?DOGE

有人拿官网重跑esolang实验机会都能做对,怀疑作者刻意博眼球or水平差。。。
https://x.com/ChaseBrowe32432/status/2035547324693582220

AI它也只是知道人类已知的。

巴黎以前总是堵车,市长想出一个办法,大幅减少停车位,后来果然少有人开车了。

这就是传说中的,把路都堵了,让别人无路可走是吧。

AI 很擅长将清晰的想法转化为可运行的代码。真正耗时的是弄清楚我到底想开发什么。清晰地表达自己的目的,方能更好地使用AI

站在宏大叙事层面来说,AI的最终结果必须要提升GDP,而不是对企业来说仅仅是减少成本,文明的主体必然是人。

作为一个日照让你,我竟然部知道彩色风雨连廊的这个小区在哪里

第一个 训练一个语言模型 肯定 得有对应的语料 跟人学语言不一样的吗

引用BX的发言:

肯定的,人能学会,大模型就能学会。本质是因为coding task对人来说也是在符号空间工作,这正是大模型的领域。

怎么个学会法?

之前我想的一句话,不知道在这适用吗?人工智能,就是想让机器像人一样,既然如此,说明机器在模仿人。那为何都在用ai替代人类呢,是人类需要休息而机器不需要。可是,人类在不工作的时候才会主动去花钱。一直进行裁员,会不会影响经济流动,从而破坏社会经济,到那时会出现更严重的产能过剩。

我敢说99%的人写不明白Brainfuck。这不是没有语料的问题...

可玩的封面?我小时候还有打开就能唱歌的立体电子生日贺卡

引用BX的发言:

肯定的,人能学会,大模型就能学会。本质是因为coding task对人来说也是在符号空间工作,这正是大模型的领域。

让人来用一种没学过的冷门语言直接写肯定也写不出来啊,现在模型智能和普通人几乎可以等同了,人能做模型才能做。模型做不了人也做不了。

标题有点暴论的意思。
感觉有点神化大模型了,以至于幻想破灭的时候从一个极端走向另一个极端。

巴黎以前总是堵车,市长想出一个办法,大幅减少停车位,后来果然少有人开车了。

市长开心了,他的专车从此再无阻拦。
普通市民就倒霉了,去挤地铁公交,环境恶劣没座位,还容易传染流感

MacBook neo壁纸里的字母形状为什么不是”neo”呢?

可以试试国产的aardio语言,文档详细,范例质量高。

冷门语言编程测试结果并不能说明大语言模型不具有逻辑推理能力,只能证明它们缺乏该领域的基本知识和经验。因为各大官方模型始终未开放强化学习能力,导致各大模型的基本能力都是静态的,结合上下文记忆和基于互联网的知识库RAG才能获得更加动态的信息。

如果开放强化学习能力,经过几轮的简单问答对话式训练,即可让模型学习新领域的知识和能力,然后去解决新领域内问题。但这项能力易被滥用,同时也大量消耗算力,所以暂时还没有那个大官方愿意开放。

苹果花这些心思在彩蛋上,是没有事情做了吗?

别变成机器。
人变成机器只需要重复做简单的事情,只要努力就可以了,对大部分人来说很简单。

而要学会提高速度、效率、质量,降低成本、消耗,并找到最有价值的解决方案,这个可不仅仅是努力的问题,它需要经验、技巧、资源以及努力,对大部分人来说很困难。

前者是对被管理者的要求,很容易被AI智能体或者其它生产率机器所替代。后者是对管理者的要求,很难被替代。很多人都知道这一点,但却总是无法做到,正所谓知易行难。

引用uu的发言:

之前我想的一句话,不知道在这适用吗?人工智能,就是想让机器像人一样,既然如此,说明机器在模仿人。那为何都在用ai替代人类呢,是人类需要休息而机器不需要。可是,人类在不工作的时候才会主动去花钱。一直进行裁员,会不会影响经济流动,从而破坏社会经济,到那时会出现更严重的产能过剩。

那为何都在用ai替代人类呢,因为ai比人便宜啊
你看看各种矿山之类的大型工地,现在都是无人驾驶卡车,雇这么多司机还得轮班倒开车要多少工资、五险?现在只需要车,不需要人,省多少成本呢。

引用BX的发言:

肯定的,人能学会,大模型就能学会。本质是因为coding task对人来说也是在符号空间工作,这正是大模型的领域。

最多是翻译,把语法翻译为pyhon之类的,无法真正学会,大模型基于统计规律,只有一个使用手册不够

引用uu的发言:

之前我想的一句话,不知道在这适用吗?人工智能,就是想让机器像人一样,既然如此,说明机器在模仿人。那为何都在用ai替代人类呢,是人类需要休息而机器不需要。可是,人类在不工作的时候才会主动去花钱。一直进行裁员,会不会影响经济流动,从而破坏社会经济,到那时会出现更严重的产能过剩。

如果生产力已经发展到让每个人都不需要工作了,经济会崩溃吗?不会的,只是经济循环不需要普通消费者的参与了。

ReadAny 不稳定、不好用

引用zheng的发言:

可玩的封面?我小时候还有打开就能唱歌的立体电子生日贺卡

大模型不具备逻辑推理能力,这不应该是常识吗?为什么评论区这么多质疑这个的?前两天的8.11>8.9都说过一次了

引用日照海洋的发言:

作为一个日照让你,我竟然部知道彩色风雨连廊的这个小区在哪里

原文有提到,百度地图也能查到。

地点:白鹭湾·咖啡与树
地址:山东省日照市五莲县星河路与白鹭湾路交叉口东北180米

微信的龙虾接口地址是多少?

那个无头应用是搞笑:

“如果我们未来都通过 AI 助手使用手机,那么各种 App 就不需要显示模块了(无头),只需向 AI 助手提供数据接口。”

问题是,这样搞应用给用户,对开发者有什么好处?

豆包的智能体平台早就有了。也没见火起来。

分配模式没找好之前,这个许愿是不可能达成的。

关于第一个问题,最近有一个新的编程语言 Codong,号称是 AI Native 的编程语言

proxychains-rs 这个项目真是解了我的燃眉之急,原来的 proxychains-ng 在 m4 平台遇到了 sip 的问题,但是这个项目完美解决了,感谢

引用mickir的发言:

我敢说99%的人写不明白Brainfuck。这不是没有语料的问题...

我一直以为Brainfuck只存在于 ctf 的 misc 题目里

5、Ruby 是构建 AI 应用的最佳语言(英文)

这不是营销软文吗

周刊里面英文文章的截图都是中文的,请问下是用什么工具翻译的

引用DeathGhost的发言:

AI它也只是知道人类已知的。

还要加上ai只能做好人类给它刻意训练的东西,ai生成代码的很套路化模板化有很强的偏好,这两点和人很像。用过ai生成前端项目的都知道蓝紫色问题,无论你是什么风格只要你和ai聊得多了,ai总会给你生成蓝紫色的卡片按钮。

深有体会。用Unity-c#的时候感觉ds就是个天才,1000行的自定义逻辑随便出。
我以为它对c#已经理解得很深刻了。
然后问了一个国人c#冷门框架ET,就算给它源码,其回答也显得缺乏逻辑。

所以不能用人的思维去类比ai

引用“巴黎以前总是堵车,市长想出一个办法,大幅减少停车位,后来果然少有人开车了。”

评论:过去觉得有些问题可以通过很巧妙的方式解决,有种四两拨千斤的感觉。
但是,总觉得哪里不对。
后来慢慢感觉到,解决任何问题都是需要成本和代价的,如果闭口不提这些,那么大概率就是这个解决方案只是看起来“很巧妙”而已。

我去看了证明「没有语料,大模型就是智障」的所谓实验的github仓库,一句话总结就是“狗屁不通,不值一驳”。

看了一下里面的“icl-example”(In-Context Learning)给的示例,给的是什么玩意儿啊!缺胳膊少腿,文件不全,只有三言两语,还不如doc里面的信息呢!你自己也是程序员,去试试doc和example,看看你能学会吗?

引用dg1245的发言:

后来慢慢感觉到,解决任何问题都是需要成本和代价的,如果闭口不提这些,那么大概率就是这个解决方案只是看起来“很巧妙”而已。

除了技术的直接进步,比如发明石器、发明轮子

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接