科技爱好者周刊(第 349 期):神经网络算法的发明者

作者: 阮一峰

日期: 2025年5月23日

这里记录每周值得分享的科技内容,周五发布。

本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系[email protected])。

封面图

北京的护城河公共绿道,位于鼓楼附近。(via visuals_china@instagram

神经网络算法的发明者

上周的《李飞飞自传》读后感,还有后续。

那篇文章的结尾是,2012年一支加拿大团队使用神经网络算法,夺得了 ImageNet 比赛冠军。

今天就来说说,这支加拿大团队的故事。

大家看了就知道了,神经网络算法是怎么诞生的,背后的推手又是谁。

(1)杰弗里·辛顿(Geoffrey Hinton,1947-)

辛顿出生于英国,后移居加拿大。他是神经网络算法的奠基人和主要发明者。

神经网络的概念,是上世纪40年代后期提出的(提出人不是辛顿)。当时的想法是,既然人类通过神经网络进行思考,那么只要让机器模拟神经网络,机器就能思考了。

但是,那只是一个概念,并没有具体的算法。机器怎么模拟思考,人们并不知道。

1984年,辛顿在加州大学担任博士后,与两个同事一起提出了反向传播算法。

这个算法可以建立多层网络,产生一个输出结果,让神经网络变成了现实,也是后来更高级算法的基础。

由于它需要多层计算,后一层在前一层的结果上学习,所以被称为"深度学习",辛顿因此成为"深度学习之父"。

辛顿后来因为这个贡献,获得了图灵奖(2018年)和诺贝尔物理学奖(2024年)。

(2)杨立昆(1960-)

杨·安德烈·勒坎(Yann André Le Cun,中文名杨立昆)是法国人。上个世纪80年代,他是多伦多大学博士后。

这一时期,辛顿也来到了多伦多大学任教,担任他的指导教师。

所以,杨立昆是辛顿的大弟子,继承和发展了辛顿的算法。他的主要成就是,为神经网络引入了卷积算法,并且做出了第一个有实际用途的神经网络。

1990年代,他用神经网络识别银行支票的手写数字,成功获得了企业的采用。

但是,这个应用也暴露了卷积神经网络的弱点:它需要大量样本的训练,耗费巨大的算力。银行支票只需要识别10个阿拉伯数字,如果是更多样化的场景,当时的计算能力难以做到。

学术界因此认为,卷积神经网络只适用特定的、计算量较小的场景,不具备推广的价值。这导致这种算法,以及辛顿和杨立昆,被冷落了二十年。

这二十年,杨立昆一直混迹于企业实验室和大学教研室。等到世界重新认识卷积神经网络,他在2018年与辛顿一起获得了图灵奖,现在是 Meta 公司的副总裁和 AI 首席科学家。

(3)亚历克斯·克里泽夫斯基(Alex Krizhevsky,1986-)

亚历克斯·克里泽夫斯基是乌克兰人,少年时随家人移民到加拿大。2007年,他进入多伦多大学,成为辛顿的博士生。

这时距离杨立昆提出卷积神经网络,已经过去快20年了。辛顿始终没忘记它,他鼓励亚历克斯和稍后要提到的伊尔亚·苏茨克维,使用这种算法,去挑战李飞飞的 ImageNet。

亚历克斯就写了一个程序,用 ImageNet 的1500万图片,来训练他的卷积神经网络。但是,计算量太大了,他的个人计算机根本跑不动,他就买了两块 Nvidia 显卡,每天24小时一刻不停地运算。

事实证明,卷积神经网络+大训练集+高速计算硬件,超过了其他一切已知的算法。最终,他们的三人团队以巨大优势,夺得了2012年第三届 ImageNet 算法比赛冠军。

这件事轰动了业界,各大互联网公司纷纷邀请辛顿和他的学生加入。百度也伸出橄榄枝,邀请辛顿担任首席科学家,但是最后输给了谷歌。

2013年,谷歌以4400万美元收购了辛顿成立的空壳公司,将辛顿、亚历克斯、伊尔亚三个人一起招入麾下。

2017年,亚历克斯辞职,现在一家创业公司研究 AI 技术。

(4)伊尔亚·苏茨克维(Ilya Sutskever, 1986-)

伊尔亚·苏茨克维出生于前苏联,后去了以色列,然后来到加拿大。他是亚历克斯·克里泽夫斯基在多伦多大学的博士同学,也是辛顿的博士生。

他与亚历克斯组成团队,共同赢得了2012年的 ImageNet 算法比赛。辛顿作为指导老师,也是团队一员。

他在2013年跟随辛顿加入谷歌,2015年辞职,成为 OpenAI 的联合创始人和首席科学家,后来是 ChatGPT 的主要作者之一。2024年,他离开 OpenAI,现在创立了自己的 AI 公司。

(5)安德烈·卡帕斯(Andrej Karpathy,1986-)

安德烈·卡帕斯出生于斯洛伐克,15岁随家人来到加拿大,在多伦多大学读完了本科。

他跟伊尔亚·苏茨克维很可能大学里就认识。但是,他没在多伦多大学读博士,而是去了斯坦福大学,指导老师就是李飞飞。

他的方向也是卷积神经网络,博士期间开设了斯坦福大学第一门深度学习课程,担任主讲。

2015年,他跟随伊尔亚一起加入 OpenAI,成为主要研究人员。

2017年,他离开 OpenAI,去了特斯拉,担任特斯拉 AI 总监,2022年离职。

(6) 总结

上面五人是神经网络算法的主要创立者和推动者。没有他们,就不会有今天的 AI 大模型。

但是,单单靠他们的算法,AI 不会成功。因为算法需要大量的数据进行训练,而训练需要高速计算的硬件。这三者缺一不可。

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

历史于是翻开了新的一页,AI 时代正式来临。

科技动态

(1)一家深圳公司推出了,可能最炫酷的树莓派机箱

它自带机箱显示屏、RGB 灯光、风扇、NVMe SSD 扩展板,很适合用作 NAS 和 AI 边缘计算。

(2)芬兰尝试在驯鹿的鹿角,涂上荧光粉。

这是为了方便司机在夜间看到驯鹿,目前每年在芬兰公路上被撞死的驯鹿有4000头。

(3)在线会议软件 Google Meet,推出实时语音翻译,首先提供西班牙语版本。

在线会议时,对方说西班牙语,你听到的却是英语,而且声音、语调和情感‌都不变。

(4)意大利开源硬件公司 Arduino,研发出了可降解 PCB(电路板),减轻对环境的污染。

这种可降解电路板,将电路印刷在植物亚麻材料上,而不是传统的玻璃纤维和树脂。

不过,电路板上的铜无法降解,需要在丢弃电路板之前先回收。

(5)一家美国创业公司,准备发射卫星,将 AI 机房建在太空

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。

文章

1、手机的 Linux 桌面环境(英文)

作者出门不带笔记本,只带手机,再配上蓝牙键盘和 AR 眼镜。

他的安卓手机在获取 root 权限后,通过 chroot 安装了 Linux 发行版,从而可以运行桌面环境。

2、AI 应用的核心逻辑(英文)

作者提出,AI 应用(AI agent)的核心逻辑只需要9行代码。

3、浏览器默认屏蔽的端口(英文)

你可能不知道,浏览器无法打开下面的网址localhost:6000,原因是6000是浏览器默认屏蔽的端口。

4、推荐 RustDesk 远程桌面(英文)

Mac 电脑访问 Windows 电脑,一种方法就是使用远程桌面,作者推荐远程桌面工具 RustDesk。

5、HTML <dialog> 的 CSS 技巧(英文)

HTML 有一个原生的弹窗元素<dialog>,本文介绍两个配套使用的 CSS 技巧。

6、Git 配置详解(英文)

本文详细解释 Git 配置命令 git config 的几个最常见的设置。

工具

1、Pyrefly

Meta 公司发布的 Python 代码的类型检查器,参见介绍文章

2、Zen Browser

新发布的一个开源浏览器,基于 Firefox,国外评价非常高,使用体验好,参见介绍文章

3、xtool

Xcode 的替代品,在 Linux/Win/macOS 开发 iOS 应用。

4、Zero Convert

在线批量转换文件,基于 WebAssembly 技术,完全本地完成,还可以编辑图片。(@xiaoshangmin 投稿)

5、耗子面板

Go 语言开发的服务器管理面板。(@devhaozi 投稿)

6、Goravel

Go 语言的 Web 开发框架,与 PHP 的 Laravel 框架保持一致,方便快速上手。(@devhaozi 投稿)

7、OpenSpeedy

开源的游戏变速工具,通过调整 Windows 系统时间函数来实现游戏速度变化。(@game1024 投稿)

8、SimonAKing-Gallery

后端的 JS 相册应用,瀑布流展示图片,指定图片目录,直接运行即可。(@SimonAKing 投稿)

9、Jwno

网友开源的 Windows 10/11 平铺窗口管理器,键盘驱动。(@agent-kilo 投稿)

10、星河小程序

滴滴公司开源的跨平台开发框架,支持将小程序打包成为安卓、iOS、鸿蒙和 Web 四个平台的原生 App。(@dos1in 投稿)

AI 相关

1、aTrain

一个跨平台、图形界面的自动语音识别工具,基于 Whisper 模型,支持识别50多种语言,参见介绍文章

2、AI Image Editor

在线的免费图像处理工具,提供多种 AI 功能,比如图片增强、去除水印、风格转换等十几种。(@worminone 投稿)

资源

1、万物博物馆

一个跨平台的桌面软件,将维基百科变成一个虚拟博物馆。

每件展品与维基百科的一篇文章相对应,墙上的画框就是文章图片,讲解牌就是文章内容。

走廊则根据文章的链接通向其他展厅,有几乎无限的展厅可以参观。

图片

1、《星球大战》的机器人

《星球大战》的第一部电影,拍摄于1976年,里面有一个机器人 R2-D2,会四处走动,做各种动作,还会说话。

其实,它根本没那么高科技,拍摄的时候,就是里面藏了一个真人演员。

2、冰为什么体积大?

水变成冰以后,体积会增大10%,密度因此小于水,使得冰可以浮在水面上。

那么,冰的体积为什么会增大呢?

答案是冰的分子结构,跟水的分子结构不一样。

上图左侧是液态水的分子结构,右侧是冰的分子结构。其中,白色节点为氢原子,红色节点为氧原子。

可以看到,液态水是紧密聚合的网络结构,冰则是中空的网络结构。也就是说,冰的分子结构不是那么密合,所以体积就变大了。

文摘

1、Slack 公司的 URL

Slack 是一家即时通信的软件公司。它的官网有一个"公司介绍"的页面,通常来说该页面的 URL 会是slack.com/about,但是 Slack 没有采用这种做法。

它将这个页面命名为is,并分拆成若干个子页面。

所以,"公司介绍"页面的 URL 是slack.com/is

子页面的 URL 如下。

  • slack.com/is/team-communication
  • slack.com/is/everything-in-one-place
  • slack.com/is/wherever-you-are

这样的好处是单单看 URL,就知道页面想要传递的信息,URL 本身就是对公司的一种宣传。

这种 is 的巧妙做法,后来被广泛借鉴。碰巧的是,is也正好是一个顶级域名,代表冰岛(iceland)。很多名人就申请了 is 域名,作为个人主页。

比如,艺术家杰西卡·希斯切(Jessica Hische)的个人网站,域名就是jessicahische.is,她介绍自己的页面 URL 就都是jessicahische.is/xxx的形式。

言论

1、

我们很快会跟大家分享一个低调的研究成果。我们会给它起一个比 chatGPT 更好的名字,以防它流行起来。

-- Sam Altman,OpenAI 的 CEO

2、

加尔定律经常被引用:"一个有效的复杂系统,总是从一个有效的简单系统进化而来。"

但是,它的推论很少被引用:"一个从零开始设计的复杂系统永远不会有效,你必须从一个可以运行的简单系统开始。"

-- Stack Staves

3、

宇宙有两种可能:要么我们是孤独的,要么我们并不孤独。这两种可能性都同样令人恐惧。

-- 阿瑟·克拉克,英国著名科幻小说家

4、

太阳绕银河系公转一圈需要2.3亿年,上一圈的时候,地球的主宰还是恐龙。

-- Reddit 网友

5、

我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

最终可能会出现这样一代人,自己的智力很低下,完全依赖于他们不理解的技术,一旦技术崩溃,他们永远无法从头开始重建。

-- 尼尔·斯蒂芬森(Neal Stephenson),美国科幻小说家,"元宇宙"一词的创造者

往年回顾

创业虽然好,不敢推荐了(#302)

互联网创业变难了(#252)

三个有启发的学习方法(#202)

从北大到技校(#152)

(完)

留言(73条)

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

CS 在读本科生,“水课”作业、专业课实验和作业,乃至大作业或课程设计,或多或少都借助了 LLM,结果就是几乎什么都没学到。还是老老实实查文档、看课本,自己动手实现一遍来得更踏实,学到真知识的同时,也更有成就感。

"一家美国创业公司,准备发射卫星,将 AI 机房建在太空。

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。"

在太空中没有空气对流,散热反而是很严重的问题,空气冷却没法用了。

沙特未来城很好地印证了加尔定律

芬兰尝试在驯鹿的鹿角,涂上荧光粉。

原文英文是 reflective paint,应该是“反光涂料”,而不是“荧光粉”吧,即只会反光,不会自发光。

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

运气成分很大呀

刘慈欣的《赡养上帝》就是讲了过分依赖过于成熟的技术,而完全丧失了对技术的理解。

引用Jason的发言:

"一家美国创业公司,准备发射卫星,将 AI 机房建在太空。

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。"

在太空中没有空气对流,散热反而是很严重的问题,空气冷却没法用了。

太空温度极低,可以通过热辐射的方式散热,效果很好且无需介质。

就在用 zen 看博客

在某社交媒体上看到关于人工智能的评论,大意如下:
现在大学生用大模型提交论文,而学校用大模型检测学生的作文是否是自己写的。这种行为十分荒诞,简直就像是用自慰棒去插飞机杯。

人类已经使用他们不理解如何生产出来的铁器生活几千年了。只要文明不断层,后人随时会从文字记录中快速恢复过来。

在太空中虽然没有空气对流,但是黑体辐射的散热效率会有很大的提升(散热功率 ≈ 散热表面积 * 玻尔兹曼常数 * 温度差^4)。如果目标温度是 20 摄氏度的话,甚至还得考虑给内部环境加热的情况。

其实我个人更在意的情况是网络延迟和带宽问题,毕竟如果想要提高散热效率就得放到更高的轨道,更高的轨道就会有更高的延迟和更窄的带宽。这样一搞无论是训练还是推理貌似都很成问题。

1986年,同龄人的我,还在为生活而苟且

引用某网友的发言:

太空温度极低,可以通过热辐射的方式散热,效果很好且无需介质。

太空热辐射散热,散热效率很慢的。特别慢。

AI的核心代码我觉得9行多了,一行就可以:

llm(msg)

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

一个人的命运,既要考虑个人的奋斗,也要考虑历史的进程

引用Jason的发言:

"一家美国创业公司,准备发射卫星,将 AI 机房建在太空。

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。"

在太空中没有空气对流,散热反而是很严重的问题,空气冷却没法用了。

问了下豆包散热的问题,得到的回复是太空飞行器一般通过辐射散热。感觉这个太空服务器主要还是通信性能和维护成本方面存在问题,就是把一般服务器的用电成本换成了发射成本+特殊材料+高折损率,规模上去的话理论上是有可能把单价打平甚至逆袭。就是到时候又会有其他问题了,比如造成太空垃圾泛滥

引用钊的发言:

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

运气成分很大呀

必然藏在偶然之中

"我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。"

工作中也经常用,只要把GPT当成自己思考的补充,而不是替代自己思考,那问题不大。

引用某网友的发言:

太空温度极低,可以通过热辐射的方式散热,效果很好且无需介质。

是的, 热传递的三种试, 传导对流辐射, 只身下辐射了, 在太空中早就广泛应用了, 只是局限很大, 对流是能最快带走热量的方式, 辐射不能, 而且还要建巨大的辐射面板

“伊尔亚·苏茨克维出生于前苏联,后去了以色列,然后来到加拿大。他是亚历克斯·克里泽夫斯基在多伦多大学的博士同学,也是辛顿的博士生。”

你说 伊尔亚 ,不看照片,不知道是谁
你要说 伊利亚 ,一下子就知道是谁了

【我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。】
很赞同,AI应该是辅助工具,不是替代工具。就像作业直接抄答案,虽然任务完成了,但是自身却没有掌握里面的知识。

引用Jason的发言:

"一家美国创业公司,准备发射卫星,将 AI 机房建在太空。

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。"

在太空中没有空气对流,散热反而是很严重的问题,空气冷却没法用了。

确实,真空中建立AI机房的话,不仅要考虑减少太阳辐射,还要考虑主动将自身的能量辐射出去

引用Allen的发言:

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

CS 在读本科生,“水课”作业、专业课实验和作业,乃至大作业或课程设计,或多或少都借助了 LLM,结果就是几乎什么都没学到。还是老老实实查文档、看课本,自己动手实现一遍来得更踏实,学到真知识的同时,也更有成就感。

电脑搜索出来前,大家都在图书馆里查资料呢

slack.com/is/wherever-you-are 已被做了重定向。
slack 官网的介绍页面还是 https://slack.com/about

引用roland的发言:

就在用 zen 看博客

+1 特地下载了Zen 来使用下

引用Allin的发言:

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

一个人的命运,既要考虑个人的奋斗,也要考虑历史的进程

突然想起《鬼吹灯》里的一句话,“摸金校尉,合则生,分则死”。回过头来看看李飞飞、辛顿和黄仁勋的个人历程,李飞飞因为imagenet项目差点没法毕业,辛顿因为第三次人工智能寒冬沉寂了20年,老黄当年做nvidia芯片好像也是破釜沉舟,三个前途未知的人碰到了一起,AI时代来临了。他们造就了时代,时代也成就了他们。真奇妙啊!

引用Allen的发言:

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

CS 在读本科生,“水课”作业、专业课实验和作业,乃至大作业或课程设计,或多或少都借助了 LLM,结果就是几乎什么都没学到。还是老老实实查文档、看课本,自己动手实现一遍来得更踏实,学到真知识的同时,也更有成就感。


之前是这样的,但其实在DeepSeek-R1模型推出之后,我觉得这种状况有所缓解。因为推理类的模型默认输出模型思考链。就相当于,我们不仅有了名师给的答案,还有了他的思考逻辑(虽然不一定适用于自身)。个人觉得遇到一个未涉足的领域问题,最难的不是实施阶段的“怎么做”,而是问题我该怎么切入,我应该“怎么问”才能获取到我应该知道的知识,哪些知识是这个问题上我需要知道的?哪怕遇到推理模型的思考链对于一些知识点一笔带过,我们也能从中提取“怎么问”的关键词,自己获取答案。

最近仔细看了下周刊下面的评论,感觉很有意思,阮大是否有群可以加入,或者考虑新建一个群,能认识下兴趣相投的人

需要封闭环境才能杜绝AI

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

实际这个世界本来也不需要那么多“学到”什么的人。无论用什么方法学,聪明人大部分最后还是聪明人,少数会变成普通人。普通人绝大多数还是会成为普通人,少数会变成聪明人。这个世界要发展,至少现阶段并不需要太多聪明人的。

特别是大语言模型并没有强制规范怎么去学,只是提供了多一种方式而已。

> 我们很快会跟大家分享一个低调的研究成果。我们会给它起一个比 chatGPT 更好的名字,以防它流行起来。

取一个有利于传播的名字不是更好吗?为什么要防止它流行起来?

引用sun的发言:

确实,真空中建立AI机房的话,不仅要考虑减少太阳辐射,还要考虑主动将自身的能量辐射出去

直接用空调原理就行了把,用氟利昂类但适合太空环境的冷却剂在设施内外传递热量,设施内部整个就是一个大的空调翅片,主板带cpu直接贴在散热片上,散热片主动制冷。散热片的热量用氟利昂带到设施外面。外面的散热装置通过自转或遮挡始终保持在背向太阳的一面,反正面积大,温差大,就直接辐射散热。

为什么不用考虑散热问题,太空最需要考虑的就是散热问题了,你建的机房产热这么多,得多大的散热板去热辐射啊。

真空环境下,散热可是老大难问题。

“我们很快会跟大家分享一个低调的研究成果。我们会给它起一个比 chatGPT 更好的名字,以防它流行起来。”Altman不愧是殿堂级的宣传营销大师。
之前就感觉,他和他的员工,经常在网上发表一些故弄玄虚、装神弄鬼的言论。
这些云遮雾绕的言论还真不是没用,至少成功把之前大公司发展AI模型的方向引歪了,大家都狂堆算力。
最后DeepSeek这个愣头青小公司(相对而言)却把OpenAI最关键的、想尽办法藏着掖着的最核心思路开源了,也就是MoE。
事后OpenAI才扭扭捏捏承认,自己其实早就发现这个东西。
虽然商业竞争无可厚非,但起个Open的名字实在反讽了些。
不过,现在看起来,Altman的发言风格还是老一套,还是那副“旷世高人”的老神仙模样,继续忽悠大法。
可能美国环境特殊,我印象中,美式商业理论非常推崇这种能说会道、满口谎言的“人才”,毕竟等到别人发现不对劲的时候,你早就已经赚饱跑路,去做下一桩买卖了。

引用Allen的发言:

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

CS 在读本科生,“水课”作业、专业课实验和作业,乃至大作业或课程设计,或多或少都借助了 LLM,结果就是几乎什么都没学到。还是老老实实查文档、看课本,自己动手实现一遍来得更踏实,学到真知识的同时,也更有成就感。

不管是查文档、看课本还是动手实现,都可以通过 AI 辅助,节省时间。重点在于要理解 AI 在说什么,而不是生搬硬套。

"一家美国创业公司,准备发射卫星,将 AI 机房建在太空。

它依靠24小时的太阳能供电,也不用担心散热。

该公司希望通过这种方法,解决 AI 服务器的耗电和冷却问题。"

看看中国的,已经上天的卫星吧。

https://news.cctv.cn/2025/05/15/ARTIczUfaHq0py6G97rC2MHU250515.shtml

实际上,这种计算卫星可以用于在太空上计算其他卫星的数据。

这一期的评论区很有深度啊

引用Allen的发言:

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

咱学前端的体验也是这样。。。
已经可以用ai花大量时间从零搓一个像模像样的独立站了。
但是让自己抛开ai写...我就完全想不到那些画面效果该怎么实现。

我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

最终可能会出现这样一代人,自己的智力很低下,完全依赖于他们不理解的技术,一旦技术崩溃,他们永远无法从头开始重建。


没啥问题吧,他们的智力会放在其它地方啊。不是每个人都需要知道芯片怎么造出来的,汽车怎么造出来的

`只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。`

我看大家都对这一句话有感触。
我理解是:这么高浓度的人才聚集在硅谷,如此优化的风投运作机制, 即使英伟达不出现高新能显卡。
其他公司或者团队估计也会攒一个硬件。
将以上的东西总结为土壤,那么只要这个土壤长时间保持肥沃,有良好的循环,一两个好的idea就像是种子一样,落到土壤里就会快速成长和发芽。至于这个种子最后可以长多高多壮大,那就看这个种子内生的生长力。

这上面的过程叫做创新。是的,创新就是这么一回事。把人才,资金,时间,软件,硬件,一大堆东西放在一个缸里,搅拌搅拌,指不定就搞出个什么好玩意儿。

这不是说我们国内就没有,杭州不久在学习这样搞么。
别急,等吧。

突然联想到有些出土的工艺是现在人无法做到的。若干年后的人会不会也惊叹当前的技术呢。

`只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。`
我觉得更像是这几个条件漫长的互相等待吧,并不是同时出现。
引用一下ai整理的关键年份:
各个关键技术和数据集的首次出现年份大致如下:

神经网络算法:

理论模型: 1943年,Warren McCulloch和Walter Pitts提出了第一个抽象的神经元模型(M-P模型)。
感知机(Perceptron): 1957年,Frank Rosenblatt发明了第一个可训练的神经网络——感知机。
反向传播算法(Backpropagation): 虽然概念在1974年Paul Werbos的博士论文中有所提及,但在1980年代中期,由Rumelhart、Hinton和Williams等人的工作使其得到广泛应用。
深度信念网络(Deep Belief Networks): 2006年,Geoffrey Hinton发表论文,提出了“深度信念网络”的概念,标志着深度学习的复苏。
ImageNet 训练集:

项目启动与首次发布: ImageNet项目由李飞飞团队于2006年启动,并于2009年首次公开发布了包含数百万张图像和数万个类别的ImageNet数据库。
ImageNet 大规模视觉识别挑战赛 (ILSVRC): 于2010年开始举办。
NVIDIA 高速显卡(GPU 与 CUDA):

GPU 概念提出: NVIDIA在1999年发布GeForce 256时首次提出了GPU(图形处理器)的概念。
CUDA 发布: NVIDIA的并行计算平台CUDA(Compute Unified Device Architecture)于2007年2月首次发布。它使得开发者能够利用GPU进行通用计算,为后来的深度学习加速奠定了基础。
综上所述,虽然这些要素在2012年达到一个结合的巅峰,并催生了深度学习的爆发,但它们各自的起源和发展都远早于2012年。

> 最终可能会出现这样一代人,自己的智力很低下,完全依赖于他们不理解的技术,一旦技术崩溃,他们永远无法从头开始重建。

我们还依赖编译器呢,现在有几个人会写汇编码?一旦世界上所有编译器崩溃,有几个人会编译?无稽之谈

> 最近仔细看了下周刊下面的评论,感觉很有意思,阮大是否有群可以加入,或者考虑新建一个群,能认识下兴趣相投的人

双手双脚同意,阮大可以组建一个活跃的技术社区/群

"我们很快会跟大家分享一个低调的研究成果。我们会给它起一个比 chatGPT 更好的名字,以防它流行起来。"

不愧为商业鬼才

如果ai能百分之百的完成这个东西,复制过来就能用,为什么还要人学习技术细节呢?直接用不就好了吗?
担心ai服务崩溃,技术资料全部消失,这比外星人入侵还要天方夜谭
ai本来就是解放人类,节省人类的时间成本的,何况如果想学真东西,有ai辅助,学习成本也能大大降低

引用kiFte的发言:

咱学前端的体验也是这样。。。
已经可以用ai花大量时间从零搓一个像模像样的独立站了。
但是让自己抛开ai写...我就完全想不到那些画面效果该怎么实现。

是的,我就是担心自己过分依赖于 AI,对 AI 生成的东西一知半解,甚至无法区分正确与否,脱离了 AI 就几乎不能自己从头实现一个项目。

不过有些时候 LLM 确实是很有用的:比如把文档喂给它,快速筛选出我想要的参数;或者生成一些简单好用的脚本;也能辅助我阅读项目源码等等。

总的来说,要用好 AI 来提升学习和工作效率的话,我觉得应真正理解 LLM 给出的内容,区分它什么时候在胡言乱语,不依赖 AI,多过过脑子才是最重要的。

引用Charles的发言:

最近仔细看了下周刊下面的评论,感觉很有意思,阮大是否有群可以加入,或者考虑新建一个群,能认识下兴趣相投的人

何不留下VX 自己建群

我觉的 雨果。德。加里斯(Hugo de Garis) 才是 真AI 的唯一创始人。

印象里费曼说过,人类一直在对世界一无所知中生活。
从来没有人真的理解自己依赖的技术,甚至可以说,理解这些技术、可以理解这些技术不过是一种虚妄的幻觉。

引用Gao的发言:

> 我们很快会跟大家分享一个低调的研究成果。我们会给它起一个比 chatGPT 更好的名字,以防它流行起来。

取一个有利于传播的名字不是更好吗?为什么要防止它流行起来?

应该是翻译问题,“得起个好名,万一火了呢”

LLM的流行会像人们展示实践的重要性,如果从现代的理论来表述的话。知识分为「陈述性知识」和「程序性知识」,LLM只解决了「陈述性知识」,但是「程序性知识」”需要实践来获得。

引用Allen的发言:

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

CS 在读本科生,“水课” 作业、专业课实验和作业,乃至大作业或课程设计,或多或少都借助了 LLM,结果就是几乎什么都没学到。还是老老实实查文档、看课本,自己动手实现一遍来得更踏实,学到真知识的同时,也更有成就感。

大模型AI之前就存在复制粘贴“缝合怪”,这个现象一直就存在,并不是AI导致了这个现象,只是降低了门槛。

请问有使用Zen Browser时,即时有开启VPN,但无法访问国外网站的问题吗?比如说Github Gmail等

引用某网友的发言:
太空温度极低,可以通过热辐射的方式散热,效果很好且无需介质。

“效果很好”是对比什么?

可以把AI当成一个有很多wheels的一个,wheels博物馆,需要什么就去取用,只要是为了完成你自己的car,当然你也要知道这个wheel的参数等各种信息,现在这个时代感觉就是要用ai来提升自己上手某件事情的速度,感觉世界就是一个巨大的草台班子,没人可以保证自己懂得自己用的所有技术@_@

机房建太空其实能源是更大的问题
近地轨道假定和地球差不多,WP上的数据是 1361 W/m^2,太阳能板的转化效率给他放高一点25%,发电效率是340W/m^2,而20℃的辐射散热片向3K背景辐射的效率是418W/m^2,还能双面散热。也就是说不到太阳能板一半的面积的辐射散热片就能处理散热问题了。
散热不是很大的问题,因为太空中只靠太阳能板即发即用,能源就不多,而你的散热需求差不多就是发电量等量,不是吗?(更不用说如果不放在日地拉格朗日点的话,在背光面不发电但散热……)

其实另外还有一个问题,宇宙射线导致的位翻转怎么处理。训练AI的容错度比较高吗?

引用schummy的发言:

AI的核心代码我觉得9行多了,一行就可以:

llm(msg)

一行不成,不能把本地权限全权交给llm,至少得做个本地代理

引用钊的发言:

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

运气成分很大呀

生命的出现运气成分更大

引用钊的发言:

只有等到2012年,才万事俱备。神经网络算法 + 李飞飞的 ImageNet 训练集 + Nvidia 高速显卡,同时出现了。

运气成分很大呀

成功永远少了运气,最后一块儿拼图

引用Charles的发言:

最近仔细看了下周刊下面的评论,感觉很有意思,阮大是否有群可以加入,或者考虑新建一个群,能认识下兴趣相投的人

其实这样最好,有点想法,大家就写下来,而且还可以保存。群里事情大家的话不多的,最后都变成了死群,而且大家说的话很多留不下来。

引用Ethan的发言:

> 最近仔细看了下周刊下面的评论,感觉很有意思,阮大是否有群可以加入,或者考虑新建一个群,能认识下兴趣相投的人

双手双脚同意,阮大可以组建一个活跃的技术社区/群

在 《网络社区的悲剧》 那一期阮老师讲过为什么不建社区/群的原因。

引用ken的发言:

生命的出现运气成分更大

这世界不是偶然的,造物主是存在的,游戏继续~~~ :D

引用yanmin的发言:

其实这样最好,有点想法,大家就写下来,而且还可以保存。群里事情大家的话不多的,最后都变成了死群,而且大家说的话很多留不下来。

建群后最终会变成吹牛水群,很多技术群都是这样的

引用daming的发言:

电脑搜索出来前,大家都在图书馆里查资料呢

用电脑也是查资料,查完学习到自己脑袋了,但是现在,是让AI帮自己做作业,但是作业没进自己脑袋

slack的文章是23年的,is也已经变成about的形状了

我喜欢每周来这里看最新的科技进展,能够获取好多有用的信息。真棒

技术都是不断地积累

引用roland的发言:

就在用 zen 看博客

zen 和 arc 很相似啊

引用铁腕的发言:

问了下豆包散热的问题,得到的回复是太空飞行器一般通过辐射散热。感觉这个太空服务器主要还是通信性能和维护成本方面存在问题,就是把一般服务器的用电成本换成了发射成本+特殊材料+高折损率,规模上去的话理论上是有可能把单价打平甚至逆袭。就是到时候又会有其他问题了,比如造成太空垃圾泛滥

适合训练任务,最好长达几十天几个月才交换一下数据,通信需求低的情况

引用Allen的发言:

> 我关注了一些教育工作者,他们都报告了同样的现象:他们的学生什么事情都用 ChatGPT,结果什么也没学到。

CS 在读本科生,“水课”作业、专业课实验和作业,乃至大作业或课程设计,或多或少都借助了 LLM,结果就是几乎什么都没学到。还是老老实实查文档、看课本,自己动手实现一遍来得更踏实,学到真知识的同时,也更有成就感。

因为chatgpt只是工具,而工具的使用是要区分阶段的
这就像小学生学四则运算时使用计算器一样。

引用Jason的发言:

在太空中没有空气对流,散热反而是很严重的问题,空气冷却没法用了。

你猜为什么太阳光是热的

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接