科技爱好者周刊(第 153 期):机器翻译是对译者的侮辱吗?

作者: 阮一峰

日期: 2021年4月 9日

这里记录每周值得分享的科技内容,周五发布。

本杂志开源(GitHub: ruanyf/weekly),欢迎提交 issue,投稿或推荐科技内容。

周刊讨论区的帖子《谁在招人?》,提供大量程序员就业信息,欢迎访问或发布工作/实习岗位。

封面图

曼谷市内最肮脏的一条水道 Klong Ong Ang,经过5年的努力,终于变清了。两岸布置了绿植和灯光,游客可以划独木舟,这条曾经的臭水沟成了吸引人的景点。(via

本周话题:机器翻译是对译者的侮辱吗?

上个月,豆瓣网有一条新闻。北京语言大学的一个研究生,对乌拉圭小说《休战》的中译本打了差评。

"机翻痕迹严重,糟蹋了原作。还是老话,没有金刚钻别揽瓷器活。希望出版社找西班牙语科班出身的译者,翻译这些名家。"

译者看见了这条评论,非常生气,你凭什么说我像机器翻译!

"作为译者,愿意虚心接受来自所有人的意见。但是,逐字逐句认真翻译反复修改的书稿被说"机翻痕迹严重",感觉挺糟心的。我觉得这和"翻译不好"不是一个概念,近乎人身攻击了。"

这本来是小事一桩,但是译者的好友打抱不平,向北京语言大学写举报信,声称该校学生对译者和出版社进行恶意攻击。学校收信后,出面让学生写了书面道歉。这下犯了众怒,网友蜂拥而至,为该书打"一星"。最终,豆瓣网不得不关闭了此书的评论和打分功能。

使用行政力量,压制正常的文艺批评,令人不齿。但是,今天我不想谈这个,而是想谈谈南桥老师提出的一个有趣的观点:机器翻译很难接受吗?

"为什么被说是机器翻译,译者会觉得反感?难道翻译一定要逐字逐句人肉翻译吗?"

这个问题提得好。 很多人内心里面,把"机器翻译"等同于"劣质翻译"。 但是,这种想法已经过时了。

现在的机器翻译强大得很,跟人工翻译的差距越来越小。英译中,人工翻译还有一点优势;但是中译英,真的不妨交给电脑吧。再过几年,如果有人说,你的翻译像机器翻译,很可能是一种表扬。这就好比,你的围棋水平被说成是软件水平,那就是世界冠军了。

我的想法是,拥抱机器翻译,尽量多使用。它是一种工具,能够提高生产力,为什么不多用呢。网上那么多英语信息,你看原文,看得过来吗?更好的方法是用机器翻译,先看一下中文。

各大浏览器现在全都内置了机器翻译,以 Edge 浏览器为例,打开英文网页时,会自动弹出一个对话框,询问是否需要翻译成中文。

我建议勾选"始终翻译英语网页",以后只要打开英语网页,就会默认翻译成中文。这样阅读英语文章,极大提高速度,你的信息量将成倍增长。就算有时翻译得语句不通,但足以了解大意,如果觉得有必要精读,再查看英语原文。

此外,Gmail 网页端也内置了"邮件翻译"功能,这个也很有用。

回到翻译书籍,我认为合理的流程是,先让机器翻译一遍原著,译者再修改机器译稿。这样起码节约了打字的时间和精力。未来也许就没有"译者"这个称谓了,只有"机器翻译校对"。

Vite + TypeScript 深度实践

周刊与培训机构合作,每周介绍一门课程。通常,介绍的都是基础性课程, 本周尝试介绍一门前沿课程,内容很新,很多公司都在尝试,需要一定的前端基础。那就是 Vue.js 官方新推出的开发工具 Vite

Vite 到底是什么?一些资深的开发者都不太了解。这也难怪,它只有一年的历史,两个月前刚发布了稳定版 2.0。

简单说,Vite 是 Vue.js 项目的开发服务器,提供了快速打包能力,用来替换掉 Webpack。大家知道,Webpack 的最大痛点除了配置复杂,就是打包速度非常慢。有些大型项目,喝一杯咖啡回来,都没打包完;开发阶段哪怕只是修改一行代码,热更新(HMR)重新打包有时也要好几秒甚至更久。

Vite 就是为了解决这个问题而设计的,利用浏览器原生的 ES6 模块的加载能力,跳过 Webpack 打包,为开发阶段提供"快如闪电"(官方文档用语)的加载速度。它的 Logo 就是一道闪电。

本周的课程介绍 Vite 的用法, 深度实践 Vite + TypeScript,带你真正理解 Vue3 的开发与应用。因为 Vite 是 Vue.js 的官方产品,以后的最佳实践应该就是用它来开发 Vue 项目。了解和学会这一套新做法,不仅有助于前端技术水平的快速进阶,也有助于先人一步掌握 Vue3.0 如何在企业项目中落地,为面试和工作助一臂之力。

本课程由腾讯课堂"双认证"机构----京程一灯提供,原价98元,周刊读者只需 0.02元即可报名。微信扫描下方二维码,加入课程群,即可报名。

报名成功的同学,还会再送一份价值294元的课程资料《TypeScript 高级教程》。

科技动态

1、海水淡化暖房

一个英国团队在非洲索马里兰海边,建成了大型海水淡化暖房。完全不用电,只使用阳光,进行海水淡化。

暖房里面有四个大型的金属制成的蒸发墙,放入海水以后,在干热的沙漠风吹拂之下,海水迅速蒸发,水蒸汽在蒸发墙上冷凝,形成淡水。同时,蒸发后的海水变成海盐,可以单独出售。

2、人脸识别破解术

上海警方破获一起虚开增值税发票案,犯罪嫌疑人通过破解"人脸识别",注册虚假公司开假发票。他们先以30元每个的价格,收购他人的高清头像照片和身份证信息,然后使用"活照片" App 让照片"动起来",生成包括点头、摇头、眨眼、张嘴等动作视频。

有了视频,下一步使用特殊处理的手机'劫持'摄像头,在人脸认证环节时,手机摄像头不会启动,系统获取的是之前做好的视频。系统会认为是本人在摄像头前,最后会通过认证。

据犯罪嫌疑人交代,他们已经破解了大量含有"人脸识别"环节的 App,其中不乏许多用户量巨大的App。每单的破解价格从25元到300元不等。

3、月球方舟

美国亚利桑那大学的科学家提出"月球方舟"的设想,将地球上670万物种的种子、孢子、精子和卵子,冷冻储存后送到月球保存,以防物种灭绝。

具体做法是,利用月球地表下熔岩形成的空洞,建设坑道,将冷冻容器放在里面。月球地表已经有三、四十亿年没有改变过,比起现在位于北极的世界种子库要安全得多,地球的风险实在太大。

4、谷歌甲骨文诉讼的终审

2005年,谷歌收购了安卓系统,准备将 Java 语言用于安卓开发。由于授权费没有谈拢,最后选择自己实现 Java 虚拟机,没有用官方实现,但是外部 API 保持不变。这样一来,开发者正常编写的 Java 代码不用修改,就可以在安卓上面运行。

2010年,甲骨文公司获得 Java 语言所有权之后,起诉谷歌侵权。双方争议的焦点是,软件的 API 是否具有版权,即谷歌沿用 Java 的 API,是否造成侵权?业界对这个诉讼非常关注,如果法庭判决侵权成立,以后就很难做服务的兼容层,因为未经许可不能提供跟他人一模一样的 API 了。

这个案件经历了多轮审判,2018年法院判决甲骨文胜诉,谷歌上诉至美国最高法院。2021年4月5日,最高法院以6票赞成、2票反对,裁决谷歌对 Java API 属于合理使用,不构成侵权。

5、一句话消息

埃及国家博物馆搬迁新馆,政府举办了一个盛大晚会。浩浩荡荡的游行队伍将18具古埃及法老和4具皇后的木乃伊,以国王的规格,护送到新馆。这些木乃伊距今已经有3000多年。

GitHub 代码提交统计的 3D 模型,前一段时间开放了官方下载,网友已经收到了实物。官方的 3D 打印价格很贵,大家可以下载 stl 文件,去国内的网店打印。

奢侈品牌 Gucci 发布了首款数字虚拟运动鞋:Gucci Virtual 25,售价人民币78元。买来后,只能在线上世界穿。目前, Gucci App、VR 社交平台 VR Chat、游戏平台 Roblox 支持该鞋。

中科院研究显示,北半球的夏季平均从78天增加到95天,而春季、秋季、冬季都变短了。

文章

1、加油站扫码支付的风险(中文)

政府提示,在加油机旁边扫码付款有重大风险,手机发射的功率可能引发射频火花。这样说的话,那里也不应该手机上网。

2、如何救助一只雪豹(中文)

青海野生动物救护中心的副主任讲述,救助一只迷路雪豹的全过程。

3、大数据可视化工具(英文)

现在前端的图表库很多,作者推荐了几个他觉得最好的库,逐一进行了介绍。

4、Git 邮件工作流(英文)

多人项目现在一般使用 Pull Request 进行合作,但是 Linux 内核项目使用的是电子邮件工作流,本文介绍具体怎么做。电子邮件发送 Patch 其实也很方便。

5、React + D3.js 如何开发 SVG 图形(英文)

本文是一篇详细教程,讲解如何在 React 里面引入 D3,开发 SVG 动画。

6、八进制数字造成的安全漏洞(英文)

本文分析 node.js 库 netmask 的一个安全漏洞的由来。如果黑客输入0177.0.0.1,netmask 会认为这是一个公网地址,但实际上是内网地址。

7、什么是二分法搜索?(英文)

通过示例,详细讲解二分法搜索的入门教程。

8、如何创建 SVG 网格布局和动画(英文)

本文是一篇详细教程,一步步教大家怎么在 SVG 图形里面,创建网格布局,并且添加图像的动画效果。

工具

1、xeuledoc

一个命令行工具,用于获取谷歌文档的各种元信息。

2、kill-sticky

一个 Bookmarklet 书签脚本,用于消除网页上的粘性页眉或页脚。

3、I don't care about cookies

浏览器插件,用来消除网页上的各种 Cookie 许可的提示层。

4、Sorted CSS Colors

CSS 标准一共列出了148种有名称的颜色,这个在线工具用来在它们当中找到合适的颜色。你在色轴上面确定一个基色,相近的颜色就会按照从浅到深的顺序列出。

5、Nyxt

一个带有命令行的浏览器,可以完全不用鼠标,只通过命令行浏览网页。

6、Charts.css

一个只使用 CSS 的图形库(不需要 JS),可以把<table>标签变成折线图、直方图或其他图形。

7、Manim

一个用来生成数学动画视频(比如绘制函数)的 Python 库。

8、React PIN Field

一个 React 组件,生成漂亮的密码(验证码)输入框。

9、FocalBoard

一个桌面的看板软件,类似 Trello,可以用来管理待办事项。

10、Workflow

搜狗的 C++ 服务器引擎,支持各种后端协议,可以在它的基础上进行 C++ 开发,定制自己的高性能服务器。(@holmes1412 投稿)

资源

1、Visu Algo

该网站有各种常用算法的可视化演示。(@CIPHER-D 投稿)

2、.new域名

.new域名是谷歌托管的,提供了一个打开网络服务的快捷方式,下面是一些例子。

  • doc.new:新建一篇谷歌文档
  • sheet.new:新建一个谷歌表格
  • js.new:新建一个 CodeSandbox 的代码片段
  • github.new:新建一个 GitHub 仓库

标题网址是谷歌官方的.new域名汇总。

3、文本编辑器比较

文本编辑器是程序员的必备工具,这里比较了十几个常见编辑器的性能,包括内存占用、文件打开时间、正则搜索速度、大文件支持等方面。

4、Emoji Tracker

这个网页按照推特的使用数量,对表情符号 Emoji 进行排序,最常用的放在最前面。可以用它查找哪些 Emoji 是经常使用的。

5、Go 实用教程(Practical Go Lessons)

一本很不错的 Go 语言的英文教程,从零讲起。

图片

1、复杂的 C++

C++ 是一门复杂的语言,但是语言设计者还在往里面添加更多的东西。

  • C++98版:879页
  • C++11版:1324页
  • C++14版:1368页
  • C++17版:1586页
  • C++20版:1834页

C++17 比 C++98 多了近80%的内容,而最新版 C++20 比 C++98 多了近1000页。开发者可能会抱怨复杂性的增加,很难掌握所有的内容,但是除了接受,并没有其他办法。

2、加尔松潟湖大桥

加尔松潟湖大桥是乌拉圭的一座环状桥梁,于2015年通车。

它的环状设计主要出于美观考量,但也有一些实际的好处,比如强迫司机只能减速行驶,同时可以为行人设置单行道,不同方向的行人走不同的半圆,提高了安全性。

文摘

1、时间是如何浪费掉的?

作者:Paul Graham

几天前,我意识到了一件令人惊讶的事情:浪费时间的最危险方法不是花时间在玩,而是花时间在做假工作。

当你花时间玩乐时,你会知道自己在放纵。内心的警报很快就会发出。如果某天早晨我醒来后,整天坐在沙发上看电视,我很快会觉得自己一定是做错了什么。这样一想,就让人不舒服。你只需要在沙发上看电视2个小时,就会有这种不舒服的反应,更不用说整天看电视了。

但是,还有一些天,你整天都在忙,等到晚上你问自己今天干了什么,回答是:虽然很忙,做的却没什么意义。

你的感觉也会因此不好,但是不像整天看电视那样糟糕。如果我整天看电视,我会觉得自己正在走向灭亡,但如果是忙忙碌碌做无意义的事情,这样的警报就不会响起。因为我所做的事情表面上看起来像是真正的工作,比如处理电子邮件。

表面上看,你一天都在办公桌前工作,但其实你也是在浪费时间,因为这不会让你的生活发生真正的变化。而且由于你的内心不会发出警报,比起看电视,假工作才是浪费时间最危险的方法。

时间要用来做对你真正重要的事情,不要落入假工作的陷阱。

言论

1、

为了提炼出一个清晰的观点,我需要充足的睡眠、贪婪地阅读、修炼者一样地冥想、不跟任何人解释我在干嘛。

-- 纳西姆·塔莱布(Nassim Taleb),畅销书《黑天鹅》的作者

2、

写作过程分为两个阶段:发散和收敛。在发散阶段,你自由地探索新想法;在收敛阶段,你变得专注,将想法尽量简化,以便将其发布。我最喜欢的一句写作格言:收集点,然后连接点。

-- David Perell

3、

金钱杀死了黑客团体,加密货币的兴起是最后一击。有些黑客团队通过入侵比特币交易所而成为亿万富翁,那些声称自己不在乎钱的黑客几乎毫无例外地都是孩子,或者只是假装自己不在乎。

-- Hacker News 读者

4、

我希望 Deno 和 node.js 可以合并,就像以前 io.js 和 node.js 的合并。但是,这次应该很难发生,io.js 属于分叉,而 Deno 更像生态系统的重启。

-- Hacker News 读者

5、

大学的建立是为了培养学生进行智力探索,但是现在,大学越来越转向职业培训,这根本不是建立大学的原始目的。

-- David Perell

历史上的本周

2020年(第 102 期):工作热情从何而来?

2019年(第 50 期):"时间换收入"是一个陷阱

订阅

这个周刊每周五发布,同步更新在阮一峰的网络日志微信公众号

微信搜索"阮一峰的网络日志"或者扫描二维码,即可订阅。

(完)

留言(45条)

环状桥梁那个,是不是椭圆会好一些

机器翻译对工具书或者教材来说没问题 但文学作品可能还是需要人为理解之后的“意译” 也就是常说的信达雅

关于机器翻译我不赞同博主观点,理由如下:

1.引用:“先让机器翻译一遍原著,译者再修改机器译稿。”
机器翻译错译漏译频繁,特别是现在所谓的神经机器翻译,原来的统计机器翻译好歹还有词对齐(Word Alignment);

2.引用:“英译中,人工翻译还有一点优势;但是中译英,真的不妨交给电脑吧。”
这点就过于池沼了,用过机器翻译的人都知道,中译英比英译中烂20倍不止,很多翻译后语句与原意有偏差,语法上也是进行时过去时乱加,无论是谷歌翻译还是DeepL都是这样;

3.机器翻译对于英语以外的语言特别是非拉丁语系都非常拉胯,比如日语、韩语、泰语等,由于缺乏语料,需要经过两次翻译,先译成英语再译成目标语言,这样翻译出的文本根本不能看。

5、总的来说,美国大学的建立是为了给学生提供一个进行智力探索的地方。但是最近,我们要求他们把重心转向职业培训,这不是他们设计的目的。现在,我们陷入了一个职业系统,它花费的时间比它应该花费的时间要长。
-- David Perell

最后一句看不到

发现本期介绍的 Visu Algo(各种常用算法的可视化演示),在第50期出现过。
为什么能发现这个情况?因为好奇看了本期的“历史上的本周”。

历史上的本周
2020年(第 102 期):工作热情从何而来?
2019年(第 50 期):"时间换收入"是一个陷阱

机器翻译不行的,特别是用在文学书籍的翻译,根本不可取;

像政府工作报告,或者专业度很高的文章,我真的觉得机翻比我强多了……(专八 + CATTI 三笔)

我觉得休战的译者可能并不是觉得机器翻译是劣等的,而是评论者戳到了痛处:就是机器翻译的,还被人看出来了。否则,你很难理解,一个普通的评论,能让人找到学校去逼迫别人道歉。事实上,大多人觉得这个评论更近乎一种比喻,就好像说“你的翻译很机械”。这么玻璃心,干脆不要发表算了。要真觉得这个已经到了诽谤的程度,直接去起诉。找学校是个什么途径?

引用江湖人称向前兄的发言:

环状桥梁那个,是不是椭圆会好一些

你可能是想说设计成橄榄形,但实际上,圆形曲率相同,大部分时间都是不需要打轮的,而椭圆则需要不停调整方向盘和速度。

@Visu Algo:

原来不止我一个人发现了,可能大家都是写程序的……

老阮这里给你提两个建议:1,除了周刊的定期更新,其他干货文章分享下哦;2,页面可能存在的bug,[[分类]]下的列表项中,从[计算机行业历史]到[USENET]点击,[周刊]或其他项目的计数会变动.

引用rodger的发言:

我觉得休战的译者可能并不是觉得机器翻译是劣等的,而是评论者戳到了痛处:就是机器翻译的,还被人看出来了。否则,你很难理解,一个普通的评论,能让人找到学校去逼迫别人道歉。事实上,大多人觉得这个评论更近乎一种比喻,就好像说“你的翻译很机械”。这么玻璃心,干脆不要发表算了。要真觉得这个已经到了诽谤的程度,直接去起诉。找学校是个什么途径?

沈腾和鲁豫的对话,你长得好看,但是对方说你丑,你不会生气,因为你知道对方是嫉妒你,但如果你真的丑,那你肯定生气,因为这是事实啊。

大学的建立是为了培养学生进行智力探索,但是现在,大学越来越转向职业培训,这根本不是建立大学的原始目的。 最后一句 不知道为什么加了 隐藏

Chrome 上可以使用Vimium C进行键盘操作

打开浏览器的翻译,你就会看到Java成为爪哇

对于机器翻译的看法不能苟同。
目前机器翻译的质量完全不能和人工翻译相比,对于多义的词,或者隐含的意思完全没有处理能力,文学作品更甚。
而且机器翻译非常刻板,有固定的格式和套路,也就是上面提到的“机器翻译痕迹”。

原来一峰老师也在用Edge浏览器,从翻译的截图可以看出。自从Edge更换了 Chromuim 内核,阻挡前端开发者的最后一道防线也被攻破了,账号同步、扩展都支持在国内访问,而且本地化得很好用,目前除了应用 icon 丑点,其他没有任何不适。

加油站那个就是扯淡,现代手机无时无刻不在进行数据传输,收发部分电路全程工作状态,除非不许带手机进去,还有现在的车机很多也是带有sim卡,卡车还必须安装带有gps和北斗的全程监测系统。

对于文档来说,辅助翻译确实是个好工具,但是对于包含创作价值,翻译价值的作品,用机器翻译出来售卖就是在侮辱大众。如果 机器翻译+修修改改+打印机就能出书。那机器写作+修修改改+打印机,估计也是条赚钱的好路子。

引用vevan的发言:

加油站那个就是扯淡,现代手机无时无刻不在进行数据传输,收发部分电路全程工作状态,除非不许带手机进去,还有现在的车机很多也是带有sim卡,卡车还必须安装带有gps和北斗的全程监测系统。

。。。你的车难道加油的时候是启动着的?

译者的好友真是猪队友,现在大家都知道译者翻译质量差了。哈哈哈

我觉得语雀的排版比较好看,为什么没有语雀链接了呀?

划的是SUP浆板,不是独木舟。

强调这一点,是因为作秀的成分明显大于实际意义。

我觉得大部分翻译,包括技术书籍,并不是译者的外语水平差,更多时候是他们的中文水平差,他们看懂了原文的意思,却不知道如何才能更好地表达。

使用机器去翻译考研英语阅读都错误百出,怎么能翻译文学作品呢。

引用鑫的发言:

大学的建立是为了培养学生进行智力探索,但是现在,大学越来越转向职业培训,这根本不是建立大学的原始目的。
最后一句 不知道为什么加了 隐藏

浏览器插件uBlock Origin屏蔽了,应该是命中了什么奇怪的广告规则...

语言只是知识的载体,结合上下文的翻译,从某种意义上来说不算是意译:)

机器翻译那个我支持译者,虽然他可能借助了翻译软件,但是现在逐渐AI智能化的今天,如果大家语言翻译方面未来越来越AI,那么沟通将变得容易,想想出门旅游该多爽了吧。

很喜欢这一期,收获很多

为什么有的链接点进去,显示无法访问此网站

头一回,我被阮老师的博客恶心到了。要知道,翻译AI可不懂相关领域,只是对着语料依葫芦画瓢,就算译出来的语句语法正确语义通顺,由特定领域的常识决定的内容也会被AI丢失,人工润色难以挽救。明知机翻润色走不通还为其站台,我不知道为什么。

阮一峰被墙了吗?我翻墙才过来的。

引用PonYoung的发言:

阮一峰被墙了吗?我翻墙才过来的。

好像是的

机器翻译很好用!对普通人足够了。至于文学翻译,就算你英语有十八级又如何,你翻出来的东西有人看么?

科技博客都能被墙?长城防火墙怕是21世纪的闭关锁国哟。

也可以看公众号呀觉得排版不好看的同学

环状桥桥梁不方便行人通行吧,路程变长了

最近的图床网址由于公司的策略被封锁了,理由竟然是成人内容...

个人感觉,市场需求和数据资源决定了当前机器翻译(MT)在不同领域的表现。较常见的应用场景,是像新闻、公文和专利这种专业领域,MT 只要做到”信&达“即可,MT 基本可以胜任。而对于文学作品,不仅训练 MT 模型的平行语料匮乏,对译文提出了更高的要求”雅“,所以短期内 MT 在文学领域举步维艰。本人作为 MT 领域的从业人员,其实很期待看到 MT 也能在文学领域一展身手,像清华的九歌作诗系统,就是统计模型在诗歌领域的探索。同时也欢迎听到大家对 MT 的批评指正和宝贵意见。

我不太认可机械翻译, 因为 翻译这项工作是把一种语言转化成另一种语言,但是,我们首先了解为什么要转化,转化的目的就是然我们去读懂 没转化之前的语言向表达的中心思想是什么,并不是根据单词去翻译对应的意思,有时候还需要去结合语境,这样让读者才能明白作者想表达什么样的意思,但是 机器翻译永远也做不到这一点 。现在有些人工翻译也同样达不到这一点。像计算机或者科学之类的翻译,别人看了一头雾水。

文学作品的机器翻译,还有很长路要走,有许多语言的优美之处无法表达出来.

月球方舟想法很好,但是,如果地球上连保存种子的能力都没有了,还有办法去月球吗?

Deno和Node.js不大可能合并。Ryan本就是因为对于Node生态的不满才搞了Deno,合并意义不大。况且真合并那些老库的兼容性也有待考量。

可以使用彩云小译插件啊,中英文对照,还能学下英语

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接