我曾经在不久前的文章中写到,未来将会普及的一个职业叫做“机器学习工程师”。当时在这里几乎没有人认可这种观点。有的同学还怀疑说,人工智能现在很火,但我的生活并没有改变多少呀,你每天瞎YY个啥……
遇到这种反应其实很正常。爱因斯坦提出相对论的时候,还没有任何实际用途,仅仅是从理论上解释了许多现象。在相对论提出几十年之后,人们开始说:如果爱因斯坦没有提出相对论,人类绝对不可能实现过去几十年这样的进步。从原子弹到GPS,无数应用从根本上改变了我们的生活。
问题是,机器学习跟相对论有可比性吗?其实是有的。
有的同学认为,机器学习领域的进步是计算力提高的结果,功劳要归给GPU。这就如同说【原子弹的发明是铀浓缩技术提高的结果】,说明这些同学并不了解机器学习。早在GPU还没有得到大规模应用的年代,各国就已经拥有了自己的高性能计算机,所以这和计算力没什么关系。
机器学习领域的进步,可以说完全是基础理论的进步。基础理论的进步有几个特点:
- 因为基础理论发生了变化,所以除斯坦福、UC等名校之外,学校一般不会教,大多数学校仍然在教老的、过时的理论。
- 由于涉及理论,所以几乎无法用常识进行概括理解,必须认真听课。在爱因斯坦的年代,一般人是不可能用常识理解E=mc^2的。
- 由于产生了能够高效解决许多问题的方式,对所有相关领域都产生了冲击,造就一批新职业,消灭一批旧职业。
而这也就是为什么任何新理论、新方法从提出到实用再到广泛接受需要非常长的时间。现代社会通讯技术高度发达,信息壁垒、语言隔阂比爱因斯坦年代要低得多,但深度学习相关的理论进展,却花了20年才从实验室进入课堂,根本原因不是信息闭塞、体制落后,而是人固有的思维惯性。
(图:四足机器人自己学会走路)
那么让我们回到这篇文章的标题:爱好变职业有多难?刘虎在他的许多文章中论述过科技爱好转变为职业的种种可能性和必然性,唯独缺少足够的样本分析。这里我以我学习机器学习相关理论的经验,补充一些观点。
首先作为一项爱好,机器学习其实是很好玩的,因为有了新的理论之后突然你就能解决以前解决不了的一大堆问题了,而且通过灵活地利用这些理论你能找到许多困难问题的多种可能解决方式。很多人觉得机器学习就是语音识别、图像处理,数据决定一切,这都是非常肤浅的看法。机器学习相关的理论,让我们可以在有限时间内解决各种非常复杂的优化问题,也就是那些以往只有人才能做到随机应变的问题。
(图:战胜中国队的唯一希望)
比如富士康曾经想用机械手给iPhone拧螺丝,总是一不小心就拧花了,还不如流水线工人的手灵巧。但在使用机器学习的一个分支——增强学习方法,对机器人的【手脑并用】进行训练之后,现在机器人也能像人手一样,学会逐步对准、逐步发力,效果跟人手一样好。这种困难优化问题,以前大家都认为是没有好的办法可以解决的。
正是因为如此管用,这项爱好在短短几年内造就了大量职业。无数拥有编程特长、数学特长的各个专业的学生纷纷投入了机器学习事业,并创造了大量财富(我认识至少5个转机器学习的人)。这就有点像互联网刚进入中国的时候,无数程序员投入了web开发事业,并成功翻身一样。但此时我如果跟普通人说,说机器学习是一项很好玩而且很有意义的爱好,几乎没有人会同意我的说法;正如15年前马云跟大家说电子商务是the big thing,大家却觉得他是疯子一样。
因此我提出一个观点:要把一项爱好变成职业,必须满足以下前提。
- 这项爱好能够带来生产力的极大差距
- 这个社会的绝大多数人都不认可这项爱好
上面两个前提,就把社会上绝大多数人给筛掉了。纵观历史,生产力的极大差距都源自科学技术相关理论进展,而任何时代的理论进展,在那个时代只可能被极少数人理解,更别说获得社会的认可了。这方面刘虎在文中曾经举过几个例子,分别是探空火箭和无线电,这两个爱好在发展的最早期都是符合上述前提的。有趣的是,如果一项工作能获得社会的广泛赞美,那么这项工作往往是大家都不太愿意做的工作,比如清洁工人。
换一个角度讲:如果社会上的绝大多数人都爱好某项活动,那么这项活动只可能是烧钱,而不可能是赚钱的。音乐、电影、文学都是非常普遍的爱好,所以这些爱好都很费钱;而想要通过音乐、电影、文学赚钱,则几乎都需要很长时间、很昂贵的专业训练。可以说,越是普遍的爱好,就越不可能靠爱好解决工作。
再以机器学习为例,这个领域的三驾马车分别是杨乐坤(Yann LeCun)、由刷崩久(Yoshua Bengio)、杰辛腾(Geoff Hinton),他们的身影经常出现在各种研讨会、培训课程中。虽然他们的工作已经帮助这个世界创造了数以百亿计的财富,但绝大多数普通人并不认识他们。
机器学习乃至人工智能领域发展最迅猛的时期,正是整个社会都搞不懂它是怎么回事的时候。
我最近把Geoff的视频教程看完了,也发现一个有趣的现象:
这是第一课:
这是最后一课:
这已经是我在互联网上能找到的最完整、最正宗、最注重内涵的机器学习课程了,然而最终能撑到最后一课的,只有600人。要知道各种机器学习工具每天的下载量都不止这个数的100倍。
把爱好变成职业,其实就是这么难。
最后,文章开头提到的“机器学习工程师”,或者叫“数据科学家”,这个职业已经存在有一段时间了。不过,未来的“机器学习工程师”并不需要学习理论或者写程序。由于机器人都配备了学习算法,我们只需要让一位人类师傅,手把手教机器人如何做好一件事就可以了,就跟师傅带徒弟一样。
比如下面这个教机器人翻大饼的例子。
先由人类示范:
然后让算法自己练习:
XXXXXXXXXXXXXXXXXXXXXXX/watch?v=W_gxLKSsSIE
这是6年前的视频。未来会有大量的工作,以这种师傅教徒弟的方式,由人类传授给机器人。而这种工作,将会和以前的每一次技术革命一样,从个人爱好者开始,到下一个BAT结束。
200字以内,仅用于支线交流,主线讨论请采用回复功能。