现代操作系统内核的主要工作,就是虚拟许多个同时运行的【线程】,在线程之间通过高速切换实现多任务并行。例如,操作系统允许程序A所在的线程运行1毫秒,然后将这个线程的所有“状态”(所有寄存器的值)缓存起来,再将程序B所在线程的“状态”恢复到操作系统寄存器中,继续运行程序B。这样对于每一个独立的程序来说,其“状态”是稳定的,如同直接运行在独立的CPU上一样。于是我们可以用“同步”的方式编写程序,让操作系统帮我们解决“异步”的问题。
为什么叫“异步”呢?因为从操作系统的角度来看,没有一个用户程序是在CPU上按照指令一路执行到底的,而是根据外部事件(比如上一个例子中的1毫秒定时器)动态切换的。两个程序同时运行,也没有办法确定地指出哪个会先执行完。
其实这是大部分自然过程的本质;自然界里没有什么事情会完美地按照某个确定的顺序发生——同时在过程中不受环境影响——
最后只产生一个确定的结果。所有的事情都以异步的方式进行着,毕竟大自然里不存在像图灵机这样的理想机器。
在操作系统中,每个【线程】的存在都会占用一定的资源。例如某个网络通信程序,它的任务是组织10000个用户聊天,需要创建10000个TCP连接。代码很简单:先接收用户输入,然后根据一定规则转发给其他用户。但如果将这段代码编译成程序,在操作系统中创建10000个线程分别处理用户输入,会占用GB级别的内存空间,而操作系统在10000个线程间来回切换也是一件很痛苦的事情。怎么办呢?
最常见的做法是,放弃操作系统线程带来的便利(同步编程),在应用程序内部实现一个异步的架构:由一个线程监听所有用户发来的聊天数据(用户之间通过数据包头区分),每当数据包到达时根据其中的用户信息,根据一定规则转发给其他用户。如果同时有两个用户发来数据包,则数据包会在网卡的缓冲区内排队等待线程按顺序读取。这种程序设计方法,称为异步编程。通常,在应用程序内部实现异步,比借用操作系统线程,性能上要高得多(没有资源上的额外开销)。因此,许多要求软实时性、大规模并发、高可靠的计算机系统,其软件都采用异步/事件驱动/虚拟机架构。
C语言的众多函数库多是为同步编程设计的。在异步编程技术突飞猛进的今天,我们拥有了越来越多的选择;其中Node.js在短短6年里就成为了高性能网络服务器最重要的开发语言。它拥有接近于C语言的性能,以及闭包特性,最重要的是将异步编程的基础——事件队列——变成了基础设施,而不是仅仅提供一个函数库。
然而异步编程最大的问题在于,没有办法用同步的方式——也是大部分编程爱好者最喜爱的方式——撰写含有异步调用的程序。这成为了许多编程爱好者进步的瓶颈,闻异步而色变。
贴出科创网络发展局 新KC论坛项目的一部分代码。
XXXXXXXXXXXXXXXXXX/ctmakro/nkc2