Charles网站对三名微软架构师进行的专访

Posted by zhang on

 Charles:今天的访谈主要讨论两个相关的论题:可组合性与编程语言。作为程序员,当我们构造系统时,总是要面对这两个问题。你们是创设语法,搭建架构的人。所以,我想讨论的一点是,你们是如何协调工作的?三个语言??C#、VB和C++都在演进,同时又服务于不同目的,C++更多服务于系统级,C#和VB更多偏向应用层面这一切是如何形成的?你们一起工作吗?你们是如何决定语言创新的?你们是一起设计,还是想到什么后再与他人共享?

Anders:我想,你说的两种情况都存在。早在做LINQ之前,Erik就在COmega项目上做了不少工作。LINQ和COmega相互影响,相似之处很多。我和他一直在讨论相关问题。实际上,Erik也在C#设计组中,我们总是在交换意见。VB组和C++组的人也在一幢楼里,大家经常碰到一起。

Charles:但我的意思是,你们是否也像最终用户一样对自己做出区分?比如,有的事情在VB中能做,C#中就做不了。例如,VB以非常简单的方式实现了完全的晚绑定,而C#中根本没有晚绑定。为什么VB和C#如此不同?你们有意这样设计的吗?

Anders:我认为,影响这个问题更多的是历史原因。VB有其悠久而丰富的历史。VB刚出现时就是晚绑定语言,没有任何类型。很显然,晚绑定对VB来说有某种核心作用。但是,从那时起,VB已逐步演进为一种更“强类型”的语言,到现在,你甚至可以把VB看作一种支持晚绑定的强类型语言。呵呵。实际的过程刚好相反。C#从一开始就是强类型语言,而且,直到现在我们都坚持早绑定。这并非说C#未来也不会支持晚绑定,但是,它很可能以不同于VB的方式来做,而且可能会有所改进。C#是否支持晚绑定其实只是一种选择。对于老式的弱类型对象模型来说,比如OLE,如果我们从晚绑定角度出发,会比从早绑定角度出发好讨论得多,因为这种对象模型无非就是对象若干方法的交互,反射等。

Herb:在一定程度上,用户造成了语言之间的差异。对于靠近底层编程的C和C++程序员来说,性能永远都是一个主要问题。你可能发现不同语言有不同特性,但是,更经常的,你会发现这些不同特性想要解决的是同一类问题,比如,“并发执行”。现在,没人能忽视这个问题。在未来5到10年,一种语言如果想留在主流编程语言的队伍中,这个问题就无法忽视,因为这是硬件的发展方向。我们正处于一个新时代??50年来,我们首次在非单核的机器上工作。任何人都无法忽视这点。因此,就这点来说,大家面临相似的问题。但是,根据处理方式、语法的不同,具体特性也会不尽相同。我也相信,不同语言推出相似特性的时间先后顺序也不相同,因为不同语言服务于不同客户群体,客户要求不同。就像Anders所说,各种情况都有一些。

Erik:我给个具体例子,说明VB和C#的差异。这例子是“无名表达式(或lambda表达式)”。我们想在VB中加入这种功能。首先就是寻找正确的语法。我们向VB项目组要到了VB的主名称表,名称表中的名字往往对VB和C#都适用。但是,这次他们想要更像关键字的名字,而不是像C#那样长长的名字,他们觉得像关键字的名字更加“VB化”一些。这里你看到的就是语法上的区别。但在语义上也有区别。当你查看一个大函数内部嵌套很深的结构,比如for循环时,语言是何时、如何处理变量捕获、如何进行实例保护就非常不同。在C#中,每次循环时实例都被保护,而VB有点像JavaScript,变量被隐性提升到函数顶部。所以,在变量捕获方面也存在语义上的区别。有时,这些区别极其细微,你必须用非常变态的程序才能观察到。

Anders:只要你写出依赖这样的特性的程序,我们就能找出成百的Bug。

Brian:你逃不出“作战室”的。(译者注:微软“作战室”,是产品、程序、测试人员一起确认需求、找Bug之所在。)

Charles:这样看来,大家都同意不同语言在相互影响,不断演进。对于VB和C#来说,有相同的核心:处理引擎,你们必须在CLR的基础上出发,随着CLR的演进而演进。很显然,C++属于另一个世界。但各种语言要互相影响,你们必须在C#中加点什么来吸引用户,让他们用C#而不是VB.NET,是吧?应该不止是语法的区别,语言中必须还有一些核心的东西来吸引用户。

Herb:你说得对。但是,我不同意你提出的理由,说我们必须在各自的语言中加点什么特性吸引用户,从而使他们不去使用其他的微软的语言。为什么呢?比如我更加关心使用C++或者C#的用户到底需要什么,怎样才能帮助他们把工作完成得更好。也许某种语言性能强大,但我的工作是怎样才能使客户的工作更成功?我必须要考虑客户会如何集成,我怎样做才能使客户工作得更好,这也是CLR的核心所在,因为目前已经不是靠一种语言就能完成整个项目的时代了。我怀疑在稍有点规模的项目中,是否还有人仅仅依靠一种开发语言。

一般说来,你用脚本语言写代码;其他语言写工具和组件;系统语言写核心??不停地在做集成。这就带来了我们所讨论的“可组合性”的问题。因为“可组合性”本质上就是跨语言的问题。当你写Web浏览器时,你不知道某个插件是用C#、C++,某种CLR扩展,还是其他什么写的。不管如何,这些东西必须一起工作,这就是主要的挑战。因为,要想使这种“可组合性”成为现实,我们必须时时将CLR和CLR以外的东西当作白盒来考虑。但是,这样做的时候又会碰到“锁”的问题。“并发执行”已经越来越重要了,但是,“锁”完全不具备可组合性。因此,这是“可组合性”面对的主要障碍。总之,对我而言,这更多的是一个语言交互的问题,而非语言竞争的问题。

Brian:我在一定程度上代表了用户。我是个物理学家,同时,我也经常写点小程序,进行模拟和仿真,解决一些数学问题。要想成功,“可组合性”对我的来说非常重要。我可以不在乎编程语言,但是我很在乎该语言是否有我所需要的组件。基本上,我十分愿意使用任何能使我的工作更简单的编程语言。

这里,我要戴上顶“老人”帽,谈谈历史上非常少的成功软件之一:数值计算库。这些东西是N年以前用Fortran写的。几十年以来,人们用这些库解决了许多非常重要的科学问题。任何头脑正常的人都不会想重新写一个“线性代数包”或者类似的东西。有许多数学家终其一生在完善这些软件包。我们需要的是“互操作性”,更是“可组合性”。所有人都知道,Fortran不支持递归,因为变量基于引用传递。这就带来了包接口的问题:如果你想要集成自身就做集成的东西,你就不能在用这个包来集成自己,这行不通。回到C++、C#和VB上,这些语言我都使用,但更喜欢C#一些,主要因为它的操作符重载。为什么我喜欢操作符重载?因为我做奇怪的线代计算,如四元数、八元数,此时用一个小加号就能够代表一大堆怪异的计算。

可能听上去有点像是使用模板,但绝不是这样,我一用模板就会开始想:模板的预处理器是完备的,也许我可以仅用模板就实现出一个链表处理库来解决。很快,我就会偏离真正的数学思考。在应用程序绝对需要晚绑定的场合,比如,那些小的计算模拟器。此时,我很自然地会选择VB。至于C++,大多数时候,它被用来实现其他的语言。在用于科学的环境下,我多次实现过Scheme。总之,就是泛谈“可组合性”。

Anders:当我开始编程生涯时,进入编程这行的学习曲线就是:学习要使用的编程语言本身。各个编程语言几乎在每个方面都不相同。语法是你要学习的很大一部分。但这是以前的事了,现在你要学习巨大的框架,这个框架正越变越大,语法只是顶上的一颗“小樱桃”,我认为这方面确实进展很大。但是,实际上起作用的东西是学习所有的API,学习你所基于的,越来越大的平台或者框架。如今,学习曲线的90%都耗费在这上面。掌握了这些,你就可以在C++、C#或者VB.NET什么的之间,毫不费力地进行语言转换,将部分项目使用这种语言,部分项目使用那种,并且找出组合这些语言的解决方案。相对于以前,实际上是不久之前,这是个主要的进步。当然,所有这些得以出现,是由于有了通用的类型系统,以及各种语言中的那些抽象。每种语言之间的差别则是细微的,而且这些差别说不上来有什么特别的理由。

Brian:有时,这些语言必须综合运用。比如,如今的Windows编程就是一大苦事:你必须懂PHP、JavaScript、HTML、XML、SQL等等,要把这些东西全写到名片上,你就只有小小的一块地方可以写自己的名字了。当然,能够同时使用多种语言也有好处,至少你可以选择自己喜欢的语法。

Erik:我们的编程语言之所以有差异,还是因为这些语言没有能够统一起来,在语言下面还有若干不一致的地方,我们实际上是被强迫使用不同的东西。CLR就不一样,基于CLR上使用相同的库,这些语言之间的排他性就要少一些,你可以选择,而非被迫使用某种特定的语言。

Brian:目前我们做得很多工作就是减少大家被迫使用某种语言这种情况。我们努力改进平台,增加更多的功能,提供更多的.NET库。

Charles:但是,C++除之外,像VB和C#这样的语言,确实绑定在某个框架上。这样的话,在一定意义上是否有局限性?如函数型程序等将如何融入到我们所谈的巨大的框架中呢?比如Haskell,又比如流行的F#,它们的结构与现在的语言完全不同。

Erik:如果我们用“命令型语言”编程,我们的基本成份是“语句”。“语句”使用并且共享“状态”,从而导致不太好的“可组合性”。你不能拿着两段语句,然后简单地把它们粘合到一起,因为它们的全局状态不能很好地交互。这就导致“命令型语言”不能很好地组合到一起。如果你看看LINQ,就会发现我们已经更多地采用“函数型语言”的风格,所有的东西都基于表达式。“表达式”从其定义来说就是可组合的。从一定意义上来说,我认为在C#3和VB9中没有什么东西是Haskell或F#中没有的。这里面有一些深奥的事情,如果你看看Haskell的类型系统,你就会发现这个类型系统跟踪程序的副作用。这给了你一定形式的可组合性。现在你虽然不能把有某种副作用的语句组合到有其他副作用的语句上,但是,你可以组合副作用相同的东西。F#有一个非常强悍的类型推断机制,它从设计之初就考虑了类型推断。我们以前也有类型推断,这并非什么新东西,但是现在的类型推断要考虑很多困难因素,比如,重载,这些东西使类型推断很困难。如果你从这个角度来看,我认为我们已经在很大程度上采用了浓厚的“函数型”风格,并且以相当“可组合”的方式来使用表达式和lambda表达式。

Anders:我们对“函数型编程”的兴趣并非学院式兴趣。实际上,当编程语言向前推进时,我们面临两类挑战。一是古老的追求??不断提高程序员的生产率,对此将沿用一直以来的方法:提升抽象的层次,给程序员垃圾回收机制、类型安全、异常处理,甚至是全新的“声明型”编程语言等。在提升抽象层次的过程中,正如Erik指出的,这些“声明型”语言获得了更高层次的“可组合型”。“函数型”语言之所以有魅力,因此你可以做出“没有副作用”,或者其他承诺,这样一来可组合性就极大地提高了。不仅如此,在如何保证多核处理器、多CPU,比如,32个CPU始终忙碌,我们也会有所收获。显然,当我们更多地使用“函数型”或者“声明型”风格的编程时,我们更有可能把运行时框架构建得能更好地发挥多核的优势,更好地处理并发。如果以“命令型”风格来工作,我们能够发挥的余地就很小,因为你无法预见所有动作??这儿拿点东西,那儿放点东西,所有动作必须串行执行,否则不可预料的事情就会发生。

Charles:作为程序员,使用了如此巨大的一个处理引擎??比如CLR之后,当然认为这些底层的东西应该被抽象掉。你的意思也是,如果我使用了一个4核的机器,运行时引擎应该有能力负责在CPU上的分配分配进程。

Anders:你这样想很正常。但是,CLR以及目前我们工业中绝大多数的运行时,都是“命令型”引擎,其指令集都相当传统,比如,堆栈增长;它们也拥有易变的状态,包括易变的全局状态等等。在此之上,之所以能进行“函数型”编程,是因为“函数型”编程从本质上来说,是“命令型”编程所具备的能力集的一个子集。现在我们想做的是最大化这种灵活性,但其实不过也就是让“函数型”能力子集越来越相关,使其越来越主流化而已。

Herb:我认为有必要将“函数型”编程领域划分成两个部分。我非常同意Anders和Erik的意见。我不太同意的是这样的措辞:我们之所以继续使用“命令型”编程语言,是因为这是大家目前所能理解的;通用程序开发者目前的工作并未取得巨大的成功;市场对于“所有的东西都是表达式,所有的语言都应该是表达式类型的语言”这样的理念已经非常接受了;“函数型”语言是“串行执行”病的好药方。我们要想使“函数型”语言运转良好,关键点并不是处理好基本的表达式问题,而是处理好lambda表达式和副作用的问题,是能够将表达式作为第一级的编程要素来使用??LINQ也是最近才在做,关键是能够指出lambda表达式和Closure(译者注:函数型编程语言中的一个概念,可以方便地组合函数,返回函数)的副作用。实际上,最后这点目前是缺失的。这些东西在“命令型”语言中也是要处理的东西。我为什么提这些?因为我觉得说“函数型”语言是方向,目前的“命令型”语言不够好,因此是垃圾,必须要抛在脑后,全面采用“函数型”语言这样的说法不对。我认为,“函数型”语言到底能够帮助程序员完成哪些工作,目前还不太明了。比如,能够用它写通用代码吗?能够用它系统级代码吗?当然,“函数型”语言有不少我们能够借鉴的好东西,比如lambda表达式,比如Closure,C#借鉴了,C++也在借鉴,这些语言因此增色不少。关于“函数型”语言还有另一个问题,那就是,有两种类型的“函数型”语言。一种是没有副作用的,因此就没有共享、易变的。

#About Me

张小璋,野蛮生长成世界500强企业供应链金融产品经理的法语毕业生。微信公众号:张小璋碎碎念(ID: SylvainZhang )。
一直在互联网金融公司从事产品经理工作并负责互联网金融产品线,深耕互联网金融和区块链领域。「PMCAFF」、「人人都是产品经理」专栏作家、「PmTalk」签约作家。