| Jun's profileJun Xu@MSRA.Beijing.Chin...PhotosBlogLists | Help |
|
August 07 China, inside out看完了ABC频道的一个节目,题目是《China,inside out》,观点确实有点意思,评价了中国的外交,不能说完全无理,但也够自私。
中非:以安哥拉为例,中国想要得到石油,中国在安哥拉投入大量资金进行基础建设,安哥拉用石油付账。老美有点吃不到葡萄说葡萄酸,批评安哥拉政府是非洲最腐败的政府之一,暗指中国公司暗中行贿。(想想美国再伊拉克做的烂事,他们有资格评论?还有,没有提到苏丹。)
中巴:中国从巴西进口大量大豆,导致巴西大量砍伐亚马逊森林,把这个责任推给中国。不过受访的巴西官员矢口否认:这个和中国无关,这是我们的事情,我们要发展经济,我们在自己国土上做事也轮不到美国来说。ABC频道评论员说的一段话挺有意思:中国目前所做的事情和我们以前把自己变成富裕国家所做的事情没有区别,问题在于中国拥有了太多的人口,如果中国每个人的消耗和现在的美国人一样高,我们将不得不需要另外一个地球。这段话还有点靠谱,也足够坦白自私。
中柬:着重讲了红色高棉,中国应该为大屠杀负责!目前中国仍然在柬输出文化:街道上到处都是中文,柬埔寨大部分学校教中文,但是不教英文(不过被访问的小孩是用英文回答问题。不知道美国人法国人是否愿意为卢旺达大屠杀负责?别忘了现在全世界学英文。)中国外交官的解释:我们不干涉邻国内政,他们国内的事情由他们的人们选择,我们发展起来了,也帮助自己的邻国发展。老美的评论:让人民进行选择往往是让最富裕最有权利的少数人选择。(呵呵,不知道老美有啥更好的办法?)
中美:中国正在成为世界最重要的力量,证据:美国总统布什过去几年经常会见胡core(看看美国人的尺子啊)。 美国很多中国制造,他们也承认美国因为这个也节省了很多钱。他们承认他们在传统制造业方面停止了进步,他们不可能制造很多衬衫,没有中国,美国人没衣服穿。但美国人又觉得中国夺走了他们的工作。中国在美国投了很多钱,美国人担心美国经济依赖中国是很不爽的事情。 倒时差发现自己的生物钟在不同时区之间做简偕震动,周期为2天,郁闷啊郁闷 July 16 牛人不爽的时候爱因斯坦
Works well with others: poor
Shares credit appropriately: poor
However, based on your file photo below, I would suggest you sign up for the "Dress for Success" class. Really: a striped shirt with a plaid suit?
呵呵,再牛的人也有不爽的时候啊。 July 15 CIKM posterCIKM出消息论文被当成poster收留,虽然不如full的爽,但也很高兴了。这次又重演了历史,经历了N次被砍总算坚持到了解放,没有白忙乎,期待。下面的问题是怎么把10页的东西缩成2页,砍哪儿都见血,很难很麻烦。 July 10 一个小时可以做什么上班下班都要在城铁上呆半个小时,每天一个小时在路上,可以做点啥消磨,一直没搞明白。
1. 听mp3, 玩游戏。这是目前用的最多的,托手机的福可以听mp3,装了一堆游戏,因为zuma莫名其妙罢工,只有泡泡龙和斗地主玩的熟,最好玩还是斗地主,赢了可以一直玩下去,输了可以重来,呵呵,有点卑鄙。可怜的手机键盘,电池耗的飞快。还要小心别坐过站。
2. 看移动广告。那个位置流动人口太多,压根听不见,只能看无声动画,而且被挤来挤去实在不爽,坐城铁和下围棋一个道理,金角银边草肚皮,躲在角落里最爽。
3. 看报纸。早上打仗似的哪有时间去买报纸啊,太挤的时候倒是可以看别人手里的报纸,要求不要太高就成,hoho。
4. 数红灯。这个我得申请专利,经过多次观察,发现城铁的信号系统挺好玩的,也够复杂,由机车自动控制,安全的保障啊。不过数多了也腻。
5. 闭目养神,接着睡回笼觉。太不现实,能抢到座而且神经足够大的话还凑合,人吵城铁晃,闭眼站着一会儿就要倒。
6. 好好用功看论文。呵呵,想什么呢,估计还没睡明白才打这主意。
7. 碰到同事熟人一路聊过来。这种好事概率不算太小,但也不高。
还有别的招没? April 17 理解矩阵(三)CSDN上看到这三篇连载, 收藏下来壮胆!
“矩阵不仅可以作为线性变换的描述,而且可以作为一组基的描述。而 作为变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也能够把线性空间中的一个坐标系(基)表换到另一个坐标系(基)去。而且,变换点 与变换坐标系,具有异曲同工的效果。线性代数里最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代数里很多定理和规则会变得更加清晰、直觉。
这个留在下一篇再写吧。 因为有别的事情要做,下一篇可能要过几天再写了。 ” 然而这一拖就是一年半。一年半以来,这两篇粗糙放肆的文章被到处转载,以至于在Google的搜索提示中,我的名字跟“矩阵”是一对关联词汇。这对于学生时代数学一直很差的我来说,实在是令人惶恐的事情。数学是何等辉煌精致的学问!代表着人类智慧的最高成就,是人与上帝对话的语言。而我实在连数学的门都还没进去,不要说谈什么理解,就是稍微难一些的题目我也很少能解开。我有什么资格去谈矩阵这样重要的一个数学概念呢?更何况,我的想法直观是直观,未见的是正确的啊,会不会误人子弟呢?因此,算了吧,到此为止吧,我这么想。 理解矩阵(二)上一篇里说“矩阵是运动的描述”,到现在为止,好像大家都还没什么意见。但是我相信早晚会有数学系出身的网友来拍板转。因为运动这个概念,在数学和物理里是跟微积分联系在一起的。我们学习微积分的时候,总会有人照本宣科地告诉你,初等数学是研究常量的数学,是研究静态的数学,高等数学是变量的数学,是研究运动的数学。大家口口相传,差不多人人都知道这句话。但是真知道这句话说的是什么意思的人,好像也不多。简而言之,在我们人类的经验里,运动是一个连续过程,从A点到B点,就算走得最快的光,也是需要一个时间来逐点地经过AB之间的路径,这就带来了连续性的概念。而连续这个事情,如果不定义极限的概念,根本就解释不了。古希腊人的数学非常强,但就是缺乏极限观念,所以解释不了运动,被芝诺的那些著名悖论(飞箭不动、飞毛腿阿喀琉斯跑不过乌龟等四个悖论)搞得死去活来。因为这篇文章不是讲微积分的,所以我就不多说了。有兴趣的读者可以去看看齐民友教授写的《重温微积分》。我就是读了这本书开头的部分,才明白“高等数学是研究运动的数学”这句话的道理。 不过在我这个《理解矩阵》的文章里,“运动”的概念不是微积分中的连续性的运动,而是瞬间发生的变化。比如这个时刻在A点,经过一个“运动”,一下子就“跃迁”到了B点,其中不需要经过A点与B点之间的任何一个点。这样的“运动”,或者说“跃迁”,是违反我们日常的经验的。不过了解一点量子物理常识的人,就会立刻指出,量子(例如电子)在不同的能量级轨道上跳跃,就是瞬间发生的,具有这样一种跃迁行为。所以说,自然界中并不是没有这种运动现象,只不过宏观上我们观察不到。但是不管怎么说,“运动”这个词用在这里,还是容易产生歧义的,说得更确切些,应该是“跃迁”。因此这句话可以改成: “矩阵是线性空间里跃迁的描述”。 可是这样说又太物理,也就是说太具体,而不够数学,也就是说不够抽象。因此我们最后换用一个正牌的数学术语——变换,来描述这个事情。这样一说,大家就应该明白了,所谓变换,其实就是空间里从一个点(元素/对象)到另一个点(元素/对象)的跃迁。比如说,拓扑变换,就是在拓扑空间里从一个点到另一个点的跃迁。再比如说,仿射变换,就是在仿射空间里从一个点到另一个点的跃迁。附带说一下,这个仿射空间跟向量空间是亲兄弟。做计算机图形学的朋友都知道,尽管描述一个三维对象只需要三维向量,但所有的计算机图形学变换矩阵都是4 x 4的。说其原因,很多书上都写着“为了使用中方便”,这在我看来简直就是企图蒙混过关。真正的原因,是因为在计算机图形学里应用的图形变换,实际上是在仿射空间而不是向量空间中进行的。想想看,在向量空间里相一个向量平行移动以后仍是相同的那个向量,而现实世界等长的两个平行线段当然不能被认为同一个东西,所以计算机图形学的生存空间实际上是仿射空间。而仿射变换的矩阵表示根本就是4 x 4的。又扯远了,有兴趣的读者可以去看《计算机图形学——几何工具算法详解》。 一旦我们理解了“变换”这个概念,矩阵的定义就变成: “矩阵是线性空间里的变换的描述。” 到这里为止,我们终于得到了一个看上去比较数学的定义。不过还要多说几句。教材上一般是这么说的,在一个线性空间V里的一个线性变换T,当选定一组基之后,就可以表示为矩阵。因此我们还要说清楚到底什么是线性变换,什么是基,什么叫选定一组基。线性变换的定义是很简单的,设有一种变换T,使得对于线性空间V中间任何两个不相同的对象x和y,以及任意实数a和b,有: 定义都是这么写的,但是光看定义还得不到直觉的理解。线性变换究竟是一种什么样的变换?我们刚才说了,变换是从空间的一个点跃迁到另一个点,而线性变换,就是从一个线性空间V的某一个点跃迁到另一个线性空间W的另一个点的运动。这句话里蕴含着一层意思,就是说一个点不仅可以变换到同一个线性空间中的另一个点,而且可以变换到另一个线性空间中的另一个点去。不管你怎么变,只要变换前后都是线性空间中的对象,这个变换就一定是线性变换,也就一定可以用一个非奇异矩阵来描述。而你用一个非奇异矩阵去描述的一个变换,一定是一个线性变换。有的人可能要问,这里为什么要强调非奇异矩阵?所谓非奇异,只对方阵有意义,那么非方阵的情况怎么样?这个说起来就会比较冗长了,最后要把线性变换作为一种映射,并且讨论其映射性质,以及线性变换的核与像等概念才能彻底讲清楚。我觉得这个不算是重点,如果确实有时间的话,以后写一点。以下我们只探讨最常用、最有用的一种变换,就是在同一个线性空间之内的线性变换。也就是说,下面所说的矩阵,不作说明的话,就是方阵,而且是非奇异方阵。学习一门学问,最重要的是把握主干内容,迅速建立对于这门学问的整体概念,不必一开始就考虑所有的细枝末节和特殊情况,自乱阵脚。 接着往下说,什么是基呢?这个问题在后面还要大讲一番,这里只要把基看成是线性空间里的坐标系就可以了。注意是坐标系,不是坐标值,这两者可是一个“对立矛盾统一体”。这样一来,“选定一组基”就是说在线性空间里选定一个坐标系。就这意思。 好,最后我们把矩阵的定义完善如下: “矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。” 理解这句话的关键,在于把“线性变换”与“线性变换的一个描述”区别开。一个是那个对象,一个是对那个对象的表述。就好像我们熟悉的面向对象编程中,一个对象可以有多个引用,每个引用可以叫不同的名字,但都是指的同一个对象。如果还不形象,那就干脆来个很俗的类比。 比如有一头猪,你打算给它拍照片,只要你给照相机选定了一个镜头位置,那么就可以给这头猪拍一张照片。这个照片可以看成是这头猪的一个描述,但只是一个片面的的描述,因为换一个镜头位置给这头猪拍照,能得到一张不同的照片,也是这头猪的另一个片面的描述。所有这样照出来的照片都是这同一头猪的描述,但是又都不是这头猪本身。 同样的,对于一个线性变换,只要你选定一组基,那么就可以找到一个矩阵来描述这个线性变换。换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变换的描述,但又都不是线性变换本身。 但是这样的话,问题就来了如果你给我两张猪的照片,我怎么知道这两张照片上的是同一头猪呢?同样的,你给我两个矩阵,我怎么知道这两个矩阵是描述的同一个线性变换呢?如果是同一个线性变换的不同的矩阵描述,那就是本家兄弟了,见面不认识,岂不成了笑话。 好在,我们可以找到同一个线性变换的矩阵兄弟们的一个性质,那就是: 若矩阵A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关系: A = P-1BP 线性代数稍微熟一点的读者一下就看出来,这就是相似矩阵的定义。没错,所谓相似矩阵,就是同一个线性变换的不同的描述矩阵。按照这个定义,同一头猪的不同角度的照片也可以成为相似照片。俗了一点,不过能让人明白。 而在上面式子里那个矩阵P,其实就是A矩阵所基于的基与B矩阵所基于的基这两组基之间的一个变换关系。关于这个结论,可以用一种非常直觉的方法来证明(而不是一般教科书上那种形式上的证明),如果有时间的话,我以后在blog里补充这个证明。 这个发现太重要了。原来一族相似矩阵都是同一个线性变换的描述啊!难怪这么重要!工科研究生课程中有矩阵论、矩阵分析等课程,其中讲了各种各样的相似变换,比如什么相似标准型,对角化之类的内容,都要求变换以后得到的那个矩阵与先前的那个矩阵式相似的,为什么这么要求?因为只有这样要求,才能保证变换前后的两个矩阵是描述同一个线性变换的。当然,同一个线性变换的不同矩阵描述,从实际运算性质来看并不是不分好环的。有些描述矩阵就比其他的矩阵性质好得多。这很容易理解,同一头猪的照片也有美丑之分嘛。所以矩阵的相似变换可以把一个比较丑的矩阵变成一个比较美的矩阵,而保证这两个矩阵都是描述了同一个线性变换。 这样一来,矩阵作为线性变换描述的一面,基本上说清楚了。但是,事情没有那么简单,或者说,线性代数还有比这更奇妙的性质,那就是,矩阵不仅可以作为线性变换的描述,而且可以作为一组基的描述。而作为变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也能够把线性空间中的一个坐标系(基)表换到另一个坐标系(基)去。而且,变换点与变换坐标系,具有异曲同工的效果。线性代数里最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代数里很多定理和规则会变得更加清晰、直觉。 这个留在下一篇再写吧。 因为有别的事情要做,下一篇可能要过几天再写了。 理解矩阵(一)一直对矩阵有一种莫名的恐惧, 在CSDN上看到这三篇连载, 收藏下来壮胆! http://blog.csdn.net/myan/archive/2006/04/02/647511.aspx http://blog.csdn.net/myan/archive/2006/04/03/649018.aspx http://blog.csdn.net/myan/archive/2007/11/03/1865397.aspx
前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪住就线性代数中一些务虚性的问题与他讨论了几次。很明显,chensh觉得,要让自己在讲线性代数的时候不被那位强势的学生认为是神经病,还是比较难的事情。 可怜的chensh,谁让你趟这个地雷阵?!色令智昏啊! 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。”,然而“按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。”事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说: * 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧合? * 矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的? * 对于矩阵转置运算AT,有(AB)T = BTAT,对于矩阵求逆运算A-1,有(AB)-1 = B-1A-1。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗? * 为什么说P-1AP得到的矩阵与A矩阵“相似”?这里的“相似”是什么意思? * 特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax =λx,一个诺大的矩阵的效应,竟然不过相当于一个小小的数λ,确实有点奇妙。但何至于用“特征”甚至“本征”来界定?它们刻划的究竟是什么? 这样的一类问题,经常让使用线性代数已经很多年的人都感到为难。就好像大人面对小孩子的刨根问底,最后总会迫不得已地说“就这样吧,到此为止”一样,面对这样的问题,很多老手们最后也只能用:“就是这么规定的,你接受并且记住就好”来搪塞。然而,这样的问题如果不能获得回答,线性代数对于我们来说就是一个粗暴的、不讲道理的、莫名其妙的规则集合,我们会感到,自己并不是在学习一门学问,而是被不由分说地“抛到”一个强制的世界中,只是在考试的皮鞭挥舞之下被迫赶路,全然无法领略其中的美妙、和谐与统一。直到多年以后,我们已经发觉这门学问如此的有用,却仍然会非常迷惑:怎么这么凑巧? 我认为,这是我们的线性代数教学中直觉性丧失的后果。上述这些涉及到“如何能”、“怎么会”的问题,仅仅通过纯粹的数学证明来回答,是不能令提问者满意的。比如,如果你通过一般的证明方法论证了矩阵分块运算确实可行,那么这并不能够让提问者的疑惑得到解决。他们真正的困惑是:矩阵分块运算为什么竟然是可行的?究竟只是凑巧,还是说这是由矩阵这种对象的某种本质所必然决定的?如果是后者,那么矩阵的这些本质是什么?只要对上述那些问题稍加考虑,我们就会发现,所有这些问题都不是单纯依靠数学证明所能够解决的。像我们的教科书那样,凡事用数学证明,最后培养出来的学生,只能熟练地使用工具,却欠缺真正意义上的理解。 自从1930年代法国布尔巴基学派兴起以来,数学的公理化、系统性描述已经获得巨大的成功,这使得我们接受的数学教育在严谨性上大大提高。然而数学公理化的一个备受争议的副作用,就是一般数学教育中直觉性的丧失。数学家们似乎认为直觉性与抽象性是矛盾的,因此毫不犹豫地牺牲掉前者。然而包括我本人在内的很多人都对此表示怀疑,我们不认为直觉性与抽象性一定相互矛盾,特别是在数学教育中和数学教材中,帮助学生建立直觉,有助于它们理解那些抽象的概念,进而理解数学的本质。反之,如果一味注重形式上的严格性,学生就好像被迫进行钻火圈表演的小白鼠一样,变成枯燥的规则的奴隶。 对于线性代数的类似上述所提到的一些直觉性的问题,两年多来我断断续续地反复思考了四、五次,为此阅读了好几本国内外线性代数、数值分析、代数和数学通论性书籍,其中像前苏联的名著《数学:它的内容、方法和意义》、龚昇教授的《线性代数五讲》、前面提到的Encounter with Mathematics(《数学概观》)以及Thomas A. Garrity的《数学拾遗》都给我很大的启发。不过即使如此,我对这个主题的认识也经历了好几次自我否定。比如以前思考的一些结论曾经写在自己的blog里,但是现在看来,这些结论基本上都是错误的。因此打算把自己现在的有关理解比较完整地记录下来,一方面是因为我觉得现在的理解比较成熟了,可以拿出来与别人探讨,向别人请教。另一方面,如果以后再有进一步的认识,把现在的理解给推翻了,那现在写的这个snapshot也是很有意义的。 因为打算写得比较多,所以会分几次慢慢写。也不知道是不是有时间慢慢写完整,会不会中断,写着看吧。 -------------------------------------------------------------------------- 今天先谈谈对线形空间和矩阵的几个核心概念的理解。这些东西大部分是凭着自己的理解写出来的,基本上不抄书,可能有错误的地方,希望能够被指出。但我希望做到直觉,也就是说能把数学背后说的实质问题说出来。 首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始,一步步往上加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。 总之,空间有很多种。你要是去看某种空间的数学定义,大致都是“存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。这未免有点奇怪,为什么要用“空间”来称呼一些这样的集合呢?大家将会看到,其实这是很有道理的。 我们一般人最熟悉的空间,毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:1. 由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动, 上面的这些性质中,最最关键的是第4条。第1、2条只能说是空间的基础,不算是空间特有的性质,凡是讨论数学问题,都得有一个集合,大多数还得在这个集合上定义一些结构(关系),并不是说有了这些就算是空间。而第3条太特殊,其他的空间不需要具备,更不是关键的性质。只有第4条是空间的本质,也就是说,容纳运动是空间的本质特征。 认识到了这些,我们就可以把我们关于三维空间的认识扩展到其他的空间。事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。 因此只要知道,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动。 下面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间是个空间,那么有两个最基本的问题必须首先得到解决,那就是: 1. 空间是一个对象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什么样的对象的集合?或者说,线性空间中的对象有什么共同点吗? 2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的? 我们先来回答第一个问题,回答这个问题的时候其实是不用拐弯抹角的,可以直截了当的给出答案。线性空间中的任何一个对象,通过选取基和坐标的办法,都可以表达为向量的形式。通常的向量空间我就不说了,举两个不那么平凡的例子: L1. 最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空间中的每一个对象是一个多项式。如果我们以x0, x1, ..., xn为基,那么任何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分量ai其实就是多项式中x(i-1)项的系数。值得说明的是,基的选取有多种办法,只要所选取的那一组基线性无关就可以。这要用到后面提到的概念了,所以这里先不说,提一下而已。 L2. 闭区间[a, b]上的n阶连续可微函数的全体,构成一个线性空间。也就是说,这个线性空间的每一个对象是一个连续函数。对于其中任何一个连续函数,根据魏尔斯特拉斯定理,一定可以找到最高次项不大于n的多项式函数,使之与该连续函数的差为0,也就是说,完全相等。这样就把问题归结为L1了。后面就不用再重复了。 所以说,向量是很厉害的,只要你找到合适的基,用向量可以表示线性空间里任何一个对象。这里头大有文章,因为向量表面上只是一列数,但是其实由于它的有序性,所以除了这些数本身携带的信息之外,还可以在每个数的对应位置上携带信息。为什么在程序设计中数组最简单,却又威力无穷呢?根本原因就在于此。这是另一个问题了,这里就不说了。 下面来回答第二个问题,这个问题的回答会涉及到线性代数的一个最根本的问题。 线性空间中的运动,被称为线性变换。也就是说,你从线性空间中的一个点运动到任意的另外一个点,都可以通过一个线性变化来完成。那么,线性变换如何表示呢?很有意思,在线性空间中,当你选定一组基之后,不仅可以用一个向量来描述空间中的任何一个对象,而且可以用矩阵来描述该空间中的任何一个运动(变换)。而使某个对象发生对应运动的方法,就是用代表那个运动的矩阵,乘以代表那个对象的向量。 简而言之,在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的乘法施加运动。 是的,矩阵的本质是运动的描述。如果以后有人问你矩阵是什么,那么你就可以响亮地告诉他,矩阵的本质是运动的描述。(chensh,说你呢!) 可是多么有意思啊,向量本身不是也可以看成是n x 1矩阵吗?这实在是很奇妙,一个空间中的对象和运动竟然可以用相类同的方式表示。能说这是巧合吗?如果是巧合的话,那可真是幸运的巧合!可以说,线性代数中大多数奇妙的性质,均与这个巧合有直接的关系。 April 03 SIGIR上午收到的通知,投俩中一,超过平均录取率,不算灌水,虽说提前知道了一点消息,但收到正式通知还是很兴奋,Review comments给的不错,祝贺一把:-) 下面该考虑另外那篇了,已经被拒两次,不是好兆头啊。组里今年还是是四篇,和去年一样,稳住了。今年WWW在北京开,没有论文也准备去蹭,一年中能同时参加这两个会还是头一次,期待! March 19 月志2又很长时间不写了,还是流水账吧,方便省事,利于阅读.
上次组织去蟒山,山不高,台阶都标着级数,每次在抢整后都名正言顺坐下休息, 导致少壮派把其他人远远落在后面. 迎面碰到一游人阔论世界经济:"我预测未来金价将达到XX美元一盎司." 倒! 可惜具体数目在惊愕中被风刮走,没听清.
去山顶还要另买票,10块钱一个,我们13个人,山后面是著名的13陵,晕,怎么凑出这么个数字,恐怖啊,还好有一条可爱的小狗陪着我们走了半程,只是它不用买票了。
山顶是有名的13陵蓄水电站,池子不大,风景还好,大坝相当壮观,不过把那么多水弄到山顶也怪麻烦的,不知道能发多少电. 归途中低空飞过一飞机,用赖伟的望远镜看了一眼,貌似南航的,有人说是东航的,也有说是国航的,方差太大了,强烈建议赖赖换个好点的镜子。飞机啊,不要因为我们瞎猜你就瞎飞。
January 31 Redmond一月记来Redmond快一月,后天要打道回府,回想起这一个月,感慨颇多,心得全无,一一罗列备查。
1. 遍历公司周围各个中餐馆,也逐渐认识菜单上的单词们。记得第一次看到英文菜单,就认出了一个beef,那叫一个惨,再次找到考六级之前的感觉,词汇量远远不够啊。还有,知道subway不卖汉堡,只有三明治,还是凉的,可怜老美们的胃!中午公司食堂的上海牛肉不错,就是面不够劲道;米饭实在是有点欠火候,一粒一粒的,吃到肚子里面还会跳三跳。
2. 适应了英语印度版,现在老印说一遍基本上能明白了。想想刚来哪几天,他们说完第一遍,我很茫然的说pardon;等他们说完第二遍,我很无奈的说sorry... 崩溃。现在也能逐渐听明白discovery在掰些啥,语言的学习都是被逼出来的。
3. 认识了好多传说中的人,中国的,印度的,呵呵,吃饭是认识人的不二法则。我们三个土人在这边都没车,晚饭以及晚上回宾馆成为大问题,于是乎,谁让我们蹭车,我们让谁蹭饭. 在饭桌上给老外们普及了不少中华博大精深的文化,也知道了不少国外的八卦奇闻,当然,以印度的居多。
4. 知道了Redmond原来不仅仅下雨,也下雪。还知道了宾馆一到下雪就停shuttle bus,我们得走路上班。88楼实在是太远了,还有,88楼整个就是一个迷宫,迷路不止一次。
5. 白云宾馆的猫有16岁了,难怪成天天没精打采的在壁炉旁边睡觉,据说猫的年龄太大就...... 想想有点恐怖
6. 也能喝苏打水了。继荣的预测很准,现在我一天来个三五罐都没问题。不过说实话,如果不是这边的茶太难喝,我才不会去碰这破玩意儿。
7. 白云宾馆的早餐有点sorry,除了自己能做个饼之外其他都很一般,对带冰碴的面包片和凉的不能再凉的鸡蛋特别提出批评。
8. 还有啥来着,回头想起来再补上
January 16 下雪了昨天下午和晚上下大雪,到处都是白的,挺兴奋,很漂亮啊。 晚上结冰了,早上被告知宾馆的汽车停了,还好公司的汽车还有。平时走路40分钟的路程,汽车走了半个小时还不到,等车用了都不止半个小时,等的实在无聊,和谷哥在22楼前捏雪人。到了88楼都10点半,还不如走路。透过玻璃墙,屋外白茫茫一片,屋里暖和的穿衬衫都热,爽:P January 07 周末+下雪到Redmond的第一个周末就在加班,也没有办法,时间太紧了。88号楼没几个人,我独占一个会议室,还是挺爽。比较搞的是那个破节能系统,对我视而不见半个小时关一次灯,害得我不断站起来挥挥手告诉它我的存在。
今天早上一睁眼已经9点半,又开始晚睡晚起的生活了,唉。外面阳光灿烂,我一个人在酒店寸步难行,还是老老实实的码字吧。中午出门吃饭,老天开始下雨,吃了碗越南米粉,味道还不错,出来一看,OMG,鹅毛大雪纷纷扬扬,等到步行回到酒店雨雪已经停了,太阳又冒出来,变的可真快。据说这个月份这里一个月下三十天雨,还真不假。
听说Annual Party非常漂亮壮观,同志们share一下照片啊 January 04 Redmond第一天出发时间是1月3号早上9点,到达是1月3号早上7点,算是越活越回去了:-) 不过出来混总是要还的,等到回国这些都得还回去。从机场到Redmond途中遇见了美国式堵车,虽然规模和程度比起知春路北四环差的不止一个档次,但是也是相当的壮观了,路上有很多长的乱七八糟的货车,样子很搞笑。
来到住的地方,一个号称“白云宾馆”的地方,打开门就觉得什么东西都贼大无比,老美的家具电器都要比正常的大一号,不管这么多,睡觉要紧,实在是太困了。中午和小幺吃完中饭,蹭车去了公司,顺便把门卡开通,转了转,在彪哥办公室窗下路过,抬头看了两眼,好像没啥特别的。决定走路回来,天上的雨淅淅沥沥的没完没了,忘记带伞,相机也没带,失败!
下午晚上都忍着没睡,据说倒时差是否成功就看今晚睡的怎么样了,希望一觉睡到大天亮。 November 14 无题Not everything that counts can be counted, and not everything that can be counted counts.
----Albert Einstein, 1879-1955 November 05 游十三陵为了不辜负北京短暂的秋天,周日和小孔游十三陵。周六晚上花半个小时敲定路线,周日清早杀到立水桥,天气不错,秋高气爽艳阳高照,等了半天不见去十三陵水库的643路公交,正东张西望,突然发现22路去昭陵,不管那么多爬上车再说,应了一句老话:计划不如变化。经过一个半小时摇摇晃晃,终于到了公交的最后一站:昭陵。
明昭陵是明朝第十二帝明穆宗朱载垕和他的三个皇后的合葬墓,在十三陵中排行第九,这个皇帝还是比较开明有作为,明朝有个有作为的皇帝可不容易啊,可惜在位6年就死了。一进大门,就蹭了一个导游,呵呵,省得自己瞎转啥也看不明白,陵园里游客稀少,那些建筑们基本上看不明白,因此光听导游讲故事了,了解了不少陵园特有的规矩和风水,什么男左女右迈门槛、啥叫风水宝地,还有传说中的左青龙右白虎北玄武南朱雀等。不过昭陵里的人少很冷清,大家都被导游说的不敢造次,相机揣在兜里都没拿出来。
从昭陵出来,不远就是人潮如织的定陵,墓主人是明朝第13位皇帝神宗朱翊钧和两位皇后的合葬陵,也就是那位有名万历皇帝,在位48年,算是明朝在位时间最久的了。因为定陵地宫被打开了,出土了N多文物,还建立了一个博物馆,因此参观十三陵的游人基本上都来这儿,门票也贵了不少,以前还看过Discovery节目,专门介绍定陵,名声在外啊,在位48年和在位6年的区别还是很大的。进了大门,照例蹭导游,这个导游比较干脆,没那么多规矩,加上人太多,也讲不了那么多规矩。跟着导游排队进了地宫,里面及其对称,虽然不是非常的大,不过在地底下几十米的地方挖出这么一个建筑,真的非常不容易,陵墓里的文物基本都被移走,我们也就看个大概,听导游说一些故事,他提到了陵墓里没有机关暗器,也没有人陪葬,电影里面的故事基本瞎掰。定陵的地宫被发掘还和一块石碑有关,当年在挖掘的时候发现了一块带有刻字的小石碑,上面刻着:“此石至金刚墙前皮十六丈、深三丈五尺”,这下惨了,暴露了陵墓的入口,万历皇帝的墓就此被挖开,据说埋那块石头是为了方便把皇后与他合葬,结果......呵呵,估计他恨死那块石头了。
应Chengsuo小弟弟的要求,添加一点从导游那里听来的野史,不过明朝那些皇帝们,呵呵,都太有才了,朱元璋的子孙们一个个太有个性。万历帝早年还是不错的,只是后来好像为了一个妃子和大臣们赌气30年不上朝不接见大臣,每餐必饮,每饮必醉,每醉必杀人,这也太过分了吧,虽说死后没有人陪葬,但是这么冤死的也不少,和曹操梦中杀人有得一拼。昭陵的石碑已经破成了一块一块的,是被李自成攻下北京后砸成这个样子,后来考古学家们又用胶粘起来了,字迹已经模糊不清;与之对应,在博物馆看到了清顺治帝批的一个折子,当时的一个直隶总督上的,清朝入主北京后不久,就拨了不少银子整修十三陵的建筑,而不是去挖人家的祖坟。算是知道为啥是顺治而不是李自成当皇帝了,也庆幸不是李自成。还有就是定陵的墓碑颜色红兮兮的,贼难看,一问导游,原来当年红卫兵为了体现革命江山一片红,皇帝陵园也是江山一部分,没能例外,涂料质量还真不错,涂上去就洗不掉,胡搞阿!看来时间的推移与思想的进步并不总是同步的。 November 02 Markov中午吃饭闲聊,突然发现大家都不确认Markov是哪国人,汗~~ 回来狂搜一把,终于在一个哥们的Blog上找到这位超级牛人的介绍,Copy之。
Live space不让上传附件文档真是麻烦,这么一页页的贴太费事了。小叶子发给我一个《量子力学史话》,因为这个原因一直没有贴上来,可惜。
马尔科夫
不安份的早年 1856年6月14日,梁赞省林业厅六等文官马尔科夫的妻子生下一个男孩,这就是我们将要认识的主人公,19世纪末至20世纪初对俄国科学和民主进步事业都作出巨大贡献的数学家安德烈•安德列耶维奇•马尔科夫(1856-1922)。 梁赞与莫斯科毗邻,自古就是俄罗斯中部富饶的谷仓。苍绿的林海和金黄的麦田复盖着广袤的大地,蜿蜒的奥卡河静静地流过省会梁赞市,给这座城市带来繁荣与生机。但是老马尔科夫在生活上和官场中都不得意,他结过两次婚,共生育了五男四女,一大家子的衣食温饱,象座山似地压在他瘦弱的肩上。然而命运多蹇,老实人后来在官场遭人诬陷被迫辞职,一家人只好迁居彼得堡另谋生路,这一年马尔科夫刚满五岁。 父亲先是在一个有钱的寡妇那里找到一份庄园管家的差事,后来靠自己的努力开设了一个私人律师事务所,一家人总算在彼得堡定居下来。从此我们的主人公就和这座北方新兴的都会结下了不解之缘,他的名字也同彼得堡数学学派紧密地联系在一起,如同涅瓦河畔的北极光一样辉映在19世纪末至20世纪初的数学天空。 谈到彼得堡数学学派,我们就不能不提起另一个光荣的名字,那就是这一学派的奠基人和我们主人公的恩师巴夫卢提•里沃维奇•切比雪夫(1281-1894)。历史上有许多巧合,命运给彼得堡数学学派的两位大师安排了类似的命运:切比雪夫自幼跛足,当其他的孩子们在庄园里活蹦乱跳地游戏时,他却只能躲进储藏室里那些锈锁和旧钟;马尔科夫也在五岁那年不幸患了骨结核,膝盖肿得象面包一样,一条腿完全不能弯曲。无独有偶,当代中国数学界的一对著名师徒华罗庚与陆启铿也都患有腿疾。也许是生理条件限制了其他方面的兴趣,也许是不公平的命运激发了向困难抗争的勇气,他们都成了蜚声数坛的明星。的确,与疾病抗争的经历磨炼了少年马尔科夫的意志,他坚持拄拐行走,忍着剧痛活动僵直的关节。十岁那年,他的腿疾经手术治疗好转,只是稍稍留下了一点后遗症,但是这段痛苦的经历在他心灵深处留下了终身难忘的印象。 中学时代开始了,马尔科夫被送到彼得堡第五中学。这是一所完全按照东正教的陈规陋俗来治理的学校。对于正在长身体和求知欲不断高涨的孩子们,学校的要求是连篇累犊地背诵希腊及拉丁文,外加各种祈祷与忏悔仪式。马尔科夫厌恶这种令人窒息的环境,除了数学以外,他对学校里的其它课程都不感兴趣。马尔科夫有两个姐姐也在这所学校读书,她们的经典和操行总是得到老师的表扬,唯独桀骜不训的马尔科夫总是不能引起老师的好感。为此父亲常被校长招到学校,为他承受那令人难堪的嘲讽与训斥。 但是马尔科夫绝不是那种除了数学就什么都不懂的怪坯子,他对社会问题的关心以及对于人文科学的热爱贯穿其生命的始终。正是在第五中学时,他读了大量课外作品──那既不是教师推荐的罗马编年史,也不是廉价的法国爱情小说,而是一些高年级学生偷偷带到学校里来的进步读物。为此他与校方发生了严重的冲突。 十九世纪六十年代是俄国民主启蒙运动空前高涨的时期,车尔尼雪夫斯基(1828-1889)、杜勃罗留波夫(1836-1861)、皮萨列夫(1840-1868)等人犀利的政论文章和生动的文学评论象严冬过后的春风一般受到青年学生的欢迎。马尔科夫正是从这些作品中汲取了养料和批判的勇气,开始对沙皇专制制度和教会的思想禁锢产生怀疑。在一次文学课上,当老师布置学生们写一篇评论来分析《叶甫盖尼•奥涅金》的抒情风格之后,马尔科夫却交上了一篇皮萨列夫式的书评,对普希金(1799-1837)笔下的俄国社会进行了入木三分的分析。这一胆大妄为的举动忤犯了顽固守旧的教师,他在马尔科夫的作业上批道:“你过多地阅读了否认人间一切美好感情的作家的作品。” 马尔科夫的言行逐渐引起了学校当局的注意,父亲被传唤的次数越来越多了。就在临近毕业的那个学期,危机终于爆发出来。在一次例行的祈祷仪式临近结束时,心不在焉的马尔科夫把《圣经》匆匆地塞进口袋,只盼着赶快跑到庭院里去轻松一下,一直在监视他的学监突然出现在他面前,气势汹汹地指责他破坏了宗教仪式的肃穆气氛。学生中一片喧哗,仪式草草收场。马尔科夫则被带到校长室,被斥为无神论者和无政府主义分子,扬言要立即开除学籍。父亲闻讯赶来,再三地赔礼道歉才算平息了这场风波。 丑小鸭不喜欢水草蔓生的池塘,因为它的未来不属于那个地方。对于数学,马尔科夫却有着一种近乎天然的热情。他独立地学习了许多课外知识,数学水平远远地超过了一般的高中学生。当别人还在为一元二次代数方程困惑不解的时候,他已在独立地钻研微分方程了。有一次他发现自己找到了一种与教科书不同的常系数线性常微分方程的解法,立即给当时俄国最有资历的数学家布尼亚科夫斯基(1804-1889)写了一封信,向他报告这一结果。布尼亚科夫斯基把信转给了自己的学生科尔金(1837-1908)和佐洛塔廖夫(1847-1878 ),他们很快就给马尔科夫回了信,鼓励他投考彼得堡大学数学系,以数学作为自己的终身的事业。事实上,马尔科夫发现的解法已由别人提出过了,但是他的创造性却给两位数学家留下了极为深刻的印象。若干年后,他们成了马尔科夫的老师和同事。 良师益友 1874年,马尔科夫考入了神往已久的彼得堡大学数学系,从此脱离那个令人感到压抑的环境,开始在绚丽多姿的数学王国里自由地呼吸。1878年,马尔科夫以优异成绩毕业并留校任教,毕业论文《以连分数解微分方程》获得当年系里的金质奖。两年后他完成了《关于双正定二次型》的硕士论文,并正式给学生开课。又过了两年,他开始考虑博士论文,后以《关于连分数的某些应用》于1884年通过正式答辩。 对于一个决心终身奉献数学的年轻人来说,彼得堡大学具有足够的魅力:一大批富有激情和才华的俄罗斯数学家正集结在切比雪夫身边,以他们独特的风格与在若干领域里的开拓性工作引起了全世界数学家的瞩目,一个属于俄罗斯的数学学派正在彼得堡大学悄然崛起。青年马尔科夫如饥似渴地向前辈们学习,很快成了这个数学团体中的一个新的重要成员。 十九世纪数学的一个特点就是学派的兴起。诞生在法兰西大革命风暴中的巴黎学派仍雄踞数坛,他们勇于开拓新的研究方向,富有创造激情,在函数论、数学物理、几何、拓扑与群论等领域总是走在别人的前面。长于哲学思辨的德国人则特别重视数学大厦的基础,“算术化”成了柏林学派的战斗旗帜;当然,柏林人不象巴黎人那样轻视“外省人”,在波恩、莱比锡和格廷根都出现了引入注意的数学家群体──特别是最后那座小城,不久就要取代巴黎成为数学的耶路撒冷。自负的英国人也开始从固步自封的旧梦中觉醒,在牛顿( I. Newton, 1642-1727 ) 的母校冒出了一个“分析学会”,会中的年轻人竟敢顶着亵渎神圣的罪名去推广德国人莱布尼茨( G.W.Leibniz, 1646-1716 ) 的微积分符号,19世纪英国人在代数学领域的成就于此不无关系。在文艺复兴的故乡,一个以几何与拓扑为突破口的新意大利学派正在成长。 按照新意大利学派第二代领袖沃尔特拉(V.Volterra, 1860-1940)的说法,这一学派的诞生可以溯源于布廖斯奇 ( E. Brioschi, 1824-1897) 和贝蒂 ( E. Betti, 1823-1892) 1858年的德、法之行。但是在俄国历史上却很难找到一个足以标志彼得堡数学学派呱呱落地的事件。有人将俄国数学的进步追溯到1727年瑞士大数学家欧拉( L. Euler, 1707-1783) 前来彼得堡科学院供职,也有人将之归因于布尼亚科夫斯基、奥斯特洛格拉特斯基(1801-1862 ) 等人从法国留学回来从事数学教育,然而真正使彼得堡与数学结缘的却是切比雪夫和他的弟子们。 彼得堡所在的地方原先只是波罗的海芬兰湾东端的一个小渔村,为了显示其向西方学习的决心并打开通向波罗的海的通道,彼得大帝( Peter I The Great, 1672-1725) 于1703年在此建立了一个军事要塞,更于1712年将首都从莫斯科迁到这里。在彼得大帝宏伟的政治经济改革蓝图中,有一项仿效西方建立科学院的计划,但是由于种种原因,直到他去世的1725年,这个柏林科学院的翻版才正式问世。早期的院士中不乏知名的数学家,如贝努利家族的尼古拉第三 ( Nicolaus III Bernoulli) 和丹尼尔 ( Daniel Bernoulli, 1700-1782)、哥德巴赫 ( C.Goldbach, 1690-1764) 以及欧拉( L. Euler, 1707-1783) 等,但是他们都是外国人。当时俄罗斯数学的土壤是贫瘠的:没有土生土长的数学家,没有能够引起其他国家数学家注意的成果,没有一所大学,甚至连一本象样的初等数学教科书都没有。马格尼茨基 ( 1669-1739 ) 是当时致力于数学教育的学者,他在自己那本著名的《算术》的扉页中写道: 让所有的人都得到智慧和地位, 真正是俄罗斯的而不是外国的。 它清除地表达了当时一部分先进的知识分子渴望祖国尽快摆脱愚昧落后状态的心情,和建设俄罗斯新科学的决心。 经过一百多年的建设,彼得堡早已不象当年那样空旷和荒凉。涅瓦河上架起了数十座铁桥,市区和彼得罗巴夫洛夫斯克要塞之间铺成了俄国第一条铁路,凝聚着古典美与俄罗斯风格的海军大厦的尖顶直指苍穹,冬宫和夏园堪与凡尔赛媲美。1804年在彼得堡建立了一所国立师范,1819年改名为彼得堡大学。 彼得堡数学学派是伴随着切比雪夫几十年的舌耕笔耘成长壮大的。自1846年接受助教职位到1882年以终身荣誉教授的身份退休,切比雪夫在彼得堡大学执鞭达三十五年之久,即使退休之后他还继续从事研究并培养研究生。他的讲课深受学生们的欢迎,那绝不是经院式的说教,而是充满启发性评论的对基本原理和方法的叙述,正如他的高足李雅普诺夫 (1857-1918) 描述的那样,“他在课堂上即兴给出的一个评论,往往与听讲者冥冥求索的某个问题有关,因为他对弟子们的水平和思想活动了如指掌。因而他的讲课极具感染力,每堂课都使学生们获益良多。”教学之外,切比雪夫本人在数学的若干领域也作出了开拓性的贡献,特别是在数论、概率论和函数逼近论方面。他是彼得堡数学学派当之无愧的领袖。 除了切比雪夫之外,科尔金在代数与函数逼近论、索霍茨基 (1842-1929) 在复变函数论、佐洛塔廖夫在数论和逼近论、波瑟(1847-1928) 在正交函数和积分运算方面成果累累,他们都是彼得堡大学数学系的毕业生,分别毕业于1858、1866、1867和1868年。稍晚的毕业生中在数学中作出重要成绩的,有开拓俄国代数与群论研究的格拉维(1863-1939),以及创立数的几何学的沃罗诺伊(1868-1908) 等。 一些非彼得堡大学毕业的青年同样属于彼得堡数学学派:交通道路学校的沙图诺夫斯基(1859-1929) 是切比雪夫的旁听生,后来在敖德萨创建了另一个数学中心;海洋学院的克雷诺夫(1863-1945) 利用切比雪夫提出的近似公式得到船舶设计方面的重要结果;莫斯科大学的茹可夫斯基 (1847-1921) 在解析函数与偏微分方程方面得益于切比雪夫的指点,后来成为现代流体力学的开创人与俄罗斯航空之父;斯捷克洛夫 (1864-1926) 在哈尔科夫跟随李雅普诺夫学习,在函数论、微分方程和数学物理方面均有建树,后来成为彼得堡数学学派在十月革命后的重要传人。 然而作为彼得堡数学学派的中流砥柱而堪称切比雪夫之左膀右臂的,则非马尔科夫与李雅普诺夫这一对师兄弟莫属了。李雅普诺夫仅比马尔科夫年轻一岁,但在事业的开始阶段却没有他的师兄顺当:与马尔科夫相比,他迟两年进入彼得堡大学,迟两年毕业,迟五年取得硕士学位,迟六年取得博士学位,迟五年被选为科学院院士;俩人虽然同于1893年成为教授,但马尔科夫早在1886年就已成为彼得堡大学的副教授,而李雅普诺夫在完成了硕士论文的次年就离开了彼得堡,于1885年应聘为哈尔科夫大学数学系讲师。尽管有这些差距,马尔科夫却深知这位师弟的能力,视其为学术上的知音和畏友。李雅普诺夫在常微分方程定性理论和天体力学方面的工作使他赢得了国际声誉。他在概率论中心极限定理的研究中引进了一种似乎是“异端”的方法,暴露了切比雪夫和马尔科夫一脉相承的工作中的弱点,而马尔科夫对自己方法的改进再次带来概率论研究方法的变革,对这门学科的现代化产生了巨大的影响。关于这一经过我们后面还要讲到。 从数论到经典分析 马尔科夫入学不久就表现出其独特的数学天赋,因此当柯尔金和佐洛塔廖夫这两位教师组织代数与数论的讨论班时,他们毫不犹豫地把这个在中学时代就敢于向大权威谈论自己发现的学生吸收进来。马尔科夫不负众望,他的第一项重要的数学工作,就是沿着柯尔金和佐洛塔廖夫俩人所开辟的道路完成的。 型的理论是代数数论中的一个重要课题,欧拉、拉格朗日( J . L. Lagrange, 1736-1813)、高斯(C. F. Gauss, 1777-1855)这些大数学家都曾为它付出艰辛的劳动。二元二次型(亦称双二次型)是二次型中最简单的一种形式,在给定其判别式的条件下,寻找二次型的极值是一件十分有意义而又相当棘手的工作,若干年来虽然有一些进展,但是疑点仍然不少。 柯尔金和佐洛塔廖夫给出了与判别式相关的两类双二次型的最小值的近似估计,这一结果得到当时法国著名数学家埃尔米特(C. Hermite, 1822-1901)的高度评价。 马尔科夫1880年的硕士论文就是对这一结果的彻底完善化。他证明了两位老师找到的数值不过是一个收敛于常数的正无穷递减数列中的前两项,而该数列通项的值则取决于一个三元二次不定方程在某些附加条件下的整数解。他还给出了由此类不定方程的解来计算通项的具体方法,从而建立了二次型表示论与著名的丢番图方程的联系。这样,马尔科夫就彻底地搞清了判别式大于零时不定双二次型最小值的分布情况,极大地推进了柯尔金和佐洛塔廖夫的结果。 在这项研究中,马尔科夫已表现出了切比雪夫等前辈学者对他的影响,那就是善于联系经典问题、充分利用初等工具、追求解的精确性、实用性以及不畏繁复计算等鲜明的彼得堡风格。论文附有一个包括前20个通项值计算程序和结果的大表,每一行数据都对应着一个复杂的丢番图方程。甚至早期彼得堡数学学派的一个缺点在这项研究中也有所反映,那就是马尔科夫完全排斥了几何背景,因为他同切比雪夫一样怀疑几何语言的严密性。其实,在型表示论中借用几何语言是最自然不过了,高斯关于三元二次型几何意义的说明被认为是闵可夫斯基(H. Minkowski, 1864-1909)关于数的几何理论的开端,早期彼得堡数学家在这一领域可谓失之交臂。 不管怎么说,马尔科夫这项工作的完成,表现了他超乎寻常的数学直觉和洞察力。这种能力加上坚韧不拔的毅力,使他很快就超过了自己的许多老师和同辈,成为彼得堡数学学派的杰出代表和中坚分子。 双二次型最小值的分布搞清楚以后,马尔科夫开始注意多个变元的二次型,只是由于教务倥偬,直到十一年后才发表了进一步的研究成果。1901年,他在《关于不定三元二次型》中给出了该类型的前四种极值形式(其中一种也为柯尔金所得到)。1909年,他汇集了自己关于三元二次型的成果,出版了包括所有判别式不大于50的三元二次型最新数据在内的专著。这些工作都是伴随着大量复杂的计算进行的,马尔科夫不仅通过计算提供了问题的解,而且对于发展计算方法也做出了贡献。以后他又研究了四元二次型,并得到其极值的前两种形式。 代数数论中的另一个重要课题是关于理想的理论。1843年,德国数学家库莫尔 ( E. E. Kummer, 1810-1893) 在企图证明费尔马大定理的壮举中被一道小河沟挡住了。看过他手稿的狄里克莱 ( P. L. Dirichlet, 1805-1859) 不客气地指出,代数域上的素因子分解唯一性定理对代数数不一定成立,而素因子唯一分解的假定对于他的证明又是绝对必要的。为了克服这一障碍,库莫尔开始在一系列论文中创立和发展一种叫做理想的理论,借助理想数来实现代数域上素因子的唯一分解,从此对理想的研究在一个时期内达到高潮。佐洛塔廖夫曾致力于三次方根域上理想素因子的分解,可惜这位英华早发的学者三十一岁就逝世了。在为纪今佐洛塔廖夫而出版的文集中,马尔科夫给出了三次方根域上理想素因子分解的当时最好结果。 马尔科夫等人在代数数论方面的工作与切比雪夫在解析数论方面的工作一起,确立了彼得堡数学学派在数论领域的领先地位。但他并不以此为满足,而是很快地把目标转向一系列更广的数学题材,特别是在经典分析领域做出了新的贡献。 经典分析是彼得堡数学学派擅长的又一个领域,马尔科夫广泛涉猎了这一领域中的若干分支:从矩的理论到积分运算、从函数逼近论到微分方程、从内插法到近似计算,处处都有他辛勤耕耘的足迹。而这一系列工作是从切比雪夫的一篇论文开始的。 1833年,法国一个不太出名的数学家比内梅(J. Bienayme, 1796-1878) 向巴黎科学院递交的一篇论文中,将力学中矩的概念作了推广,但文章直到三十四年后才在刘维尔 ( J. Liouville, 1809-1882)的《纯粹与应用数学杂志》上刊登出来。切比雪夫立即意识到矩的研究具有重要意义,并试图在对概率论极限定理的证明中应用这一工具。他在1874年写成的论文《关于积分的极限值》中,借助于矩给出了某类非负函数积分以连分数形式表达的极值不等式,但没有证明。1884年马尔科夫在《某些切比雪夫积分的证明》一文中,给出了这些不等式的严格证明,并在同年通过的博士论文的第三部分给出了切比雪夫问题的完整解答。 后来在概率论的研究中,马尔科夫一再回到矩的问题上来,并对切比雪夫的矩问题作了许多深入的拓广。他的这些工作,最初见于1876年发表的《连分数的一些新应用》,而后又在1897年的一系列论文中作了进一步的阐述,其中最为重要的一篇是《关于矩的一个L问题》 几乎在马尔科夫证明切比雪夫不等式的同时,荷兰数学家斯提吉斯(Th. J. Stieltjes, 1856-1894) 也开始了同样的研究,他在《关于所谓力学积分法的研究》一文中给出了与马尔科夫类似的结果。一开始俄国数学界宣称拥有优先权,斯提吉斯则声称自己没看到马尔科夫的论文,也不知道切比雪夫原先提出的问题。事实也的确是这样。问题搞清楚以后,马尔科夫与斯提吉斯成了很好的朋友,他们寄书鸿雁,频繁地交流各自在矩理论以及有关内插法、构造积分、余项估价和连分数等方面的新成果,这种关系一直持续到斯提吉斯逝世。就在去世前不外,斯提吉斯发表了带有综述性质的《关于连分数的研究》,其中解决了无穷区间上的矩问题,并且给出了所要寻找的函数的一切整数阶矩的连分数表达式。作为回答与对好友的纪念,马尔科夫于1895年发表了《关于某些连分数收敛性的两个证明》,在其中给出了斯提吉斯连分数收敛的充分条件。 十余年来,马尔科夫和斯提吉斯共同研究矩的理论。他们都是从经典分析中的问题出发,企图对积分的上、下界给出一个精确的估计,工作中又都大量运用了连分数这一工具,所以不谋而合与互相启发的现象常常出现在俩人之间。但是马尔科夫对精确的结果特别感兴趣,不惮于繁复的数字运算,并把对于积分的估值应用到概率论中,这是彼得堡数学学派风格之体现。而斯提吉斯更注意从一般的原则上去考察矩问题,他更关心的是积分形式的意义,而不是其估值的结果,从而导致了一类应用广泛的斯提吉斯积分的出现, 为实变函数论的日后发展开辟了道路,这又很有些法兰西数学学派的味道。 如同他的导师切比雪夫一样,马尔科夫对实际问题具有浓厚的兴趣,他在函数逼近论方面的工作就是一例。出于化学理论上的需要,彼得堡大学的著名化学家、也就是元素周期律的发现者门捷列夫(1834-1907)曾提出过一个问题,从数学上说相当于找出定义在闭区间上的高次多项式的导数在某种条件下的最大值。1889年,马尔夫在题为《关于一个门捷列夫问题》的论文中,解决了由多项式的上界来求其导数多项式上界的问题;这个问题也可表示为偏离零点的多项式的最大偏差的估计,因此与切比雪夫所建立的一系列结果都有关系。1892年,马尔科夫的同父异母弟弟弗拉基米尔(1871-1897)曾把这一问题推广到求导数多项式的上确界的情况,可惜这位颇有数学才华的弟弟二十六岁便死于肺结核。马尔科夫还研究过许多其它的实际问题,其中包括将空间曲面部分最小变形地转换到平面,以及铁路弯道的曲率等问题。 马尔科夫对微分方程的贡献主要是关于拉梅(G. Lame., 1795-1870)方程和超几何方程的研究。他确定了一个超几何方程的两个解的乘积可作为整函数的条件,研究了这些函数与拉梅函数的零点分布,这些工作还导致了以初等函数表示积分,并涉及了大量的近似计算方法。 马尔科夫在博士论文中就给出过关于高斯积分余项的表达式,在《关于级数收敛的加速变换》一文中又首次引入一种加快级数收敛速度的方法,这种方法被人称为“马尔科夫变换”。他对计算的偏爱最明显地表现在1888年发表的具有八位小数的《积分 exp{- t2}dt 数值表》中。他的更多的关于近似计算理论和方法的成果则被汇集到《有限演算》这一专著之中,这本书是计算方法从以古典分析为主要工具的时期向以广泛采用函数论工具的新时期过渡的代表作。 马尔科夫在经典分析领域里的工作,显示了他扎实的基础和广博的知识,这对于继承和发展切比雪夫所开创的事业来说是极其可贵的。我们也可以看出,从代数数论到经典分析,马尔科夫的一个主要目标就在于完善对于数学对象的估计:无论是二次型还是多项式,无论是积分还是导数,他都希望给出一个尽量精确的关于上、下限的表达式;当他后来巧妙地把自己对积分界的估计用于概率论中古典极限定理的证明时,就引起了这门学科面目的极大改观。 把概率论推进到现代化的门槛 把概率论从濒临衰亡的境地挽救出来,恢复其作为一门数学学科的地位,并把它推进到现代化的门槛,这是彼得堡数学学派为人类作出的伟大贡献。切比雪夫。马尔科夫和李雅普诺夫师生三人为此付出了艰辛的劳动,其中尤以马尔科夫的工作最多。据统计,他生平发表的概率论方面的文章或专著共有二十五篇(部)之多;切比雪夫和李雅普诺夫在概率论方面的论文各为四篇和二篇。 大约从1883年起,马尔科夫就开始考虑概率论中的基本问题了。十九世纪的八、九十年代,他主要是沿着切比雪夫开创的方向,致力于独立随机变量和古典极限理论的研究,从而改进和完善了大数定律和中心极限定理。进入二十世纪以后,他的兴趣转移到相依随机变量序列上来,并创立了使他名垂千古的那个概率模型。 概率论中的一个基本问题就是探索概率接近于1时的规律。特别是大量独立或弱相依因素累积结果所发生的规律,大数定律就是研究这种规律的命题之一。1845年,切比雪夫第一次严格地证明了贝努利形式的大数定律,次年他又把结果推广到泊松形式的大数定律。在概率论门户萧条的年代里,切比雪夫的工作无疑起到了振聋发聩的作用。但是由于处理手法还不够完善,所得结果还是比较粗糙的。马尔科夫不满意切比雪夫要求随机变量的方差值一致有界的条件,经过努力他找到了两种更合理的条件,极大地改进了切比雪夫的结果。 中心极限定理则是概率论中极限理论的又一重要内容,它讨论随机变数和依分布收敛到正态分布的条件,在众多的技术领域里具有重要意义。前文已经提到,切比雪夫首先尝试在概率论的背景中使用矩方法。1884年马尔科夫证明了切比雪夫提出的不等式后,加快了工作步伐,于1887年得到中心极限定理的初步证明。说它是初步的,是因为无论在定理的陈述还是在证明过程中都有某些缺陷。马尔科夫热爱自己的导师,但他更热爱真理,在给彼得堡数学学派的另一成员,喀山大学的瓦西里耶夫(1853-1929)的信中,他特别称老师的结果为“切比雪夫正在证明的定理”,这封信后来以《大数定律和最小二乘法》为题发表在1898年的《喀山大学数理学报》上。同年,马尔科夫又在《关于方程ex (d n e-x /dxn ) = 0的解》一文中,尽力精确地陈述并证明了切比雪夫提出的命题。 改进后的方法被人称作切比雪夫-马尔科夫方法。马尔科夫进而把自己和老师的一系列结果,都写进1900年出版的《概率演算》一书之中。这部书是他在概率论方面的集大成的著作,以后每次再版他都增添一些新的内容。 至此矩方法获得了辉煌的胜利,但是出人意料的事情发生了。1902年春天,马尔科夫的低班校友、也是他最敬重的同事和最有力的竞争者李雅普诺夫,在哈尔科夫工作了十七年后回到彼得堡。在此前的一、二年中,李雅普诺夫从一个全新的角度去考察中心极限定理,引入了特征函数这一有力工具,从而不仅避免了矩方法要求高阶矩存在的苛刻条件,在相当宽的条件下证明了中心极限定理,而且通过特征函数实现了数学方法上的革命,为这一定理的进一步精确化准备了条件。 与矩方法相比,特征函数法显得更灵活、更具一般性。据说马尔科夫曾经不无苦涩地对李雅普诺夫讲,你老弟的这个玩笑开得太大了;言外之意是说这位师弟掘了自家的祖坟。其实他一直在暗中奋斗,以求恢复矩方法的声誉。经过八年的努力他获得成功,在《在关于概率极限的定理与院士李雅普诺夫的论辩》一文中,他创造了一种“截尾术”,即在适当的地方截断随机变量使其有界,这样就可以既不改变它们和的极限分布,又能保证其任意阶矩的存在。这一成果在方法论上的意义是巨大的,它不仅克服了特征函数法过分依赖独立性的弱点,开辟了通向非独立随机变量研究的道路,而且突破了特征函数仅适用于弱极限理论范畴的局限,为强极限理论发展提供了有力的手段。应用这一技术,马尔科夫一举实现了他多年来精确论证中心极限定理的理想,他的研究成果被收入《概率演算》的第三版中。马尔科夫和李雅普诺夫关于方法论的竞争,极大地丰富了本世纪初概率论的内容,对这门学科的现代化产生了深远的影响。今天,“截尾术”已经与“对称化”、“中心化”一起,成为现代极限理论中的三大技术,它们连同特征函数一道,在这一领域发挥着难以估量的作用。 马尔科夫在概率论方面还有其它一些成就,如最小二乘法、方差系数的估计等等。他不愧为概率论现代化进程中伟大的设计师和先行者。他对古典极限理论和相依随机变量序列的研究则构成了彼得堡数学学派历史上最辉煌的一章,下一节就专门介绍他的这一成果。 随机过程理论的开拓者 在当代科学与社会的广阔天地里,人们都可以看到一种叫作随机过程的数学模型:从银河亮度的起伏到星系空间的物质分布、从分子的布朗运动到原子的蜕变过程,从化学反应动力学到电话通讯理论、从谣言的传播到传染病的流行、从市场预测到密码破译,随机过程理论及其应用几乎无所不在。人类历史上第一个从理论上提出并加以研究的过程模型是马尔科夫链,它是马尔科夫对概率论乃至人类思想发展作出的又一伟大贡献。 出于扩大极限定理应用范围的目的,马尔科夫在本世纪初开始考虑相依随机变量序列的规律,并从中选出了最重要的一类加以研究。1906年他在《大数定律关于相依变量的扩展》一文中,第一次提到这种如同锁链般环环相扣的随机变量序列,其中某个变量各以多大的概率取什么值,完全由它前面的一个变量来决定,而与它更前面的那些变量无关。这就是被后人称作马尔科夫链的著名概率模型。也是在这篇论文里,马尔科夫建立了这种链的大数定律。 用一个通俗的比喻来形容,一只被切除了大脑的白鼠在若干个洞穴间的蹿动就构成一个马尔科夫链。因为这只白鼠已没有了记忆,瞬间而生的念头决定了它从一个洞穴蹿到另一个洞穴;当其所在位置确定时,它下一步蹿往何处与它以往经过的路径无关。这一模型的哲学意义是十分明显的,用前苏联数学家辛钦(1894-1959〕的话来说,就是承认客观世界中有这样一种现象,其未来由现在决定的程度,使得我们关于过去的知识丝毫不影响这种决定性。这种在已知“现在”的条件下,“未来”与“过去”彼此独立的特性就被称为马尔科夫性,具有这种性质的随机过程就叫做马尔科夫过程,其最原始的模型就是马尔科夫链。 这即是对荷兰数学家惠更斯(Ch. Huygens, 1629-1659)提出的无后效原理的概率推广,也是对法国数学家拉普拉斯(P. S. Laplace, 1749-1827)机械决定论的否定。 这里应该指出,尽管拉普拉斯对概率论的早期发展作出过重大贡献,但是他的部分哲学观点是不利于这门学科的深入发展的。十八世纪以来,随着牛顿力学的彻底胜利,一种机械唯物主义的决定论思潮开始在欧洲科学界蔓延,鼓吹最力者就是拉普拉斯。1759年他在巴黎高等师范学院发表了一篇题为《概率论的哲学探讨》的演讲,淋漓尽致地表达出了这种思想。他说:“假如有人知道了某一时刻支配自然的一切力,以及它的一切组成部分的相对位置,又假如他的智力充分发达,能把这一切数据加以充分的分析,把整个宇宙中从最巨大的天体到最微小的原子的一切运动完全包括在一个公式里面,这样对他就没有什么东西是不确定的了,未来也好,过去也好,他都能纵览无遗。”1812年,拉普拉斯又进一步提出“神圣计算者”的观念,认为这个理想的数学家只须知道世界某一时刻的初始状态,就可以从一个无所不包的微分方程中算出过去和未来的一切状态。换句话说,他认为任意系统在 t > t0时的状态 x可由其初始时刻 t0和初始状态 x0唯一决定。这可真是笔判终身、细评流年,数学家可以摆个卦摊了。马尔科夫的概率模型从根本上否定了系统中任一状态 x与其初始状态 x0之间的因果必然性,从而也否定了“神圣计算者”的神话。 还应该指出,马尔科夫所建立的概率模型不但具有深刻的哲学意义,而且具有真实的物质背景,在他的工作之前或同时,一些马尔科夫链或更复杂的随机过程的例子已出现在某些人的研究中,只不过这些人没有自觉地认识到这类模型的普遍意义或用精确的数学语言表述出来罢了。例如苏格兰植物学家布朗 ( R. Brown, 1773-1858) 于1827年发现的悬浮微粒的无规则运动、英格兰遗传学家高尔顿(F.Galton, 1822-1911) 于1889年提出的家族遗传规律、荷兰物理学家埃伦费斯特 ( P. Ehrenfest, 1880-1933) 于1907年关于容器中分子扩散的实验,以及传染病感染的人数,谣言的传播,原子核中自由电子的跃迁,人口增长的过程等等,都可用马尔科夫链或过程来描述。也正是在统计物理、量子力学、遗传学以及社会科学的若干新课题、新事实面前,决定论的方法显得百孔千疮、踵决肘见。 有趣的是,马尔科夫本人没有提到他的概率模型在物理世界的应用,但是他利用了语言文学方面的材料来说明链的性质。在《概率演算》第四版中,他统计了长诗《叶甫盖尼•奥涅金》中元音字母和辅音字母交替变化的规律:这是长诗开头的两句,意为:“我不想取悦骄狂的人生,只希望博得朋友的欣赏。”诗人那火一般的诗篇在数学家那里变成了一条冷冰冰的锁链:在这条锁链上只有两种链环,C代表辅音、 代表元音(为了使问题简化起见,不仿把两个无音字母算作辅音)。马尔科夫分别统计了在C后面出现C和 的概率p和1-p,以及在 后出现C和 的概率q和1-q,把结果与按照俄语拼音规则计算出的结果进行比较,证实了语言文字中随机的(从概率的意义上讲)字母序列符合他所建立的概率模型。 完成了关于链的大数定律的证明之后,马尔科夫又开始在一系列论文中研究链的中心极限定理。1907年他在《一种不平常的相依试验》中证明了齐次马尔科夫链的渐近正态性;1908年在《一个链中变量和的概率计算的极限定理推广》中作了进一步的推广;1910年他发表了重要的论文《成连锁的试验》,在其中证明了两种情况的非齐次马尔科夫链的中心极限定理。与此同时他在一些假定的前提下证明了模型的各态历经性,成为在统计物理中具有重要作用的遍历理论中第一个被严格证明的结果。遍历理论亦称ergodic理论, 是奥地利物理学家玻耳兹曼(L. Boltzmann, 1844-1906) 于1781年提出来的,其大意是:一个系统必将经过或已经经过其总能量与当时状态相同的另外的任何状态。 马尔科夫链的引入,在物理、化学、天文、生物、经济、军事等科学领域都产生了连锁性的反应,很快地涌现出一系列新的课题、新的理论和新的学科,并揭开了概率论中一个重要分支--随机过程理论蓬勃发展的序幕。 为科学与民主而斗争 1836年,经切比雪夫提名,马尔科夫成为彼得堡科学院候补成员,1890年当选为副院士,1896年成为正院士。对于这一俄国科学界的最高荣誉,他抱着一种十分淡泊的态度,而为了伸张真理与正义,他可以抛弃一切功名利禄。他不是一个把自己关在书斋里不问天下事的学者,他提倡科学,反对迷信,关心哲学和社会问题,憎恨教会与沙皇的专制统治。在十九世纪末二十世纪初俄国先进知识分子争取科学与民主运动的潮流中,他是一个勇敢无畏的斗士。 马尔科夫的代表作《概率演算》,不但是概率论学科中不朽的经典文献,而且可以看成是一篇唯物主义者的战斗檄文。这部巨著带有强烈的论战性质,而论战的主要对手竟是他恩师切比雪夫的老师,被认为是俄国数学元宿的布尼亚科夫斯基。 把概率论的方法应用到社会科学中,这本来是法国大革命时代一些数学家的大胆尝试,但是由于拉普拉斯机械决定论的影响,这些学者们往往把复杂的社会现象归结为服从牛顿力学的机械运动,因而这种应用反而损坏了概率论的声誉。布尼亚科夫斯基在自己的著作中以长达六十页的篇幅叙述“把概率分析应用到供词、传说、候选人与不同意见之间的各种选择和依多数表决的司法判决”。其中一个典型的例子是这样的:“由全部俄文字母中任取六个并按取出顺序排列起来,有两个证人说组成了MOCKBA(莫斯科)这个词,问‘证词是真的’这件事的概率是多少?”在假定六个俄文字母所组成的词共5万而证人说真话的倾向为9/10的条件下,布尼亚科夫斯基算得一个小于1/300的概率,这当然大大低于一般人按常识判断出的结果。如果法庭以此来判定证词的真伪,两个“基本上诚实”的证人岂不冤哉枉也?马尔科夫在《概率演算》中尖刻地嘲讽了这个概率论应于“伦理科学”的例子,他写道:“(这个例子)充分阐明在解类似我们所讨论的这种本质上很不确定的问题时,不可避免要引出许多任性的假设。如果容许证人能有错误并且取消其证词的独立性,则所考虑的问题还会有更不确定的性质。”这就一针见血地道破了这种应用的荒诞不经。 如果说布尼亚科夫斯基在概率论的某些应用方面的错误是受法国数学家影响的话,那么他在认识论方面的错误则是从拉普拉斯等人的机械唯物论退到了滥用终极理由的神学和不可知论。他宣称概率论“所考虑和估值的是这样的现象:它们依据我们完全不知道的原因,并且由于我们的无知,我们对这些原因也无法作任何假设。”他又说:“有些哲学家以极不体面的方式,试图把关于证据和传说弱化的概率公式应用到宗教信仰上,以此来动摇它们。”对于这种宗教卫道士式的言论,马尔科夫在《概率演算》中进行了针锋相对的批判,他说:“不管数学公式如何,对不大可能的事件的叙述就仿佛对久远年代以前发生的事件一样,显然应该予以极端的怀疑。因此我们无论如何不能同意布尼亚科夫斯基院士的意见,仿佛必须划分出某一类叙述,对这类叙述怀疑一下就认为是大逆不道的了。” 明眼人都知道“这类叙述”指的是什么。布尼亚科夫斯基的原意是要在《圣经》等宗教经典中的传说与一般世俗传闻之间划一条明确的界限,对于前者绝对不允许使用概率论的手段去分析。马尔科夫和布尼亚科夫斯基的这段论战,成了他与教会彻底决裂战斗中的一颗重磅炸弹。 1896年,俄国末代沙皇尼古拉二世(1868-1918)粉墨登基。这是一个残酷暴虐的家伙,被人称作“血腥的尼古拉”。从青年时代就受到民主启蒙运动熏陶的马尔科夫,对沙皇的专制统治非常鄙夷,在接纳进步文学家高尔基(1868-1936)为科学院名誉院士的斗争中,马尔科夫与许多富有正义感的院士们一起,与尼古拉二世的粗暴干涉进行了勇敢的斗争。 1902年2月25日,科学院文学部联席会议通过了一项决议,接纳不久以前因为发表了《海燕之歌》而遭到宪兵搜捕和流放的高尔基为名誉院士。这一藐视沙皇专制统治的事件引起了尼古拉二世的极度恐慌,他公然给国民教育大臣发布了一道手谕:“委托你宣布,按照朕的命令,高尔基的当选无效。”受到压力的科学院院务委员会于3月12日发布了一个取消高尔基当选资格的文告。 对于沙皇的这一粗暴干涉,科学院中的进步人士表示了强烈的愤慨,柯罗连科(1853-1921)、契诃夫(1860-1904)等人以宣布退出科学院表示抗议。身在数理学部的马尔科夫于4月6日向院务委员会递交了如下声明:“我认为科学院关于取消高尔基当选资格的文告是无效的和被强加的;第一,文告盗用了科学院的名义,但事实上科学院并无意取消这一资格;第二,文告所借用的理由是毫无意义的。”虽然马尔科夫在院务委员会上要求宣读这一声明,但是遭到执行主席的拒绝。于是他又采取了进一步的行动,两天以后,他向沙皇的叔父、充任科学院院长之职的康斯坦丁递交了辞去院士称号的声明。这个根本不懂科学的院长一面劝告马尔科夫收回成命,一面竭力向报界隐瞒事件的真相,害怕更多的科学家效法马尔科夫采取对抗行动。只是由于当时马尔科夫在科学院里正担负着编辑切比雪夫文集的工作,他才没有采取更激烈的措施。但是直到1905年,他还不忘上书院委会,提请撤消其1902年的错误文告。 在这一事件中,马尔科夫对科学院上层集团屈服于沙皇的淫威深感失望。1903年初,他以院委会要从其成员所得科学奖金中抽税一事为借口递交了一份备忘录,上面写着,“我最诚恳地提请院委会注意,我决不申报任何奖励,也决不期望得到任何奖励。”马尔科夫的这一举动的真正目的不在于反对征税,而是以此显示自己绝不同听任沙皇摆布的院委会同流合污。 1905年的民主革命失败以后,俄国政治上开始了一个极端反动时期。1907年6月3日,沙皇的走卒斯托雷平(1862-1911)悍然解散有社会民主党人参加的第二届国家杜马,随后组织代表地主和资产阶级利益的第三届杜马。为此,马尔科夫照会科学院理事会说:“第三届国家杜马的建立完全违背了宪法,因而它根本不是一个代表人民意愿的议会,而只是一个非法的团体,因此我最坚决地请求理事会不要将我的名字列入选民的名单之中。” 在斯托雷平反动时期,大学里的民主进步力量遭到了破坏。1908年国民教育部发表通告,重申取消大学自治、恢复学监制度、封闭一切社团。马尔科夫对此非常气愤。他立即给教育大臣写了一封信,信中声称:“我最坚决地拒绝在彼得堡大学充当沙皇政府走卒的角色,但我将保留开设概率论课程的权利。” 在与反动政权的一系列冲突之后,马尔科夫与沙皇专制的重要精神支柱东正教教会实行了决裂。东正教最高会议的头子是尼古拉二世的私人教师和谋臣,他们在奴役俄国各族人民、镇压日益高涨的民主运动等一系列问题上是沆瀣一气的。沙皇当局不便直接出面干的坏事,就由东正教会来干,1901年东正教最高裁判所就宣布大文豪托尔斯泰(1828-1910)为异教徒而开除了他的教籍。马尔科夫从青年时代就具有无神论的倾向,托尔斯泰的思想对他也有一定的影响。1912年2月12日,马尔科夫致信东正教最高会议,信中写道:“我最诚挚地请求革除我的教籍。我希望以下所摘引的本人所写的《概率演算》一书中的言论足以成为除籍的理由,因为这些言论已经充分表明我对成为犹太教和基督教义之基础的那些传说所持的反对态度。” 下面马尔科夫整段地摘引了我们在前文所提到的他与布尼亚科夫斯基之间的论战,为了使那些不懂得什么是概率论的教士们了解他的意思,他又火上加油地写下了以下的话:“如果上述言论还不足以构成开除我教籍的理由的话,那么我再次恳切地提请你们注意:我已经不认为在圣像和木偶之间有什么本质的区别。它们当然不是上帝们,而只是上帝们的偶像;我也早就不赞成任何其它宗教,它们也都如同东正教一样,是靠火与剑来维持并为其服务的。” 这无疑是向教会神权的宣战。教会在反动报刊上对他组织了围攻,同时彼得堡教区的总主教还派代表企图说服他放弃这一声明,但马尔科夫表示“只与来人谈数学”。万般无奈的教会只好革除了他的教籍。 马尔科夫的一生与大文豪托尔斯泰有什么关系,我们手头没有更多的材料。不过根据马尔科夫的儿子所写的传记,他父亲当年的行动正是为了揭露教会于1901年开除托尔斯泰教籍“这一散发着中世纪霉臭的荒唐举动”而作出的。有一点是十分明确的,那就是马尔科夫和托尔斯泰在宗教与科学的关系上的看法有惊人的相似之处。在托尔斯泰的作品中我们能发现许多数学家感兴趣的内容:《战争与和平》中那个教女儿几何学、自己演算高等数学的老保尔康斯基公爵的原型据说就是托尔斯泰的外祖父。在这部名著的尾声我们还可以读到有关概率论的一段议论。托尔斯泰在谈到当代科学与旧的宗教、法律、道德规范之间的关系时写道:“自从有人说出了并且证明了出生率和犯罪率服从数学定律,一定的地理和政治经济的条件决定这种或那种政府形式,人口和土地的一定关系产生人民的移动,从那个时候起,历史所寄托的那些基础便在实际上被毁坏了。”这不正是布尼亚科夫斯基感到恼火的“有些哲学家”的言论吗? 1913年,沙皇政府为了转移国内日益高涨的革命情绪和准备帝国主义战争,决定以1613年全俄贵族会议选举米哈依尔•罗曼诺夫(1596-1645〕为沙皇这一历史事件为标志,举行浮华的罗曼诺夫王朝建立三百周年庆典。与此针锋相对,马尔科夫决定以瑞士数学家雅各•贝努利 ( Jacob Bernoulli, 1654-1705) 于1713年出版的《猜度术》为标志,在科学界发起庆祝大数定律发现二百周年的活动(《猜度术》中载有世界上第一个大数定律,该书于雅各•贝努利去世八年后才出版,所以实际上大数定律的发现应在1705年之前)。这一行动清楚地表明了马尔科夫立场,即对建立在奴役与压迫基础上的沙皇家族统治的极端蔑视,和对作为人类精神财富创造者的科学伟人的无比崇敬。 马尔科夫就是这样一个刚直不阿的学者,一个不畏强暴的勇士,一个坚定的无神论者和民主运动的斗士。 家庭和大学 1883年,马尔科夫与自幼相识的女友瓦里瓦契耶瓦娅结为伉俪,新娘的母亲就是他父亲当年的女雇主。大学时代的马尔科夫曾给读高中的瓦里瓦契耶瓦娅当过业余家庭教师,正是这种频繁的接触催开了这一对年轻人心中的爱情花朵。但是一开始,那位富孀是不赞成这门婚事的,因为她一想起当年那个在花园里拄着拐杖踽踽独行的可怜孩子和经常使他忠厚的管家心绪不宁的桀骜少年,心里总是有一种靠不住的感觉。然而事实最终战胜了偏见,面对这个事业上不断获得成功的英俊青年助教,她终于感到无可挑剔了。 从1880年马尔科夫就开始在彼得堡大学任教,先是担任助教和讲师,1886年成为副教授,1893年升为正教授,1905年退休并荣获终身荣誉教授的称号。二十五年来,他先后讲授过微积分、数论、函数论、矩论、计算方法、微分方程、概率论等课程,为祖国培养了许多出色的数学人才。 关于马尔科夫的讲课风格毁誉不一。他与切比雪夫和李雅普诺夫不同,讲课时既不在乎板书的工整也不注意表情的生动,而且经常有意略去教科书中的传统题材,因此一般的学生抱怨不好懂。但是优秀的学生发现他的课程从逻辑上来看具有无可指责的严密性,内容充实无华,其中往往还有些他本人最新的研究成果。 他从教授席位上退休以后,仍然以科学院院士的资格在彼得堡大学开设概率论课程,讲义用的就是倾注了他半生心血的《概率演算》。为了开好这门课,他反复地对这部书进行了修改,直到临终前还在进行第四版的校订工作。这一最后的修订本于他逝世两年以后出版。 十月革命前夕,彼得堡的局势动荡不定,科学院与大学已无正常的工作秩序。在这种情况下,马尔科夫请求科学院派他到外省去从事中学教育。1917年9月,年过花甲的马尔科夫来到梁赞省一个叫萨兰斯克的县城,无偿地担负了县中学的数学教学工作。他有个十四岁的儿子也一同来到这里,恰好就插班在他任课的年级。 这个小马尔科夫( 1903-1979)的名字及父名与父亲完全相同,后来也成了有名的数学家,先研究理论物理和天体力学,后转向动力体系理论、测度论、拓朴学、代数等,并于1953年当选为苏联科学院通讯院士。 据小马尔科夫回忆,父亲在县中学的第一堂课是十分吓人的。一个成绩一向优秀的学生被叫到黑板前演算,当他按照原任课教师的要求用圆规和三角板在黑板上画图时,马尔科夫大为恼火,狠狠地批评了这种在枝节问题上精雕细琢的作法。他讲课时总是随手画出一个示意图,而把重点放在解题的思路和方法上。为了弥补学生们的知识缺陷,他经常利用课余时间辅导他们做难度较大的习题。 马尔科夫父子到萨兰斯克不久,十月革命就爆发了。由于内战和饥荒,他们在这里度过了一个艰苦的学年。但是马尔科夫不介意生活条件的艰苦,他把相当大的精力用在提高学生的数学修养上,为此学校领导和当地苏维埃对他十分感谢。 1918年秋,马尔科夫因患青光眼回到彼得堡治疗,手术后他返回阔别已久的母校继续开设他的概率论讲座。这时候他的体力已远不如从前了,每次讲课都要儿子搀扶着进出教室。然而当他一站到讲台上,就感到有了精神。在几十年的教学生涯,他比其他任何人都更忠实地向学生们灌输彼得堡数学学派的信条和理想。他继承了切比雪夫对具体问题的兴趣,不断地追求数学方法的简单化和尽可能精确的结果,他善于向经典课题汲取养料,同时把自己的事业深深地札根在大学这块沃土之中。在彼得堡数学家团体中,没有人比他更“彼得堡化”了。有一次别人向他请教数学的定义,他不无骄傲地说:“数学,那就是高斯、切比雪夫、李雅普诺夫、斯捷克洛夫和我所研究的东西”。 1921年秋天,马尔科夫的病情开始严重起来,他只得离开心爱的大学。在生命的最后一年里,他还抓紧时间修订了《概率演算》。1922年7月20日,这位在众多数学分支里留下足迹和为科学与民主事业奋斗了一生的老人辞别了人世。马尔科夫的遗体被安葬在彼得堡的米特罗方耶夫斯基公墓,他的墓碑没有过多的修饰,就象他的文章和讲课一样朴素无华。然而他的思想、他的成就、他的品德就象一座巍峨的丰碑,永远矗立在真理求索者的心中。 |
|
|