如果个体的观测数据能表示为P维欧几里得空间的点,那么这样的数据叫做多元数据,而分析多元数据的统计方法称为多元统计分析。主要多元分析方法有:多重回归分析、判别分析、聚类分析、对应分析、典型相关分析、多元方差分析等。许宝騄在哥伦比亚大学和教堂山讲授多元统计分析,培养学生从事这一领域的研究。
自20世纪30年代起,费希尔、郝太林、许宝騄等做出了一系列奠基性的工作,使多元统计分析在理论上得到迅速发展。1938年到1945年,许宝騄所发表的相关论文一直处在多元统计分析理论的前沿。在多元分析假设检验理论中,许宝騄最先讨论了优良性,是奈曼-皮尔逊的假设检验理论在多元分析中应用的先导。他推进了矩阵论在数理统计理论中的应用。许宝騄把矩阵论中处理问题的方法引进了数理统计的研究,实质上这是一个长方阵在某一变换群下的标准型。有了线性模型的法式,使估计和假设检验问题变得十分简明。
费希尔创立的“n维几何”方法,使数学家们获得了一些重要统计量的精确分布。典型例子是1928年维夏特(J. W ishart)导出了任意维正态样本全体二阶矩的联合分布———维夏特分布。
不少学者给出维夏特分布的不同证明。1939年,许宝騄利用数学归纳法推导出维夏特分布。他假定对n - 1, p - 1成立来推导对n, p的密度函数。除了密度函数中的矩阵外,还需要一个( p - 1)维的正态向量和一个n维的正态变量,在证明过程中所需的分析推导仅仅是n维向量模的平方是x2n 分布[ 11 ] 。专家们一致认为许宝騄的推导方法是最优美的一个。
文中许宝騄的另一个杰作就是得到了现今所称的许氏公式:当n≥p≥1时,有
∫⋯∫f ( x′x) dxn ×p=πnp2 -p4 ( p - 1)Π p- 1j=OΓ(n - j2) ∫A >0⋯∫| A |n - p- 12 f (A ) dA
该公式是处理20世纪80年代所形成的椭球等高分布统计量的有力工具。
多元分析中一个基本分布是关于随机正定阵相对特征根的分布。线性模型中线性假设的检验问题,都与这些特征根有关。若正定随机矩阵A 和B 相互独立,各自遵从维夏特分布W (m, Σp ×p) 和W ( n, Σ) ,且m ≥ p, n ≥ p,θ1 ≥⋯≥θp ≥ 0表示| A - θ(A +B ) | = 0
的p个根,寻求θ1 , ⋯,θp 的联合密度是一个重要研究课题。在20世纪30年代末,许宝騄和一些著名统计学家,都对其进行了探讨。在众多方法中,许宝騄的方法严密而清晰,他以矩阵微分为工具,计算了一些复杂变换的雅可比行列式,而导出相应的分布[ 12 ] 。
这个方法的难点是计算雅可比行列式,许宝騄在文章中给出了任意阶的雅可比行列式结果,并证明了3阶行列式情形。其学生安德逊( T. W. Anderson)详细介绍了这一工作,认为某些雅可比行列式的计算是许宝騄的杰作。
许宝騄把数学家分成三流。第一流的数学家是天才, 他们能开创新的领域,如柯尔莫哥洛夫、诺依曼(John von Neumann, 1903—1957) 、维纳(NorbertWiener, 1894—1964)等。第二流数学家是靠刻苦学习而成功的。他们认真消化整理前人的东西,在此基础上有所创造和发现,辛钦就属于这一类。第三流的数学家只是在某个问题上有所贡献,不能像第二流的那样系统工作。剩下的就是不入流的数学家了。他认为自己没有才能,所有成就完全是靠刻苦学习而获得。
“三十功名尘与土,八千里路云和月”。许宝騄对科学研究的态度和精神永远值得我们借鉴和学习。
参 考 文 献
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说理学类许宝騄对概率论与数理统计的卓越贡献(5)在线全文阅读。