3個搞物理的顛覆了數學常識,數學天才陶哲軒:我開始壓根不相信
八月的一個清晨,數學天才、菲爾茲獎得主陶哲軒點開了一封來自三位陌生物理學家的郵件。
三人在郵件中解釋道:
我們偶然發現了一個公式,如果這個公式是正確的,那么它就會在線性代數中一些最基本且重要的對象之間建立一種意想不到的關系。
然而陶哲軒的第一反應卻是:
這么短、這么簡單的東西,早就應該出現在教科書里了。這不可能是真的。
其實,陶哲軒向來不喜歡以這種方式被咨詢,甚至在他的主頁上寫下了警告:別拿你的手稿隨便打擾我。
但令三位物理學家驚訝的是,僅僅2 個小時之后,他們就收到了陶哲軒的回復。
而更意想不到的是,在一周半后,他們還一起發表了論文,闡述了這個公式的證明過程。
是什么樣的公式受到陶哲軒如此青睞?
求解特征向量。
沒錯,就是這個再普通不過的基礎數學求解公式。
按照傳統解法:
計算特征多項式→求解特征值→求解齊次線性方程組,得出特征向量。
而這三位物理學家在研究“中微子”的過程中,卻意外發現另一種奇妙解法:
知道特征值,只需要列一個簡單的方程式,特征向量便可迎刃而解。
三位物理學家。從左至右:張西寧、Peter Denton 和 Stephen Parke。
就像陶哲軒所說:
這個公式看起來好得令人難以置信。
我完全沒想過,子矩陣的特征值編碼了原矩陣特征向量的隱藏信息。
耶魯大學數學家 Van Vu 則用“驚人”和“有趣”兩個詞來形容這一發現。
一位 Hacker News 網友甚至認為,這一公式的理論價值在克萊姆法則之上。
注:克萊姆法則是線性代數中的基本定理,用行列式計算出n元一次方程組的解。
新方法怎么來的?
先來回顧下我們所熟知的特征向量和特征值。
一個矩陣乘以一個向量,就相當于做了一個線性變換。但這個向量的方向往往會發生改變。
但若是存在一個矩陣A,讓這個向量v在線性變換后,方向仍然保持不變,只是拉伸或者壓縮一定倍數,即:Av=λv。
那么,這個向量v就是特征向量,λ就是特征值。
在現在的教科書里,已知特征向量求特征值比較容易,但是求矩陣的特征值又比求特征向量方便。
但三位物理學家在計算中微子振蕩概率的時候發現:
特征向量和特征值的幾何本質,其實就是空間矢量的旋轉和縮放。而中微子的三個味(電子,μ子,τ子),不就相當于空間中的三個向量之間的變換嗎?
中微子振蕩是一種量子力學現象。實驗發現,電子中微子、μ子中微子和τ子中微子這三種中微子之間是可以相互轉化的,而這就是中微子振蕩現象。
圖源:Quantamagazine
物理學家們意識到,特征向量和特征值之間,可能存在更普遍的規律。于是,新公式的面紗被揭開了。
通過刪除原始矩陣的行和列,創建子矩陣。
子矩陣和原始矩陣的特征值組合在一起,就可以計算原始矩陣的特征向量。
簡而言之,已知特征值,一個方程式就可以求得特征向量。
圖源:Quantamagazine
這個新公式有多牛?
數學天才、菲爾茲獎得主陶哲軒評價道:
新公式的非凡之處是,在任何情況下,你不需要知道矩陣中的任何元素,就可以計算出你想要的任何東西。
證明過程
在陶哲軒的回信中,他還附上了這一新公式的三種證明方法,并在之后和 Peter Denton、Stephen Parke、張西寧三位物理學家一起發表了論文。
先定義A為一個 n x n 的厄米特矩陣,它具有特征向量λi(A)和賦范特征向量vi。
厄米特矩陣(Hermitian Matrix)能夠將特征向量轉化為實數,更適用于解決現實世界的問題。
特征向量中的每個元素標記為vi,j。
通過刪除jth行和jth列,可以得到A的子矩陣Mj,大小為(n-1) x (n-1),它的特征值為λk(Mj)。
首先,通過證明可以得到一個柯西-比內(Cauchy-Binet)型公式。
引理1。讓A的一個特征值為0,不失一般性的,可以讓λn(A)=0。那么對于任意大小為 n x (n-1) 的矩陣B,我們可以得到:
接下來就可以進入新公式的推導了。
引理2。特征向量各元素的范數平方與其特征值、子矩陣特征值有關。
于是可以證明:令j=1 且i=n。通過λn(A)In 轉化(shift) A,使得λn(A)=0;這也同樣轉化了A和Mj中所有剩余的特征值,因此公式 2 就變為:
注意,公式 3 的右側為 det (M1)。
接下來,在B=(0,In-1)中應用引理1。我們發現公式 1 的左邊為,公式 1 的右邊為 det (M1)。
證明:對于任意不是A的特征值的λ,
對于,j∈[1,n]有,
進一步簡化,并取極限λ→λi(A),
公式 7 右邊的對角元素提供了公式 2 的左半部分。通過共軛的定義,公式 7 左邊的對角元素決定了λi(A)In-A 的子矩陣。
應用引理2,必然的結論就是,如果特征向量中的一個元素消失,vi,j=0,那么矩陣A的特征向量方程將化為其子矩陣Mj的一個特征向量方程。
這一發現所帶來的影響
簡而言之,物理學家們的這一最新成果,將使人們可以僅使用特征值信息,計算出特征向量。
而在現在的教科書里,用特征向量求特征值比較容易,但是求矩陣的特征值又比求特征向量方便。
也就是說,這一成果揭示了基礎數學新的事實。
更為重要的是,在現實世界中,無論是在數學、物理學還是工程學中,許許多多的問題都涉及到特征向量和特征值的計算。
比如計算中微子振蕩概率。
比如在機器學習領域,數據降維,人臉識別,都涉及矩陣特征值/特征向量理論的實際應用。
俄亥俄州立大學的粒子物理學家 John Beacom 指出,這一理論應用前景廣泛,甚至將打開新世界的大門。
物理學家和數學天才的合作
被三位物理學家邀請,并證明了新公式的數學家是公認的數學天才陶哲軒(Terence Tao)。
陶哲軒
他 7 歲讀高中,9 歲上大學,13 歲獲得國際奧林匹克數學競賽金牌,是 IMO 金銀銅牌最年輕得主紀錄的保持者。
24 歲,他就成為 UCLA 數學系終身教授,31 歲獲得了有“數學界諾貝爾獎”之稱的菲爾茲獎,成為第二位獲此殊榮的華裔數學家。
而三位物理學家,一位是美國布魯克黑文國家實驗室的助理物理學家彼得·丹頓(Peter B.Denton)。2016 年博士畢業于范德比爾特大學物理系。
另一位是新西蘭物理學家斯蒂芬·帕克(Stephen J. Parke)。他是美國費米國家加速器實驗室的杰出科學家和理論物理系主任,專注于中微子物理學和頂夸克物理學研究。
最后一位作者張西寧(Xining Zhang)同樣是華人面孔,就讀于芝加哥大學,從事理論粒子物理研究,是斯蒂芬·帕克的弟子。
傳送門
論文地址:
https://arxiv.org/abs/1908.03795
https://arxiv.org/abs/1907.02534
博客地址:
https://www.quantamagazine.org/neutrinos-lead-to-unexpected-discovery-in-basic-math-20191113/