【數感生活——數學家與間諜誰比較準?】
前幾天有一則新聞講到對岸疑似修改飛機編號來壯大軍容。 智程梁 (Chih-Cheng Liang)將這則新聞連結到很有趣的數學歷史「德國坦克問題」。在經過作者同意後,我們也來和大家分享這則故事:
§
二戰尾聲時,盟軍發現德國在戰場上推出新型坦克 Panzer V,性能相當強大,唯一值得慶幸的是目前看到的數量並不多。盟軍的情報網立刻開始調查德國投入多少資源來生產Panzer V,回報的答案有些不妙
二戰尾聲時,盟軍發現德國在戰場上推出新型坦克 Panzer V,性能相當強大,唯一值得慶幸的是目前看到的數量並不多。盟軍的情報網立刻開始調查德國投入多少資源來生產Panzer V,回報的答案有些不妙
「很大量,每個月能生產千餘台坦克。」
同一時間,盟軍數學家吩咐士兵在各地戰場撿拾Panzer V的殘骸、拆解,記下引擎蓋、車輪等等坦克元件上的「生產序號」。看似沒用的生產編號,在統計學家的眼裡比間諜的情報還珍貴。
§
舉例來說,倘若今天抄到的號碼是(27, 40, 18, 5, 10),我們通常會覺得坦克可能是40多台,因為在40號以後還有一些號碼,就如同5號以下還有1,2,3,4一樣。但不太可能到上百台,畢竟有上百台坦克,但遇到的都是40號以前,這機率挺小的。
舉例來說,倘若今天抄到的號碼是(27, 40, 18, 5, 10),我們通常會覺得坦克可能是40多台,因為在40號以後還有一些號碼,就如同5號以下還有1,2,3,4一樣。但不太可能到上百台,畢竟有上百台坦克,但遇到的都是40號以前,這機率挺小的。
數學家發明了一道簡潔公式估算總數
40+(40/5)-1=47
也就是「總數=取樣最大值+取樣最大值/取樣總數 -1」。
40+(40/5)-1=47
也就是「總數=取樣最大值+取樣最大值/取樣總數 -1」。
他們利用這個公式估算,得到跟情報網截然不同的答案
「每個月了不起生產300餘台。」
「每個月了不起生產300餘台。」
二戰結束,盟軍歡欣鼓舞慶祝勝利,數學家也滿心期待,對答案的時刻總算到了。以下是數學家、情報網、德國生產報告的數據比較結果:
🎭1940/6:數學家認為有169台,情報網認為1000台,實際生產數量122台。
🎭1941/6:數學家認為有244台,情報網認為1550台,實際生產數量271台。
🎭1942/8:數學家認為有327台,情報網認為1550台,實際生產數量342台。
🎭1941/6:數學家認為有244台,情報網認為1550台,實際生產數量271台。
🎭1942/8:數學家認為有327台,情報網認為1550台,實際生產數量342台。
數學家大獲全勝!除了第一個月誤差稍大,其他兩個月都只有10%以內的誤差。情報網則被德軍矇騙,高估到4.5~8倍的產量。
這個故事從此成了一個經典案例,一則展示數學的威力,一則提醒我們資料安全的重要性,德軍成功讓情報網失去作用,但不小心遺漏的幾個數據,遇上專家,終究還是被萃取出關鍵資訊。
也歡迎大家閱讀智程梁 (Chih-Cheng Liang)臉書原文:goo.gl/LRPPYS
✨不要錯過數感實驗室的每一則動態✨
請在上方「已說讚」的下拉式選單中,打勾「搶先看」,第一時間接收我們的消息!
請在上方「已說讚」的下拉式選單中,打勾「搶先看」,第一時間接收我們的消息!
相關新聞「遼寧號航母實彈演習穿幫 塗改飛機編號充數?」http://www.ntdtv.com/xtr/b5/2016/12/16/a1302275.html
如果幫軍方造飛機,編號一定不能乖乖從一開始數的啊
以前課本裡有個估計離散均勻分布最大值的方法,假設有個亂數產生器,給你最小值是 1 ,最大值未知的整數,要怎樣抽樣估計最大值是多少呢。假設抽了 4 個樣本 19, 40, 42, 60 ,統計學說套個公式 60 + (60/4) + 1 = 74 。大致可理解為,把樣本最大的數字 60 ,加上平均間距 60 除以 4 。
看過沒什麼感覺,直到後來看了一個德國坦克問題。
在 D day 前,盟軍內傳德軍有大量五號坦克。五號坦克性能威猛,盟軍的雪曼坦克不敵,然而五號坦克先前盟軍只遇到少量。
盟軍很想知道到底德軍有多少五號坦克。盟軍的資料科學家吩咐不願役去抄擄獲與銷毀的五號坦克編號,引擎蓋、工具箱、輪子的編號也都要抄(不願役哭哭 ...上戰場還要做這些雜事)。抄出來的坦克編號可用上面公式去估計最大值是多少,以知道總共有多少台坦克,其他零件的估法複雜些,但也可用類似邏輯提升估計精準度。
盟軍很想知道到底德軍有多少五號坦克。盟軍的資料科學家吩咐不願役去抄擄獲與銷毀的五號坦克編號,引擎蓋、工具箱、輪子的編號也都要抄(不願役哭哭 ...上戰場還要做這些雜事)。抄出來的坦克編號可用上面公式去估計最大值是多少,以知道總共有多少台坦克,其他零件的估法複雜些,但也可用類似邏輯提升估計精準度。
當然,身為盟軍派個間諜也是挺合理。間諜自個兒工作去,按下不表。
最後細作回報,德軍應該恐有千餘台五號坦克。但資料科學家的估計只有百來台。
等到戰後德軍生產記錄揭曉,雙方答案得以驗證。統計估計還蠻準的!
年月 | 統計估計 | 情報估計 | 德軍記錄
June 1940 |169 | 1,000 |122
June 1941 |244| 1,550| 271
August 1942 |327| 1,550| 342
June 1940 |169 | 1,000 |122
June 1941 |244| 1,550| 271
August 1942 |327| 1,550| 342
有了這件事之後,後來的人就學乖了。編號一定要夠亂,非常亂!
遼寧號航母實彈演習穿幫 塗改飛機編號充數?
更新時間 : 2016-12-16 07:31 AM [紐約時間]
( 自動連播 )
【新唐人2016年12月16日訊】中共軍方首艘航空母艦遼寧號于近日首次進行實彈演練,但軍事專家從畫面中發現,艦載機殲-15的編號再次被塗改,暴露出配備遼寧號航母的戰機仍嚴重不足。軍方此種虛張聲勢的行爲也再次印證,遼寧號離真正形成戰鬥力還很遠。
中共軍方近日首次進行了航母編隊實彈演習,但軍事專家發現,參加此次軍演的艦載機殲-15的數量僅有數架,且殲-15的編號被再一次塗改,以充數迷惑外界。
資深軍事研究員黃東表示,殲-15戰機的缺乏與其真實的數量,是「中國特色」的軍事機密,可正常操作的殲-15目前僅有4至6架。同時,殲-15的發動機仍使用著老舊的俄羅斯産發動機。
黃東在評論中寫道,首先之前已有國內網友說過,爲免産量太丟人現眼,海軍對殲-15編號大玩數字游戲。每次邀請官媒記者上艦前,就把其中幾架塗上新編號,大擺空城計濫竽充數,搏取網上無數點贊,以壯「強大軍容」。
當然這幷非專門指殲-15,只是該機目前真正的服役數量,特別是常態化部署在遼寧號航母上可操作數量,從官方資料都可以知道只有個位數字。很自然地,假如有較高强度訓練的話,因維護保養而趴窩的數量還要增加,若再加上地勤人員水平等不利因素,只剩下4至6架能够操作,絕對不會令人意外。
黃東此前披露,遼寧號航母存在三大致命缺陷,一、艦體自身壽命已過去一半;二、艦體存在極高的崩裂風險;三、艦載機遲遲不能形成戰鬥力。
殲-15戰鬥機技術不過關,無法正常裝備遼寧號航母。黃東說,只可惜最核心的戰鬥機不過關,甚至害死新飛行員,令艦機融合困難重重,拖了全艦戰鬥力生成的後腿。
(記者張明健報導/責任編輯:趙雲)
廣告
中共軍方近日首次進行了航母編隊實彈演習,但軍事專家發現,參加此次軍演的艦載機殲-15的數量僅有數架,且殲-15的編號被再一次塗改,以充數迷惑外界。
資深軍事研究員黃東表示,殲-15戰機的缺乏與其真實的數量,是「中國特色」的軍事機密,可正常操作的殲-15目前僅有4至6架。同時,殲-15的發動機仍使用著老舊的俄羅斯産發動機。
黃東在評論中寫道,首先之前已有國內網友說過,爲免産量太丟人現眼,海軍對殲-15編號大玩數字游戲。每次邀請官媒記者上艦前,就把其中幾架塗上新編號,大擺空城計濫竽充數,搏取網上無數點贊,以壯「強大軍容」。
當然這幷非專門指殲-15,只是該機目前真正的服役數量,特別是常態化部署在遼寧號航母上可操作數量,從官方資料都可以知道只有個位數字。很自然地,假如有較高强度訓練的話,因維護保養而趴窩的數量還要增加,若再加上地勤人員水平等不利因素,只剩下4至6架能够操作,絕對不會令人意外。
黃東此前披露,遼寧號航母存在三大致命缺陷,一、艦體自身壽命已過去一半;二、艦體存在極高的崩裂風險;三、艦載機遲遲不能形成戰鬥力。
殲-15戰鬥機技術不過關,無法正常裝備遼寧號航母。黃東說,只可惜最核心的戰鬥機不過關,甚至害死新飛行員,令艦機融合困難重重,拖了全艦戰鬥力生成的後腿。
(記者張明健報導/責任編輯:趙雲)
沒有留言:
張貼留言