拿什么來拯救下一次“微軟藍屏”?
上周微軟的藍屏事件波及全球,其影響力堪比一場網(wǎng)絡(luò)版的“普法戰(zhàn)爭”。這不僅是一個警示,更是對未來AI技術(shù)潛在風(fēng)險的一次深刻反思。讓我們一起探究這場“微軟藍屏”事件的背后原因,以及它給現(xiàn)代社會帶來的啟示。
過去幾百年,7月19日都是沒什么歷史大事發(fā)生的一天,唯一記錄在冊的,是1870年這天,法國向普魯士宣戰(zhàn),普法戰(zhàn)爭爆發(fā),就此給44年后第一次世界大戰(zhàn)的劇變埋下引線。
那時的電報還需要架電纜使用,6年之后貝爾才發(fā)明電話,26年之后,人類才實現(xiàn)史上首次無線電通信,100年以后,手機才誕生。世界緩慢進入第二次工業(yè)革命的電氣時代,主要的信息傳遞還要依靠紙質(zhì)的信件和公開發(fā)表的報刊文章。那時的人類對于通訊這件事還非常耐心,一切消息都經(jīng)得起漫長的等待。
154年后的7月19日,世界多地的Windows系統(tǒng),因為一個名叫Falcon的安全平臺的更新故障而出現(xiàn)了大規(guī)模的藍屏。這句話很拗口,154年前的電報員恐怕永遠無法理解,這場賽博時代的“千里之堤,潰于蟻穴。”
01 一塊藍屏停住半個地球
這天的藍屏被稱作史上最大的IT故障,甚至有人認為,這場事故是在預(yù)演潛藏在AI技術(shù)和IT行業(yè)里的崩潰風(fēng)險。
2024年的北京時間7月19日,世界各處有超過850萬臺電腦卡在了同一個藍色界面。
圖源自網(wǎng)絡(luò)
中國的許多外企員工在這天實現(xiàn)提前下班,卻又在咖啡店遭遇點單故障;
加拿大的Mago因此被取消了出差飛機,久違的在家體驗了刷劇、洗衣服和做飯的放松工作日;
ris在美國加州的舊金山機場遭遇4小時的飛機延誤,又在登機2小時后被趕下飛機,在無法取回托運行李的情況下無奈回家;
日本羽田機場的地勤則在這天為上百名乘客手寫登機和行李牌。
全世界的航空、物流、醫(yī)療、金融等多個行業(yè)都在這場故障中受到影響:
數(shù)以千計的航班延誤或取消;機場滯留游客和行李出現(xiàn)擁堵;值機手續(xù)改為人工辦理;鐵路的列車位置信息也無法同步;
特斯拉的生產(chǎn)線受阻;萬豪、凱悅、希爾頓和洲際等諸多國際連鎖酒店集團的網(wǎng)絡(luò)操作系統(tǒng)停擺;
英國廣播公司無法播放早間新聞;多地的自動收銀系統(tǒng)受到影響;醫(yī)院的患者就診系統(tǒng)癱瘓;就連巴黎奧運會也因系統(tǒng)問題暫時了奧運證件激活服務(wù)……
圖源自網(wǎng)絡(luò)
在GPT引領(lǐng)的AI技術(shù)變革前夜,還會發(fā)生這樣一場因為一個bug席卷全球的網(wǎng)絡(luò)災(zāi)難,引起全球各行業(yè)的集體宕機,荒誕感令人錯亂不已。
這還不是一場故意為之的網(wǎng)絡(luò)攻擊,而是一場草臺班子式的塌房,少數(shù)錯誤代碼“引發(fā)的血案”。
特別是它發(fā)生的時候很不湊巧,更多的人們開始焦慮,在即將到來的AI時代,一個同樣不起眼的bug,在AI的放大之下是否會引起更大規(guī)模、難以預(yù)測的后果?
因此,7月19日這天的停擺更像一種現(xiàn)代技術(shù)警示:再專業(yè)的安全軟件,也可能在設(shè)計或更新中出現(xiàn)紕漏。即使是科技巨頭,也會被一場小小的失誤絆倒。
02 到底發(fā)生了什么????
藍屏的英文全稱是Blue Screen Of Death,縮寫為BSOD,一般是由硬件故障、驅(qū)動程序問題、軟件沖突、系統(tǒng)更新錯誤等原因引起。這是Windows系統(tǒng)特有的崩潰顯示方式。藍屏其實是程序員開發(fā)工作中的“家常便飯”:“今天藍屏了,明天再努力吧”也是常有的事。更廣泛的領(lǐng)域里, Windows系統(tǒng)在過去幾年也曾偶爾出現(xiàn)過一些規(guī)模性的藍屏狀況,但從未像這次波及這么多國家。
這次“史上最大IT事故”的藍屏現(xiàn)象出現(xiàn)在中國、新西蘭、澳大利亞、日本、印度等多國,波及行業(yè)之廣前所未有。崩潰源頭直指網(wǎng)絡(luò)安全公司CrowdStrike,其在調(diào)查之后宣布了造成系統(tǒng)崩潰的技術(shù)原因:
2024 年 7 月 19 日 04:09 UTC(國際協(xié)調(diào)時間),CrowdStrike監(jiān)測到新的網(wǎng)絡(luò)攻擊技術(shù),于是向自家Windows 系統(tǒng)的Falcon軟件發(fā)布了傳感器配置更新。這并非新操作,自Falcon創(chuàng)建以來,CrowdStrike就一直每日更新策略、技術(shù)和程序,傳輸給自家平臺。
但在這次,其中的一個“通道文件”291號出現(xiàn)了邏輯錯誤,導(dǎo)致軟件在運行過程中依據(jù)錯誤規(guī)則,越界觸碰到了系統(tǒng)中的其他本不該接觸到的部分,這就緊急觸發(fā)了Windows系統(tǒng)的自我保護機制BSOD,即我們看到的世界范圍級藍屏。
事故的責(zé)任方CrowdStrike公司成立于2011年,是一家位于美國硅谷的網(wǎng)絡(luò)安全公司,可以被視作“美國的360”。這家公司以揭露俄羅斯對美國民主黨全國委員會的網(wǎng)絡(luò)攻擊而知名,為全球2.9萬家客戶提供終端安全,包括監(jiān)測威脅情報、防病毒等在內(nèi)的產(chǎn)品和服務(wù),于126億美元的終端保護軟件市場中占據(jù)18%的份額,早在2019年6月于納斯達克上市。
CrowdStrike|圖源自網(wǎng)絡(luò)
就在問題發(fā)生的當(dāng)天下午,公司的首席執(zhí)行官George Kurtz做出解釋,稱這次發(fā)生的問題并非安全事件或網(wǎng)絡(luò)攻擊。但它還是對公司聲譽和客戶信任帶來了重大打擊,公司的市值一夜蒸發(fā)百億美元,股價暴跌。
作為與CrowdStrike緊密合作的科技巨頭,7月22日,微軟發(fā)言人在接受媒體采訪時,對此次藍屏做出補充說明,認為是歐盟的限制性措施引發(fā)了這次的全球故障。
2009年,微軟與歐盟達成協(xié)議,要給所有安全軟件開發(fā)商與自家軟件同等的系統(tǒng)訪問權(quán)限,讓像CrowdStrike這樣的第三方安全軟件,能輕松通過Windows系統(tǒng)執(zhí)行極其深入且復(fù)雜的操作。這在最初是為了確保安全軟件開發(fā)商擁有公平的市場競爭環(huán)境,但也削弱了Windows系統(tǒng)的安全性和可控性,在15年后間接造成了這場事故。
如果此后歐盟對微軟放松了限制措施,也許可以降低這類由第三方軟件帶來的系統(tǒng)崩潰,但其也將在市場中占據(jù)更大的市場份額,未來又會有什么樣的風(fēng)險,還不得而知。市場規(guī)范與科技發(fā)展的力量相互作用,在一次次網(wǎng)絡(luò)安全事件后得到?jīng)_擊與重塑。
03 重提網(wǎng)絡(luò)安全險和技術(shù)冗余論
2007年,電腦殺毒軟件Norton(諾頓)在升級后,將Windows XP系統(tǒng)的兩個關(guān)鍵系統(tǒng)文件將作病毒清除,這次“誤殺”造成國內(nèi)數(shù)百萬臺電腦系統(tǒng)崩潰,出現(xiàn)藍屏、重啟的現(xiàn)象,給國內(nèi)經(jīng)濟造成了難以預(yù)估的損失。只是在彼時,由于國內(nèi)法律在信息安全領(lǐng)域的空白,企業(yè)抵抗網(wǎng)絡(luò)風(fēng)險、挽回損失和維護權(quán)利的路徑尚不清晰。
到了2024年7月的這次事故,全球已有超過15個國家和地區(qū)發(fā)布了超過一百部的網(wǎng)絡(luò)和數(shù)據(jù)安全法案,立法和監(jiān)管推動了用于抵御風(fēng)險的網(wǎng)絡(luò)安全保險市場的發(fā)展。
2019年的一項全球調(diào)查報告數(shù)據(jù)顯示,有超過一半的企業(yè)選擇購買網(wǎng)絡(luò)安全保險,年收入超過10億美元企業(yè)的投保率更是有57%。
據(jù)《2022年全球網(wǎng)絡(luò)安全保險市場報告》,2022年網(wǎng)絡(luò)安全保險市場規(guī)模約為119億美元,預(yù)計到2027年將達到 292億美元。索賠頻率和嚴(yán)重程度也拉高了保費,2022年第一季度,僅美國網(wǎng)絡(luò)保險的定價就上漲了110%。
整體來看,我國企業(yè)的網(wǎng)絡(luò)安全意識和網(wǎng)絡(luò)安全保險市場都起步較晚。近20年,隨著企業(yè)數(shù)字化轉(zhuǎn)型,越來越多的網(wǎng)絡(luò)安全問題開始出現(xiàn)。
2017年,一款名為WannaCry(想哭)的蠕蟲式勒索病毒就在中國等多個國家的企業(yè)、學(xué)校、醫(yī)院等地爆發(fā)并蔓延,這種病毒會強力封鎖電腦中的文檔、圖片和程序,索取用戶以比特幣支付的贖金。多行業(yè)因此受到影響。
wannacry蠕蟲病毒|圖源自網(wǎng)絡(luò)
類似風(fēng)險還隱藏在企業(yè)員工可能遇到的網(wǎng)絡(luò)釣魚鏈接中,給用戶和企業(yè)帶來諸多如信息泄露、敲詐勒索、竊取資產(chǎn)、干擾業(yè)務(wù)等網(wǎng)絡(luò)安全風(fēng)險?!?022年風(fēng)險晴雨表》就顯示,勒索軟件攻擊、數(shù)據(jù)泄露、遠程辦公導(dǎo)致的IT漏洞和云平臺數(shù)據(jù)供應(yīng)鏈中斷,已經(jīng)成為如今企業(yè)最擔(dān)心的4類網(wǎng)絡(luò)風(fēng)險。
隨著需求的增長,國內(nèi)網(wǎng)絡(luò)安全保險業(yè)務(wù)發(fā)展也在提速。
《科技日報》報道稱,截至2023年7月,我國有37家保險公司(含外資、合資保險公司)提供89款在售網(wǎng)絡(luò)安全保險產(chǎn)品(含附加險9款)。工信部、國家金融監(jiān)管總局聯(lián)合印發(fā)了《關(guān)于促進網(wǎng)絡(luò)安全保險規(guī)范健康發(fā)展的意見》。
這次的藍屏事件,或許將成為國內(nèi)網(wǎng)絡(luò)安全險發(fā)展歷程的又一個分水嶺。
在這次的藍屏事件中,美國安德森經(jīng)濟集團的首席執(zhí)行官預(yù)測,藍屏事件造成的損失可能高達10億美元。更具體的數(shù)字至今還難以估計,有預(yù)測其將達到15億甚至上百億美元。7月24日,馬來西亞方官員還公開要求微軟和CrowdStrike考慮賠償全球在藍屏期間遭受損失的公司。
而保險經(jīng)紀(jì)公司Marsh McLennan稱,有超過75家客戶可能會因為CrowdStrike全球性崩潰事件而提出網(wǎng)絡(luò)故障索賠。接下來,隨著核心技術(shù)問題被逐漸修復(fù),眾多損失估算和索賠將陸續(xù)被提上議程。
從這場損失巨大的事故追根溯源,可以發(fā)現(xiàn)問題核心直指全球企業(yè)過于依賴單一產(chǎn)品,缺乏“冗余備案”的盲區(qū)。
微軟在全球擁有10億多用戶,卻將網(wǎng)絡(luò)安全服務(wù)交給全球少數(shù)幾家公司。而作為占據(jù)了一定市場份額的一家龍頭安全服務(wù)公司,卻在臨近周末的周五,一次性向全球客戶推出了更新內(nèi)容,連灰度測試也沒有。
約翰霍普金斯大學(xué)凱瑞商學(xué)院的信息系統(tǒng)助理教授Javad Abed(賈瓦德·阿貝德)在接受采訪時就說:
“網(wǎng)絡(luò)安全的基本原則之一就是冗余。CrowdStrike事件清楚地提醒我們,無論供應(yīng)商的聲譽如何,依賴單一的工具都會造成危險的單點故障,與多家供應(yīng)商一起實施多層級的保護至關(guān)重要……
企業(yè)所有者不應(yīng)僅僅將網(wǎng)絡(luò)安全服務(wù)視為一項成本,而應(yīng)該將其看作對公司未來的一項必要投資。”
在網(wǎng)絡(luò)安全層面,通俗來說,就像是給電腦裝上一套自動備胎,當(dāng)原來的設(shè)備出現(xiàn)故障,另一個“輪胎”可以自動補上,保持系統(tǒng)的正常運轉(zhuǎn)。從經(jīng)濟角度考量,它意味著較高的成本投入,但在危急事件發(fā)生時,它可能于無形中消除一場災(zāi)難。
“我一般會用次新版本或次次新版本的操作系統(tǒng),穩(wěn)定壓倒一切,不想當(dāng)廠商的小白鼠。”一位超算師這么說。在大部分企業(yè)面臨藍屏危機時,一些使用30年前Windows老系統(tǒng)的企業(yè)躲過一劫,也從最極端的角度驗證了這種說法。
在技術(shù)融合日漸緊密,人們的工作生活愈發(fā)依賴互聯(lián)技術(shù)之時,如何在追求先進性的同時確保穩(wěn)定:要便捷、經(jīng)濟、還要允許適當(dāng)?shù)脑糚lan Z。于靈活和笨拙間維持最起碼正常的運轉(zhuǎn),是一個先進的數(shù)字化社會應(yīng)該、并且迫切需要具備的能力。
參考資料:
《賽博&眾安科技:2022網(wǎng)絡(luò)安全保險科技白皮書》
《安全技術(shù)與保險服務(wù)相結(jié)合的新興險種——網(wǎng)絡(luò)安全保險有據(jù)可依》科技日報
文 | 徐嘉 編 | 園長
本文由人人都是產(chǎn)品經(jīng)理作者【刺猬公社】,微信公眾號:【刺猬公社】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!