隨著人工智能發(fā)展步伐的加快,美國國防規(guī)劃者非常重視人工智能技術(shù)在指揮和控制方面所預(yù)示的超匹配能力。重要的規(guī)劃、規(guī)劃和預(yù)算編制已經(jīng)開始,這將在未來戰(zhàn)場上提高通信能力和生存能力。現(xiàn)在,部隊也在設(shè)計和制作現(xiàn)代系統(tǒng)原型,以幫助指揮官比以往任何時候都更全面、更快速地感知——觀察、定向、決策和行動。他們將刺穿戰(zhàn)爭的迷霧。
隨著武裝沖突時間框架的壓縮,技術(shù)影響是什么?過去可能持續(xù)數(shù)年的戰(zhàn)爭可能會在幾個月甚至幾周內(nèi)決定。在數(shù)周內(nèi)執(zhí)行的操作必須在幾天或幾小時內(nèi)完成。而歷史上在做出決定之前可能有大量時間的指揮官將被迫在幾秒鐘內(nèi)做出決定。每個指揮所的組織和運行將如何改變?這些是軍事領(lǐng)導(dǎo)人面臨的主要問題,因為他們規(guī)劃了一條前進的道路,融合并利用了自主性、機器學(xué)習(xí)、可信通信和邊緣計算的優(yōu)勢。

未來戰(zhàn)場上的指揮所
2058 小時,本地
一只兔子咀嚼著一些三葉草,咬中了一口,把耳朵轉(zhuǎn)向左邊。穿過樹林,它聽到另一個生物向它移動的腳步聲。如果聲音的來源是捕食者,兔子準備逃跑,它聽著不明野獸的四只腳有節(jié)奏地小跑,看著它出現(xiàn)在空地邊緣。它快速遠離接近的四足動物,這與它所見過的任何東西都不一樣。這個像狗一樣的生物是當晚該地區(qū)十二個機器人之一,這些自主機器人正在指揮所周圍的關(guān)鍵地形上占據(jù)位置,一個機動師正準備建立。這些是戰(zhàn)爭的開始時刻,狗的任務(wù)是進行偵察。
幾分鐘后,樹林里傳來一陣低沉而穩(wěn)定的盔甲踩踏聲,師長和參謀人員停了下來,擺出防御姿態(tài)。指揮所的自主防御元素——狗——現(xiàn)在占據(jù)了安全陣地。這些狗以三人為一組。當一個人輪班四小時時,另外兩人正在充電。
這些狗足夠接近,可以將自己維持為它們用于通信和數(shù)據(jù)泄露的網(wǎng)狀網(wǎng)絡(luò)中的節(jié)點。在沖突的這個階段,狗有一個簡單的交戰(zhàn)規(guī)則:如果有人接近,就會向指揮所發(fā)出警報。如果它們檢測到人類,它們會使用傳感器記錄音頻、視頻和熱紅外數(shù)據(jù)傳輸?shù)街笓]所。被指派保衛(wèi)指揮所的連長將根據(jù)該人是否被確定為友軍、敵方或非戰(zhàn)斗人員來決定采取什么行動。
在行動的這一階段,指揮所將在原位停留長達四十八小時,然后再次移動。在這 172,800 秒內(nèi),每只狗每小時將傳輸近乎穩(wěn)定的 288 KB。這是他們的指揮和控制數(shù)據(jù)速率,它允許他們一遍又一遍地重復(fù)熟悉的模式——向左看、向前看、向右看、報告系統(tǒng)狀態(tài)、重復(fù)。這確保了他們彼此保持溝通并保持警覺。如果他們懷疑或檢測到他們附近的人,那么他們的數(shù)據(jù)速率將膨脹到每小時 720 GB 的機載傳感器態(tài)勢感知觀察。
在這種環(huán)境中,帶寬在功率、重量和冷卻方面都很昂貴。通信資源上還有其他方面。由于該部門的每個成員及其設(shè)備都是一個傳感器,因此有額外的情報、監(jiān)視和偵察饋送在網(wǎng)絡(luò)上爭奪優(yōu)先級。后勤系統(tǒng)、語音通信、地理空間更新、命令、醫(yī)療診斷數(shù)據(jù)和天氣數(shù)據(jù)都試圖通過這些網(wǎng)絡(luò)移動。此外,還有計劃進行網(wǎng)絡(luò)限制和從主要途徑到備用途徑的過渡,以混淆任何對抗性系統(tǒng),使其無法識別該部門的真正組成和身份。
由于這些原因,狗(或該部門中的其他傳感器)中的計算機視覺模型必須盡可能少地誤報。值得慶幸的是,狗“眼睛”上的計算機視覺模型已經(jīng)完成了近五萬小時的訓(xùn)練,在高度多樣化的生物群落上,一年四季都有,天氣和光照條件各不相同。他們還使用了關(guān)于現(xiàn)代軍事遮蔽者對視覺、偽裝技術(shù)和模式的影響以及人類和機器人軍事編隊的差異化步態(tài)和身體姿勢的特殊訓(xùn)練數(shù)據(jù)。盡管這種訓(xùn)練數(shù)據(jù)制度聽起來令人印象深刻,但它永遠無法解釋所有情況,這就是為什么該師的機器學(xué)習(xí)行動部門準備對整個部隊的狗和其他傳感器進行微調(diào),以微調(diào)他們遇到的生物群落,以及敵人的戰(zhàn)術(shù)、技術(shù)和程序的不可避免的變化。

重新訓(xùn)練計算機視覺模型與所有其他統(tǒng)計分析一樣。簡單地說,需要有一個代表性的樣本來用數(shù)學(xué)方式表達樣本關(guān)鍵變量之間的關(guān)系。在計算機視覺中,場景中的對象(天空、云彩、地平線、有樹木的山丘、沒有樹木的山丘、單個建筑物、建筑物上的窗戶、透過窗戶看的人臉等)都是樣本。每只狗的傳感器都在收集周圍生物群落(種群)的無數(shù)樣本。在這些樣本中,出現(xiàn)了計算機視覺模型以前從未見過的新異常值,因為它的制造者沒有一個可以包含地球上所有多樣性的實驗室。
在最初的8,640秒夜間巡邏之后,這些狗錯誤地警告了一只熊,這只熊爬到一棵樹上,然后用后腿站立,試圖抓住一些橡子。當它這樣做時,其中一只狗會檢測到它,通過其傳感器捕捉到幾分鐘的時間,并提醒指揮所安全元件。在早上的員工聚會上,指揮所安全連長詢問機器學(xué)習(xí)操作人員,他們能對這只讓他們夜不能寐的熊做些什么。
機器學(xué)習(xí)團隊是整個聯(lián)合部隊的眾多團隊之一。他們都在沖突的早期階段收集樣本。感知到的異常值以及所有觀測值的大量隨機樣本會根據(jù)其容量和隊列優(yōu)先級流回影院內(nèi)外的計算集群。一些數(shù)據(jù)通過戰(zhàn)術(shù)網(wǎng)狀網(wǎng)絡(luò)傳輸。其他數(shù)據(jù)由從一個單元移動到另一個單元的各種物流車輛被動收集,然后通過物理存儲設(shè)備傳輸。
當數(shù)據(jù)科學(xué)家處理整個視覺傳感器機群的誤報時,他們確定他們對當?shù)匦芊N有統(tǒng)計學(xué)意義的觀察結(jié)果,他們可以將所有觀察結(jié)果傳回 AI 數(shù)據(jù)產(chǎn)品團隊,以完成一輪半監(jiān)督的負面訓(xùn)練,將它們歸類為非人類和非戰(zhàn)斗人員。研究小組認為,新訓(xùn)練的計算機視覺模型將減少約70%的熊誤報。
早期樣本中的另一個重要發(fā)現(xiàn)是發(fā)現(xiàn)了計算機視覺模型未檢測到的敵方戰(zhàn)術(shù)哨兵。這種假陰性可能會對部隊保護產(chǎn)生不利影響。哨兵類似于坐在樹枝上的鳥,但實際上它是一個獨立的音頻和視頻傳感器包。通過將哨兵的多次觀察結(jié)果與互聯(lián)網(wǎng)上業(yè)余觀鳥者的視頻樣本進行比較,數(shù)據(jù)科學(xué)團隊能夠訓(xùn)練分類器來區(qū)分哨兵和活鳥。
有了這個新的計算機視覺模型,該團隊準備了軟件更新策略。計算機視覺更新是將在未來21,600秒內(nèi)在整個聯(lián)合部隊中部署的數(shù)百個更新之一。它們不能也不應(yīng)該同時部署。在過去三年中,這些團隊已經(jīng)實踐了數(shù)百次這種持續(xù)集成和持續(xù)交付 (CI/CD) 方法。與現(xiàn)代云計算提供商一樣,他們有一個部署策略,該策略經(jīng)過一系列測試和小型部署以確認功能正常。

除了這些現(xiàn)代軟件實踐之外,機器學(xué)習(xí)操作元素還確保他們的計算機視覺模型部署到狗樣本中,這些樣本將重新觀察類似鳥類的受試者以及熊產(chǎn)生最多誤報的地方。隨著新數(shù)據(jù)顯示誤報和漏報顯著減少,團隊繼續(xù)在計算機視覺傳感器的其余部分進行部署。值得慶幸的是,更新計算機視覺模型在帶寬上是有效的。原始模型是 40 到 60 兆字節(jié),具體取決于傳感器。更新可以是原始模型的 10–20%,在這種情況下,原始模型僅為 5到 10 兆字節(jié)。所有這些小效率在戰(zhàn)術(shù)邊緣及其在被拒絕、斷開連接、間歇性或有限條件下的潛力都很重要。
Data Epochs、Battle D rills 和 WERX
這個小插曲描述了在沖突開始時每兩周(1 萬秒)可能發(fā)生的數(shù)百次更新之一。在每個數(shù)據(jù)周期中必須發(fā)生的一系列更新是新的戰(zhàn)斗演習(xí)。他們必須變得像士兵清理卡住的武器一樣熟悉和磨練。
最終現(xiàn)場必須展示哪些概念?我們的軍事編隊、人員和領(lǐng)導(dǎo)人必須如何采用和塑造這些新的數(shù)據(jù)戰(zhàn)演習(xí)?美國陸軍已經(jīng)開始了云計算、軟件定義網(wǎng)絡(luò)、算法戰(zhàn)爭、自主和人機團隊的數(shù)字奧德賽。美國各軍種都在迅速使其采購、安全和 IT 干部能夠提供這些技術(shù)和實踐。由此產(chǎn)生的軟件開發(fā)實踐不僅限于后臺功能。它們通過傳統(tǒng)和替代的收購?fù)緩皆诟鱾€梯隊同時出現(xiàn)。久經(jīng)考驗的研究、開發(fā)、測試和評估計劃,以及專注于成功部署數(shù)字和人工智能能力的新組織正在加速這些進程。引領(lǐng)這些新努力的是一個領(lǐng)導(dǎo)者網(wǎng)絡(luò),他們擁有共同的愿景,并重新燃起了謹慎冒險的胃口。
走進任何一個新的軟件工廠或開發(fā)/運營(開發(fā)/運營)軟件團隊(如 AFWERX、SOFWERX 等),你會看到了解他們的使命和技能的授權(quán)專業(yè)人士。就像他們之前在航空、機械化作戰(zhàn)和無人系統(tǒng)領(lǐng)域的先驅(qū)一樣,他們知道他們所從事的新穎性很容易被誤解或忽視。然而,當他們考慮烏克蘭和以色列正在進行的戰(zhàn)爭時,他們積極推動新的能力以超越任何對手。
AI 加速路線圖
所有這些努力都是有意義的。為了讓它們結(jié)出碩果并最大限度地發(fā)揮軍事效能,領(lǐng)導(dǎo)者必須積極努力加速其團隊的效果。為此,他們可以采取幾個關(guān)鍵步驟。
首先,消除開發(fā)團隊與其最終用戶之間的距離。這對于成功采用軟件和硬件至關(guān)重要。用戶和開發(fā)人員之間的定期接觸點是您應(yīng)該衡量和投資的東西。如果用戶沒有破壞這項技術(shù),而開發(fā)人員沒有迅速將其適應(yīng)他們無法想象的用例,那么你就把這些不幸的發(fā)現(xiàn)推遲到你的第一場戰(zhàn)斗中。
第二,與官僚機構(gòu)中的現(xiàn)狀偏見作斗爭。如果有人告訴你,對生成式人工智能沒有要求,請?zhí)嵝阉麄儯谲娛職v史的其他轉(zhuǎn)折點,也沒有對槍支、坦克、飛機、反簡易爆炸裝置和反無人機技術(shù)的要求——直到技術(shù)和用例融合并明確了要求。
第三,將您的 AI 程序分解為一個組合,該組合平衡了通用開發(fā)、安全、機器學(xué)習(xí)、運營 (DevSecMLOps) 管道與不同機器學(xué)習(xí)學(xué)科(例如自然語言、計算機試聽和計算機視覺)的獨特需求,用于不同的應(yīng)用,如遙感、意義建構(gòu)和自主。
第四,除了你的團隊正在為之構(gòu)建的人類角色之外,你還必須將另一個用戶帶到桌面上——你新興的力量結(jié)構(gòu)中的機器角色。部隊結(jié)構(gòu)中的每個支持機器學(xué)習(xí)的設(shè)備都需要一個支持 AI 的數(shù)據(jù)產(chǎn)品策略和一個數(shù)據(jù)網(wǎng)絡(luò)策略,以便在一系列沖突、生物群落和任務(wù)中實現(xiàn)其再訓(xùn)練。當人類繼續(xù)消耗豆子和子彈時,機器將消耗電池和字節(jié)。
第五,除了已經(jīng)構(gòu)建的物理和虛擬培訓(xùn)環(huán)境之外,您還需要一個設(shè)備場、一個模型動物園和一系列數(shù)字孿生。移動應(yīng)用程序開發(fā)人員必須跨各種設(shè)備制造商進行測試,以確保向前和向后兼容。設(shè)備場可幫助開發(fā)人員快速從此類異構(gòu)設(shè)備隊列中獲取技術(shù)反饋。在下一個戰(zhàn)爭時代,這些可能是四足機器人、無人機群或可選的載人履帶式車輛。機器學(xué)習(xí)工程師在眾多開源和專有模型上構(gòu)建和迭代。當他們訓(xùn)練和再訓(xùn)練它們時,工程師們將擁有越來越多的模型集合(動物園),這些模型可以作為在新情況下快速微調(diào)的更好起點。數(shù)字孿生將有助于確保您擁有一個具有充分代表性的環(huán)境,以顯示新的網(wǎng)絡(luò)-設(shè)備-數(shù)據(jù)-模型組合按預(yù)期工作。
第六,信任零信任系統(tǒng)。就像 Hedy Lamarr 和 George Antheil 發(fā)明的跳頻擴頻一樣,零信任系統(tǒng)不斷強制執(zhí)行憑證和其他證書連接、輪換和重新身份驗證,以確保針對外部和內(nèi)部威脅的安全一致性。正確處理它是一種復(fù)雜的藝術(shù)形式,但它是您在數(shù)據(jù)和系統(tǒng)訪問中應(yīng)該要求的一項功能。BYOD(自帶設(shè)備)是組織可以以零信任方式運營的指標。當你能夠信任你的員工帶來的異質(zhì)敵對外國設(shè)備時,你將獲得所需的組織和技術(shù)實力,在聯(lián)合部隊中與你的盟友和任務(wù)伙伴做同樣的事情。
第七,您的組織需要每周部署到生產(chǎn)環(huán)境中,您的領(lǐng)導(dǎo)者應(yīng)該參與 CI/CD 流程。現(xiàn)代云計算服務(wù)通過多種策略實現(xiàn)高可用性。其中最關(guān)鍵的是,在中斷事件期間,開發(fā)人員與其領(lǐng)導(dǎo)者之間的軟件定義連接。在純粹的形式中,DevOps意味著構(gòu)建軟件的同一團隊也部署它,如果部署失敗,將在半夜進行尋呼。這增強了測試過程中對細節(jié)的關(guān)注。尋呼過程也可以連接到關(guān)鍵領(lǐng)導(dǎo)者。如果你知道你有一定的時間來修復(fù)糟糕的軟件部署,并在你的經(jīng)理被分呼之前恢復(fù)正常服務(wù),那么在測試過程中,每個人都會更加注意細節(jié)。
第八,在你的各種能力中,明確你允許對“系統(tǒng)1”和“系統(tǒng)2”機器思維進行實驗的領(lǐng)域。丹尼爾·卡尼曼(Daniel Kahneman)在他的《思考,快與慢》一書中普及了現(xiàn)代人對人類思維能力的理解,認為人類思維能力是兩個系統(tǒng)的副產(chǎn)品。系統(tǒng) 1 自動快速響應(yīng),就像戰(zhàn)斗或逃跑響應(yīng)一樣。您的視覺、聽覺或嗅覺幾乎不需要任何努力來處理著火的房子。卡尼曼將其與系統(tǒng)2區(qū)分開來,后者“將注意力分配給費力的心理活動”,并實現(xiàn)復(fù)雜計算等任務(wù)。通過它,當我們將精力分配給集中注意力時,我們會感到更多的能動性和選擇權(quán)。人機協(xié)作的關(guān)鍵是將系統(tǒng) 1 和系統(tǒng) 2 的任務(wù)分配給正確的隊友。
禁止我們經(jīng)歷這種情況的那一天,但在未來的戰(zhàn)場上,兩支軍隊將在夜間發(fā)生沖突。早上,雙方的幾個營可能只是自己的殘余。無論哪一方能夠更快地進行重組戰(zhàn)斗演習(xí),都將擁有直接的優(yōu)勢。從本組織分離并附加到新組織的任務(wù)命令需要幾個管理和控制步驟。指揮官應(yīng)該選擇首先組建哪個新領(lǐng)導(dǎo)人和哪個編隊——這是一個系統(tǒng) 2 的過程。然而,一旦命令下達,一系列系統(tǒng)1應(yīng)用程序和消息應(yīng)該能夠使所有人員、醫(yī)療、后勤和其他支持數(shù)據(jù)能夠迅速準確地傳輸給新的指揮人員。如果我們做好擺在我們面前的工作,這個新營應(yīng)該在3 600秒而不是28 800秒內(nèi)準備好戰(zhàn)斗。分秒必爭。
作者:
John Brennan博士是Scale AI公共部門業(yè)務(wù)的總經(jīng)理。他曾在韓國的美國陸軍擔任步兵軍官。他還曾在中央情報局的戰(zhàn)區(qū)服役。在過去的 2 年里,他幫助世界各國政府開發(fā)和實施這些技術(shù),用于其云計算、數(shù)據(jù)科學(xué)和網(wǎng)絡(luò)安全計劃。John 是 AWS 機密云和絕密云的產(chǎn)品經(jīng)理,為情報界和國防部提供支持。這篇文章的靈感來自他在陸軍未來司令部的工作及其設(shè)計未來CJADC的努力。
Adarsh Kulkarni 是 Scale AI 的高級軟件工程師,他的工作重點是自主的計算機視覺。他擁有機械工程和機器人學(xué)位,此前曾在 Ghost Robotics 擔任自主和 AI 應(yīng)用工程師。本文利用了 Adarsh 在操作機器狗方面的知識以及他在 Scale AI 的工作,幫助訓(xùn)練用于周邊防御應(yīng)用的計算機視覺模型。原文刊于現(xiàn)代戰(zhàn)爭研究所