“一騎紅塵妃子笑,無人知是荔枝來。”這是中國古代對“快遞”最廣為人知的描述。時至今日,品嘗一顆鮮美的荔枝已不再困難,物流服務(wù)也不再只是簡單地將東西送達。如何讓快遞的每個環(huán)節(jié)效率最大化,找到運送貨物的最優(yōu)路徑,減少理賠,成為快遞企業(yè)需要解決的問題。
近日,在北京舉辦的“微軟亞洲研究院創(chuàng)新論壇2019”上,微軟亞洲研究院分享了利用人工智能(AI)技術(shù)推動快遞業(yè)務(wù)高效運轉(zhuǎn)的兩個案例。在人工智能技術(shù)幫助下,針對個人用戶快遞業(yè)務(wù),順豐公司已做到了智能理賠預(yù)警,將準確率提升了60%。海上航運方面,東方海外航運在AI的幫助下,可在毫秒內(nèi)完成實時路徑優(yōu)化,大大提高了航運效率。
智能理賠預(yù)警,準確率提升60%
對順豐來說,每天需面對大量的個人用戶快遞業(yè)務(wù),會出現(xiàn)一定幾率的需求風險,如惡意騙賠等。微軟亞洲研究院與順豐的合作就從這一業(yè)務(wù)場景切入。
微軟亞洲研究院副院長劉鐵巖在接受媒體采訪時稱:“微軟亞洲研究院與順豐合作的具體任務(wù)是做理賠預(yù)警。合作過程中,我們發(fā)現(xiàn)如果現(xiàn)實中做簡單的分類任務(wù),比如做基礎(chǔ)研究,數(shù)據(jù)都是非常規(guī)整的,有標準的數(shù)據(jù)集。可是到了實際業(yè)務(wù)中,絕大部分的訂單是正常的,只有萬分之幾甚至是十萬分之幾的訂單是有問題的,所以拿到的數(shù)據(jù)會是一個嚴重不平衡的數(shù)據(jù),大量的樣本針對這一問題其實都沒有價值,只有少量的樣本有價值,是非常不平衡的,這是在合作中很明顯的一個鴻溝和挑戰(zhàn)。”
什么樣的快遞訂單有風險?該如何去判斷?傳統(tǒng)做法是從訂單信息中提取人工特征,利用梯度提升樹方法學習理賠預(yù)警模型。然而,當模型達到一定準確率后,繼續(xù)提升模型性能會付出極大的人工代價。另外,當線上數(shù)據(jù)分布發(fā)生變化時,原來的人工特征也容易在新的場景下失效,造成線上模型性能的下降。
為了構(gòu)建合適的優(yōu)化方案,微軟亞洲研究院的研究員對數(shù)據(jù)進行了深入分析,發(fā)現(xiàn)方案構(gòu)建的核心難點在于,歷史數(shù)據(jù)中理賠訂單僅占全部訂單的萬分之幾,極度不平衡的樣本比例使得傳統(tǒng)機器學習方法無法達到理想效果。目前已知的處理不均衡數(shù)據(jù)的解決方案,無論在學術(shù)界還是工業(yè)界,均達不到智能理賠預(yù)測問題的要求。
為了解決這個難題,微軟亞洲研究院采用了“深度因子分解+基于精度的級聯(lián)”方案,利用多次選擇交叉驗證集減少由于分布變化造成的影響。通過對歷史數(shù)據(jù)的測試,目前該模型在固定召回率的前提下,準確度已經(jīng)比原始方法提升了約60%。
智能航運:實現(xiàn)毫秒內(nèi)完成實時路徑優(yōu)化
在微軟亞洲研究院與東方海外航運的合作中,則覆蓋了供需預(yù)測和路徑優(yōu)化這兩個物流行業(yè)的主要業(yè)務(wù)場景,通過運用深度學習和強化學習等最新的人工智能技術(shù),來優(yōu)化現(xiàn)有的航運網(wǎng)絡(luò)運營。
在過去的幾十年里,航運企業(yè)通常采用基于運籌學的組合優(yōu)化方法來實現(xiàn)路徑規(guī)劃。這種方法一般需要首先對供需進行預(yù)測,然后基于預(yù)測結(jié)果,將有關(guān)客戶、港口、航線、區(qū)域的限制信息人為設(shè)置成現(xiàn)有商業(yè)軟件的約束條件,并用其進行求解。
但對于東方海外航運來說,其全球港口數(shù)量眾多、船只數(shù)目也很大,采用這種方法會讓商業(yè)軟件不堪重負。作為一種折中,人們通常需要將幾個港口劃成一個片區(qū)進行處理,而即便如此,實現(xiàn)一次優(yōu)化仍然費時費力,每天可能需要花費數(shù)個小時來計算路徑優(yōu)化的方案。而一旦外部條件發(fā)生變動,就不得不重新執(zhí)行如此費時費力的優(yōu)化過程,才能做出合理的應(yīng)激反應(yīng),這種延時對于航運公司會造成不小的損失。此外,對貨品和空箱的供需預(yù)測,很難做到非常高的精準度。這種情況下,先預(yù)測再優(yōu)化的方式或造成誤差傳導(dǎo),導(dǎo)致整個優(yōu)化過程的效果受損。
為了突破方法的局限性,微軟亞洲研究院在與東方海外航運的合作中探索出了一套全新的解決方法——競合多智能體強化學習技術(shù)(Coopetitive Multi-Agent Reinforcement Learning)。它把每一個港口和船只建模成智能體,對原來的復(fù)雜問題分而治之,以去中心化的方式進行求解。
微軟亞洲研究院的研究員們在各個智能體之間建立了高效的通信機制,通過協(xié)調(diào)智能體之間的利益分配與轉(zhuǎn)移,來促進智能體之間的合作,同時協(xié)調(diào)他們之間的競爭,最終起到全局優(yōu)化的目的。
據(jù)劉鐵巖介紹,通過競合多智能體強化學習技術(shù),可以做到航運路徑優(yōu)化的時間減少至毫秒級。每個智能體的局部運算可以并發(fā)進行,傳統(tǒng)運籌學方法需要好幾個小時進行的路徑優(yōu)化,利用競合多智能體強化學習技術(shù)則可以縮短到毫秒級。當某個智能體遇到突發(fā)狀況時,系統(tǒng)只需調(diào)動周圍相關(guān)的幾個智能體自己協(xié)調(diào)就能解決,無需從頭開始重新計算。
其次,自動學習、適應(yīng)變化,可與環(huán)境持續(xù)交互。當某個港口停運或者某一航線發(fā)生變化時,多智能體模型可以實時獲得信息,并動態(tài)調(diào)整和反饋,快速適應(yīng)新的環(huán)境。無需像傳統(tǒng)運籌學方式那樣,人為重寫規(guī)則,再做優(yōu)化。
第三,實現(xiàn)預(yù)測和優(yōu)化的端到端學習,消除誤差傳導(dǎo)。在競合多智能體強化學習中,預(yù)測環(huán)節(jié)與優(yōu)化環(huán)節(jié)是一體化進行的,不需要分階段、按順序執(zhí)行,因此,也就不存在誤差傳導(dǎo)的情況。
智能體的訓(xùn)練可以利用實際運營數(shù)據(jù),也可以通過自我博弈的方式來獲得提升。微軟亞洲研究院為此設(shè)計了復(fù)雜的仿真系統(tǒng)和分布式計算框架,可以使模型訓(xùn)練又快又好,目標每年可為東方海外航運節(jié)省1000萬美元的運營成本。
除了可以提高效率,新的解決方案中的每個智能體模型還可以針對港口的調(diào)度員進行模仿學習。在過去,航運調(diào)度員會根據(jù)自己的經(jīng)驗對商業(yè)軟件給出的調(diào)度方案進行調(diào)整,方案的實際采用率甚至不足50%。但競合多智能體的模仿學習能力,可以學習不同調(diào)度員的行為習慣,生成更易于被調(diào)度員所接納的方案。人工智能作為助手,結(jié)合調(diào)度人員的專業(yè)經(jīng)驗,將進一步提升東方海外航運的運輸調(diào)度效率。這種人工智能(AI)與人類智能(HI)的結(jié)合,也將是未來人工智能普及的常見模式。
關(guān)鍵詞: