海關是一個國家進出口貿易最重要的機構,最重要的任務之一是查緝非法走私貨物,有效查緝非法走私可減少犯罪並提高政府關稅收入。現行查緝非法進口交易的作法仰賴執法人員人工查核,然而面對每天成千上萬的進口貨物,有限的人力難以全面查緝,若僅抽樣查核一部份,又可能有漏網之魚。

我們研究團隊與世界海關組織(World Customs Organization, WCO)合作,開發一套能夠自動偵測非法交易的人工智慧演算法,簡稱為「DATE模型」,此模型能從海關進口交易的大數據中學習偵測非法走私。每一筆申報進口交易的紀錄,包含商品類型、數量、重量與價值等資訊,都是DATE模型要學習的資料「特徵」。學習出這些特徵與非法交易的潛在關聯後,DATE模型能產生偵測為非法交易的機率值,海關查緝人員僅須專注於檢測機率值較高的交易貨品,機率值較低的交易貨品則可以隨機抽樣或直接放行,減少人力成本。DATE模型除了偵測非法交易,更可以對偵測結果產生對應的可解釋性文字,來輔助說明為何該交易貨品是非法交易。

相較於傳統的機器學習方法,DATE模型有三個特點:

1.能從交易貨品的特徵中,找出最有效辨識非法交易的特徵組合,例如讓AI判斷「貨品類型、價值、重量」此組合是否隱含非法交易的線索。

2.可讓AI學習特徵組合與商品之間的關聯性,若AI學習到「價值2~3萬且重量2,000~3,000克」液晶電視被謊報為「價值5,000~1萬且重量500~1,000克」電腦螢幕的機率很高,就可讓查驗人員知道要特別注意這兩個特徵組合的關聯。

3.訓練AI能同時預測交易是否非法,以及預測交易能帶來的額外關稅收益。

目前DATE模型已在奈及利亞與馬拉威的海關系統中測試,讓海關查緝人員可以只檢測一百多萬筆進口交易中的10%貨品,就能找到所有非法交易的90%,並找回比傳統機器學習方法還要多兩倍的逃漏關稅收益。通過測試後,DATE模型未來將會應用在這些國家的海關系統上。若要將DATE模型運用在台灣,有幾個值得留意的地方。首先,必須先確認台灣海關的進出口資料與WCO所提供之海關資料欄位是否契合,若欄位調整至相同,即能運用目前已經訓練好的模型來偵測非法交易;若欄位難以調整,則重新進行資料前處理、訓練專屬台灣海關的AI模型。另一方面,不肖廠商可能根據不同國家的海關法規,鑽不同的漏洞,所以不同國家的非法交易行為可能不同。為使DATE模型學習到台灣的非法交易行為,我們可用已經訓練好的DATE模型,再加上台灣海關現有的非法交易資料並微調模型的參數,才能更好的轉移模型到台灣海關的偵測系統上。

由於每日的交易數量相當龐大,目前多數先進國家不像奈及利亞等國海關,會檢測每一筆進口交易,因此非法交易的標記數據非常稀少。針對此問題,我們團隊正著手開發新的AI演算法,讓不同國家的海關能利用現有大量的未標記數據,加上非常少量的標記數據,便能得到與目前DATE模型接近的準確性。於是,每個國家便不需仰賴以其他國家資料訓練出來的模型,可以用自己國內海關進出口的資料來訓練,不但能保密資料,更能讓AI學到適合自己國家的模型。

#偵測 #國家 #交易 #海關 #模型