篇名 數據不平衡下以機器學習方法預測交通事故嚴重性之分析
作者 胡大瀛、李岳洪
51
4
頁次 275
出版年份 111
出版月份 12
摘要        降低事故的嚴重程度是近年來全世界努力的方向,全球已經發展出許多被動式安全系統來減緩事故嚴重程度,如安全帶、安全氣囊、煞車輔助系統等等,建立預測事故嚴重性的模型也是許多學者研究的目標,近年來
機器學習以及深度學習的方法取代統計方法,可以達到較高的準確度以及運算效率,然而進行模型訓練時需要大量的數據,但肇事資料庫中存在著數據不平衡的問題,因此如何處理這種狀況將是一項重要的課題。
       本研究將交通事故嚴重性分為死亡、受傷、未受傷三個等級,為多元分類問題,並收集臺南市的公開資料庫且利用過採樣以及欠採樣兩種資料預處理的方法,對於不平衡的數據進行重新採樣,分別使用SMOTE 和Cluster Centroid 這兩種演算法去進行;在模型訓練的部分,採用基於集成學習(Ensemble Learning)的兩種分類模型,本文使用Random Forest 和Catboost 這兩種演算法來進行兩種集成的學習,研究結果顯示,在欠採樣及過採樣的資料中,兩種模型分別都有97.69%以及86.84%以上的準確度,此結果未來可以應用於自駕車上或是給予相關單位作為制定決策時的一些證
據。
檔案下載 數據不平衡下以機器學習方法預測交通事故嚴重性之分析.pdf