第182期 數位時代下的社會工作(2023年06月)
大數據分析在保護服務之應用──以老人保護及兒少保護案件之應用經驗為例
近年來受到「大數據分析」、「資料治理」等潮流影響,從中央部會到地方政府都積極地推動巨量資料分析與應用,由公務機關與學術研究機構、業界公司異界結合,將海量的公務資料進行大數據分析,期待能夠應用在改善政府的施政與決策上,優化政府服務的效能(劉宗熹,2016;引自陳毓文等人,2022)。國內外學者都認為運用資通訊科技來協助社福領域輸送服務,已經是無法回頭的事實。過去在科技的輔助下,能夠強化社工人員個案資訊的儲存、統計分析與分享,並迅速找到有需求的個案,提升服務的效能與品質(Susan, 2015; 引自黃寶中,2018)。
保護服務工作同樣受到這波數位科技浪潮的影響。為提供家庭暴力及性侵害被害人完整且適切之服務,衛生福利部(以下稱本部)於2000年依據《家庭暴力防治法》(1998/2021)第5條及《性侵害犯罪防治法》(1997/2023)第4條規定,統籌建立全國家庭暴力及性侵害受暴個案資料庫,供第一線工作人員使用,並明確範定該電子資料庫管理及使用事宜。後續因應實務需求,分別於2003年、2005年、2007年及2014年擴充系統功能並改版,同時整合家庭暴力、性侵害、兒少保護、性騷擾個案管理,改名為「家庭暴力、性侵害及兒少保護資訊系統」(以下簡稱「保護資訊系統」),併同將「113保護專線」、「男性關懷專線」資料庫系統納入整合為「婦幼安全聯合防護網絡」,以提升整體服務效能。配合行政院2018年核定《強化社會安全網計畫》(行政院,2018)之以「風險預防」、「單一窗口」及「整合服務」等目標,為強化網絡工作效能,本部保護資訊系統除增設集中派案窗口功能外,並同時完成刑案資訊整合系統等16個部外系統,及精神照護資訊管理系統等17個部內系統;另為完整呈現保護性個案家庭風險圖像,本部並開發家庭歸戶模型,協助社工人員快速掌握案家概況與動力、個案及其家庭成員福利身分、家庭風險圖像、強化渠等危機敏感度,並提供有效且完整的處遇服務。從建置運作至今,保護資訊系統已累積千萬筆通報案件資料,加上前述大量資訊串接,實已具大數據分析的先備條件。
在保護性服務領域對大數據之分析、運用部分,國內文獻指出(謝宗震、李承恩,2020),保護服務領域社工人員工作的「痛點」在於:通報案量大、社工工作量大以及資料分析能力不足,即使傳統社工訓練強調每個個案都是獨一無二,仍有必要對於過往累積的服務經驗,有系統地蒐整歸納出一套可理解、有效率、容易執行的行動方針,來有效提升服務效能。由國、內外嘗試結合保護性服務與大數據分析的經驗,大略可歸納出幾個重要的元素,包含:大量的資料、資訊串接、資料清理、預測準確性,更重要的是與實務的對話及落地執行等。國外具體案例包括美國新罕布什爾州社會服務部與SAS公司合作,將兒少保護個案資料庫串接犯罪判決資訊、醫療保險等資料,建置預測系統(陳愷新,2019);紐西蘭社會發展部與奧克蘭大學合作,串接兒少保護與公共救助系統,建立有132個變項的風險預測模型(Gillingham, 2015; 引自陳毓文等人,2022)。在國內部分,臺北市家庭暴力暨性侵害防治中心及新北市政府社會局分別於2017、2018年將轄內家暴通報案件套用google地圖,完成家暴熱點地圖的建置,及分析轄內高風險家庭(現轉型為脆弱家庭)資料,建立風險計算機(智庫驅動,2016;引自陳毓文等人,2022;謝宗震、李承恩,2020)。
本部則於2018年起運用大數據科技,將保護資訊系統所列2014年至2017年兒少保護案件資料,以邏輯斯蒂回歸(Logistic Regression)運算個案及其家庭風險程度,將低風險、中低風險案件派至脆弱家庭服務,中高風險、高風險案件則派至兒少保護服務,模型準確度高達74.2%;另於2019年使用2016年7月至2018年6月兒少保護案件資料,運用大數據分析技術,結合XGBoost、隨機森林(Random Forest)、多元迴歸等統計方法,以「是否開案」、「是否再通報」作為變項,發展出風險預警燈號,以輔助兒少保護社工人員判斷訪視及處理的密集度,模型準確率高達七成。有了上述經驗,本部更於2019年與2020年分別與專精大數據資料分析的業界公司及學術單位合作,發展老人保護AI風險預警模型及兒少保護通報分流指標,以保護資訊系統累積保護通報案件為素材,期透過大數據分析技術,掌握更多老人保護或兒少保護案件的風險因子,以輔助社工掌握個案之風險等級並提升其敏感度,更快速地找出有需求的老人保護或兒少保護個案,以及時提供有效的服務介入及保護措施。以下僅就老人保護AI風險預警模型及兒少保護通報分流指標進行說明。