
自 2023 起,全球迎來人工智慧大爆發的豐饒時刻:從 2023 MidJourney 驚為天人的算圖功力受到廣泛討論、ChatGPT的橫空出世,到 2024 各家大型語言模型(LLM)品牌百家爭鳴,再至近期 ChatGPT 的吉卜力算圖充斥風靡社群媒體;人工智慧似乎愈發緊密鑲嵌於我們日常生活。在技術蓬勃發展之下,人類千年歷史也警醒著我們以相應規定——或者至少是共識——與技術相繩是勢在必行。從美國白宮在 2023 年 10 月 31 日簽署 「安全、可靠且值得信賴的開發及使用AI行政命令」(“Executive Order on the Safe, Secure, and Trustworthy Development and Use of AI”)、歐盟在 2024 年 8 月 1 日公開「歐盟人工智慧法案」(“EU Artificial Intelligence Act”),到臺灣自身的「人工智慧基本法草案」也已在院堂討論之中;翻諸這些律令,我們能發現使 AI 為使用者「可信賴」(trustworthy)往往是眾多規範的核心要點之一。
而,可信賴究竟是什麼意思呢?
2025 年 3 月 28 日,在國立清華大學電機工程學系劉奕汶教授的邀請下,李祈均老師來到電機系書報討論的課堂,跟同學們分享 BIIC Lab 關於可信賴式人工智慧一些初步想法與研究成果。從除了日常生活外,AI 更是能為醫療領域帶來極大助益切入,李老師順勢指出我們可以用藥品從研發到上市來設想 AI 之部署至應用,可以如何由三個層面來定義「可信賴」:「隱私」(privacy)、「公平」(fairness)與「安全」(safety);在這次的分享中,李老師將主要著重在「公平」與「隱私」兩個面向。

「隱私」,意指設計相應機制保護使用者在 AI 從訓練到推論的各階段所提供的資訊:譬如,透過聯邦式學習將訓練階段限制在本地免於傳遞時洩漏的可能[1]、加密使用者提供給模型的資訊避免被加工使用[2]、限制提供給模型使用的資料在必要特徵杜絕使用者其他資訊外洩[3]。
「公平」,又可以從團體與個體公平兩個面向來理解:以情緒辨識的應用會面臨的性別討論來說(讓我們先最保守地將性別二分為生理男及生理女),在個體性上,是指面對不同的生理男,模型都能有相對一致的結果[4],而就團體性公平論,即是讓 AI 能在無論生理男女使用上都能有相近甚至一樣的結果[5];除此之外,讓我們再退一步到資料訓練的場景,標記者及語者的性別差異也可能影響對於情緒資料的標記[6]。再將視線放到資料本身,在訓練資料間本身就存在著落差時(即是所謂部分資料有著 missing data),要如何消弭這些落差使後續應用不致表現出差異,也是亟待克服的難題之一[7]。
「安全」,指的是模型可以穩定的運作;也可以細細從不同面向展開來討論,不過在這次演講中,李老師比較沒有分享到我們相關的研究,這邊就也先暫且不表。
光是試著描述出這三個面向可能的具體現象就如此困難,遑論研究者實際投入研究時,企圖抽絲剝繭所要花費的無比心力!如同李老師在 Q&A 階段回應同學的提問時所說,這些研究都在持續進展的歷程,於技術進展與社會回應的互動中,工程師們一步又一步擘畫出可信賴式AI的實作與應用;這樣複雜的工程,單靠工程師們竭力研發難以完全,而更必須靠著政府部門、學術研究、產業實踐、社會大眾等各場域的通力合作才有可能,歐盟、美國聯邦政府所制訂的律令只是開始的一小步,來日方長,尚待眾人一同努力。
[1] P. -C. Lin, J. -L. Li, W. -S. Chien and C. -C. Lee, "In-The-Wild Physiological-Based Stress Detection Using Federated Strategy," ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Seoul, Korea, Republic of, 2024, pp. 1681-1685, doi: 10.1109/ICASSP48485.2024.10446004.
[2] Yang, C.-Y., Upadhyay, S.G., Wu, Y.-T., Su, B.-H., Lee, C.-C, “RW-VoiceShield: Raw Waveform-based Adversarial Attack on One-shot Voice Conversion,” Proc. Interspeech 2024, 2730-2734, doi: 10.21437/Interspeech.2024-458.
[3] W. -T. Hsu, C. -P. Chen and C. -C. Lee, "Concealing Medical Condition by Node Toggling in ASR for Dementia Patients," ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Seoul, Korea, Republic of, 2024, pp. 12496-12500, doi: 10.1109/ICASSP49357.2023.10094984.
[4] Chou, H.-H., Chien, W.-S., Wu, Y.-T., Lee, C.-C, “An Inter-Speaker Fairness-Aware Speech Emotion Regression Framework”. Proc. Interspeech 2024, 3190-3194, doi: 10.21437/Interspeech.2024-471.
[5] Chien, W.-S., Lee, C.-C, “An Investigation of Group versus Individual Fairness in Perceptually Fair Speech Emotion Recognition”. Proc. Interspeech 2024, 3205-3209, doi: 10.21437/Interspeech.2024-461.
[6] W. -S. Chien, S. G. Upadhyay and C. -C. Lee, "Balancing Speaker-Rater Fairness for Gender-Neutral Speech Emotion Recognition," ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Seoul, Korea, Republic of, 2024, pp. 11861-11865, dot: 10.1109/ICASSP48485.2024.10447167.
[7] W. -S. Chien, and C. -C. Lee, "Understanding Missing Data Bias in Longitudinal Mental Stress Detection," 2024 IEEE 20th International Conference on Body Sensor Networks (BSN), Chicago, IL, USA, 2024, doi: 10.1109/BSN63547.2024.10780500.