Blog

featured image

自動語音辨識 ASR 的前世今生


ASR是以電腦自動將人類的語言内容轉換爲相應文字的一種技術。它的應用很廣泛,像是室内裝置控制、Siri、語音輸入法等等,這些都使得我們的生活更加便捷。尤其是在智慧型 3C 產品大量普及的現代,人們用聲音進行人機互動的需求看可以說是越來越高了。

本文參考2019年的一篇綜述論文[1],將簡單地介紹ASR的歷史,並著重描述最新的end-to-end技術。
more...


featured image

Privacy aware learning 隱私感知/保護學習,讓AI可靠又隱密


自步入大數據時代以來,我們逐漸習慣於讓機器從巨量資料中學習其運行規則,機器學習廣泛應用於醫學、自動駕駛、語音識別等領域,進而造福人類。然而,在大量資料被收集、被用來訓練模型的過程中,我們也面臨到日益嚴峻的隱私洩漏問題。
more...


featured image

零樣本學習 Zero-Shot Learning 演算法介紹(一)


在訓練各種機器學習模型或是類神經網絡模型時,都需要倚靠大量的資料褲來協助訓練,然而,並不可能對「所有」不同領域或是情況下的資料都蒐集完之後才來做模型的訓練。
為了讓模型可以更加 Generalize、同時因應各種不同領域的資料庫,因而產生了 Zero-Shot Learning 的演算法。
more...


featured image

演算法: Learning to learn Meta learning


隨著機器學習、深度學習的發展,機器已經能夠在單一任務上取的非常優異的表現。然而,機器與人類仍有本質上的差別,那就是快速學習新事物的能力。想像嬰兒時期的我們面對新環境時已有一套本能的機制處理,再由環境給我們的回饋,我們可以快速的把之前的知識套用在新問題上面。為了讓機器也有這種「知道如何學習」的能力,Meta-Learning(元學習)的概念開始發展。
more...