谷歌DeepMind人工智能 學會讀唇語讓監控變“監聽”

2016-11-25 16:01:18 來源:互聯網作者:佚名 人氣: 次閱讀 228 條評論

谷歌的人工智能DeepMind又厲害了。近日,DeepMind部門與牛津大學研究人員共同創造了一個記錄:在測試的上千小時BBC視頻片段中,DeepMindAI實現...

谷歌的人工智能DeepMind又厲害了。

近日,DeepMind部門與牛津大學研究人員共同創造了一個記錄:在測試的上千小時BBC視頻片段中,DeepMind AI實現了46.8%的讀唇識別文字精準率。也許你覺得46.8%不是很牛,但其實經過訓練的人類讀唇專家,正確率也僅為12.4%而已。

谷歌AI學會讀唇語了 能幫助盲人“看”電視

牛津大學的研發小組在本月早些時候發布了報告,首先他們開發了一款名為“Lipnet”的讀唇軟件,其測試成績為93.4%準確率,似乎比DeepMind AI更高,但其實這是在特制錄像的條件下完成的,測試語句全部為公式化。

谷歌AI學會讀唇語了 能幫助盲人“看”電視

DeepMind AI則不同,它完全是在“看電視”的情況下測試的,也就是說片段隨機、片段中人物的語音隨機,更具挑戰性。為此,DeepMind AI經過了約5000小時的訓練,包括大量新聞節目,鍛煉并學習“看、聽、讀、拼”的能力。

DeepMind的研究表明,AI可以實現更強大的語言學習能力,并且擁有廣泛的應用價值,比如幫助聽障人士理解自然對話、可以詮釋無聲電影或是集成到諸如Siri和Alexa等語音助手中。

當然,也有人對該技術感到恐懼,認為這是一種更方便的監控技術。不過研究人員表示,該技術需要在明亮的、高分辨率視頻畫面中運行,目前的監控視頻還不具備操作條件。但無論如何,AI正在變得越來越聰明,這是一件好事。

您可能感興趣的文章

相關文章