2022年6月9日 星期四

Google IO 2022必須知道的十件事

今年Google IO 2022在AI 上必須知道的十件事

 

大家好我是Jerry老師,已經有一段時間因為公司忙碌沒發文,今天要跟大家分享的是關於今年Google在Google I/O的活動上分享最近透過AI方法做的十件事,特別在Google產品上都透過AI做了許多附加價值的事情,包含在Google翻譯、Google地圖、Youtube、Google Meet、Google Doc、Google搜尋、 Google助理、 Google手機、Google眼鏡等9種產品上,全文參考內容來自於這裡

 

今年的開頭讓Jerry老師覺得很棒,因為疫情、環境的關係,Google做了很多對社會有很大幫助的事情,像是「預測洪水的預警時間,發送超過2300萬則的災害警報給印度的民眾」,「透過翻譯技術協助烏克蘭人跟波蘭人能夠互相溝通」,「協助彙整全球Covid-19的照護資訊,有超過20億人次使用來找附近診所」,「透過Google手機發送數億條的空襲訊息讓烏克蘭人能夠避難」,這些都是對社會非常有幫助的事情。





接下來Jerry老師彙整了Google IO上10件必須要知道的事

 

1.     Google翻譯能夠自主學習新的語言



過去學習語言翻譯是採用雙語學習(Bilingual learning),像是英文轉西班牙文,他就要有對應的英文跟西班牙文,但是全世界語言很多,不一定每個語言轉換都有成對的訓練資料可以用。Google的團隊發表了一種做法叫單語學習(Monolingual learning)這種方法可以在Zero-Resource的情況下去學習新的語言翻譯,使用了Transformer-based的模型架構與半監督學習(Semi-supervised)的方式,學習了24種新語言的翻譯,包含阿薩姆語(Assamese)、林加拉語(lingala)、米佐语(Mizo)等。

 

細節請參閱文章


 


 

 

2.     Google Map建立最佳環保路徑

 



Google也透過機器學習的技術,提出了eco-friendly的概念,自動生成最佳的環保路徑提供給使用者使用。


細節請參閱文章


 

 

3.     Youtube能夠提供自動章節分段功能


能夠自動透過機器學習的方式去分析影片中的內容,進行自動分段的工作,這個技術解決了影片過長,但是使用者想分段去觀賞的問題,同時也可以提升搜尋的效率與結果。

 

 

4.     Google Meet自動加亮


在Google Meet上 也透過機器學習的方式去做了畫面加亮、去背、增強背景等功能


5.     Google Doc 自動摘要功能

這是一個很特別的機器學習技術,在影片中可以看到包含了自然語言理解(NLU)、資訊壓縮(IC)、自然語言生成(NLG)等技術,可以讓Google文件能夠有自動摘要的功能,方便使用者能夠先閱讀摘要掌握文本資訊。當然主要先從英文的會議記錄開始,但是可以想得到未來大量的文本閱讀上,在Google文件上面可以變得非常方便。 

 

6.     Google搜尋可以用照片作為搜尋關鍵字



混合搜尋(Multi search)是一個重要的技術,突破了過去搜尋只能用文字處理,過去我們曾用過以圖搜尋、以文搜圖的方式去獲取資訊,但是今年Google搜尋將會提供用圖+文字的混合搜尋的方式,可以把圖片當作文字的一部分,搭配文字進行搜尋。

 

 

7.     Google助理可以透過擬人化的方式喚醒與互動



Google助理變得更擬人化了,過去我們使用音箱上面會常常會不小心喚醒音箱服務,但是現在音箱多了視覺辨識功能,我們可以用「Look and Talk」的功能,用看然後再說話的方式,喚醒音箱,想像就是對人講話的方式來做互動。

 

詳細請參閱影片


 

 

8.     更強大的自然語言理解模型PaLM


去年Google才出了LaMDA,今年又出了一個PaLM,事實上Google希望能夠打造出跨語言的自然語言理解模型,這個PaLM能夠處理的自然語言理解任務又更多了,Jerry老師將會再另外找時間去做比較深度的分享,基本上應該會出現在Google Devfest的活動上,敬請期待!


 

9.     Google手機自動檢測車禍、自動撥打緊急電話


在影片中介紹不少Google手機、手錶應用,讓我印象深刻的是自動檢測車禍、自動撥打電話功能,請參閱影片來感受一下這個技術對於人們有多大的幫助

 

詳細請參閱影片


 

 

10.  Google眼鏡與翻譯的結合



 

最後是Google測試中的產品,目標也是在希望能夠讓人與人溝通能夠更加便利,透過這個Google眼鏡,能夠做快速翻譯的動作,透過分析雙方的聲音,能夠直接在眼鏡上用自己習慣的語言做互動,對於語言不通的兩個人,可以做有效率的溝通。


詳細請參閱影片


 


以上做簡單分享,供大家參考!