2023年5月12日 星期五

Google I/O 2023的速記



 大家好我是Jerry老師,又來一年一度IO分享速記。

今年的Google I/O 2023,可以很清楚看到Google如同前幾年提到的方向,將AI部署到旗下所有產品當中,這一步棋,走的很早,但速度還不夠快。

但個人覺得因為面臨Microsoft加上GPT能力的產品提升,所以Google應該會增加整合速度,以及走的更深。從市場來看,過去台灣企業不知道如何導入AI,在未來台灣必定在各類系統走向AI化,已經是必然趨勢。

如果您想回顧去年的IO,請點這裡

Google IO 2022必須知道的十件事

這次IO可以看到Google將AI導入產品更加具體化,從各種功能上看起來都非常實用。

整體上IO重點發表了兩塊 AI、硬體,本篇針對AI的部分做比較多彙整。

Google從Gmail開始以生成式AI技術推出Smart Reply、Smart Compose、Help me write


Google Maps則持續更新Immersive View,去年提到也是採用機器學習建模讓街道成像能夠更真實。


再來是Google Photos提供了Find photos、Magic Eraser、Magic Editor


而上面的產品加值的技術源頭,就是PaLM2,事實上Jerry老師在4月的時候已經分享過PaLM是一個能說、能看、能動、能理解的語言模型

但PaLM缺點是目前支持語言並不多,之前Google所推出的語言模型技術當中,像是BERT、T5、MT5都普遍支援多國語言,以MT5為例,Jerry老師有介紹過 一個大規模跨國語言的預訓練模型MT5 ,就支援超過100種語言

至今MT5還是被用在做各種低成本的語言任務當中。Google最終還是要讓人工智能能夠幫助到每個人(Making AI helpful for everyone),讓人人都能受益。

在PaLM模型上,跟GPT一樣,他有推出不同的版本,包含Gecko、Otter、Bison、Unicorn


如果熟Google Cloud的朋友,就可以知道Bison可以到Vertex AI的Generative AI Studio功能中,已經上架供測試,但還是沒有多國語言啊啊啊....











也許還在測試?

但是Med-PaLM2會讓人覺得滿強大的,細節可以看這裡

他是全球第一個在美國醫學執照考試 (USMLE) 式問題的 MedQA 數據集上在“專家”應試者水平準確率達到 85% 以上的模型

接下來是大家期待的Bard,可以看到風格跟ChatGPT不太一樣,Bard會先把說明寫在前面,答案在後面。

但生成的程式碼結果其實不會差太多,預期上程式碼訓練來源應該都是差不多的地方。


接下來我們可以看到GoogleWorkspace的部分,包含自動撰寫徵人資訊、自動試算表計算、試算表問答、簡報生成圖片素材等等,都是能夠增加生產力的功能,Google稱為Duet AI for Workspace 一種協奏的概念:D


再來是Google最強的搜尋產品,看起來新功能是直接在綠色文字區塊呈現,而非Bing的方式是放在右邊,從UI/UX來看Google的作法更為細緻與深入些,因為直接推薦問題,問答的互動則是再細部資料呈現之後再提供



看了覺得很讚,但還是一樣,希望中文能夠盡快推進。


再來是Google Cloud介紹,新的PaLM API的案例、NVIDIA H100的機器推出、Colab推出程式自動撰寫功能等。

還有比較特別的是語言轉換影片

可以看到從英文轉為另一個語言,甚至連嘴型都可以配合。透過Lip matching 、 Speech generation、Intonation、Translation技術來達到這個效果。

後面的部分則是介紹Android生態,以及未來硬體+AI的成長變化
像是在Android手機、平板上可以方便使用搜尋、工作甚至是Bard的整體介面。

接下來針對幾個Google推出的AI服務,Jerry老師也做一下彙整

對於Generative AI有興趣的


可以參閱網址:

https://io.google/2023/program/21666103-ad8f-463f-9f05-a2b1e11aeb60/


https://io.google/2023/program/ca897c89-e56a-445c-97d6-eda2df5adecc/


https://io.google/2023/program/27cce05f-df4c-4ab2-9a59-5b466bdae0f9/


https://io.google/2023/program/79bf6ddf-781f-4b99-a7f7-6202df00052d/


今年的LLMs 與 生成式AI的主題相當多,只好有空再來整理給大家了


跟生成式AI有關的輸出責任問題 可以參考這個


概念上就是多了一層輸出的模型處理答案的正確與否,這跟以前的LaMDA有做一個分類跟評分的「流程」很像。

https://io.google/2023/program/04c03aa2-e9ac-44f8-865a-33c1a494e11d/


https://io.google/2023/program/5668793d-5e8b-4da1-8813-5d2972e0270a/



對AR有興趣可以看這裡

https://io.google/2023/program/0192be73-9c6a-46b2-bd1e-d9a4818c1cc8/


https://io.google/2023/program/750f0a8b-bab2-41f3-9cef-61d02f2369f3/


https://io.google/2023/program/e0949a49-5d57-4551-9b41-1650536a5800/


另外直得深入研究的是


Kaggle Model 這個跟 huggingface有得比的模型庫,而且是歷經各種挑戰的模型庫


https://www.kaggle.com/models



以及在Google Cloud上面的模型

https://console.cloud.google.com/vertex-ai/model-garden



相信在未來做機器學習的學習成本會越來越低,更快導入到各行各業。


如果您有看到什麼不錯,想跟Jerry老師分享的

也歡迎來信 dsjerry2017@gmail.com


以上就是這次Google IO 2023的報告 謝謝大家

沒有留言:

張貼留言