資料科學實驗室: 2024

2024年8月11日星期日

Google I/O Connect 2024 速記

大家好我是Jerry老師，週一要上班了，趕快來把上週在Google I/O Connect 2024 的經驗做個分享，疫情後連續兩年參加Google I/O 的活動，之前在上海，今年在北京。晚上的晚宴很有趣，這次有東南亞的社群朋友，很熱鬧，中、英交叉主持。

大中華的主管們分享

有趣的問題，大家猜到了嗎

全球生態圈的大老闆分享

今年辦在北京國家會議中心(China National Convention Center)

今年換穿白色制服的Google開發者，可以直接入場

入口報到

從另一個角度拍攝，大家魚貫上手扶梯

一樣看起來很酷炫的Keynote開場，滿滿的人

一如往常Google介紹貢獻，有個編譯夢想的計畫，很特別

透過AI創造很多應用的計畫

各項培育計畫

GenAI的個人化應用種類

完整的生態圈

https://developers.google.cn/appdev/

Chrome也有 AI計畫

基本上 Google生態圈的產品，都已經開始支援Gemini做各種不同的應用

相當期待

Google的公益也做了不少

聽障的公益

現場手語辨識

可以提足球，透過AI評分

Google也是要跟NVIDIA一起串一下，這邊提的是Gemma支援NIMs

Google重視的負責任AI

這邊的RGAI很完整

VertexAI開發的環境

以前的TensorFlow JS現在改為為Web AI

現在也支持LLM

去年就有介紹的Visual Blocks 今年功能更強大了。

支援幾個常見的LLM模型

這個真的滿重要的，因為現在LLM可以讀超過我們人類讀的速度

在Web上做推論

中間還有特色禮品跟飲品

這個概念很不錯，看起來就是透過Google技術把最後一哩路走完

PaliGemma是一個可以做圖文的雙模態

這的確是Google的夢想，也是Jerry老師的夢想，只有這樣這個世界才會透過科技更強大

Google Cloud分享最新動態

事實上也是繞著GenAI主題在討論

透過生成式AI評分，相當有趣的應用，因為Gemini已經可以多模態，

所以他透過影片來進行分析。

透過這張圖來解釋嵌入的關係

在Firebase上的應用

在Android上的應用

11:00的時候代表台灣進入閉門會議，很特別的經驗。

這個要講出RAG的梗，因為資料不夠，導致幻覺

示範了透過對話的方式針對Ray這份文件做互動

Ray與K8S的整合應用

KubeRay的概念很棒

這個是三星的案例，透過Ray來進行機器學習服務

接下來是Jerry老師覺得最棒的一個收穫，是關於RAG應用，

當然活動中有不少介紹RAG的場次，但這場介紹的最好

何謂RAG

RAG範例

RAG的優勢

RAG搜尋

文字與圖片進行Chunking

多模態的混合

Google採用到目前為止最好的維度搜尋技術ScaNN

在Google Cloud上的引擎

混合搜尋，這塊也是近年大家的新作法

客製化RAG應用

智能分塊的概念也值得參考

的確是能強化RAG的做法之一

這個做法在開源也有類似的參考

捕捉真實答案的方法

接地氣的範例

這是 Uber的案例，比較像是搜尋＋對話生成的方式

Uber的架構範例

Uber的架構範例

用多模態來讀論文（這種也是跟過去只讀文字是不同的）

範例流程

範例都在這裡

總結一下這次的心得，Google短短不到一年，

將所有產品圍繞Gemini + RAG，很期待接下來在整個生態的應用展開。

歡迎寫信給 jerry@ap-mic.com交流

訂閱：意見 (Atom)