ChatGPT 不過如此,Kosmos-1 更勝一籌?微軟這波又贏了

就在上周,微軟繼推出 new bing 之后,在 AIGC 領域再爆重磅炸彈:推出比 ChatGPT 更加全能的 AI —— AI--Kosmos-1

Kosmos,該詞源于希臘語 kosmos,意思是:宇宙、和諧、表示一個有序且和諧的系統,與另外一個單詞 chaos (混亂)相對。
怎麼讀?
本瓜:科哦日摸斯~~
ChatGPT 只能是純文本對話,而這個 Kosmos-1 可以處理文本、音頻、圖像和視訊等內容!!
ChatGPT 是【大型語言模型】(LLM) ,Kosmos-1 是【多模式大型語言模型】(MLLM)
來看看它的表現,一圖勝千言:

CRAZY,在原先文本對話的基礎上,再加圖片的理解、音頻的理解等,確實更進一步。
它原理如何?
咱們用魔法打敗魔法,讓兄弟產平 new bing 來作解釋:




原理還是有點復雜,主要的觀點:
KOSMOS-1 主干基于 Transformer 的因果語言模型,整合了語言、視覺、語言等模態的輸入,對于連續信號模態(例如圖像和音頻),將輸入表示為離散編碼。
KOSMOS-1 借助了 PyTorch 框架,這個框架是一個深度學習的優化張量庫,可使用 GPU 和 CPU 進行計算。
PyTorch 提供了靈活的動態計算圖、自動求導功能、分布式訓練和部署等特性,我們可以用它來構建各種神經網絡模型,如卷積神經網絡、循環神經網絡、變分自編碼器等。。。

Kosmos-1 在哪體驗?

目前它還只是一個研究項目,未商用。最新進展在:
Microsoft Introduces Kosmos-1: A Multimodal Large Language Model That Can Perceive General Modalities, Follow Instructions, And Perform In-Context Learning - MarkTechPost Microsoft Introduces Kosmos-1: A Multimodal Large Language Model That Can Perceive General Modalities, Follow Instructions, And Perform In-Context Learning - MarkTechPost
別的不說,微軟這波確實走在了前頭,首先它們以最快的速度引入 GPT 3.5 到自家 Edge 瀏覽器中,推出 new bing ,狂拉一波瀏覽器的使用率,之前這個基本被 Google 吞占了。
而后,又推出 Kosmos-1,將 AI 與圖片分析、音頻分析結合,可看出其野心。
前兩天在 YOUTUBE 上看到一個博主說:微軟正準備將 GPT 整合到自己的各類工具中,比如文檔寫作 office、onenote 等等,這必將帶來又一波波爆炸式的產品增長。
憑借 AIGC,微軟這波或能彎道超車,在 AI 應用上,超越谷歌、甲骨文等公司。
微軟這波又贏了~~



[圖擷取自網路,如有疑問請私訊]

本篇
不想錯過? 請追蹤FB專頁!    
前一頁 後一頁