目錄
- 前言
- 第一場:辦公學習
- 第二場:日常識別
- 第三場:定位導航
- 第四場:應用構建
- 小結
11月18日,螞蟻推出靈光app,正式加入了AI大戰。
這邊廂,靈光app以可視化回答、閃應用和多模態鈎住用户的視線。那邊廂,因品牌定位而更名的千問app(由“通義”更名為“千問”),帶着Qwen的最強模型與功能新定位(一站式解決方案)與大眾見面。
這倆也算是被擺在了顯眼的擂台上對打。
對於用户而言,商業戰略倒是其次,功能是否多樣、是否實用、是否方便才是思量的重點。
所以,這倆到底哪個更戳用户的心巴呢?
下面它倆將會在辦公學習、日常識別、內容創作、應用構建四方面進行對決,大家可坐好小板凳細細觀看。
第一場:辦公學習
靈光和千問都是直接在首頁輸入指令即可。比如常識掃盲和方案提供:
(左為靈光回覆,右為千問回覆)
(左為靈光回覆,右為千問回覆)
靈光就像寫了一篇排版美觀的文章,圖、文、表結合,標題可簡約可文藝,結尾還有名言引用,其中圖不只是你預料之中的插圖,還有知識、清單卡片,看着真是賞心悦目。
千問就是常見大模型看到的那種結構化回答,文、表結合,條理清晰,講解深入,文末有時還附帶其他用户的經驗分享(圖和視頻)。
與靈光相比,千問儘管沒有靈光的高顏值,但勝在回答夠垂直、夠精深。比如離心率重點講解其規律與公式,送禮的禮品能詳細到“低乳糖”“蒸煮型”等具體的產品側重點。
所以,就查資料、想方案而言,若你只是需要快速理解含義或找大致方向、步驟,靈光會更好用,可視化讓回答重點突出,你能一眼看到重中之重。相反,若你遇到公式數據類疑問,或者想看到更細化的方案,千問會更適合你。
第二場:日常識別
識圖分析
輸入模態方面,強調“全模態”的靈光卻敗給了千問。
靈光的輸入模態只有3種——文字、語音和圖片,而千問倒像是全模態,圖片和常見類型文檔都能上傳,還能上傳現場拍攝的視頻、現場錄製的音頻,能現場通話。
單就識圖而言,千問識萬物更為精準,甚至連物品目前所在地址可能都能定位,但回答層次單一。若是識圖解題,千問數理邏輯比靈光更強。
比如讓它倆識別文物:
(左為靈光回覆,右為千問回覆)
靈光最多隻識別到清代玉雕花插,更多注重宏觀和藝術的講解。
千問回答簡單但一語中的,“佛手形玉擺件”“四川博物院”讓我驚呼“666”。這確實是我在四川博物院拍的,文物名稱同場上的標籤如出一轍。
再比如讓它倆解答這道排列組合題:
(排列組合原題)
(左為靈光回覆,右為千問回覆)
笑死了,我懷疑靈光是在演我,邊做邊自我懷疑,重來好幾次,最後總算成功得出了一個錯誤答案。
千問倒是一如既往地穩,四步便得到了正確答案,一目瞭然。
定位導航
看到靈光“能給出交互地圖”的介紹,我還以為是能像網頁一樣直接點開導航,結果原來不是。
(左為靈光回覆,右為千問回覆)
靈光可以定位,不過只是用於給出具有針對性的路線,讓你看到從實際位置到目的地的具體耗時和貼合實際的攻略和路線方案,並沒有導航系統,也不會提供買票鏈接。
千問不能定位,除非你輸入具體位置,否則不能給出具體的耗時和路線,同樣沒有導航系統和買票鏈接。
沒有接入地圖系統的情況下,靈光能給出貼合實際位置的攻略和路線規劃,也實屬厲害了。
這一局,兩者勢均力敵。千問勝在識圖分析,靈光勝在出行規劃。
第三場:內容創作
生圖
文生圖方面,靈光和千問相差無幾,都能在聊天界面直接生圖。不過千問的聊天界面有還很多設置項,比如風格、尺寸選項,而靈光只能在文字中輸入設定項。
圖生圖方面,靈光明顯居於弱勢,明明可以像千問用嘴p圖,卻偏偏理解能力差。比如下面的小狗圖:
(左為原圖,右為靈光圖生圖結果)
提示詞:小狗右手拿起草莓,草莓只有一半了(上面的一半沒了)。
靈光無法變成右手拿草莓,也始終讓草莓去掉鏡頭面前的一半。
圖生視頻
靈光的這項功能也不如千問。
只能單圖生視頻,視頻沒有音效,只有bgm。這也就罷了,吃的動作都做不好是怎麼回事?
(靈光生成結果)
雖然千問也有音效配不好的問題,但人家至少動作自然啊,也可首尾幀生成視頻,儘管1天只有4次免費機會。
(千問生成結果)
這一局,毫無疑問千問獲勝。
第四場:應用構建
靈光、千問構建應用的形式不一樣。
靈光只需在主界面輸入要求,就能產出可直接使用的小應用。不同於靈光,千問不能直接產出小應用,雖然它自身有兩種構建應用的方法——主界面給出代碼、構建智能體。
千問給出代碼的方式就同其他大模型一樣,需要下載本地、網頁打開或後端環境運行。
千問創建智能體本質上是將領域和內容細分了,以聊天的形式娛樂或解決問題,並不能通過文字或語音回答之外的形式來執行任務。
這裏我構建了非聊天形式的音樂創作助手應用:
(靈光生成結果)
(千問生成結果)
提示詞:根據需求生成多樣風格並可調整的音樂創作助手。
靈光的音樂創作助手是“麻雀雖小,五臟俱全”,流程可以跑通,功能按鍵都能使用,只是功能設計和生成的音樂比較簡單。
千問是隻能生成前端仿真界面,應用無法運行,流程跑不通。
如若想生成功能複雜的大應用,比如支付寶應用,兩者都不適用。它倆要麼直接婉拒,要麼生成結果整個垮掉。
(上由靈光生成,下由千問生成)
或許,手機app的定位就是如此吧,不需要生成功能複雜的應用,能給日常增添樂趣、來點兒新意就足夠了!
生成小應用這局,靈光勝出了。
小結
目前看來,靈光最大的優勢就在於以下亮點:
1.顏值在線。以圖(各類圖:插圖、數據圖表、卡片、動態圖等)文並茂的形式反饋給你一篇文章樣式的答覆,讓你賞心悦目的同時一眼看到重中之重。
2.產出應用。讓你一句話生成小應用,在手機上就能玩耍和使用,增添生活趣味和便捷度。
至於實用性,比如查專業問題、解答數理題、短視頻創作,還是千問更戳大眾心巴。
即便靈光在出行規劃上的實用性強於千問,但別忘了,還有旅行專職顧問“飛豬問一問”“同程程心AI”,誰還會打開飛豬、同程購票時再打開靈光搜旅遊攻略和路線呢?
並且,無論是輸入還是輸出模態,千問的模態類型都比靈光廣。
1.輸入模態:
靈光:文字、語音、圖片。
千問:圖片、文檔、視頻、語音、通話
2.輸出模態:
靈光:文字、圖、視頻
千問:文字、圖、視頻、文件、語音播報
今天的分享就到這裏了。若你在使用靈光和千問app的過程中有自己的感悟和體驗,歡迎在評論區分享,我們一起交流,也歡迎大家入羣討論哦~
關注ChooseAI,和我們一起探索AI時代!