国产地址二永久伊甸园,成年网在免费线播放欧美

<li id="hwnou"></li>

<li id="hwnou"></li>

<rt id="hwnou"></rt>

中國新聞網(wǎng)-上海新聞

新聞熱線：18516110765 固話：021-62496853

投稿郵箱：shanghai@chinanews.com.cn

上海分社 • 正文

阿里云通義開源首個多模態(tài)推理模型QVQ，視覺推理比肩OpenAI o1

2024年12月25日 13:28 來源：中新網(wǎng)上海

　　12月25日，阿里云通義千問發(fā)布業(yè)界首個開源多模態(tài)推理模型QVQ-72B-Preview。QVQ展現(xiàn)出超預(yù)期的視覺理解和推理能力，在解決數(shù)學(xué)、物理、科學(xué)等領(lǐng)域的復(fù)雜推理問題上表現(xiàn)尤為突出。多項評測數(shù)據(jù)顯示，QVQ超越了此前的視覺理解模型“開源王者”Qwen2-VL，整體表現(xiàn)與“滿血版”O(jiān)penAI o1、Claude3.5 Sonnet等推理模型相當(dāng)。目前，開發(fā)者可在魔搭社區(qū)和HuggingFace平臺上直接體驗。

　　人類的推理能力植根于語言思維和視覺記憶中，正因此，利用視覺理解增強(qiáng)大模型推理能力，成為AI技術(shù)的前沿探索之一。一個月前，通義發(fā)布AI推理模型QwQ-32B-Preview，即斬獲SuperCLUE的AI推理模型榜單“全球開源冠軍”；如今，通義團(tuán)隊在Qwen2-VL-72B開源模型基礎(chǔ)上，研發(fā)出多模態(tài)推理模型QVQ-72B-Preview，可實現(xiàn)更仔細(xì)的逐步推理，視覺推理能力也顯著進(jìn)步，在解決復(fù)雜問題時表現(xiàn)驚艷。

　　在考察模型視覺理解及推理的MMMU評測中，QVQ取得了70.3分，水平已達(dá)大學(xué)級別；在聚焦數(shù)學(xué)的視覺推理測試MathVista中，QVQ得分超過OpenAI o1，印證了其強(qiáng)大的圖形推理能力；在更具多樣性和學(xué)科廣度的MathVison評測中，QVQ表現(xiàn)超越Claude3.5及GPT4o，說明QVQ更擅長解決真實數(shù)學(xué)問題；在奧賽級別的OlympiadBench基準(zhǔn)測試中，QVQ也展現(xiàn)了出色的視覺推理能力。

　　QVQ是一個會基于視覺進(jìn)行深度思考推理的大模型。QVQ不但能感知更準(zhǔn)確的視覺內(nèi)容，并據(jù)此作出更細(xì)致的分析推理，還會質(zhì)疑自身假設(shè)，仔細(xì)審視其推理過程的每一步，經(jīng)過深思熟慮后給出最后結(jié)論。QVQ可以輕松識別“梗圖”內(nèi)涵；看真實照片可合理推斷出物體個數(shù)及高度等信息；在面對數(shù)學(xué)、物理、化學(xué)等各科學(xué)領(lǐng)域難題，QVQ能像人甚至科學(xué)家一樣，給出思考過程和準(zhǔn)確答案。

　　目前，QVQ-72B-Preview已在魔搭社區(qū)和HuggingFace等平臺上開源，開發(fā)者可上手體驗。據(jù)了解，一個月前開源的推理模型QwQ受到全球開發(fā)者熱捧，一發(fā)布就登上HuggingFace模型趨勢榜榜首。截至目前，通義千問Qwen的衍生模型數(shù)突破7.8萬個，已超越Llama成為全球規(guī)模最大的AI模型群。（完）

注：請在轉(zhuǎn)載文章內(nèi)容時務(wù)必注明出處!

編輯：蔡佳蓉

熱點視頻

觀眾通過直播平臺與演員互動體驗短劇創(chuàng)新玩法

沉浸式直播情景劇《上海風(fēng)云》新聞發(fā)布會在松江石湖蕩鎮(zhèn)舉行

圖片報道

關(guān)于我們　| About us　|　聯(lián)系我們　|　廣告服務(wù)　|　供稿服務(wù)　|　法律聲明　| 招聘信息　

本網(wǎng)站所刊載信息，不代表中新社和中新網(wǎng)觀點。刊用本網(wǎng)站稿件，務(wù)經(jīng)書面授權(quán)。

未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像，違者將依法追究法律責(zé)任。

常年法律顧問：上海金茂律師事務(wù)所

[網(wǎng)上傳播視聽節(jié)目許可證（0106168)]　[京ICP證040655號][京公網(wǎng)安備：110102003042] [京ICP備05004340號-1]