<dd id="514ha"></dd>
    <dd id="514ha"><center id="514ha"><td id="514ha"></td></center></dd>

          1. 創業頭條
          2. 前沿領域
          3. 人工智能
          4. 正文

          業界最強開源大模型來了!通義千問720億參數模型正式開源

           2023-12-01 11:53  來源:互聯網  我來投稿 撤稿糾錯

            【推薦】海外獨服/站群服務器/高防

          12月1日,阿里云舉辦通義千問發布會,開源通義千問720億參數模型Qwen-72B。Qwen-72B在10個權威基準測評創下開源模型最優成績,成為業界最強開源大模型,性能超越開源標桿Llama 2-70B和大部分商用閉源模型。未來,企業級、科研級的高性能應用,也有了開源大模型這一選項。

          通義千問還開源了18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問共開源18億、70億、140億、720億參數的4款大語言模型,以及視覺理解、音頻理解兩款多模態大模型,實現“全尺寸、全模態”開源。力度之大,業界無出其右。

          業界最強開源模型,填補中國LLM開源領域空白

          Qwen-72B基于3T tokens高質量數據訓練,延續通義千問預訓練模型一貫以來的強勢表現,在10個權威基準測評中奪得開源模型最優成績,在部分測評中超越閉源的GPT-3.5和GPT-4。

          英語任務上,Qwen-72B在MMLU基準測試取得開源模型最高分;中文任務上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準,得分超越GPT-4;數學推理方面,Qwen-72B在GSM8K、MATH測評中斷層式領先其他開源模型;代碼理解方面,Qwen-72B在HumanEval、MBPP等測評中的表現大幅提升,代碼能力有了質的飛躍。

          在10大權威測評中,通義千問720億參數模型獲得開源模型最優成績

          通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4

          Qwen-72B可以處理最多32k的長文本輸入,在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發團隊優化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游應用集成。比如,Qwen-72B搭載了強大的系統指令(System Prompt)能力,用戶只用一句提示詞就可定制AI助手,要求大模型扮演某個角色或者執行特定的回復任務。

          用戶僅用一句提示詞就可創建自己的AI助手

          此前,中國大模型市場還沒出現足以對標Llama 2-70B的優質開源模型。Qwen-72B填補了國內空白,以高性能、高可控、高性價比的優勢,提供不亞于商業閉源大模型的選擇?;赒wen-72B,大中型企業可開發商業應用,高校、科研院所可開展AI for Science等科研工作。

          從1.8B到72B, 通義千問 率先實現全尺寸開源

          如果說Qwen-72B“向上摸高”,抬升了開源大模型的尺寸和性能天花板;發布會上的另一開源模型Qwen-1.8B則“向下探底”,成為尺寸最小的中國開源大模型,推理2K長度文本內容僅需3G顯存,可在消費級終端部署。

          從18億、70億、140億到720億參數規模,通義千問成為業界首個“全尺寸開源”的大模型。用戶可在魔搭社區直接體驗Qwen系列模型效果,也可通過阿里云靈積平臺調用模型API,或基于阿里云百煉平臺定制大模型應用。阿里云人工智能平臺PAI針對通義千問全系列模型進行深度適配,推出了輕量級微調、全參數微調、分布式訓練、離線推理驗證、在線服務部署等服務。

          阿里云是國內最早開源自研大模型的科技企業,8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單,得到中小企業和個人開發者的青睞,累計下載量超過150萬,催生出150多款新模型、新應用。發布會現場,多位開發者伙伴現身說法,分享了他們用Qwen開發專屬模型和特定應用的實踐。

          阿里云CTO周靖人表示,開源生態對促進中國大模型的技術進步與應用落地至關重要,通義千問將持續投入開源,希望成為“AI時代最開放的大模型”,與伙伴們共同促進大模型生態建設。

          通義千問基座模型持續進化,多模態探索業界領先

          通義千問在多模態大模型領域的探索也領先業界一步,當天,阿里云首次開源音頻理解大模型Qwen-Audio。

          Qwen-Audio能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。用戶可以輸入一段音頻,要求模型給出對音頻的理解,甚至基于音頻進行文學創作、邏輯推理、故事續寫等等。音頻理解能夠賦予大模型接近人類的聽覺能力。

          通義大模型能“聽”也能“看”。通義千問8月開源出視覺理解大模型Qwen-VL,迅速成為國際開源社區最佳實踐之一。本次發布會又宣布了Qwen-VL的重大更新,大幅提升通用OCR、視覺推理、中文文本理解基礎能力,還能處理各種分辨率和規格的圖像,甚至能“看圖做題”。不論從權威測評成績還是真人體驗的效果看,Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

          通義千問閉源模型也在持續進化,一個月前發布的通義千問2.0版閉源模型,最近已進階至2.1版,上下文窗口長度擴展到32k,代碼理解生成能力、數學推理能力、中英文百科知識、幻覺誘導抵抗能力分別提升30%、10%、近5%和14%。用戶可以在通義千問APP免費體驗最新版本的閉源模型。

          申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

          相關標簽
          大模型

          相關文章

          • 首屆通義千問AI挑戰賽開賽,參賽者可暢玩通義開源模型家族

            12月1日,首屆“通義千問AI挑戰賽”開賽,參賽者可免費暢玩通義開源模型家族,包括剛剛發布的720億參數模型Qwen-72B。主辦方為參賽者提供價值50萬元的免費云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道,前者聚焦通義千問大模型的微調訓練,希望通過高質量的數據探索開源模型的代碼能力上限,后

            標簽:
            大模型
          • 最強開源大模型來了!通義千問720億參數模型開源發布

            12月1日通義千問發布會,阿里云開源通義千問720億參數模型Qwen-72B。Qwen-72B在10個權威基準測評創下開源模型最優成績,成為業界最強開源大模型,性能超越開源標桿Llama2-70B和大部分商用閉源模型,可適配企業級、科研級的高性能應用。通義千問當天還開源了18億參數模型Qwen-1.

            標簽:
            大模型
          • 掰開安卓手機,滿屏都是三個字:大模型

            這年頭,安卓廠商沒個大模型,都不敢開手機發布會了。前腳OPPO剛用大模型升級了語音助手,后腳vivo就官宣自研手機AI大模型;小米發布會則直接將大模型當場塞進手機系統……其競爭激烈程度,不亞于搶芯片首發。到底是怎么回事?究其原因,還是智能終端已經成為了各類AIGC應用的落地“新灘頭”。先是圖像生成大

            標簽:
            大模型
          • 加速大模型落地,容聯云發布多款生成式智能服務

            基于容聯云自主研發的赤兔大模型能力,容聯云容犀機器人真正將大模型強大的理解能力、知識學習能力、總結能力、挖掘能力、推理能力融入于實際落地應用中。開創性的打造生成式場景化智能問答、生成式智能輔助、AI運營話術庫,幫助企業洞悉更精準的客戶真實需求,提升一線客服人員的專業服務能力,并代替人工完成大量低價值

            標簽:
            大模型
          • 從搜索到大模型,百度商業化的“驚險一躍”

            文:向善財經關于百度,最近發生了這么兩件事兒。一個是華爾街分析師重申了對百度股票的買入評級和目標價,但在該公司11月21日公布第三季度收益之前下調了第三季度收入預期。分析師給出的理由是,線下廣告支出走軟,以及2G資金減少之后,給智能交通帶來挑戰。另外一個是最近文心一言正式上線了專業版,并且開始收費,

            標簽:
            百度
            大模型
          • 空間計算時代加速到來,需要的不只是蘋果

            創新和用戶拓展,哪個都不能太快

          • 用友的YonGPT大模型,落到了企業服務的點子上

            文|智能相對論作者|沈浪“面向AI時代,所有的產品都值得用大模型重新升級?!贝竽P蜕鯂虊m上,各行各業都在嘗試用大模型來重做業務。此前,用友率先發布了業內首個企業服務大模型YonGPT。作為大模型與企業運營管理的深度結合,YonGPT是否能把大模型的行業應用路徑給走通?從目前透露出來的信息來看,用友Y

            標簽:
            大模型
          • 巨人踏步,港口自動駕駛提速向前打開行業新空間

            按照吞吐量排名,全世界最大的50個港口,中國占了29個。在中國的港口和碼頭上,一場進化正在發生:人在這個生態中占的比重越來越少,技術接管的要素正在越來越多。像是最具代表性的全球綜合自動化程度最高的碼頭——上海洋山港四期自動化碼頭上,甚至到了“人跡罕見”的地步。之所以稱之為進化,是因為任何事物在規模達

            標簽:
            自動駕駛
          • 高通:人工智能只是一個紅利

            高通作為人工智能領域的重要參與者可能被低估。

          • 博通:人工智能驅動的漲勢遠未結束

            總之,博通成為一家財務穩健、盈利能力卓越的公司。

          • 國產自研大模型加快落地,新一輪搜索入口戰打響?

            在這個以效率為先的時代,AI的廣泛應用自然而然,而若談及受到影響最大的行業,搜索領域必定是其中之一。目前,抖音、B站、淘寶等互聯網平臺均推出了自家的AI搜索產品,而垂直搜索領域的玩家也在新興技術趨勢下找到了更大的革新動力。2023年10月,百度旗下“簡單搜索”宣布升級,成為百度通過大模型重構的第一個

            標簽:
            大模型
          • 專訪榮耀趙明:MagicOS 8.0定義意圖識別新交互

            什么才是真正的人工智能?在每個人都在談人工智能的時代,這個最基礎的問題反而不那么好回答。最近榮耀發布的MagicOS8.0(中文名:魔法OS8.0)似乎給了我們一個最接近正確答案的解題方向,那就是基于意圖識別的人機交互。為此,我專訪了榮耀CEO趙明,聽他詳細闡述了關于MagicOS8.0、端側AI、

          • ChatGPT之父稱人類水平的AI即將出現 為世界帶來前所未有的影響

            近日,人工智能領域的領軍人物,ChatGPT之父薩姆·阿爾特曼(SamAltman)發表了令人振奮的言論。他表示,人類水平的人工智能(AI)即將出現,這一變革性技術的發展將為世界帶來前所未有的影響。作為OpenAI的首席執行官,阿爾特曼的這番言論引發了業界和學術界的廣泛關注。一直以來,實現具有人類智

            標簽:
            chatgpt
          • “具身智能”浪潮中,達闥機器人的商業化“奇點”已然到來?

            當前,人形機器人產業正在快速發展,而2023年必將會是載入史冊的一年。具體來看,2023年,AI技術大爆發,可在語言、視覺、運動控制、降低研發成本等多方面賦能人形機器人產業發展。與此同時,特斯拉、波士頓動力、優必選、達闥、小米、傅利葉智能等海內外企業紛紛布局,從2023世界機器人大會就可感受到行業的

          • 熱鬧人工智能VS酷寒資本寒冬,2023年AI Agent項目盤點與融資分析

            2023年都有哪些國內廠商推出了AIAgent?哪些廠商成功融資?對創業有什么啟示?一文看明白。

            標簽:
            ai智能

          編輯推薦