阿里云通義千問(wèn)720億參數(shù)模型宣布開(kāi)源
12月1日,阿里云通義千問(wèn)720億參數(shù)模型Qwen-72B宣布開(kāi)源。隨著Qwen-72B的開(kāi)源,通義千問(wèn)還開(kāi)源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問(wèn)共開(kāi)源18億、70億、140億、720億參數(shù)的4款大語(yǔ)言模型,以及視覺(jué)理解、音頻理解兩款多模態(tài)大模型,實(shí)現(xiàn)“全尺寸、全模態(tài)”開(kāi)源。
據(jù)介紹,此前,中國(guó)大模型市場(chǎng)還沒(méi)出現(xiàn)足以對(duì)標(biāo)Llama 2-70B的優(yōu)質(zhì)開(kāi)源模型。Qwen-72B填補(bǔ)了國(guó)內(nèi)空白,以高性能、高可控、高性價(jià)比的優(yōu)勢(shì),提供不亞于商業(yè)閉源大模型的選擇?;赒wen-72B,大中型企業(yè)可開(kāi)發(fā)商業(yè)應(yīng)用,高校、科研院所可開(kāi)展AI for Science等科研工作。
如果說(shuō)Qwen-72B“向上摸高”,抬升了開(kāi)源大模型的尺寸和性能天花板;發(fā)布會(huì)上的另一開(kāi)源模型Qwen-1.8B則“向下探底”,成為尺寸最小的中國(guó)開(kāi)源大模型,推理2K長(zhǎng)度文本內(nèi)容僅需3G顯存,可在消費(fèi)級(jí)終端部署。
從18億、70億、140億到720億參數(shù)規(guī)模,通義千問(wèn)成為業(yè)界首個(gè)“全尺寸開(kāi)源”的大模型。用戶可在魔搭社區(qū)直接體驗(yàn)Qwen系列模型效果,也可通過(guò)阿里云靈積平臺(tái)調(diào)用模型API,或基于阿里云百煉平臺(tái)定制大模型應(yīng)用。阿里云人工智能平臺(tái)PAI針對(duì)通義千問(wèn)全系列模型進(jìn)行深度適配,推出了輕量級(jí)微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗(yàn)證、在線服務(wù)部署等服務(wù)。
阿里云是國(guó)內(nèi)最早開(kāi)源自研大模型的科技企業(yè),8月以來(lái)開(kāi)源了Qwen-7B、Qwen-14B和視覺(jué)理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單,得到中小企業(yè)和個(gè)人開(kāi)發(fā)者的青睞,累計(jì)下載量超過(guò)150萬(wàn),催生出150多款新模型、新應(yīng)用。發(fā)布會(huì)現(xiàn)場(chǎng),多位開(kāi)發(fā)者伙伴現(xiàn)身說(shuō)法,分享了他們用Qwen開(kāi)發(fā)專(zhuān)屬模型和特定應(yīng)用的實(shí)踐。
阿里云CTO周靖人表示,開(kāi)源生態(tài)對(duì)促進(jìn)中國(guó)大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要,通義千問(wèn)將持續(xù)投入開(kāi)源,希望成為“AI時(shí)代最開(kāi)放的大模型”,與伙伴們共同促進(jìn)大模型生態(tài)建設(shè)。
同日,首屆“通義千問(wèn)AI挑戰(zhàn)賽”開(kāi)賽,參賽者可免費(fèi)暢玩通義開(kāi)源模型家族,包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價(jià)值50萬(wàn)元的免費(fèi)云上算力和豐厚獎(jiǎng)金。賽事分為算法和Agent兩大賽道,前者聚焦通義千問(wèn)大模型的微調(diào)訓(xùn)練,希望通過(guò)高質(zhì)量的數(shù)據(jù)探索開(kāi)源模型的代碼能力上限,后者鼓勵(lì)開(kāi)發(fā)者基于通義千問(wèn)大模型和魔搭社區(qū)的Agent-Builder框架開(kāi)發(fā)新一代AI應(yīng)用,促進(jìn)大模型在各行各業(yè)的落地應(yīng)用。即日起開(kāi)發(fā)者可通過(guò)天池平臺(tái)報(bào)名參賽。
轉(zhuǎn)載請(qǐng)注明來(lái)自浙江中液機(jī)械設(shè)備有限公司 ,本文標(biāo)題:《阿里云通義千問(wèn)720億參數(shù)模型宣布開(kāi)源》
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...