數(shù)智上海 2023 峰會 | 通用、垂直、AI Agent,大模型是如何擁抱千行百業(yè)應(yīng)用場景的?
由于通用大模型的泛化特性,它很難在落地行業(yè)場景中精準(zhǔn)滿足用戶需求。讓通用大模型學(xué)習(xí)行業(yè)知識和行業(yè)語料成為行業(yè)大模型,再進(jìn)一步學(xué)習(xí)業(yè)務(wù)知識和專業(yè)領(lǐng)域工具演進(jìn)為場景大模型,是當(dāng)前大模型落地應(yīng)用的關(guān)鍵路徑。未來,AI Agent 的產(chǎn)品形式被越來越多地認(rèn)為是大模型的進(jìn)化方向,是賦能各行各業(yè)的高效生產(chǎn)力工具。
通用大模型性能如何保障?如何架構(gòu)行業(yè)垂直大模型?AI Agent 落地前景?數(shù)智上海 2023 峰會上,最具代表性的產(chǎn)學(xué)一線嘉賓圍繞大模型演進(jìn)過程,帶來了前沿分享。
以「智能創(chuàng)新賦能產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型」為主題,數(shù)智上海 2023 峰會已圓滿落幕。其中,聚焦引領(lǐng)新一輪科技浪潮的關(guān)鍵 AI 技術(shù),峰會特別舉辦了「數(shù)智說」生成式人工智能創(chuàng)新應(yīng)用賦能千行百業(yè)論壇。
復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師,中國中文信息學(xué)會理事張奇,商湯科技副總裁張少霆,科大訊飛 AI 研究院副院長盛志超,創(chuàng)新奇智技術(shù)副總裁郭江亮等進(jìn)行了主題演講。圓桌環(huán)節(jié),達(dá)觀數(shù)據(jù)首席戰(zhàn)略官劉江賢主持,張奇、中科曙光智能計(jì)算產(chǎn)品部總經(jīng)理杜夏威、實(shí)在智能創(chuàng)始人、CEO 孫林君,瀾碼科技創(chuàng)始人、CEO 周健、上海人工智能產(chǎn)業(yè)基金投研合伙人劉經(jīng)國交流了觀點(diǎn)。
嘉賓們分享了生成式 AI 最新技術(shù)進(jìn)展,以及其在醫(yī)療、教育、工業(yè)等重要領(lǐng)域落地的關(guān)鍵經(jīng)驗(yàn),探討了 AI Agent 的落地前景。
復(fù)旦 NLP 實(shí)驗(yàn)室核心成員張奇
摒棄神化與擬人化大模型
ChatGPT 能夠高效生成更符合人類價(jià)值觀的內(nèi)容,背后的關(guān)鍵技術(shù)正是基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)。然而受限于實(shí)驗(yàn)設(shè)計(jì)困難、試錯(cuò)成本巨大等多重因素,RLHF 的穩(wěn)定訓(xùn)練仍然是一個(gè)難題。
復(fù)旦 NLP 團(tuán)隊(duì)今年發(fā)布多項(xiàng) RLHF 相關(guān)工作成果。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師,中國中文信息學(xué)會理事張奇結(jié)合最新研究成果帶來「AI 賦能百業(yè),大模型助力行業(yè)數(shù)智化升級」主題分享。
此次,張奇教授總結(jié)了 RLHF 大模型訓(xùn)練各階段關(guān)鍵問題。預(yù)訓(xùn)練階段,基礎(chǔ)大語言模型訓(xùn)練中的「工程秘密」大部分已經(jīng)公開,但仍需做好「預(yù)訓(xùn)練數(shù)據(jù)構(gòu)成和數(shù)量、預(yù)訓(xùn)練數(shù)據(jù)對模型各類任務(wù)效果影響、語言與知識的關(guān)系」等基礎(chǔ)問題研究,否則大模型訓(xùn)練仍是「煉丹」。指令微調(diào)階段,千億模型的 SFT 模型訓(xùn)練數(shù)據(jù)需求不到百萬量級,難點(diǎn)在于構(gòu)建高質(zhì)量訓(xùn)練語料。
OpenAI 此前公布的 InstructGPT 技術(shù)報(bào)告中將近端策略優(yōu)化(PPO)算法作為 RLHF 階段的強(qiáng)化學(xué)習(xí)算法,但未開源訓(xùn)練技術(shù)細(xì)節(jié)。FudanNLP 團(tuán)隊(duì)持續(xù)投入 RLHF 完整工作流程及 PPO 算法研究,確定了使得 PPO 算法在大模型人類對齊方面行之有效的關(guān)鍵因素,并進(jìn)一步總結(jié)出在大模型上訓(xùn)練更穩(wěn)定的 PPO-max 算法。張奇教授展示了 PPO-max 算法效果并表示近期會發(fā)布安全倫理相關(guān)報(bào)告。
「摒棄神化與擬人化大模型,它們只是統(tǒng)計(jì)學(xué)習(xí)的精彩舞者。」張奇教授認(rèn)為目前大模型表現(xiàn)還是可以在統(tǒng)計(jì)機(jī)器學(xué)習(xí)范疇下進(jìn)行解釋,仍是「匹配」而非「理解」。此外,現(xiàn)階段通用大語言模型直接落地產(chǎn)業(yè)存在一定困難,未來落地方向需要結(jié)合場景,「do something people want」,不只是寫詩、做論文,還應(yīng)助力行業(yè)提升生產(chǎn)力。
商湯科技副總裁張少霆
打造「商湯醫(yī)療大模型工廠」
隨著大模型開始進(jìn)入產(chǎn)業(yè)導(dǎo)入期,大模型的垂直領(lǐng)域應(yīng)用成為主線。從醫(yī)學(xué)科研、藥物研發(fā)、智慧診療到醫(yī)院管理等,產(chǎn)學(xué)研正聯(lián)手推動高質(zhì)量醫(yī)療領(lǐng)域基礎(chǔ)模型構(gòu)建及產(chǎn)品落地。AI 成為每個(gè)醫(yī)生的診療助手、每個(gè)人的健康助手的醫(yī)療場景新范式正在顯現(xiàn)。
商湯科技副總裁張少霆帶來了「基于 AI 大模型打造未來醫(yī)療場景新范式」主題演講。
人的疾病有幾萬種,存在大量長尾問題,大模型、基礎(chǔ)模型的能力會有助于快速開發(fā)醫(yī)療長尾問題解決方案。基于此,商湯在醫(yī)療領(lǐng)域進(jìn)行了豐富的大模型落地應(yīng)用探索。
商湯與行業(yè)伙伴合作,推出了醫(yī)療大語言模型、醫(yī)療影像大模型、生信大模型等多模態(tài)基礎(chǔ)模型群,覆蓋CT、MRI、超聲、內(nèi)鏡、病理、醫(yī)學(xué)文本、生信數(shù)據(jù)等廣泛醫(yī)療數(shù)據(jù)模態(tài)。借助商湯大裝置的超大算力和醫(yī)療基礎(chǔ)模型群的堅(jiān)實(shí)基礎(chǔ),商湯能夠化身「醫(yī)療大模型工廠」,幫助醫(yī)療機(jī)構(gòu)針對下游臨床任務(wù)高效訓(xùn)練模型。該模式突破了醫(yī)療長尾問題數(shù)據(jù)樣本少、標(biāo)注難度高的瓶頸,實(shí)現(xiàn)了針對不同任務(wù)的小樣本、弱標(biāo)注、高效率的訓(xùn)練,滿足不同醫(yī)療機(jī)構(gòu)個(gè)性化、多樣化的臨床診療需求。
在醫(yī)療多模態(tài)基礎(chǔ)模型群賦能下,商湯自主研發(fā)的SenseCare?智慧診療平臺搭載 20 余個(gè) AI 輔助診療模塊,可提供覆蓋全身多部位、多病種、多模態(tài)數(shù)據(jù)的 AI 輔助分析,賦能診-療-愈全流程。其中,SenseCare?肝臟智能手術(shù)規(guī)劃系統(tǒng)可以快速完成肝內(nèi)及腹部多器官的精準(zhǔn)三維重建,并支持多種切除術(shù)式智能規(guī)劃,將原先 1~2 小時(shí)的手術(shù)規(guī)劃時(shí)間縮短至 3~5 分鐘,大幅提升了術(shù)前規(guī)劃效率。該產(chǎn)品已落地瑞金、新華等醫(yī)院,為很多高難度手術(shù)提供了保障。
針對醫(yī)療大語言模型的應(yīng)用場景探索,商湯研發(fā)了醫(yī)療健康大語言模型「大醫(yī)」,內(nèi)嵌智能自診、診后隨訪管理、智慧病歷、影像報(bào)告結(jié)構(gòu)化等 13 個(gè)預(yù)設(shè)場景,可高效輔助醫(yī)生診療與患者服務(wù)?!复筢t(yī)」支持提示工程自定義、長程記憶存取和醫(yī)學(xué)知識庫查詢總結(jié)等個(gè)性化功能,可幫助醫(yī)療健康產(chǎn)業(yè)鏈上下游機(jī)構(gòu)打造專屬醫(yī)療健康大模型,推動行業(yè)全方位數(shù)智化轉(zhuǎn)型。目前「大醫(yī)」已落地鄭州大學(xué)第一附屬醫(yī)院、瑞金醫(yī)院、新華醫(yī)院等醫(yī)院,賦能用藥咨詢、患者服務(wù)、輔助決策等多元場景。
科大訊飛 AI 研究院副院長盛志超
共迎「認(rèn)知大模型+教育」大時(shí)代
認(rèn)知大模型的「智能涌現(xiàn)」將帶來解決人類剛需的全新機(jī)遇。改變信息分發(fā)獲取模式、革新內(nèi)容生產(chǎn)模式、全自然交互完成任務(wù)、實(shí)現(xiàn)專家級的虛擬助手、顛覆傳統(tǒng)手工編程方式、成為科研工作的加速器,這些大模型能力催生的變革正帶來多種教育場景的顛覆式創(chuàng)新。
科大訊飛 AI 研究院副院長盛志超分享了星火認(rèn)知大模型賦能教育的實(shí)踐探索。
ChatGPT 發(fā)布后,科大訊飛正式啟動「1+N」認(rèn)知大模型專項(xiàng)攻關(guān),其中「1」是通用認(rèn)知智能大模型,「N」是大模型在教育、辦公、汽車、人機(jī)交互等各個(gè)領(lǐng)域落地,目前一系列產(chǎn)品已經(jīng)實(shí)際應(yīng)用。
基于星火認(rèn)知大模型能力開發(fā)的多種應(yīng)用,已經(jīng)支撐了不同場景教學(xué)工作:
? 教學(xué)助手,星火教師助手應(yīng)用能夠輔助教案設(shè)計(jì)、習(xí)題情境改造、作文批改等;
? 學(xué)習(xí)助手,「訊飛語伴」面向各學(xué)段學(xué)生提供個(gè)性化口語陪伴老師,另外基于科普中國優(yōu)質(zhì)內(nèi)容資源構(gòu)建科普大模型;
? 編程助手,面向信息科技教學(xué)場景,輔助教師高效編程教學(xué),輔導(dǎo)學(xué)生自主編程與學(xué)習(xí)(Python);
? 心理輔導(dǎo)助手,構(gòu)建心理健康專有模型,具備多模態(tài)情感識別能力、共情表達(dá)能力、尋因式提問能力、個(gè)性化心理指導(dǎo)能力四大核心能力。
從實(shí)現(xiàn)效能提升、加速模式創(chuàng)新到支撐育人變革,大模型帶來了教育領(lǐng)域機(jī)遇,同時(shí)在專業(yè)性、教學(xué)秩序、協(xié)同素養(yǎng)提升等方面帶來挑戰(zhàn)。盛志超院長認(rèn)為,應(yīng)該以樂觀的態(tài)度看待大模型與教育結(jié)合帶來多種場景的顛覆式創(chuàng)新。
創(chuàng)新奇智技術(shù)副總裁郭江亮
為工業(yè)大模型落地提供全鏈路 AI 能力
大模型的出現(xiàn)給智能制造帶來廣闊想象空間,但是工業(yè)領(lǐng)域涉及全生產(chǎn)流程、供應(yīng)鏈各個(gè)環(huán)節(jié)以及 ERP、MES、PLC 等,提供端到端解決方案并非易事。
創(chuàng)新奇智技術(shù)副總裁郭江亮進(jìn)行了「大模型助力新型工業(yè)化:重構(gòu)工業(yè)生產(chǎn)力與生產(chǎn)關(guān)系」主題演講,分享了企業(yè)在工業(yè)大模型落地方面的前沿工作。
全面擁抱大模型技術(shù)是企業(yè)提升競爭力必由之路,而對于工業(yè)領(lǐng)域的企業(yè)來說,垂直大模型不需要唯參數(shù)論,大模型落地性價(jià)比是關(guān)鍵因素。通過更好地使用大模型技術(shù),以更低成本、更好產(chǎn)品,滿足工業(yè)領(lǐng)域里面中長尾、細(xì)小場景需求是當(dāng)務(wù)之急。
創(chuàng)新奇智推出的以 AInno-15B 為核心的「奇智孔明 AInnoGC 工業(yè)大模型」,建立在開源通用大模型基礎(chǔ)上,專注工業(yè)知識的生成、問答以及工業(yè)自動化任務(wù)的編排。從效果看,150 億模型參數(shù)是最優(yōu)效果,同時(shí)部署時(shí)對算力要求較低。
創(chuàng)新奇智構(gòu)建起由「MMOC 人工智能技術(shù)平臺」和「AInnoGC 工業(yè)大模型技術(shù)平臺」組成的技術(shù)雙塔布局。其中,MMOC 平臺提供傳統(tǒng) AI 能力,端到端支持 AI 解決方案創(chuàng)新、研發(fā)和交付,工業(yè)大模型支持文本、視覺、多模態(tài)內(nèi)容生成,驅(qū)動 AI 2.0 應(yīng)用和解決方案的開發(fā)與落地。
郭江亮表示,創(chuàng)新奇智將AI技術(shù)雙塔平臺化,組合研發(fā)打造解決方案,未來還將持續(xù)聚焦工業(yè)細(xì)分領(lǐng)域,助力打造更多專精特新企業(yè)。
產(chǎn)學(xué)投共論大模型下一站
AI Agent 會是大模型未來發(fā)展方向嗎?
受大語言模型浪潮推動,AI Agent 相關(guān)研究快速發(fā)展。兩者的區(qū)別在于,大模型與人類之間的交互是基于 prompt 實(shí)現(xiàn)的,用戶 prompt 是否清晰明確會影響大模型回答的效果;而僅需給定 AI Agent 一個(gè)目標(biāo),它就能夠針對目標(biāo)獨(dú)立思考并做出行動。因此,AI Agent 的產(chǎn)品形式被認(rèn)為將廣泛應(yīng)用于各行業(yè)組織數(shù)字化實(shí)體打造進(jìn)程。
AI Agent 會是大模型的未來發(fā)展方向嗎?以此為題,學(xué)術(shù)、產(chǎn)業(yè)、投資界多位嘉賓進(jìn)行了深入交流。
達(dá)觀數(shù)據(jù)首席戰(zhàn)略官劉江賢主持了本次對話,指出 Agent 不是一個(gè)科研的具象,而是一個(gè)落地應(yīng)用場景的具象,大模型發(fā)展不僅要從供給側(cè)發(fā)力,更要聽需求側(cè)真實(shí)聲音,「Agent 像是產(chǎn)、學(xué)、研之間交匯的基點(diǎn)」。
「我們堅(jiān)定地看好 Agent,并且認(rèn)為 Agent 會大爆發(fā)。2024 年會是 Agent 元年?!箤?shí)在智能創(chuàng)始人、CEO 孫林君認(rèn)為,首先,當(dāng)前處在從人工過渡到人機(jī)協(xié)同、再到機(jī)器完全自主完成的過程中,要對 Agent 有合理的預(yù)期,不能把 Agent 和 AGI 畫等號,認(rèn)為它無所不能,這是不符合實(shí)際的預(yù)期;其次,有針對性的進(jìn)行人機(jī)協(xié)同的產(chǎn)品設(shè)計(jì)才是現(xiàn)實(shí)思路,設(shè)計(jì)出來的產(chǎn)品才是高可用的,Agent 的實(shí)用性才會更強(qiáng)。
「Agent 未來落地,真正有話語權(quán)是那些業(yè)務(wù)場景的用戶?!怪锌剖锕庵悄苡?jì)算產(chǎn)品部總經(jīng)理杜夏威認(rèn)為,要從業(yè)務(wù)側(cè)出發(fā)看 Agent 的落地形式和方向,圍繞著業(yè)務(wù)需要的 Agent,判斷對模型規(guī)模、算力形式的需求。
當(dāng)前大多數(shù) RPA 廠商,都在以生成式 AI 補(bǔ)充 RPA 為中心的自動化流程,或者基于 AI Agent 重新構(gòu)建超自動化產(chǎn)品。張奇教授認(rèn)為這將是大模型 B 端落地的關(guān)鍵方式,傳統(tǒng) RPA 構(gòu)建業(yè)務(wù)流程自動化存在脆弱性,大語言模型的引入這意味著這些機(jī)器人不會停在新數(shù)據(jù)導(dǎo)致的「死胡同」,而是可以從錯(cuò)誤中「學(xué)習(xí)」并調(diào)整其一系列任務(wù)。
信息化是數(shù)字化的前提,數(shù)字化是數(shù)智化的前提。瀾碼科技創(chuàng)始人、CEO 周健認(rèn)為,AI Agent 落地過程首先要將專家知識通過各類信息系統(tǒng)實(shí)現(xiàn)數(shù)字化;其次是基于對話式UI,建立機(jī)器適應(yīng)人的新的人機(jī)交互模式;第三步則是通過這種新的交互模式,反復(fù)使用和打磨專家知識,最終實(shí)現(xiàn)領(lǐng)域知識的循環(huán)沉淀。
Agent 產(chǎn)品將會越來越多,未來將有望成為 AI 應(yīng)用層的基本架構(gòu),包括 to C、to B 產(chǎn)品等。上海人工智能產(chǎn)業(yè)基金投研合伙人劉經(jīng)國認(rèn)為,從投資角度看,國內(nèi) to B、垂類應(yīng)用仍是 AI Agent 容易率先落地的方向。
轉(zhuǎn)載請注明來自浙江中液機(jī)械設(shè)備有限公司 ,本文標(biāo)題:《數(shù)智上海 2023 峰會 | 通用、垂直、AI Agent,大模型是如何擁抱千行百業(yè)應(yīng)用場景的?》
還沒有評論,來說兩句吧...