10月15日,由中國電子信息行業(yè)聯(lián)合會主辦的第27屆中國國際軟件博覽會在鄭州舉辦。百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜分享了大模型時代AI基礎平臺驅動軟件生態(tài)帶來的新變化。她表示,大模型的爆發(fā)將人工智能推向一個新的高潮。

百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜
在開幕式暨主題峰會環(huán)節(jié),吳甜表示,大模型具有效果好、泛化性強、研發(fā)流程標準化等特點,正引領人工智能的發(fā)展。在這一階段,AI研發(fā)范式帶來了開發(fā)、計算、部署的新挑戰(zhàn),尤其是大模型的高效訓練和推理部署,需要軟硬件協(xié)同發(fā)力。
她進一步講到,大模型高效訓練的關鍵要素包括訓練吞吐、訓練有效時間和收斂效率,這背后涉及框架、芯片、集群、算法等軟硬件不同組合的協(xié)同優(yōu)化。對大模型的推理部署來說,效果無損、低時延高吞吐、成本效益等要素極為關鍵,需要模型壓縮與量化、并行推理、軟硬件協(xié)同優(yōu)化等技術的支持。
要解決大模型研發(fā)所帶來的一系列挑戰(zhàn),深度學習平臺關鍵需要具備大規(guī)模并行計算、高性能推理部署、全流程工程化三方面能力。以百度飛槳為例,作為百度自研的產(chǎn)業(yè)級深度學習開源開放平臺,飛槳從核心框架、基礎模型庫,到端到端開發(fā)套件、工具與組件,以及星河社區(qū)等,全方位支持了文心大模型的演進過程。飛槳在核心框架和芯片之間構建了硬件適配層,打造多硬件統(tǒng)一適配方案,已適配60多款系列芯片,相比PyTorch,芯片基礎適配的接口數(shù)減少56%,代碼量減少80%。
在深度學習平臺與大模型聯(lián)合優(yōu)化下,文心大模型的能力得到了拓展、效率得到了提升,ERNIE-4.5-300B-A47B模型上實現(xiàn)預訓練MFU達47%, ERNIE-4.5-300B-A47B模型在TPOT 50ms時延條件下,實現(xiàn)了輸入57K tokens/秒、輸出29K tokens/秒的高吞吐性能。文心思考模型X1.1相比上個版本,事實性提升34.8%,指令遵循提升12.5%,智能體提升9.6%。
大模型與深度學習平臺為科技創(chuàng)新和產(chǎn)業(yè)升級構筑了堅實的AI基礎技術底座平臺,但最終在各行各業(yè)廣泛應用起來,應用生態(tài)建設至關重要。
百度進行了模型及相應配套工具的開源。文心大模型4.5系列已開源11款模型,涵蓋47B、3B激活參數(shù)的混合專家(MoE)模型,與0.3B參數(shù)的稠密型模型,配套開源了文心大模型開發(fā)套件ERNIEKit、大模型高效部署套件FastDeploy,方便開發(fā)者在此基礎上實現(xiàn)高效的模型開發(fā)和部署,進而在更廣泛的行業(yè)加速AI的落地應用。
星河社區(qū)為開發(fā)者提供全方位服務,已上線700萬個實踐項目,600多門公開課以及400多場AI競賽。開發(fā)者也在應用中反過來推動AI基礎技術平臺的完善。目前,飛槳框架貢獻者俱樂部成員達到195位,飛槳開發(fā)者技術專家411位,全球各地開發(fā)者自主建立運營的飛槳領航團超過400個。
在文心大模型和飛槳深度學習平臺的基礎上,百度在上海、廣州、武漢、南京、寧波、廈門、南昌、無錫等多地落地產(chǎn)業(yè)賦能中心、數(shù)據(jù)生態(tài)中心和教育創(chuàng)新中心,加快區(qū)域產(chǎn)業(yè)智能化升級。例如,在制造行業(yè),中車集團依托百度飛槳產(chǎn)業(yè)級深度學習平臺以及飛槳科學計算 PaddleCFD 套件,創(chuàng)新性地構建了空氣動力學智能化仿真大模型,整體仿真效率提升30倍以上。在能源行業(yè),國家電網(wǎng)聯(lián)合百度打造的人工智能基礎設施,讓安全巡檢效率提升了36倍。在通信行業(yè),中國聯(lián)通推出的智能中心AI平臺,助力1.3萬座基站安全作業(yè)。
公開資料顯示,截至2025年9月,飛槳文心生態(tài)開發(fā)者已達到2333萬,服務企業(yè)達到76萬家。