近日,西安電子科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院沈玉龍教授團(tuán)隊(duì)在密碼大模型方面取得突破性進(jìn)展。研究成果以“玄知大模型”命名在西部網(wǎng)絡(luò)安全大會(huì)上正式發(fā)布。

2025年8月15日,第四屆西部網(wǎng)絡(luò)安全大會(huì)在陜西周至召開。西安電子科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院沈玉龍教授團(tuán)隊(duì)發(fā)布了一款全球首個(gè)面向密碼學(xué)領(lǐng)域的大語(yǔ)言模型——玄知大模型(CryptoLLM)。該模型的發(fā)布標(biāo)志著密碼學(xué)進(jìn)入智能化發(fā)展新階段,為密碼算法分析、協(xié)議設(shè)計(jì)與工程實(shí)現(xiàn)提供了全流程的智能支持,開啟密碼學(xué)AI應(yīng)用新紀(jì)元。

大會(huì)現(xiàn)場(chǎng)(西安電子科技大學(xué)供圖)

玄知大模型由西電NSS實(shí)驗(yàn)室沈玉龍教授團(tuán)隊(duì)研發(fā),基于國(guó)產(chǎn)開源大模型構(gòu)建,融合超百億級(jí)密碼學(xué)專業(yè)數(shù)據(jù)與分階段精調(diào)策略,在三大關(guān)鍵能力上實(shí)現(xiàn)突破:密碼算法智能分析:自動(dòng)識(shí)別算法缺陷,輔助安全性驗(yàn)證與漏洞定位;密碼協(xié)議智能設(shè)計(jì):支持協(xié)議設(shè)計(jì)與安全推理,提升協(xié)議生成效率與質(zhì)量;密碼工程高效實(shí)現(xiàn):實(shí)現(xiàn)密碼庫(kù)集成、自動(dòng)代碼生成及部署優(yōu)化。

當(dāng)前,全球密碼技術(shù)競(jìng)爭(zhēng)已上升至國(guó)家戰(zhàn)略博弈層級(jí),直接關(guān)乎國(guó)家安全、科技話語(yǔ)權(quán)乃至未來(lái)國(guó)際秩序重塑。掌握密碼核心技術(shù),即掌握數(shù)字時(shí)代的主導(dǎo)權(quán)。傳統(tǒng)研究范式已難以應(yīng)對(duì)快速演進(jìn)的安全威脅。

西安電子科技大學(xué)作為我國(guó)密碼學(xué)研究的發(fā)源地,擁有軍外唯一國(guó)家級(jí)密碼學(xué)重點(diǎn)學(xué)科,被譽(yù)為“密碼學(xué)黃埔軍校”,為國(guó)家培養(yǎng)大批頂尖人才。傳承先輩使命,西電NSS團(tuán)隊(duì)以玄知大模型為支點(diǎn),肩負(fù)起智能時(shí)代密碼學(xué)創(chuàng)新的歷史責(zé)任,推動(dòng)密碼技術(shù)從“護(hù)衛(wèi)國(guó)家安全”向“賦能數(shù)字文明”跨越。

發(fā)布現(xiàn)場(chǎng)(西安電子科技大學(xué)供圖)

為打造玄知大模型的核心競(jìng)爭(zhēng)力,團(tuán)隊(duì)組建超百人專項(xiàng)數(shù)據(jù)工程組,歷時(shí)6個(gè)月攻堅(jiān),建成規(guī)模達(dá)50Btokens的垂直領(lǐng)域知識(shí)池——全面覆蓋密碼學(xué)權(quán)威著作、頂會(huì)論文、開源協(xié)議庫(kù)、算法代碼庫(kù)及技術(shù)博客等多元高價(jià)值數(shù)據(jù)源。

團(tuán)隊(duì)自主研發(fā)全棧式數(shù)據(jù)處理平臺(tái),實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的深度結(jié)構(gòu)化解析:論文智能解析系統(tǒng):精準(zhǔn)提取公式、圖表及算法描述語(yǔ)義,突破非結(jié)構(gòu)化數(shù)據(jù)處理瓶頸;代碼知識(shí)蒸餾引擎:自動(dòng)構(gòu)建調(diào)用鏈拓?fù),完成安全關(guān)鍵點(diǎn)的形式化驗(yàn)證; 跨模態(tài)語(yǔ)義對(duì)齊:實(shí)現(xiàn)文本、代碼、數(shù)學(xué)符號(hào)的聯(lián)合表征建模。

基于此構(gòu)建的千萬(wàn)級(jí)精標(biāo)指令數(shù)據(jù)集,通過(guò)雙輪人工校驗(yàn)機(jī)制,確保指令集兼具場(chǎng)景覆蓋廣度與專業(yè)認(rèn)知深度,為模型訓(xùn)練提供高價(jià)值知識(shí)基座。

在模型訓(xùn)練中,基于國(guó)產(chǎn)開源千問(wèn)2.5通用模型,采用了分階段微調(diào)策略。該策略通過(guò)四個(gè)遞進(jìn)階段:沉淀行業(yè)知識(shí)、淬煉行業(yè)技能、對(duì)話交互增強(qiáng)、強(qiáng)化人類偏好,全面提升了模型在密碼學(xué)領(lǐng)域的通用能力基礎(chǔ),并在特定密碼任務(wù)上達(dá)到專家級(jí)水平。最終模型不僅能精準(zhǔn)解析密碼學(xué)專業(yè)語(yǔ)言,更能進(jìn)行類人推理、設(shè)計(jì)與優(yōu)化,為密碼學(xué)領(lǐng)域提供強(qiáng)大的智能解決方案。

西安電子科技大學(xué)同步發(fā)布全球首個(gè)密碼學(xué)專業(yè)測(cè)評(píng)基準(zhǔn)CryptoBench,填補(bǔ)領(lǐng)域空白。該基準(zhǔn)覆蓋密碼算法/協(xié)議/工程三大板塊、12個(gè)核心方向、74個(gè)細(xì)分領(lǐng)域,包含10,000+道精編題目,實(shí)現(xiàn)能力邊界精準(zhǔn)探測(cè)。建立版本迭代流程,持續(xù)適配密碼技術(shù)演進(jìn)需求。

在權(quán)威測(cè)評(píng)基準(zhǔn)CryptoBench的全面評(píng)估中,玄知大模型(CryptoLLM)展現(xiàn)出全球領(lǐng)先的密碼學(xué)專業(yè)能力:其綜合性能超越當(dāng)前最優(yōu)模型GPT-4o達(dá)8.8%,并在密碼算法分析(+8.6%)、協(xié)議設(shè)計(jì)(+6.8%)、工程實(shí)現(xiàn)(+5.1%)三大核心維度全面領(lǐng)先GPT-4o、Claude4.0、Gemini2.5等國(guó)際頂尖產(chǎn)品。

在對(duì)稱加密、安全模型證明等12個(gè)細(xì)分方向中的11項(xiàng)顯著優(yōu)于國(guó)際競(jìng)品。值得注意的是,該成果基于僅32B參數(shù)的國(guó)產(chǎn)基座模型實(shí)現(xiàn),驗(yàn)證了專領(lǐng)域深度定制,能夠帶來(lái)小領(lǐng)域中質(zhì)的飛躍。

玄知大模型聚焦密碼工程實(shí)際應(yīng)用,面向產(chǎn)業(yè)界提供開放API與SDK工具包,顯著降低密碼技術(shù)應(yīng)用門檻。模型已支持在安全多方計(jì)算、隱私計(jì)算等核心領(lǐng)域廣泛應(yīng)用。(西安電子科技大學(xué)供稿)

編輯:蘇睿楠
更多精彩資訊請(qǐng)?jiān)趹?yīng)用市場(chǎng)下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時(shí)報(bào)料熱線400-800-0088;消費(fèi)者也可通過(guò)央廣網(wǎng)“啄木鳥消費(fèi)者投訴平臺(tái)”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請(qǐng)聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責(zé)任。
長(zhǎng)按二維碼
關(guān)注精彩內(nèi)容