亚洲日韩av无码中文,亚洲国产精彩中文乱码av,亚洲欧美中文日韩v在线观看

“磐石·科學(xué)基礎(chǔ)大模型”推出新型“神經(jīng)-符號(hào)”融合規(guī)劃器

點(diǎn)擊數(shù)：211 發(fā)布時(shí)間：2025-08-08 19:25:31
分享到：

智能規(guī)劃技術(shù)是科學(xué)決策的重要手段，可以完成科學(xué)實(shí)驗(yàn)方案規(guī)劃與評(píng)估等任務(wù)，在醫(yī)療健康、生產(chǎn)調(diào)度、航空航天等諸多領(lǐng)域發(fā)揮關(guān)鍵的作用。然而，目前的智能規(guī)劃方法大多局限于單向推理，存在盲目性高、效率低等問題。近日，中國科學(xué)院自動(dòng)化研究所“磐石·科學(xué)基礎(chǔ)大模型”研發(fā)團(tuán)隊(duì)提出一種新型的“神經(jīng)-符號(hào)”融合規(guī)劃器，為神經(jīng)規(guī)劃系統(tǒng)和符號(hào)規(guī)劃系統(tǒng)的融合提供了統(tǒng)一和通用的框架。該智能規(guī)劃器已集成至“磐石·科學(xué)基礎(chǔ)大模型”。

關(guān)鍵詞：神經(jīng)規(guī)劃系統(tǒng) , 智能規(guī)劃器 , 人類運(yùn)動(dòng)學(xué)習(xí)

基于Knowledge of Result（KR）的閉環(huán)系統(tǒng)是人類運(yùn)動(dòng)學(xué)習(xí)的關(guān)鍵部分，可以幫助學(xué)習(xí)者糾正錯(cuò)誤，向著目標(biāo)方向?qū)崿F(xiàn)有效學(xué)習(xí)。 “神經(jīng)-符號(hào)”融合新型規(guī)劃器通過借鑒這一反饋閉環(huán)理念，構(gòu)建了一種閉環(huán)反饋的雙向規(guī)劃機(jī)制——KRCL(Knowledge-of-Results based Closed-Loop)，正向神經(jīng)規(guī)劃器生成問題的動(dòng)作序列與反向KR反饋機(jī)制構(gòu)成動(dòng)態(tài)的錯(cuò)誤檢測-糾正閉環(huán)。該機(jī)制通過有效利用信息的雙向傳遞和反饋來評(píng)估和調(diào)整動(dòng)作，在規(guī)劃中研究以KR信息為中心的閉環(huán)規(guī)劃結(jié)構(gòu)，實(shí)現(xiàn)準(zhǔn)確的反饋以加強(qiáng)錯(cuò)誤檢測和錯(cuò)誤糾正，持續(xù)評(píng)估和調(diào)整規(guī)劃器的動(dòng)作，從而促進(jìn)規(guī)劃器的有效學(xué)習(xí)。此外，研發(fā)團(tuán)隊(duì)構(gòu)建了一種規(guī)劃器與規(guī)劃識(shí)別器的新型融合模式，實(shí)現(xiàn)了神經(jīng)系統(tǒng)與符號(hào)系統(tǒng)之間的雙向連接，通過利用兩種范式的互補(bǔ)優(yōu)勢，在規(guī)劃中同時(shí)實(shí)現(xiàn)的有效學(xué)習(xí)和推理。其中，基于神經(jīng)系統(tǒng)的規(guī)劃器利用其強(qiáng)大的表示和學(xué)習(xí)能力生成規(guī)劃動(dòng)作序列；而基于符號(hào)系統(tǒng)的規(guī)劃識(shí)別器作為反向機(jī)制，通過準(zhǔn)確、可靠的推理來校正規(guī)劃結(jié)果，在規(guī)劃的過程中兼顧有效學(xué)習(xí)與推理能力。

為進(jìn)一步提升規(guī)劃效率并減少對(duì)反饋信息的依賴，研發(fā)團(tuán)隊(duì)還提出了面向規(guī)劃的自我控制機(jī)制，從規(guī)劃問題難度和模型表現(xiàn)兩方面展開研究，讓反向規(guī)劃識(shí)別器只在正向規(guī)劃器“需要”的時(shí)候被激活，優(yōu)化正向規(guī)劃器接收反饋的頻率，減少雙向規(guī)劃器對(duì)反饋的依賴，進(jìn)而提高模型的自主性和規(guī)劃效率。

研究團(tuán)隊(duì)在國際IPC（International Planning Competition）競賽的8個(gè)代表性規(guī)劃任務(wù)上系統(tǒng)評(píng)估了KRCL的性能，結(jié)果顯示，KRCL的平均覆蓋率顯著優(yōu)于其他對(duì)比規(guī)劃器，證明了提出的基于神經(jīng)-符號(hào)融合的雙向規(guī)劃器可以指導(dǎo)規(guī)劃器尋找正確的解決方案，精準(zhǔn)有效地解決規(guī)劃任務(wù)。此外，還在用于評(píng)估大語言模型在規(guī)劃任務(wù)中表現(xiàn)的基準(zhǔn)數(shù)據(jù)集(PlanBench)上對(duì)所提出的方法與大型語言模型o1在規(guī)劃任務(wù)中的性能進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明，所提出的KRCL在規(guī)劃覆蓋率和規(guī)劃效率方面均顯著優(yōu)于o1，進(jìn)一步驗(yàn)證了該方法在規(guī)劃任務(wù)中的優(yōu)勢。

KRCL通過神經(jīng)和符號(hào)系統(tǒng)優(yōu)勢互補(bǔ)，能夠有效提升規(guī)劃性能。該新型規(guī)劃器利用其強(qiáng)大的閉環(huán)反饋機(jī)制、精準(zhǔn)的推理校正能力以及高效的自主規(guī)劃特性，可為各類科學(xué)研究任務(wù)提供更可靠、更智能的規(guī)劃工具。

圖1.?人類運(yùn)動(dòng)學(xué)習(xí)的“反饋閉環(huán)”與對(duì)應(yīng)的規(guī)劃問題

圖2 “神經(jīng)-符號(hào)”融合新型規(guī)劃器架構(gòu)

圖3.面向規(guī)劃問題的自我控制機(jī)制

來源：中國科學(xué)院自動(dòng)化研究所

1.我有以下需求：
得到貴公司產(chǎn)品詳細(xì)資料得到貴公司產(chǎn)品的價(jià)格信息貴公司產(chǎn)品銷售人員聯(lián)系我貴公司技術(shù)支持人員聯(lián)系我
2.詳細(xì)的需求：
*
姓名:	*
單位:
電話:	*
郵件:	*

技術(shù)頻道

行業(yè)頻道

熱門頻道

技術(shù)頻道

行業(yè)頻道

熱門頻道

資訊頻道

熱點(diǎn)新聞

推薦產(chǎn)品