• 
    <ul id="auswy"><sup id="auswy"></sup></ul>
  • <ul id="auswy"></ul>
    最新廣告
    關(guān)注中國自動化產(chǎn)業(yè)發(fā)展的先行者!
    工業(yè)智能邊緣計算2025年會
    CAIAC 2025
    2025工業(yè)安全大會
    OICT公益講堂
    當前位置:首頁 >> 資訊 >> 行業(yè)資訊

    資訊頻道

    “磐石·科學(xué)基礎(chǔ)大模型”推出新型“神經(jīng)-符號”融合規(guī)劃器
    • 點擊數(shù):147     發(fā)布時間:2025-08-08 19:25:31
    • 分享到:
    智能規(guī)劃技術(shù)是科學(xué)決策的重要手段,可以完成科學(xué)實驗方案規(guī)劃與評估等任務(wù),在醫(yī)療健康、生產(chǎn)調(diào)度、航空航天等諸多領(lǐng)域發(fā)揮關(guān)鍵的作用。然而,目前的智能規(guī)劃方法大多局限于單向推理,存在盲目性高、效率低等問題。近日,中國科學(xué)院自動化研究所“磐石·科學(xué)基礎(chǔ)大模型”研發(fā)團隊提出一種新型的“神經(jīng)-符號”融合規(guī)劃器,為神經(jīng)規(guī)劃系統(tǒng)和符號規(guī)劃系統(tǒng)的融合提供了統(tǒng)一和通用的框架。該智能規(guī)劃器已集成至“磐石·科學(xué)基礎(chǔ)大模型”。

    智能規(guī)劃技術(shù)是科學(xué)決策的重要手段,可以完成科學(xué)實驗方案規(guī)劃與評估等任務(wù),在醫(yī)療健康、生產(chǎn)調(diào)度、航空航天等諸多領(lǐng)域發(fā)揮關(guān)鍵的作用。然而,目前的智能規(guī)劃方法大多局限于單向推理,存在盲目性高、效率低等問題。近日,中國科學(xué)院自動化研究所“磐石·科學(xué)基礎(chǔ)大模型”研發(fā)團隊提出一種新型的“神經(jīng)-符號”融合規(guī)劃器,為神經(jīng)規(guī)劃系統(tǒng)和符號規(guī)劃系統(tǒng)的融合提供了統(tǒng)一和通用的框架。該智能規(guī)劃器已集成至“磐石·科學(xué)基礎(chǔ)大模型”。

    基于Knowledge of Result(KR)的閉環(huán)系統(tǒng)是人類運動學(xué)習的關(guān)鍵部分,可以幫助學(xué)習者糾正錯誤,向著目標方向?qū)崿F(xiàn)有效學(xué)習。 “神經(jīng)-符號”融合新型規(guī)劃器通過借鑒這一反饋閉環(huán)理念,構(gòu)建了一種閉環(huán)反饋的雙向規(guī)劃機制——KRCL(Knowledge-of-Results based Closed-Loop),正向神經(jīng)規(guī)劃器生成問題的動作序列與反向KR反饋機制構(gòu)成動態(tài)的錯誤檢測-糾正閉環(huán)。該機制通過有效利用信息的雙向傳遞和反饋來評估和調(diào)整動作,在規(guī)劃中研究以KR信息為中心的閉環(huán)規(guī)劃結(jié)構(gòu),實現(xiàn)準確的反饋以加強錯誤檢測和錯誤糾正,持續(xù)評估和調(diào)整規(guī)劃器的動作,從而促進規(guī)劃器的有效學(xué)習。此外,研發(fā)團隊構(gòu)建了一種規(guī)劃器與規(guī)劃識別器的新型融合模式,實現(xiàn)了神經(jīng)系統(tǒng)與符號系統(tǒng)之間的雙向連接,通過利用兩種范式的互補優(yōu)勢,在規(guī)劃中同時實現(xiàn)的有效學(xué)習和推理。其中,基于神經(jīng)系統(tǒng)的規(guī)劃器利用其強大的表示和學(xué)習能力生成規(guī)劃動作序列;而基于符號系統(tǒng)的規(guī)劃識別器作為反向機制,通過準確、可靠的推理來校正規(guī)劃結(jié)果,在規(guī)劃的過程中兼顧有效學(xué)習與推理能力。

    為進一步提升規(guī)劃效率并減少對反饋信息的依賴,研發(fā)團隊還提出了面向規(guī)劃的自我控制機制,從規(guī)劃問題難度和模型表現(xiàn)兩方面展開研究,讓反向規(guī)劃識別器只在正向規(guī)劃器“需要”的時候被激活,優(yōu)化正向規(guī)劃器接收反饋的頻率,減少雙向規(guī)劃器對反饋的依賴,進而提高模型的自主性和規(guī)劃效率。

    研究團隊在國際IPC(International Planning Competition)競賽的8個代表性規(guī)劃任務(wù)上系統(tǒng)評估了KRCL的性能,結(jié)果顯示,KRCL的平均覆蓋率顯著優(yōu)于其他對比規(guī)劃器,證明了提出的基于神經(jīng)-符號融合的雙向規(guī)劃器可以指導(dǎo)規(guī)劃器尋找正確的解決方案,精準有效地解決規(guī)劃任務(wù)。此外,還在用于評估大語言模型在規(guī)劃任務(wù)中表現(xiàn)的基準數(shù)據(jù)集(PlanBench)上對所提出的方法與大型語言模型o1在規(guī)劃任務(wù)中的性能進行了對比。實驗結(jié)果表明,所提出的KRCL在規(guī)劃覆蓋率和規(guī)劃效率方面均顯著優(yōu)于o1,進一步驗證了該方法在規(guī)劃任務(wù)中的優(yōu)勢。

    KRCL通過神經(jīng)和符號系統(tǒng)優(yōu)勢互補,能夠有效提升規(guī)劃性能。該新型規(guī)劃器利用其強大的閉環(huán)反饋機制、精準的推理校正能力以及高效的自主規(guī)劃特性,可為各類科學(xué)研究任務(wù)提供更可靠、更智能的規(guī)劃工具。

    17546523631.png

    圖1.?人類運動學(xué)習的“反饋閉環(huán)”與對應(yīng)的規(guī)劃問題

    17546523801.png

    圖2 “神經(jīng)-符號”融合新型規(guī)劃器架構(gòu)

    17546523901.png

    圖3.面向規(guī)劃問題的自我控制機制


    來源:中國科學(xué)院自動化研究所


    熱點新聞

    推薦產(chǎn)品

    x
    • 在線反饋
    1.我有以下需求:



    2.詳細的需求:
    姓名:
    單位:
    電話:
    郵件: