• 
    <ul id="auswy"><sup id="auswy"></sup></ul>
  • <ul id="auswy"></ul>
    最新廣告
    關(guān)注中國自動化產(chǎn)業(yè)發(fā)展的先行者!
    工業(yè)智能邊緣計算2025年會
    CAIAC 2025
    2025工業(yè)安全大會
    OICT公益講堂
    當(dāng)前位置:首頁 >> 資訊 >> 行業(yè)資訊

    資訊頻道

    AI 3.0,走向“大數(shù)據(jù)”與“大知識”融合的全新時代
    • 作者:清華大學(xué)計算機系副教授 智源青年科學(xué)家 劉知遠
    • 點擊數(shù):4873     發(fā)布時間:2021-04-18 18:53:00
    • 分享到:
    4月17日下午,湛廬特別邀請圣塔菲研究所客座教授、《AI 3.0》一書作者梅拉妮·米歇爾,中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點實驗室主任王飛躍,馭勢科技聯(lián)合創(chuàng)始人、董事長兼CEO吳甘沙,清華大學(xué)計算機系副教授、智源青年科學(xué)家劉知遠等國內(nèi)外知名科學(xué)家和創(chuàng)業(yè)者,以及特別嘉賓達闥云端機器人小姜,一起探討AI 3.0時代的新商機和新生態(tài)。
    關(guān)鍵詞:

    4月17日下午,湛廬特別邀請圣塔菲研究所客座教授、《AI 3.0》一書作者梅拉妮·米歇爾,中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點實驗室主任王飛躍,馭勢科技聯(lián)合創(chuàng)始人、董事長兼CEO吳甘沙,清華大學(xué)計算機系副教授、智源青年科學(xué)家劉知遠等國內(nèi)外知名科學(xué)家和創(chuàng)業(yè)者,以及特別嘉賓達闥云端機器人小姜,一起探討AI 3.0時代的新商機和新生態(tài)。

    image1619490585778875.png

    這次全智能場景發(fā)布會第一次采用了演播室和戶外智能場景雙現(xiàn)場形式,在無人駕駛汽車和云端智能機器人的烘托下,全面展示了中國人工智能領(lǐng)域的創(chuàng)新實力和前沿進展。幾位科學(xué)家、企業(yè)家跨界深度交流,共同探討了人工智能發(fā)展現(xiàn)狀,以及透視當(dāng)下AI發(fā)展的關(guān)鍵問題,并對產(chǎn)業(yè)布局和政策提出了可供參考的建議,助力未來的想象與開創(chuàng)。

    以下為清華大學(xué)計算機系副教授、智源青年科學(xué)家劉知遠的演講精華內(nèi)容

    劉知遠.png

    清華大學(xué)計算機系副教授 智源青年科學(xué)家 劉知遠 

    《AI 3.0》的作者米歇爾教授通過深入淺出的方式,把人工智能的發(fā)展歷程,特別是其內(nèi)在的技術(shù)路線的邏輯呈現(xiàn)給了大家,并提出了人工智能未來發(fā)展將會面臨的一些非常重要的命題,以及無人駕駛、自然語言處理等人工智能非常重要的應(yīng)用場景。我相信從技術(shù)路線的發(fā)展上來講,未來會有更多探索的可能性。我相信這是所有學(xué)者都在追尋的問題。

    1.png

    AI 3.0,一個“大數(shù)據(jù)”和“大知識”融合的時代 

    說到“AI 3.0”,那么必然存在“AI 1.0”和“AI 2.0”。人工智能學(xué)者有一個重要共識,那就是人工智能的發(fā)展已經(jīng)歷了兩個非常重要的階段:從“小數(shù)據(jù)”(small data)到“大數(shù)據(jù)”(big data),再到“智慧數(shù)據(jù)”(smart data)的過程。從語言理解這個層面,我認(rèn)為人工智能的發(fā)展基本上也可以劃分成三個階段。

    第一個階段,自然語言處理最初是從機器翻譯開始的。最開始,我們通過人為地編寫一些翻譯的規(guī)則,再配一個詞典,以實現(xiàn)機器翻譯。這個階段對應(yīng)“AI 1.0”。

    后來,人們發(fā)現(xiàn)這個做法不可行,因為人類的語言千變?nèi)f化,我們很難通過一套人工編寫的規(guī)則來覆蓋所有情形。到了20世紀(jì)90年代,有人提出用機器學(xué)習(xí)方法,通過大規(guī)模的數(shù)據(jù),讓人工智能自動學(xué)習(xí)翻譯的規(guī)則。隨后,人們進一步使用神經(jīng)網(wǎng)絡(luò)來挖掘每個詞背后的深層語義信息,以實現(xiàn)對整句話的理解。這是第二個階段,它對應(yīng)的是“AI2.0”。

    從自然語言處理這個角度來講,人工智能在這一階段已經(jīng)達到一個新的高峰。我們在智源研究院的支持下做的“悟道”模型——超大規(guī)模的預(yù)訓(xùn)練模型,就是想要用互聯(lián)網(wǎng)級別的大規(guī)模的文本數(shù)據(jù)來學(xué)習(xí)各種語言的語言模型。

    那么,是不是數(shù)據(jù)越多、模型越大其語言理解能力就越強?這就要提到人工智能第三個階段“AI 3.0”,我認(rèn)為答案是否定的。到第三個階段一定會有一個更新的框架,人工智能應(yīng)該能夠從大數(shù)據(jù)里學(xué)到更好地反映人類對這個世界認(rèn)知相關(guān)知識的能力,這類似于我們外在有一個世界模型,它一定不是像現(xiàn)在的神經(jīng)網(wǎng)絡(luò),而是應(yīng)該有知識體系、層次結(jié)構(gòu),至于它具體是什么樣的,從我的角度來看未來應(yīng)該是要把大數(shù)據(jù)和“大知識”(big knowledge)結(jié)合,即從AI 1.0階段的符號人工智能路線升級到第三階段的AI 3.0,充分對人類的知識進行建模,從而支持各種各樣的包括自然語言處理在內(nèi)的人工智能應(yīng)用。 

    多模態(tài),人工智能認(rèn)知世界的全新形式 

    人類的認(rèn)知其實是多模態(tài)的,有視覺的、聽覺的、語言的等,因此我們希望計算機在認(rèn)識世界時也是多模態(tài)的。

    米歇爾教授在《AI 3.0》中也提到了,在自動駕駛方面,人工智能領(lǐng)域正越來越多地討論關(guān)于賦予機器常識的重要性,人工智能對于語言、圖像的理解需要各種各樣的包括抽象能力、類比能力、常識在內(nèi)的復(fù)雜知識的支持。未來的人工智能需要像人一樣,構(gòu)建出關(guān)于這個世界的全面的認(rèn)知體系,這是非常重要的。

    最近這兩三年在自然語言處理以及在計算機視覺領(lǐng)域有一個非常重要的趨勢,那就是如何讓互聯(lián)網(wǎng)上的大規(guī)模的文本、圖像、視頻等數(shù)據(jù)為我所用,讓計算機能夠自動從中學(xué)習(xí)我們的語言、視覺識別的相關(guān)知識。其實這幾年我們在這方面取得了一個非常重大的突破——預(yù)訓(xùn)練模型,也就是說我們不需要再去人為標(biāo)注任何數(shù)據(jù)了,我們可以直接讓模型從大規(guī)模的數(shù)據(jù)里進行自動學(xué)習(xí),因此,我們稱之為自監(jiān)督的學(xué)習(xí)。

    同時,我們希望利用數(shù)據(jù)驅(qū)動的方法從數(shù)據(jù)中獲取更多的關(guān)于語言理解的知識,其實這就是from data to knowledge(從數(shù)據(jù)到知識)。不過,我認(rèn)為現(xiàn)在的這種“data追問”的方法實際上無法比較好地還原我們?nèi)祟悓@個世界的認(rèn)知模型,包括抽象層次的結(jié)構(gòu)、復(fù)雜的關(guān)系,不同類型的知識等。然而,現(xiàn)在的訓(xùn)練模型的確可以通過大規(guī)模的數(shù)據(jù)習(xí)得生成流暢語言的能力,這說明它其實已經(jīng)學(xué)到了很多關(guān)于語言的知識,比如語法的規(guī)則等,互聯(lián)網(wǎng)上的語言文本的數(shù)據(jù),可以看成是我們大腦中語言能力的外在體現(xiàn)。所以,在我看來“data追問”的方法一定是未來的一個非常重要的需要繼續(xù)堅持的路徑。

    當(dāng)然,我們同時也要充分借鑒AI1.0時代人類知識的構(gòu)建模式,比如我們對于類比、隱喻、抽象學(xué)習(xí)這樣一些相關(guān)能力的先驗的認(rèn)識——元認(rèn)知或元知識,我們要把這兩者結(jié)合起來。也就是說我們可能會有一些底層的從數(shù)據(jù)中心獲得的比較具體的“知識”,我們可能還會有一些“大腦”,我們要把這兩者結(jié)合起來,由這些“大腦”指導(dǎo)我們的學(xué)習(xí)過程,進而得到一個更類似于人類學(xué)習(xí)能力的語言學(xué)習(xí)模型,這是我認(rèn)為的未來自然語言處理的一個重要的發(fā)展路徑。

    “悟道1.0”是智源發(fā)布的一個最初版本,我們希望其能夠不斷演化,在各大高校和研究機構(gòu)的支持下,利用大數(shù)據(jù)、大算力以及學(xué)生們的聰明才智,一起推動這個領(lǐng)域的發(fā)展。 

    重構(gòu)人類的知識平臺,人工智能的未來使命 

    在我看來,未來的計算機一定能夠更好地服務(wù)于我們和我們社會,比如在人的生老病死、衣食住行等各個方面肯定都能發(fā)揮很重要的作用。

    我主要是從事自然語言處理,具體來說是知識圖譜方面的研究,我認(rèn)為整個人類社會的發(fā)展其實是不斷積累我們認(rèn)識世界、改造世界的知識的過程,但其實就我們現(xiàn)在的社會來說,每個人的分工、知識體系其實都是高度專業(yè)化的,而且會越來越專業(yè)化。

    每個人其實都只是整個人類知識的拼圖里很小的一塊,而且這一塊可能會越來越小,因為整個拼圖其實變得越來越大了,這時,對于人類社會來說,認(rèn)識世界、改造世界會變得越來越難。那么,隨著拼圖越來越大,我們到底該如何學(xué)才能更高效地把通識教育學(xué)習(xí)得更好,這是我們應(yīng)該思考的問題。比如,對于生物學(xué)家或者醫(yī)生而言,他會面臨一些挑戰(zhàn),從去年新冠疫情出現(xiàn)至今,關(guān)于新冠病毒的論文已經(jīng)有幾萬篇了,那么對于從事這個領(lǐng)域研究的學(xué)者來說,他應(yīng)該如何讀這么多論文,其實本身我覺得對于學(xué)者來講,或者說對于人類社會的每個人來講,他想要再去創(chuàng)造新的知識就會變得越來越難,因為他所需的積累會變得越來越多。

    所以,我認(rèn)為人工智能未來的一個非常大的使命,就是幫助人類把這個平臺構(gòu)建起來,使其成為我們的一個外部知識庫,這樣一來,我們只需掌握如何去利用這個知識庫,就可以更好地認(rèn)識世界、改造世界。 

    每個人都能夠借助人工智能,走向一個更高的地方 

    米歇爾教授在書中最后提到了6個問題,其中計算機能夠具有創(chuàng)造性嗎?我們距離創(chuàng)建通用的人類水平人工智能還有多遠?都是非常關(guān)鍵的問題,需要我們不斷地去探索并找到答案。

    20世紀(jì)五六十年代的學(xué)者在面向未來時,他們也不知道該如何走,他們各自提出了一些技術(shù)路線,然后不斷得以演化,這也是一個跌宕起伏的展過程。雖然人工智能至今只有近70年的歷史,但其發(fā)展歷程可謂波瀾壯闊,經(jīng)歷過高峰,也經(jīng)歷過低谷。這一發(fā)展歷程正體現(xiàn)了一代又一代的人工智能學(xué)者的不懈探索。

    說到人工智能的發(fā)展,它源于很多領(lǐng)域?qū)<业墓餐Γ热鐢?shù)學(xué)家、控制論的專家、計算機專家以及腦科學(xué)家和神經(jīng)科學(xué)家等。所以,人工智能其實是一個交叉學(xué)科,其中甚至包含一些哲學(xué)、倫理學(xué)方面的研究。

    因此,未來人工智能的發(fā)展需要摒棄“人工智能就是一門獨立的學(xué)科”這種觀念,我們需要綜合多學(xué)科的努力才能推動這個領(lǐng)域的發(fā)展。那么,在人才培養(yǎng)上,我們應(yīng)該重視培養(yǎng)交叉學(xué)科的能力和專業(yè)素養(yǎng),這是人工智能跟其他的學(xué)科發(fā)展的不同之處。

    每個人都在不斷地探索這個世界、獲取新的知識,但是這些知識可能都是散落在各處的,我希望未來的人工智能像粘合劑一樣,把這些知識拼出一個人類認(rèn)識這個世界的途徑,使得每個人都能借助人工智能,走向一個更高的地方。

    熱點新聞

    推薦產(chǎn)品

    x
    • 在線反饋
    1.我有以下需求:



    2.詳細(xì)的需求:
    姓名:
    單位:
    電話:
    郵件: