近日,“大語言模型離人類語言有多遠:新一輪科技創新與產業革命的風口”學術研討會在我校云龍校區順利召開。本次論壇由我校語言能力省部共建協同創新中心主辦,語言能力省部共建協同創新中心機器語言能力平臺、語言科學與藝術學院、江蘇省重點培育智庫語言能力高等研究院、江蘇省人工智能學會自然語言處理專委會承辦。來自清華大學、北京大學、中國人民大學、復旦大學、武漢大學、百度、科大訊飛、出門問問等數十家高校、科研機構和企業界的近百名專家學者和業界人士參加了本次論壇。
副校長婁崢嶸主持大會開幕式。副校長商亮致歡迎辭,向與會嘉賓介紹語言能力協同創新中心的學科發展情況。江蘇省教育廳科學技術與產業處副處長徐寧出席會議并致辭,高度評價了語言能力協同創新中心在加強基礎研究提供政策依據、推普脫貧攻堅和服務社會發展等方面的代表性作用。教育部高等學校中國語言文學教學指導委員會副主任委員、北京語言大學原校長劉利代表教指委致辭時表示,江蘇師范大學語言學學科已成為我國新文科建設的突出代表。
與會專家圍繞大語言模型的成長及功能、大語言模型與腦科學的互動、人與機器語言理解的比較分析、人工智能技術與智慧教育、語言加工認知機制的計算建模研究等議題展開深入討論,共開展了19場特邀報告。在與會專家的報告中,大語言模型與人類語言的比較分析成為熱議的話題。
教育部長江學者特聘教授、我校語言能力協同創新中心主任楊亦鳴教授指出,以ChatGPT為代表的大語言模型的出現是人類科技發展史上的重大突破,它開啟了全球第四次科技革命——“智能化”的浪潮。百度公司技術委員會主席吳華研究員介紹了百度公司的知識增強大語言模型“文心一言”,并就大模型能力和應用范式進行了探討??拼笥嶏w副總裁汪張龍研究員展示的科大訊飛星火認知智能模型在賦能智能語言學習全場景表現出色,開啟了智能語言學習新時代。出門問問副總裁李維博士介紹了該公司的一站式AIGC產品矩陣,剖析了大語言模型的本性及內容創作新范式。這些國內頂尖科技公司的生成式人工智能大模型在邏輯思考、數學證明、智能編程、文檔問答與摘要、圖表生成、圖片理解等領域展現出驚人的天賦與優良的性能,受到與會專家的高度好評。
清華大學人工智能研究院常務副院長孫茂松教授展示了大語言模型在具備一定規模之后涌現出的類似于數學符號推導的推理“創新”能力,他認為語言生成模型之所以具有強大的生成能力,其深刻內因在于它使用了向量語言,進而可實現“萬物皆向量”。北京大學計算語言學研究所副所長詹衛東教授、浙江大學生物醫學工程與儀器科學學院研究員丁鼐教授、我校語言科學與藝術學院吳燕京教授、北京師范大學認知神經科學與學習國家重點實驗室丁國盛教授等專家學者就這一話題進行了深入研討,認為人類有著天賦的語言機制,這一機制有許多大語言模型無法模擬的方面。
楊亦鳴教授指出,大語言模型的語言“創新”與人類語言的創新存在本質區別。大語言模型是將人類加工過的語言及其衍生品(文本、圖片等)轉化為數字信息并依據同現概率等統計信息進行進一步處理的,大語言模型涌現能力的呈現依然受人類的影響。北京外國語大學王克非教授、武漢大學趙世舉教授等也指出,正是由于大語言模型與人類語言存在本質不同,過度依賴大數據和云計算也造成了,如能源消耗過高,數據資源即將耗盡,價值觀、道德觀的偏離等問題。
最后,與會專家們對大語言模型的未來發展進行了展望。中國科學院院士、清華大學人工智能研究院院長張鈸教授指出,大語言模型的未來發展路徑之一是擴展多模態,擴大模型規模,研究與發展GPT語言,但其生成式方法的局限性決定了大語言模型并不適用于確定性答案、邏輯推理等語言應用領域,需要研究者另辟蹊徑。楊亦鳴教授指出,人腦“預裝”的語言機制是大語言模型難以超越人類語言的根本原因,應當從分子、細胞、行為、功能層面開展全方位的語言腦機制研究,破譯人腦語言加工之謎,以此建構可以“預裝”的“語言腦”,可能是我國人工智能發展的一條創新路徑。
本次會議聚集了多學科領域的頂級專家共同聚焦當前科技前沿,激發出更多關于大語言模型發展方向創新思路的想法,為更好的把握科技創新和產業革命的風口、推動大語言模型與人類語言更進一步開風氣之先,具有重要的現實意義,受到人民日報、光明日報、新華日報、中國教育電視臺等多家媒體的關注與報道。
![]() |
![]() |