原標題:兩位北大學生在人工智能國際頂級會議比賽中奪冠(引題)
【資料圖】
當人工智能的“老師”很難也很酷(主題)
中青報·中青網(wǎng)記者 畢若旭
凌晨4點,耿逸然和安博施的鬧鐘同時響起。一個小時后,第36屆神經(jīng)信息處理系統(tǒng)大會(NeurIPS 2022)即將開始,作為大會中MyoChallenge挑戰(zhàn)賽骰子重定向(Die Reorientation)賽道冠軍,這兩位來自北京大學信息科學技術學院2020級圖靈班的大三學生,即將迎來各自人生中首次在國際頂級會議上的亮相。
“還是很激動和緊張的?!?022年12月,該會議在美國舉辦。北京時間清晨5點,耿逸然和安博施線上參會,在15分鐘的全英文報告中,他們對參賽方案的完整闡釋,將來自世界各地的聽眾帶回2022年的夏天。
去年8月,兩人在導師的推薦下了解到,NeurIPS推出了一項比賽,要求參賽者設計一套人工智能算法,控制仿生靈巧手完成隨機的抓取、轉動骰子等任務,最終成功率最高、需要肌肉施加力最小的團隊獲勝。
賽事通知讓他們立即興奮起來。兩人的導師、北京大學人工智能研究院助理教授、北京通用人工智能研究院研究員楊耀東和計算機學院前沿計算研究中心助理教授董豪長期從事機械臂和靈巧手的人工智能與環(huán)境交互研究,在這幾位老師的指導下,耿逸然和安博施也一直在學習,如何在這一領域成為訓練人工智能的“優(yōu)秀教師”。此外,他們在匯集頂級人工智能專家的北京通用人工智能研究院長期與許多優(yōu)秀研究員共同工作,積累了很多寶貴經(jīng)驗。用國際頂級人工智能會議的大賽檢驗自己,既是絕佳的練兵機會,也是展示學習所得的機會。
比賽發(fā)令槍響,耿逸然和安博施的“全速奔跑”開始了。和他們一起合作的,還有同樣來自北京通用人工智能研究院的大學生鐘伊凡、吉嘉銘、陳源培等。盡管他們對機械臂的人工智能控制已經(jīng)相對熟悉,但這次比賽中要面對的,是一只截然不同的“虛擬仿生手”。在電腦屏幕上的模擬器中,這只手“有血有肉”,銀灰色的手部骨骼外,覆蓋著由紅色線條表示的一束束肌肉,如同真正的手一樣,各個關節(jié)和每條肌肉密切聯(lián)動,“牽一發(fā)而動全身”,和常見的只能控制每個獨立關節(jié)的實體機械手相比,復雜程度多了不是一點半點。
花了大約一周時間熟悉仿生靈巧手的關節(jié)與肌肉之間的關系后,他們開始制訂培訓這位人工智能“學生”的方案。抓取、轉動骰子,對仿生手來說相當復雜,他們就將動作拆解,如同體操教練教學員完成一套復雜的轉體、曲體組合動作時,先教各個分解動作,再進一步完成動作組合。如同水族館表演的海豚,通過獎勵塑造,人工智能在完成目標動作時,一個相當于小魚的獎勵函數(shù)會對它進行“激勵”,以促進其更好地“學習”。
這些聽起來簡單的操作,背后是無數(shù)爭分奪秒的努力。電腦隨身攜帶,耿逸然有時就趁著上課前的10分鐘,打開電腦修改代碼。每天面對黑色屏幕上一行行白色字母組成的代碼難免枯燥,但早上醒來打開頭天晚上訓練的模型,一個好的實驗結果足以讓人雀躍。“這個過程就像開盲盒。”安博施介紹,研發(fā)的過程沒有正確答案,一切都是摸著石頭過河,“前一天訓練了10個模型,第二天跑完數(shù)據(jù)可能有8個結果一般、1個不好、還有1個非常好。每天都很期待,會有更多好的結果?!?/p>
憑著長期打下的基礎和比賽期間的用心,第一次上傳參賽代碼,他們就高居首位,隨著之后不斷調整方案,也一直處于領先。但就在接近比賽截止日期的一個凌晨4點,從睡夢中醒來的耿逸然突然發(fā)現(xiàn),有其他參賽者的成績超過了他們。他一下就清醒了,套上衣服就沖進隔壁宿舍,搖醒了安博施。兩個眼睛還沒睜開的人大腦已經(jīng)無比清醒,迅速沖出宿舍,沖進實驗室,緊鑼密鼓地開始調整方案。
10月末,比賽截止。在之后公布的結果中,在全球10多個國家的40個參賽隊伍提交的340余份有效方案中,他們的方案位居榜首。
在2022年末的學術會議召開前,耿逸然和安博施分工合作,為了他們共同的第一次英文學術報告反復推敲,擬定表述方式、寫下逐字稿、互相給對方試講,一直磨到凌晨3點。兩個小時后,他們的報告結束,一位來自瑞士的教授向安博施發(fā)出邀約:“你們的講述非常好,希望你可以考慮申請我的博士項目?!?/p>
2023年年初,兩位搭檔了一年多的伙伴再次合作,以共同第一作者的身份,在2023年國際機器人與自動化大會(ICRA 2023)中,發(fā)表研究論文《基于端到端可操作性學習的機器人操縱框架》。“論文里介紹了我們探索出的機械臂抓取物件的方法。”比起參加比賽,日常的學術研究需要更加深入的方法探索,通過他們開發(fā)的這套方法,機械臂可以通過作用域物體的關鍵點,如柜子的拉手、鍋蓋的抓手等,實現(xiàn)拉開柜門、提起鍋蓋等操作。
但比賽的過程也對他們啟發(fā)頗多?!爸坝X得讓靈巧手轉動一個骰子很簡單,但這次比賽中使用的仿生靈巧手模擬了真實的骨骼和肌肉關系,我們發(fā)現(xiàn)動物的日常動作遠比機械精細的多,且不說大腦,動物小腦中就不知有多少我們還沒發(fā)現(xiàn)的秘密。”他們知道,想讓人工智能實現(xiàn)更精細的功能,一代代計算機人還有很長的路要走。
來源:中國青年報
作者:畢若旭
責任編輯:馮崢
標簽:
- 當人工智能的“老師”很難也很酷
- 最新資訊:基因組分析進一步揭示飲酒和彌漫性胃癌的關聯(lián)
- 【科技前沿】我科學家研究發(fā)現(xiàn)火災對全球變暖具有顯著影響_環(huán)球熱消息
- 中國太保首個養(yǎng)老產(chǎn)業(yè)輕資產(chǎn)定點合作項目落地
- 天天熱門:大家保險設立50億元健康養(yǎng)老私募股權投資基金
- 益陽醫(yī)專附屬醫(yī)院獲全省教學查房比賽一等獎
- 視點!北京銀保監(jiān)局局長李明肖:持續(xù)推進糾紛源頭治理
- 讓老年人乘車的優(yōu)待不再等待
- 安徽來安:多措并舉 扎實推進就業(yè)創(chuàng)業(yè)工作-世界熱文
- 天天速看:提振消費信心“護航”消費者權益 郵儲銀行瀘州市分行積極組織開展“3.15”消費者權益保護教育宣傳周活動
- SHY48成員尚官起訴絲芭 3月22日將于上海開庭|全球聚焦
- 黨建引領筑誠信環(huán)境 服務為民振消費信心
- 建行邯鄲分行送金融知識進校園 每日快報
- 中國二冶生物醫(yī)藥產(chǎn)業(yè)園項目組織青年志愿者開展反電信詐騙宣傳志愿服務活動 環(huán)球今亮點
- 建行邯鄲分行開展消費者權益保護教育宣傳活動
- 玫瑰書香滿庭芳 巾幗奮進新征程——中國二冶西南分公司召開女職工閱讀分享會-全球微頭條
- 車輛養(yǎng)路費是什么意思?京a牌照意味著什么?
- 怎么查詢自選車牌號有沒有被注冊?交通違章1208代碼是什么意思?
- 成都單行道逆行扣多少分?機動車違反禁令標志指示的意思是什么?
- 【漫威】漫威所有系列資源合集
- p9壞事做盡!
- 廣州C4D培訓機構(附C4D培訓排名)
- 3d建模培訓多少錢?(附建模培訓排名)
- 加拿大取消對中國入境旅客新冠檢測要求 每日熱訊
- 成品油或迎年內(nèi)“第二跌” 原油暴跌扭轉調價預期-世界簡訊
- 國家稅務總局曝光:個人未辦理兩年個稅匯算補稅及罰金近10萬
- 美軍公布美俄撞機視頻,美高級官員:絕對證實”發(fā)生了物理碰撞和燃料傾倒
- 上海黃浦江邊有2處官方認證釣魚點 網(wǎng)友:垂釣點非常搶手
- 天天熱文:別讓放大的“育兒焦慮”蔓延了
- 考研不是目的 上生活的岸才是
- 1 當人工智能的“老師”很難也很酷
- 2 最新資訊:基因組分析進一步揭示飲酒和彌漫性胃癌的關聯(lián)
- 3 【科技前沿】我科學家研究發(fā)現(xiàn)火災對全球變暖具有顯著影響_環(huán)球熱消息
- 4 中國太保首個養(yǎng)老產(chǎn)業(yè)輕資產(chǎn)定點合作項目落地
- 5 天天熱門:大家保險設立50億元健康養(yǎng)老私募股權投資基金
- 6 視點!北京銀保監(jiān)局局長李明肖:持續(xù)推進糾紛源頭治理
- 7 SHY48成員尚官起訴絲芭 3月22日將于上海開庭|全球聚焦
- 8 【漫威】漫威所有系列資源合集
- 9 p9壞事做盡!
- 10 廣州C4D培訓機構(附C4D培訓排名)