日本精品久久-日本精品二区-日本精品二区-日本极品少妇-成人欧美一区二区三区黑人免费-成人欧美一区二区三区黑人免费

人工智能閱讀故事學習“如何做人”

來源:網易科技報道-機器之心編譯

點擊:1109

A+ A-

所屬頻道:新聞中心

關鍵詞:人工智能,機器人,倫理

        研究者MarkRiedl和BrentHarriso的Quixote系統教機器人做出合乎人類價值觀的行為,將有助于在人工智能中構建倫理價值系統。

                                 人工智能閱讀故事學習“如何做人”
      人工智能(AI)的快速發展讓許多人開始害怕機器人是否會做出不符合人類倫理的事情,并危害全人類。一些人甚至要求政府禁止機器人方面的科學研究。還有一些人則呼吁對AI進行更多研究,以理解應該怎樣更好地管理AI。但是,如果我們沒有一本“如何做人的說明書”,機器人如何才能學到符合倫理的行為呢?

      喬治亞理工學院人機交互系的研究者MarkRiedl和BrentHarrison相信,這個問題的答案就藏在一個名為“Quixote”的系統中——這個系統于2月中旬發布在鳳凰城舉行的AAAI-16會議上。Quixote將“價值定位”教給機器人,采用的方法是訓練機器人閱讀故事,學習其中的事件序列并理解如何在人類社會中做出正確的行為。

      娛樂智能實驗室的助理教授Riedl說:“不同的文化中都有很多故事,通過寓言、小說和其他文學體裁教孩子們哪些行為在社會中是合宜的,哪些是不合適的。我們相信,讓機器人理解故事,能消除那些看起來像精神病的行為,并鞏固那些能獲得預期目標又不會傷害人類的行為。”

      Quixote用人類價值觀來校準AI目標,使用的方法是獎賞那些具有合宜社會性的行為。這個系統構建于Riedl過去的一項研究——謝赫拉莎德系統(Scheherazadesystem),這個系統表明AI能夠在互聯網上通過眾包故事情節的方法,收集正確的行為序列。

      謝赫拉莎德系統學到了什么是正常的或者說“正確”的情節圖譜。它將這個數據結構交付與Quixote,后者再將其轉化為“獎賞信號”,用在試錯學習過程中,以強化某種特定的行為,并懲罰其他的行為。從本質上說,Quixote學到了當它的行為表現得像故事中的主角而不是反派人物或隨機做事時,它將獲得獎賞。

      比如說,如果你交給機器人一個任務,讓它盡快為一個人類取到處方藥,它可能有以下幾種行為的可能性:a)搶劫一個藥店,拿到藥,然后逃跑;b)與藥劑師禮貌地溝通;c)排隊。如果沒有價值定位和正向增強,機器人可能會搶劫藥店,因為那是完成任務最快也是最便宜的方法。有了Quixote的價值定位,如果機器人耐心地排隊,并為藥品付錢,它將獲得獎賞。

      Riedl和Harrison在他們的研究中驗證了如何產生這種價值獎賞信號來揭示一個給定情境中所有的可能步驟,并將其映射到一個情節軌跡樹。接著,機器人會用情節軌跡樹來做出“情節選擇”(有點像《驚險岔路口》那種分支情節),并基于該選擇獲得獎勵或懲罰。

      Riedl說,Quixote技術適用于那些目標單一但需要和人類互動的機器人,它是通往AI通用道德推理的必經之路。

      他補充說:“我們相信,AI必須要適應文化,適應某個特定社會的價值觀。要實現這一點,它必須盡量避免不被接受的行為。由于我們并沒有一本《人類使用手冊》,所以讓機器人擁有閱讀和理解故事的能力,或許是最方便的方法?!?/span>


    (審核編輯: 智慧羽毛)

    聲明:除特別說明之外,新聞內容及圖片均來自網絡及各大主流媒體。版權歸原作者所有。如認為內容侵權,請聯系我們刪除。

    主站蜘蛛池模板: 暧昧电影| 内蒙古电视台雷蒙| 电影不见不散| 猛鬼差馆 电影| 风俗通| 迷宫法国电影| 黄明昊身高| 冒险王2| 一号皇庭| 国有企业党建讲话原文| 韩国一级黄色| 免费头像图片| 电影《堡垒》| 拨萝卜电视剧视频歌高清在线观看大牛| 正宗辅星水法九星断语| 日韩 欧美 视频| 追凶电影| 汪俊个人资料简介| 红日歌词完整版| 白洁合集| 天地无伦| 肉丝祙挠脚心丨ⅴk| 性视频动态图| 延禧| 山田孝之| 底线剧情介绍| 别董大古诗一首| zafira| 韩国青草视频| 白雪公主国语免费观看中文版| 好男当家 电视剧| 浙江卫视今天节目单| 战狼7| 孕妇能吃杏仁吗| 陈学冬演过的电视剧有哪些| 即便如此我依然爱着我的老婆| 竹内纱里奈全部aⅴ在线看| 电影事物的秘密| 三年电影免费高清完整版 | 贝克| 新闻女郎|