TechWeb報道12月25日消息,李開復曾經在新書《人工智能》分享會上談及寫稿機器人,他說,“不僅僅是重復性的工作會被取代,很多白領工作也將在10年內被取代。”其中就包括人。 日前,今日頭條人工智能實驗室憑借“互聯網信息摘要與機器寫稿關鍵技術及應用”項目榮獲吳文俊人工智能技術發明。“吳文俊人工智能科學技術”被譽為“中國智能科學科技最高”,代表中國人工智能學界的重大突破與最高榮譽。 評委方認為,今日頭條該項目在以下方面取得了較大突破:一是發明了多文檔摘要自動提取方法;二是設計了一種全新的圖注意力神經網絡生成模型,實現文本新聞概括和摘要生成;三是發明了跨語言摘要方法,實現了英文文本新聞的中文摘要生成;四是通過融合體育領域知識進行智能語句篩選,可實現高質量長篇新聞報道的實時生成。 基于相關,該項目發表國際的ACM/IEEE Trans.期刊和CCF A類長文40篇,獲得ACL2017杰出論文,申請發明專利22項。 據悉,該項已于去年以頭條號xiaomingbot的形式在今日頭條上線,至今已創作超過兩萬篇文章。在里約奧運會期間,今日頭條自動寫新聞機器人xiaomingbot創作200余篇賽事報道,累計獲得200W用戶閱讀。其撰寫速度與電視直播同步,文章內容涵蓋比賽時間、實時比分、運動員信息等主要新聞要素,并且可以自動完成插圖。 奧運會后xiaomingbot還在持續撰寫NBA、CBA、中超、意甲等體育賽事的文章,包括很多場冷門比賽,xiaomingbot也均有報道。根據今日頭條統計,xiaomingbot文章的閱讀率與人類創作者基本持平。 近期,xiaomingbot已完成最新一輪升級,除體育新聞,xiaomingbot撰寫的文章現已涵蓋科技、財經、房產等十幾個分類,并可實現多領域每日熱點新聞的自動創作。據記者了解,xiaomingbot已與網、《財經》(博客,微博)、大河報等主流達成戰略合作,向其進行優質內容輸出。 據了解,機器寫稿與信息摘要背后的核心技術是自然語言處理,同時會涉及機器學習、數據挖掘、深度學習、知識圖譜等多項技術。自然語言處理是人工智能領域難度最大的課題之一。相對于語音和視覺來說,語言是高度抽象化的表現。一方面,人類語言具有復雜性,同一句話可能代表不同含義。另一方面,正確理解人類語言還要有足夠的背景知識,比如對成語和歇后語的理解。這些都是自然語言理解進一步發展需要克服的難題。 今日頭條人工智能實驗室總監李磊博士表示,xiaomingbot的意義在于,一方面能夠更大程度的滿足長尾的資訊獲取需求,另一方面,一些消息類報道使用機器人寫作,能使記者從疲于奔命式的搶新聞中出來,對事件背后的新聞線索進行深入挖掘和性地思考。(周小白) 中證公告快遞及時披露上市公司公告,提供公告版面信息,權威的“中證十條”新聞,對重大上市公司公告進行解讀。
|