更新時間:2018年06月12日 12744瀏覽
今日新華社發布了媒體大腦2.0“MAGIC”智能生產平臺,其名有兩層含義,除了魔法的音譯,還源于“MGC”(機器生產內容)和“AI”(人工智能)的組合。
該平臺由媒體人工智能公司「新華智云」獨立研發,此次上線后將首次用于俄羅斯足球世界杯的報道中。預計整個賽事周期中,可根據內容生產的主題、標簽定義,根據賽事信息每天生產1萬條短視頻新聞內容(最大產能)。
新華智云成立于2017年6月,由新華社和阿里巴巴合資成立,啟動資金達10億元。
借此次發布,36氪采訪到了新華智云聯席CEO傅丕毅、徐常亮,就以下幾點問題進行了探討:
1、媒體大腦可以智能生成稿件么?它能為內容生產者提供哪些服務?
2、媒體大腦從1.0到2.0,有哪些技術、功能提升?
3、有哪些前沿科技作支撐?
傅丕毅向36氪表示,新華社一直在探索媒體和前沿科技的結合點,新華智云就像探索無人區的先頭兵,“我們要看看,AI能帶領媒體走向什么新的邊界”。在傅丕毅眼中,MGC是要幫助內容生產者占有、高效調用更多的新聞資源(包括新聞事件本身,以及事件相關信息的篩選,此前類似事件的影響及分析等),幫助內容創作者足夠高效地定向產出視頻、音頻、圖片、文字等形式的價值新聞。
新華智云團隊認為,AI時代內容生產基礎設施將以大數據處理技術、智能算法技術和人機協作技術為核心,包括智能數據工坊、智能媒資平臺、智能生產引擎、智能主題集市等四大智能系統:
智能數據工坊,即大數據處理平臺,將新聞內容數據化,對大數據進行清晰和結構化,方便后續的數據抓取。
智能媒資平臺,把結構化的數據進行顆粒化,切分成小單元存儲起來,形成資源平臺。以世界杯為例,一場球賽的實況視頻內容,將被切分為進球、傳球、帶球過人等多組鏡頭,進行標簽化存儲。
智能生產引擎,主要功能是從媒資庫調取內容、渲染、配音合成出一條視頻內容,根據內容生產者的主題需求,將涉及到的所有關鍵要素,從智能媒資平臺中抽取出來,按照動因關系、調度邏輯等,進行順序排列。
基于k8s,智能生產功能的服務性和擴展性從1.0到2.0有了不小的提升,目前最大可調度節點有2千多個,形象得來說就是,一條3分鐘的短視頻,自動生成時間不會超過20秒,且MAGIC平臺目前能同時生產1萬條作品。
智能主題集市,更前端的一項產品,供內容生產者下任務、定制短視頻。據徐常亮介紹,借助阿里云的彈性支持,媒體大腦從1.0到2.0算力擴大了幾個數量級,當初只能處理10路視頻,現在可同時處理2千個視頻。
關于背后的一些技術實現,徐常亮向36氪介紹,經過一年多的產品研發,通過不斷的訓練機器進行視頻追蹤、深度學習、視頻工程的二維三維映射,以及知識圖譜的構建,目前MAGIC在命名實體識別(NER)的時候,CRF(隨機場算法)做到93-94%準確率、基于深度學習的融合算法做到97%的準確率。
也正是基于這些技術實現,才能夠能夠準確識別球隊、球員、射門等動作和指令,當你在前端網頁輸入“梅西進球集錦”、“巴西隊點球破門”字樣,系統才能準確的從媒資庫中抓取對應信息,按照一定順序將片段化的數據合成為一條渲染過的、有配樂、有解說的短視頻,而且產出速度足夠快、可承載并行運算量足夠大。
新華智云表示,媒體大腦平臺已入駐了十余家官方媒體,部分定制化功能需要付費使用,但2.0的MAGIC現階段將提供給內容生產者免費使用。
此外,從此次發布的視頻來看,僅有拖著彗星長尾的行動軌跡,及人體骨骼動圖,對于大眾對「AI+球賽解讀」的預期而言還有很大差距。新華智云表示此次發布媒體大腦2.0僅僅是推開了視頻新聞智能生產的一道門,此后怎么疊加對視頻內容的抓取分析緯度,以及添加特效、優化內容質感等方面還有很大提升空間。
團隊方面,現在共有150余人,其中90%左右是技術人員。聯席CEO傅丕毅,高級記者,前新華社浙江分社副總編輯,采訪報道過汶川地震、吳英案等一系列新聞事件,80余篇稿件受到中央領導批示,產生重大影響。
聯席CEO徐常亮,阿里巴巴大數據平臺ODPS(即MaxCompute)、機器學習平臺PAI創始人,阿里云大數據業務第一任總經理,一站式大數據開發平臺——數加平臺第一任掌門人。曾在紐約時報負責新聞標簽化與搜索。