
大數據讀劇本:技術還是藝術?
美劇《紙牌屋》的成功,讓人們看到了科技參與藝術創作中的可能性。利用“大數據”對影視劇進行“全身CT”,亦成為現實。
通過人工智能讀取、拆解影視劇文本,再根據大數據比對進行劇本評價,由計算機為人“打分”。從浩如煙海的劇本中找到優秀作品并投入創作,也許將成為未來影視劇創作的必由之路。
專訪
“大數據”,是近年來的科技熱詞,為數不少的領域都將其作為技術發展的突破口;影視作品創作,則一向被視為人類情感與創意的結晶。將兩者結合碰撞出的火花,既新奇又絢麗。
用“大數據”審視人類創作,其背后的機制如何?科技“理性派”能給藝術創作帶來什么?帶著這些問題,本報專訪了北京工商大學經濟學院統計與數量經濟系副教授、小土科技創始人兼CEO祝金甫。
“電視劇每集包含6個轉折最能吸引觀眾”
記者:讓計算機去分析劇本,首先需要它能讀懂劇本。那么程序是怎么理解劇本中的轉折、沖突?
祝金甫:首先,將劇本導入計算機后,程序會自動分析其中的文字并分解成不同的元素。再將這些元素進行分析、比對,就能讓計算機去理解劇本。
例如劇情中的拐點、轉折,一定是伴隨著某一個事件。就好比劇本中之前還是大晴天,突然開始下暴雪,那這其中就包含一個轉折;再比如前面是一對恩愛的夫婦牽著手走著,突然發生了車禍,那這里就蘊含著一個巨大的轉折。我們的計算機可以通過比對文本中的文字去計算。
與此同時,這還有個程度問題。比如車禍,可能涉及到角色的死亡,也可能就是受傷,到劇情里就是轉折的大與小。這都需要去判斷,其背后也就是計算機的語義分析技術。通過語義分析,我們還能分析劇本中人物的情緒。例如恐懼,涉及的詞匯可能有流汗、顫抖等等。
讓計算機能夠準確地理解含義,需要我們收集大量的詞義,創建一個庫。這個工作需要很長時間,我們已經做了七八年的時間。目前,對于劇本的整個分析過程還做不到全自動化,計算機只能承擔大約50%的工作,隨著計算機技術的不斷發展,我相信這個比例也會逐漸增大。
記者:計算機對劇本的量化評分,需要基于一定的標準,這個標準又從何而來?
祝金甫:這也是通過大數據分析得出來的結果,此前我們收集了大量優秀的作品,對這些作品進行分析,從而得出一些共性的東西。例如電視劇每集四十多分鐘,包含6個轉折最能吸引觀眾。通過這些標準我們再分析新的劇本,得出綜合的評分,目前來看,我們的評分也是很準的。高分的劇本拍出來后,收視率和好評率都有一定的保障。
記者:目前國外也有基于大數據分析進行影視劇創作的先例,利用大數據評估劇本和定制劇本有什么區別?
祝金甫:兩者之間還是有很大的區別,我們的評估方式,是找到優秀劇本的共性,對劇本進行一個客觀的評估。有點像給你的劇本做CT,再根據統一客觀的標準進行評價。
國外一些案例則是收集用戶喜好的行為數據,例如什么題材用戶最愛看,最喜歡哪個明星,碰到什么劇情就快進。通過這些數據,再來投其所好,選擇用戶偏好的題材、演員乃至導演進行創作。
“70%的規定動作大數據來做,剩下的30%要靠人的創作”
記者:用硬標準給藝術創作打分,必然帶來一種質疑。這樣的評價機制,是否會讓劇本的創作僵化,難道以后每集電視劇都要包括6個轉折?
祝金甫:曾經有編劇就問過我,如果大家都這樣去做,不是所有作品都一樣了?
首先,影視作品也是一件商品,它必須吸引觀眾的眼球。那么能吸引眼球的,一定會有一些共性。因為人有其自身偏好特點,一個作品,連續6分鐘對話沒有沖突,那觀眾就是看不下去。一個故事包含人物地點時間,缺一個就不行,這些是結構化的。但這個沖突是什么,故事如何鋪墊,每個劇本都是不一樣的,這是計算機做不到的。
用計算機來評價劇本,是給出一個意見。比如你這一集里只有3個轉折,我們會建議你加幾個,但加什么還是編劇的創作。我相信這會是未來影視工業化的一個趨勢,比如和做體操一樣,70%的規定動作大數據來做,剩下的30%是自選動作,要靠人的創作。真正的大師級作品,一定是人在這30%里賦予獨特的思想和靈魂創作出來的。
記者:這樣的技術是否會影響創作者的積極性,甚至反感此類技術?
祝金甫:之前確實有很多這樣的擔心,但現實恰恰相反。絕大多數創作者,把作品視為自己的孩子,他當然希望孩子會更好。那我們這種第三方的評價方法,起到一個旁觀者清的作用,我們提意見,創作者再完善作品,會讓作品更好、更受歡迎。
主筆 吳楠 插圖 宋溪