0%
第十六章 控制的未來 16.3 沒有實體的機器人

第十六章 控制的未來

16.3 沒有實體的機器人

難點在於人物動作的微妙之處。「我們拿起電話的方式會跟我們拿起一隻死耗子的方式不一樣,」斯特拉斯曼說,「我可以儲存不同的手部動作,但難辦的是不知道什麼東西支配著這些動作。掌管這些選擇的部門又是從哪裡冒出來的呢?」
格拉夫的工作室落戶在一間重新裝修過的倉庫里,很擁擠。在幾間燈光黯淡的大屋子裡,二十幾台巨大的顯示器閃爍不已。這是一個二十世紀九十年代的動畫工作室。計算機都是由矽谷圖形公司製造的強力圖形工作站,上面閃爍著項目不同階段的圖像,其中包括一個完全計算機化了的搖滾明星彼得·蓋布瑞爾的半身像。計算機對蓋布瑞爾的頭型以及臉部進行掃描和數字化,再拼接到虛擬的蓋布瑞上去,用來替代他在音樂錄影帶中的真身。這些事情能在錄音棚或者舞池裡就完成,誰還會費那個勁在攝像機面前跳舞呢?我看著一個動畫師擺弄這個虛擬明星。當時她正要通過拖動游標來提起蓋布瑞爾的下巴,好讓他的嘴巴合上。「糟了。」她發出一聲驚嘆,剛才她的動作稍微大了些,結果蓋布瑞爾的下嘴唇提得太高穿過了他的鼻子,扯成了一副難看的鬼臉。
那些試圖讓人工形象模擬人類動作的研究者們很快認識到那些製作兔八哥和豬小弟的動畫師們早就知道的事情:就動作而言,某些聯接順序會比其他聯接順序顯得更「自然」。當兔八哥伸手去拿胡蘿蔔的時候,它的手臂伸向胡蘿蔔的路徑更像人類的手臂運動(當然,兔八哥的行為不是模仿自兔子,而是人),並且與各個部位動作的前後時機也很有關係。一個動畫形象即使按照人類的正確順序來行動,如果它甩膀掀胯的相對速度跟https://read.99csw.com不上節奏,仍會顯得很機械。人類大腦能夠輕易地識別出這種贗品。所以說,時機的掌握是動作的又一個複雜面。
格拉夫和其他動畫師下一步想做的事情是:賦予莫西這樣的角色某些基本動作——起立、趴下、負重,這些基本動作可以組合成連貫逼真的活動。然後就可以應用到複雜的人類角色上去了。
斯特拉斯曼想用簡單易懂的英語來指導角色。你只要告訴它做什麼,它就會從「行為庫」里找到一組合適的素材,然後再按照恰當的次序把它們組成一個合理的動作。比如說,你告訴它站起來,它就會知道應該先把自己的腳從椅子下面移出來。「瞧,」斯特拉斯曼在演示開始前提醒我說,「這傢伙寫不了奏鳴曲,但它能坐在椅子上。」
當動畫師想讓莫西跳舞的時候,他就會戴上一頂黃色的頭盔。盔頂有一個用膠帶固定的小棍,小棍的末端是一個位置感測器。隨後,動畫師在肩膀和胯部也捆上感測器,然後再拎起兩個泡沫板裁成的巨型卡通手——其實是手套。他一邊跳舞一邊揮動這兩隻手——那上面也有位置感測器。於是,卡通狗莫西也在屏幕上它那個古怪的桃木屋裡亦步亦趨地舞起來。
計算機先是想了幾秒鐘,然後屏幕上的角色們就開演了。約翰皺起了眉毛,他遞書的那個動作非常僵硬;他攥緊了拳頭。瑪麗忽然站了起來。結束。沒什麼出彩的地方,他們的行動也不太像人的動作。要抓住那些轉瞬即逝的姿勢並不容易,因為他們的動作並不能引起觀眾的注意。看的人也沒什麼參與感,就只知道,在這個房間里有兩個人按照上帝設計的腳本互動了一下。
麻省理工學院媒體實驗室的戴維·塞爾徹帶著一幫研究生研發出了一種能夠在不平的地面上「自己」走動的粗線條形象。這些形象很簡單——一條線段做軀幹,四條線段是四條腿,連在軀幹上。學生們為這個「小活物」設定好一個方向,它就挪動步子,探明哪兒高哪兒低,並隨之調整自己步伐的長短,邁步前進。結果就生成了一個生物走過崎嶇地帶的逼真圖像。與我們看到的「嗶嗶鳥」動畫不同,在這個片子里,動物何時搬動哪條腿,不是由人來決定的。從某種意義上說,是這個角色自己作出了決定。塞爾徹團隊後來還在他們的世界里加入了六條腿的能自動行走的「小活物」,甚至還弄出了一個會到山谷里逛一圈再回來的兩腿生物。九_九_藏_書
「我這個導演很執著,」斯特拉斯曼說。「如果我不喜歡某個場景的效果,就讓他們再來一遍。」於是,他又輸入了一段替代劇情:「這一幕里,約翰覺得難過。他左手拿著書。他溫柔地把書遞給瑪麗,但她很有禮貌地拒絕了。」角色們按照這個劇本又演了一次。
斯特拉斯曼啟用了兩個角色,一個叫約翰,一個叫瑪麗。故事發生在一個普通房間里;視角是從天花板的某個傾角俯視的——這多少有點神之俯視的意味。斯特拉斯曼管這個叫做「桌面劇場」。這對夫婦在戲中時不時會發生口角。而斯特拉斯曼這次是要來一場兩人分手的戲。他是這麼輸入的:「這一幕里,約翰發火了。他很粗暴地把書遞給了瑪麗,但是她沒接。他把書摔在了桌子上。就在約翰瞪著瑪麗的當兒,瑪麗站了起來。」寫完他就按下了播放鍵。
當這隻奇大無比的鉻蟑螂在街上爬行時,它的行為是「自由的」。程序員告訴它「走過這片建築」,計算機里的虛擬蟑螂就會設法搞明白它的腿應該如何動作,它的軀幹應該轉動到什麼角度,然後煞有其事地扭動著爬過一座5層高的磚房。程序員給這隻大蟲子的只是行動的目標,而不是動作的指令。從樓上下來時,一股人工重力會對這個巨大的機器蟑螂形成一種牽引,讓它往下掉。當它掉下來的時候,模擬的重力和模擬的表面摩擦力會讓它的腿像在現實中那樣反彈和打滑。這隻蟑螂不需要它的導演們為它繁瑣的腿部動作傷腦筋就能把動作做九*九*藏*書好。
當然,造夢並不是那麼容易的事情。移動只是行動的一個方面。模擬生物除了移動之外,還必須尋找路線,表達情感,做出反應。為了創造出不僅僅會走路的生物,動畫師們(還有機器人研究者們)需要找出辦法來培育出所有類型的自然行為。
我去格拉夫的工作室是想見一見莫西:第一個完全計算機化的動畫人物。在顯示器上看,莫西看起來就像一隻卡通狗。他有一個大鼻子,一隻被啃了的耳朵,戴著白手套的手,還有「橡皮管」一樣的手臂。他還有非常滑稽的聲音。當時他的動作還沒畫好。這些動作是從一個人類演員的動作中提取出來的。在房間的一角,有一個自製的虛擬現實裝置「瓦爾多」。所謂瓦爾多(名字取自一個老科幻小說中的人物)是一種可以讓人遠距離操縱木偶的裝置。第一個以這種方式完成的計算機動畫是帶有試驗性質的《科米蛙》,它是用一個手掌大小的瓦爾多裝置畫出來的。而莫西則是一個擁有完整身體的虛擬角色,一個虛擬木偶。
人們正在嘗試更進一步的自主虛擬角色:提取出巨型蟑螂那自下而上的行為引擎,為它包裹上侏羅紀恐龍的迷人外殼,就得到了一個數字電影演員。給這個演員上緊發條,給它分配充足的計算機周期,再像指導真人演員那樣對它進行指導。程序員只要給它下達一些通用的指令——如「去找吃的」——它就會自己弄明白如何通過協調自己的肢體來完成指令。
在位於舊金山工業區的克洛薩爾圖像工作室,布萊·德·格拉夫正在進行仿造人類行為的工作。克洛薩爾是一個鮮為人知的特效工作室,很多著名電視動畫廣告的幕後都有它的身影。克洛薩爾還為MTV製作過名為《流動的電視》的先鋒動畫系列。這些動畫片由一些粗線條的形象——騎摩托的落魄布偶、栩栩如生的動畫剪紙以及壞小子癟四和豬腦等等——領銜主演。read.99csw.com
如果時間足夠充裕的話,今天的計算機勉強能進行人類動作的計算。但是,要想進行實時計算,就像你的身體在真實生活中那樣隨機應變,這種模擬幾乎是無法計算的。人體大概有200個運動點。這200個運動點所能做出的動作姿態其數量基本上是天文數字。單單是個摳鼻子的實時動作,所需要的計算量就已經超過了我們現在所擁有的大型計算機的能力。
在蘋果電腦公司的實驗室中,我曾經看到一位計算機圖形學專家翻來覆去地播放一段貓走路的錄像來分解它的動作。這盤錄像帶,以及一堆關於貓的四肢本能反射的科學論文,能夠幫助他提煉出貓走路的風格。然後他打算把這個風格植入到一個計算機化的虛擬貓里。而他的終極目標則是提取出某種具有普遍性的四足運動模式,在相應調整后可以用到狗、豹子、獅子或者隨便什麼東西上去。他根本不關心這些動物的外形;他的模型就是一些粗線條的形象。他關心的是如何組織複雜的腿、踝、腳部的動作。
塞爾徹和他的同事邁克爾·麥肯納從粗線條形象和檸檬頭那裡吸取了經驗,開始給六條腿的小生物添枝加葉,把它變成一隻邪惡的金屬鉻蟑螂,讓這個小昆蟲成為有史以來最古怪的一部計算機動畫片中的明星。他們開玩笑地把這部短片叫做「咧嘴笑的邪惡死神」。這部片子長五分鐘,主要講述了一隻來自外太九*九*藏*書空的金屬巨蟲入侵地球並摧毀了一座城市的故事。這個故事雖然無聊,但是故事的主角,那個六腿怪物,卻是世界上第一隻「小活物」——一隻內部驅動的人造動物。
莫西最擅長的把戲就是可以自動地對口型。把錄製好的語音輸入到一個演算法中,這個演算法可以計算出莫西的嘴唇應該怎麼動,然後牽動它們。工作室的高手總是讓莫西用別人的聲音說各種氣人的話。其實,讓莫西動起來的方法有很多。旋轉撥盤,敲命令,移動游標,甚至用演算法生成某種自主行為,都能讓莫西動起來。
創造人工動作的早期嘗試迫使工程師們對動物的行為進行研究。為了建造一個能夠在火星上漫遊的多腿車,研究者們對昆蟲進行了研究,其目的不是為了學會如何做出一條腿來,而是要搞清楚昆蟲是如何實時協調六條腿的動作。
塞爾徹的學生還組裝了一個能夠自己走路的卡通形象,叫「檸檬頭」。檸檬頭走起路來要比那些線條形象更真實也更複雜,因為它的行動需要更多的身體構件和關節支持。它可以非常逼真地繞過躺倒的樹榦之類的障礙。檸檬頭啟發了塞爾徹實驗室的另外一個學生史蒂文·斯特拉斯曼,他想試試在設計行為庫上到底能走多遠。基本的想法就是給檸檬頭這樣的通用角色提供一本收集有各種動作和姿勢的「剪貼簿」。想要擤鼻涕?行,這有一整張碟的動作可選。
而人類動作的複雜性還不僅僅於此,因為身體的每一個姿勢都可以通過多種不同的途徑來達到。當我把腳伸到鞋裡去的時候,我要通過小腿、腳以及腳趾的數百個動作的配合引導腿精確完成整個運動。事實上,我的四肢在走路時所完成的動作順序是如此地複雜,以至於有足夠的餘地允許用上百萬種不同的方式去完成它。通常,熟人在一百尺開外不用看我的臉就能把我認出來,完全是因為我走路時無意識地使用了慣用的腿部肌肉。模仿他人的動作組合是非常困難的。