好久沒寫blog了,人們的惰性堅強,尤其我又更擅長這點。這幾年都習慣用facebook,其 實那只是影音版的BBS罷了,哪天如果有了smart phone又可以直接錄影音貼到牆上的話我大概就會忘了怎麼打中文了吧。是說自從去年去了一趟IRCAM,並在巴黎待了8個月後,總算覺得有比較了解自己在做什麼研究了。對於一個已經博六人的人而言我的成長似乎太慢了點,不過前置的天賦沒有先點滿時怎麼點到下一層呢?
上週末中研院楊奕軒博士邀請西班牙Pompeu Fabra大學Music Technology Group的指導教授Xavier Serra來台並開了個Workshop,與大家一起分享研究。 就跟偶像一樣,Xavier一直是我想見面的名人之一,做Audio這塊領域的人應該都知道他的代表作是Sinusoidal Modeling,他當時在Stanford CCRMA跟的老師是師Julius Smith (日後有機會再聊他老人家,第一次出國參加會議時有遇過他,可惜沒機會與他交談)。另外,阿宅界也許不知道非常有名的大宇宙歌姬天使「初音ミク」的爸爸就是Xavier,因為現行YAMAHA公司出的語音合成技術就是與MTG合作產生的。
這次與會的團隊裡面除了有我們尖叫實驗室跟中研院外,還有清大張智星教授與台大鄭士康教授,大家分享的研究內容都十分有趣,不過最精彩也最令我意外的,反而是最後一個多小時的自由討論時間。大家討論的話題不是誰誰誰研究做得怎樣,而是未來Audio這塊研究的出路會是什麼。Xavier認為台灣可能跟歐洲一樣,要開公司並不容易,不像在美國,多的是人在學術界錢賺的是業界的例子 (聽說美國大學還滿鼓勵這麼做的,在台灣做這種事是會被學界排擠的)。舉例來說,最近的成功例子就是Julius先前的華人學生Ge Wang,在我博一博二時他帶了一群人在CCRMA開發了一套on-the-fly programming tool叫CHUCK, 這系統做到純熟後就開始在CCRMA開課推廣。最後,Ge Wang「不意外」的跟其他多數CCRMA學生一樣,一篇journal paper都沒有就博士畢業。之後他到 Princeton U.任職一段時間,那邊可是有個很喜歡玩音樂/音效訊號的Perry Cook大師, 在這段期間Ge Wang做了一些奇怪樂器搬到校園裡給大家玩 (Princeton Laptop Orchestra, PLOrk, youtube上很多影片),我猜Smule就是這時候成型的,因為後來他便開始在MacOS的所有智慧型裝置上開發Smule這個APP並開了公司。張智星教授有分享到說他過去曾有兩年的期間密切與業者合作,不過他的經驗是常常需要花費非常多時間在tune code,業界與學界間的認知差異難免會有。再者,Xavier也提到,過去做Audio的人出來只要會寫dsp就有工作了,但現在都拉到 APP 層在做,實作門檻降低,不過我自己是覺得這樣比較好,因為做效果器雖然很賺但用的人就樂手,做成 APP 讓更多人玩的好處就是可以開發人們新的需求。
另一個比較重要的消息是,MIREX比賽經費只到今年為止 ,從明年開始就呈現沒人贊助的情況,接下來這個比賽該何去何從?難道要停辦嗎?Xavier很坦白的說這個比賽因為是目前做Music Information Retrieval (MIR)領域中最重要的比賽,很多研究人員因這比賽而獲得利益 (知名度/經費/升等),但他認為有些項目的資料庫還不夠完整,如此將無法客觀呈現演算法好壞;另一方面,「何謂正確答案」這件事也是個課題,例如Audio Melody Extraction這項目來說,某些音樂類型的「旋律」是不明確的。 張智星教授提倡可以讓世界各地的 team 輪流主辦,有點像international workshop那樣,資料庫與人員的支出就由主辦單位負責,不過這個想法並沒有進行更進一步的細節討論 。
其實經過這次的會議後,我開始羨慕博班生, 因為只要關心論文有沒有上能不能畢業就好,剩下的就是做自己想做的研究,畢業以後果然有更多鳥事要煩惱啊。Alvin常跟我聊要我思考以後的事,Michelle則是大老遠從法國打電話來跟我分享歐洲市場現況,然後很熱心的想(找廠商出錢)幫忙我在台灣開發audio市場。我這一生活到現在什麼錢都沒賺到,就是貴人這個資產一直都有,不過我現在最需要的還是那張紙啊~~(倒)
更正:Ge Wang並非是Julius的學生而是Perry Cook的學生,因此他最早開發的CHUCK是在Princeton U.,不過當年我知道這套軟體時CCRMA已經引進而他才剛博班畢業,所以我才一直有他是畢業於CCRMA的錯覺,在此特地更正。