神之手人偶音樂

2010年3月2日星期二

關於聽覺視覺化

這絕對是未來最主要的發展跟研究目標

把聽覺世界與視覺世界連結在一起

就像狄卡兒發明了直角座標把代數圖形化一樣偉大!

因此我們可以直接看到摸到操控到一個"聲音物體"

直接利用視覺圖形介面來達到聲音的編輯以及雕塑

聲音不再是單純的抽象語言與物理能量

要能從傳統音樂的抽象符號世界裡蛻變到具象音樂的直觀世界最後

再進階到超越空間與時間的超現實世界

這聽起來就令人興奮!

我們說傳統的音樂或是西方古典音樂音樂的本質是抽象的是符號化的無論從調式音樂複音音樂到調性音樂多調性音樂甚至是無調性音樂只要是記譜音樂基本上就是符號而符號的意義就是一種抽象的理解這整個抽象理解延伸擴大到整個音樂聆聽美學因此所謂的"樂音" 與 "噪音" 的分別就建立在這個符號編排之上是否讓人喜歡讓人覺得難以忘懷就考驗作曲家的功力

但是一直到了未來主義的噪音宣言認為所有的聲響都可以是成為音樂的一部分便開啟了直觀世界的大門而真正成熟期在於具象音樂理念的提出與實踐通過科技的進步人們可利用更好的器材來達成以往做不到的事情錄音技術的發展提供了具象音樂有力的後盾因此我們可以專注於聲響上的趣味而逐漸跳脫以符號音高節奏曲式對位和聲結構等等抽象元素所組成的傳統音樂美學更直接的面對聲響

但是無論具象再如何具象終究還是聲音人類對於聲音的理解本質基本上就是很抽象的也似乎不太在乎是否為"符號"或是"直觀具象" 畢竟語言的本身就是一種符號化將抽象符號思想轉換到具象直觀的思想並不能說他是一種"進步" 頂多只能說是一種探索與開發全面否定傳統符號抽象概念並不正確

因此下一步要往哪裡走? 看來聽覺視覺化是能賦予聲音真正血肉的途徑他以具象音樂為出發不排除抽象符號但徹底的將聲音與視覺形體連結因此聲音開始有了形體化有了生命是一個完整的存在了透過玩弄這些形體我們可以更專注於時間與空間的操作以及與人之間的互動

2010年1月11日星期一

關於都普勒效應 doppler effect

Spatialisation領域裡面或者是多聲道控制領域裡很重要的一門課題就是虛擬音源的設立模擬
由於並非所有的錄音都是以既定的多聲道規格去收音的因此在事後製作以及重新模擬一個虛擬的音源及相關的音場變成了異常的重要

大部分的空間處理或是模擬軟體都一定會牽涉到多聲道編解碼的問題也就是說當一個虛擬音源被放置在一個虛擬的音場空間內其單一訊號要如何分配到相關再生重建此音場的喇吧的一個重要問題

別以為這樣多了幾顆喇吧好像就只是兩倍或三倍於傳統立體聲的數量因此仍然從立體聲的觀點去看待多聲道控制其實整體的複雜程度應該是指數成長而非倍數

大部分的3D AUDIO 多聲道 spatialisation處理都會牽涉到兩個層面 (或者是說分成兩種層面來解釋會比較好理解) 第一就是所謂要實現聲音定位感第二要能實現聲音的空間感

事實上以目的而論完美的模擬音源再生當然都是結合了好的定位跟空間資訊缺一不可不過在實行上我們還是會將兩者分開來處理會比較方便

而定位感的部分所謂的sound localisation 會從兩個因素上去判斷一者為ILD (interaural level difference) 另一者為ITD (interaural time difference) 白話的說起來就是音量差距跟時間差距因此兩耳之間的音量差距或是時間差距造就了人類去分辨音源的來源及定位

而在多聲道實現上雖然整個概念以及數學模型跟立體聲有很大的差距可是若以定位目的來看大致上仍舊會在ILD 跟ITD上下手

純粹以ILD來做多聲道PANNING的規格所要解決的問題就只是要去解決多個喇吧所建構起的音場內聲音的平均分布以及合理性代表作如ambisonics 跟VBAP (vector based amplitude panning)

但是若要考慮到ITD 更多的問題就來了簡單的說法我們僅需要額外再考慮每個聲道或是喇吧之間的細微時間差距即可但是實際上操作起來並不是這麼一回事

假設虛擬的音源是靜態的不會移動的那還好處理若一個虛擬音源S, 在N顆喇吧所組成的音場內則每個喇吧 SPn 所會擁有的ITD 則會根據音源S的位置而定依序可得 SP1=若干ms的delay,SP2=若干ms的delay,SP3......SPn=若干ms的delay

但是如果今天虛擬的音源是會移動的問題就大了我們無法在單純的僅用幾何上的算術就把相對應的SPn的delay給算出來因為這變成每個SPn的時間差隨時都在變動
這樣說起來好像沒什麼大不了可是請仔細想想所謂的一個虛擬音源其聲音來源不外乎兩種 1.外部的麥克風或是音訊音源 2.現成的聲音檔案
假設此虛擬音源是靜止的那麼我們只要令 SPn中 delay最小的甚至沒有delay設定的喇吧先開始播放此音源然後依據每個SPn的延遲依序播放下去即可比方說第一個喇吧有1ms的延遲後開始播放此音源而第二個喇吧再等1ms的延遲第三個喇吧再等1ms..... 一切都可以運作很正常

若假設此虛擬音源開始移動變代表著每個SPn的延遲開始有了變動回到剛才的假設第一個喇吧會從1ms的延遲經過0.5秒後增加到2ms 問題來了請問在這0.5秒的時間內此虛擬音源的訊號要怎麼處理呢?? 對於SPn來說訊號從一開始產生後就必須是連續不斷的線性的因此根本不可能從1ms 突然跳到xxms的時間差要達到這樣的目的等於是要硬生生的將音源(無論是聲音檔案或是現場的input)切成兩半從新的時間點繼續播放否則不可能改變時間差但是這樣就會出現一個很不合理的現象 : 在自然生活中怎麼可能有聲音會突然斷掉跳到另一個時間點上去呢? 非線性在日常生活中是不可能存在的

因此我們必須重新回頭思考一個"移動中"的音源在現實生活中會有什麼樣的情況發生於是就不得不去重視 "都普勒效應" 的存在跟應用

都普勒效應的公式如下 : f={(v+vr)/(v-vs)}*f0
其中 f為想要求得的最終頻率變化 v為正常一般介質下的音速 vr為聆聽者的速度(若靠近音源則為正反之為負) vs為音源的速度 (若靠近聆聽者則為負反之為正)

現在讓我們回到剛才的問題要如何讓這0.5秒內由1ms的延遲增加到2ms 最簡單的做法就是非線性的粗魯做法直接把1ms 跳到2ms 也就是說此虛擬音源中間會有整整1ms的斷層突然消失
但是我們說過這是不允許的因此換個角度來想要如何讓虛擬音源在這0.5秒內可以從1ms的延遲逐漸變化到2ms 達到一個線性的目的

若用doppler的角度去解釋 1ms的秒差*音速340m/s的話就是等於34cm 也就是此虛擬音源的直線上運動遠離了聆聽者(圓心)34公分在0.5秒內因此速率為0.68m/s 代入上面公式可得340/340+0.68=0.998 因此假設虛擬音源的頻率為440hz的La 在此移動中我們會聽到440*0.998=439 的大約頻率

這是現實情況

若以聲音檔案或是數位訊號來看要做到這樣看似簡單的事情卻還滿難的不過還是可以達成
如同上面所說若時間是延續的線性的那麼要在0.5秒內讓聲音延遲從1ms變成2ms 一個很直覺的方法就是把播放的速度放慢因此當慢到2ms的延遲後再回復正常速度我們知道當聲音檔案放慢的同時音高頻率也會降低這其實就是任何波形運動簡諧運動都會存在的現象都普勒效應一樣可以在播放聲音檔案中實現出來

結論在以ITD implementation內的多聲道虛擬系統中只要扯的上時間差距就必須要扯到都普勒效應否則無法維持時間上的線性虛擬音源在移動的過程中一定會爆音以及非線性的延遲但是為求運算效能只要虛擬的音源是靜止的我們大可以放心捨棄doppler 節省運算資源

2009年12月25日星期五

聖經推薦~

無論是PATCH的撰寫以及理論的解釋都一定不能錯過一本由聖人所寫的聖經

THE THEORY AND TECHNIQUE OF ELECTRONIC MUSIC

BY MILLER PUCKETTE

對就是Max/MSP 跟Pure Data的作者 PUCKETTE先生親筆寫的觀念書籍~~
內容編排簡潔所談的範圍幾乎全包了所有你可能會遇到的情況

大力推薦

2009年12月24日星期四

Max/MSP二三事@@

關於Max/MSP的PATCH無法加密的問題相信很多人包括74'上面的論壇都已經討論N遍了
很多人花了非常多的時間去編寫一個非常有系統非常龐大完成度非常高的patch 相信作者本人的確對於他的PATCH 是以一個 "個人資產" 的角度去看待的甚至有人委託編寫等於是賣錢的PATCH 相信這種東西作者當然不希望讓別人看光光裡面的內容

不過無論如何呼籲74 我想對方是個不算小的公司應該是不可能鳥這種問題的即便把PATCH鎖住把他給BUILD 弄成STANDALONE版本但是只要您對MAX稍微有點認識都曉得這不是根本的辦法有心人還是可以花點功夫把裡面的內容看透透

因此想要完全讓自己的PATCH給徹底 "商業化" 基本上最徹底的方式就是自行重新撰寫程式也就是說不再倚賴MAX所提供的環境及平台自行用C語言慢慢寫出來然後結合WINDOWS或是OS的API 把END USER的GUI也一併寫出來這是最萬無一失的狀況但是這種開發方式沒有個小型10來人的軟體公司是根本做不來的想一個人獨力完成可能要耗費數年的時間

因此比較可行的做法以IRCAM為例他的FORUM LOGICIELS都是要錢的但是都必須要在MAX的環境下執行他賣的不只是PATCH 還有他們自行開發的OBJETS 以及LIBRARY 這些東西都必須要完整了解MAX的SDK開發環境才能自行用程式語言撰寫出獨立的OBJET 一方面他不怕人家看因為你只有PATCH也沒用你沒有資料庫跟相關的元件還是不能啟動

最後一個方法當你自己還沒有到達自行開發OBJET能力但又想要自己的PATCH有獨特性你可以利用MAX裡面的JAVA支援利用mxj 以及js檔案來讓你的PATCH看起來高級複雜許多就算別人想要COPY或是修改也必須要花非常久的時間來了解你的PATCH 而我相信在大型的PATCH裡面通常都有4個以上的階層也就是說最上層的主PATCH裡面還有第二層SUBPATCH 然後第二層內還有第三層第四層第五.... 依此類推然後整個大型PATCH完成之後若要發布流傳你可以將第一層主PATCH以下的所有的編排通通弄成黑色背景也是然後全部ALIGN 置中讓所有的物件通通疊在一起盡量能弄多亂就弄多亂這樣的話別人就算是有心想要看裡面的東西也要花很多的功夫整理.... (當然前提條件是你必須要另存別的檔案原始檔的內容還是要乾淨整齊的...)

神之手人偶音樂

2010年3月2日星期二

關於聽覺視覺化

2010年1月11日星期一

關於都普勒效應 doppler effect

2009年12月25日星期五

聖經推薦~

2009年12月24日星期四

Max/MSP二三事@@

文章分類

追蹤者

網誌存檔

關於我自己

神之手人偶音樂

2010年3月2日 星期二

關於 聽覺視覺化

2010年1月11日 星期一

關於都普勒效應 doppler effect

2009年12月25日 星期五

聖經推薦~

2009年12月24日 星期四

Max/MSP二三事@@

文章分類

追蹤者

網誌存檔

關於我自己

2010年3月2日星期二

關於聽覺視覺化

2010年1月11日星期一

2009年12月25日星期五

2009年12月24日星期四