KORGのチューナーcortosiaはどうやって「いい音」を採点してるのか?
楽器の音を5つの要素で分析し、「いい音」かどうかをリアルタイムで採点してくれる新しい概念のチューナー、cortosia。KORGがバルセロナのPompeu Fabra大学と共同開発したものらしいです。
実は、ちょうど5月に行ってきた138th AES Convention Warsawでこのcortosiaに関する技術の研究発表があったので聞いてきました。
動画で述べられている以下の5つの「いい音」の評価の基準は、ある音楽教師のグループによって定義されたものだそうです。論文では、音楽演奏の良し悪しは主観的なものであり複雑だと述べた上で、音楽教育においては何かしら「いい音」のコンセンサスが得られるはずだ、と述べています。
1:ピッチの安定性(Pitch Stability)
2:音量の安定性(Dynamic Stability)
3:音色の安定性(Timbre Stability)
4:音色の豊かさ(Timbre Richness)
5:アタックの明瞭度(Attack Clarity)
cortosiaは、機械学習によって「いい音」を判断しています。まず、プロのミュージシャンによって演奏された上記の5つの属性それぞれが悪い例と、全てが良い例の合計6種類の演奏音をひたすらレコーディングすることで、訓練データを作成。機械学習によって、それぞれの属性が悪い例にどのような音響的な特徴があるかをシステムに学習させたとのことです。音響特徴量は、それぞれの音をonset(音の始まり)、beggining of sustain(音のサステインの部分の始まり)、release(音のサステイン部分の終わり)、offset(音の終わり)の4つのパートに分割して分析しています。
その後、システムが判断した「いい音」の得点と、実際に人間が聴いて判断した主観的な得点にどの程度の違いがあるかについても論文に述べられています。楽器によってそれらの違いが変わってくるのでここでは詳しく言及しませんが、ものによってはかなりシステムと主観印象との相関が高いので、有用なのではないかと思われます。
ただ、著者も述べているように、これはあくまで数人のミュージシャンによる演奏に基づくものなので、もっとデータを増やして発展させていきたいとのことです。
ぜひ、それぞれの楽器を教える先生方がcortosiaの評価についてどのように思うかについて色々と聞いてみたいですね。
This Post Has 0 Comments