~蛙が跳ぶ程度の更新速度~
てなわけでタイトル通り、ちょろちょろっと描いていこうと思いますー。
まず録音するアナログのシームレスな情報があります。これを一定周期でサンプリングしてやる。これがもっとも標準的な音源で言うと、44kHzになるんだね。最近は192kHz音源なんてものもあるけど、何が違うかというと細かくとればとるほど高音がよくとれる。高音は時間軸に対して細かく震えるから大量にサンプリングしないと本当はたくさんあるのに そのタイミングだけ0 なんてこともある。
で、これを量子化するのだけれど、これが16bitやら24bitやら言ってるように、表現の幅のことをいう。これが広いと情報は少ないが、表現できる音の数がかなり減る。本当は0.75 1.23も、 1になってしまうような感覚だ。
とまぁ そんな感じで何を表してるかがこれだけでも大体わかるね。
で、ここで面白いのが普及してるフォーマットはすべて、一度1ビットオーディオと同じようなデータ形式になってから、保存しやすいようになのか、あるいは軸変換がしやすく、フィルタリングしやすいようになのか分からないが、別の形式に置き換わるこれがWAVなどの標準的なフォーマットだ。
このフィルタリングしやすい形にして変換をかけてしまった劣化音源じゃなく、もう一段階元音源に近いのが1ビットオーディオになる。ファイル形式はDSDだ。
当然暗号化が1段階増えれば復号も1段階増える。結果、2つもエラーやノイズの原因となる変換を多く行っている。その反面でノイズキャンセラーはこの変換があるからこそ簡単に行えるわけで、取り扱いも楽だ。ここらへんはトレードオフだったんだろうね。
で、今回はこの標準的なほうを軽く触っていこうかと思う。
WAV形式は非圧縮の形式。1411kbpsだったっけ?そんな数字だった気がするが、非常に空間表現が上手く、音圧が出る感じがする。プラシーボかもしれないけど。現状としてオーディオ的にみてもっとも聴き疲れしにくい音を出す音源(自然に近い)
MP3は誰でも知ってる圧縮形式。圧縮効率がよく、音が細くなる。情報量はビットレートに依存する。全体的に元気がよくざっくりした音を鳴らす。
FLAC形式もやや音痩せする。が、圧縮の中ではもっとも高音質で、ビットレートなどの対応も豊富で非常に扱いやすい形式。SACD(高音質CD:DSD形式)の帯域にも対応していた記憶がある。
メジャーなものはこんなもんだけれども、聞き比べなしでぱっと提示されると音源によってはCDのレベルではあまりつかないと思う。SACDはやったことが無いのでわからない。
音源の差は空間メインなのでボーカルが出てくるとかの差が一番おおきい。でもこれが小音量でしっかり聞こえてくるかの大きな差になってくる。真ん中にあつまるとモノラルに近くなるのと同じだ。モノラルに近くなると人間はだんだん情報の境界線が分からなくなって ピアノとかの楽器の音が混ざってきて分からなくなったりする。
で、それを防ぐためにサラウンドをつけたりしているのが今のプレイヤー。でも、個人的にはあまり好きじゃない。違和感がたっぷりとでてくる。
圧縮と非圧縮、聞き分けられるほど違うか?
結論から言うと再生側による。ということだ。そしてそこまで音質(ピッチとか質感など)自体は変わらない。
後はイヤホンは装着によって全然音が変わるからそのスポットを見つけるのもオーディオの楽しみではあると思う。
というかRADWIMPSとかみたいに録音自体が糞みたいなものもあるのでなんともいえない。なのでよく聴く音源だけいいものにしておく、というのが一番効率がいいとは思う。
話ここまで。こっから脱線。
最近は面白いものもたくさん出ている。音楽再生に特化したHM-601がでたりね。フルデジタルアンプなるものもあり、これは小型化がしやすい。俺がプレイヤー組めたらいいのだが。。。まだ回路の勉強が進んでない(というかずっと忘れててやってない)からできないし、デジタル回路はまたアナログと違うから別物だし。
デジタル回路はすぐにできると思うんだ。半田さえ上手くいけば。アナログはちゃんと自分でオリジナルのパーツの組み合わせをしないといけないから大変なんだよね。。。エンベディッドやりてぇなぁ。。。 とまぁ そんなことはおいておいて。
とにかく、音源をつめるのは最後な気はする。強化したい点はイヤホン>アンプ>プレーヤー>音源の質(MP3の256以上)てな感じかな。でもイヤホンとかの出力段は高級になるとやたら非効率で鳴らしにくかったりするし、結局は財布と相談してバランスが気に入ったら物足りなくても次にしっかりとシステムが作れる見通しが立つまでは動かないのが賢いと思う。
身近に詳しい人がいればその人と視聴コーナーに行きましょう。いろいろと面白い情報があるかも。おれはまだまだひよっこだからこんなくらいのことしかかけないけど。
オーディオ理論学んでないオーディオ暦5年なんてこんなもんさ。。。と思ったらあのイヤホン2kのモデルの改造品なのに5年も持ってるのか。俺は物持ちいいほうって言われてたけど毎日のように使ってた割にはモってるなぁ。。。さすがにソニーの耐久性はしっかりしてる。うん。
オーディオ理論を学ぶくらいなら物理学勉強するけど、とりあえず、こんなところで。参考になるところが無かったのは内緒。
うーん。やっぱりまだまだ知らないことだらけだ。
まず録音するアナログのシームレスな情報があります。これを一定周期でサンプリングしてやる。これがもっとも標準的な音源で言うと、44kHzになるんだね。最近は192kHz音源なんてものもあるけど、何が違うかというと細かくとればとるほど高音がよくとれる。高音は時間軸に対して細かく震えるから大量にサンプリングしないと本当はたくさんあるのに そのタイミングだけ0 なんてこともある。
で、これを量子化するのだけれど、これが16bitやら24bitやら言ってるように、表現の幅のことをいう。これが広いと情報は少ないが、表現できる音の数がかなり減る。本当は0.75 1.23も、 1になってしまうような感覚だ。
とまぁ そんな感じで何を表してるかがこれだけでも大体わかるね。
で、ここで面白いのが普及してるフォーマットはすべて、一度1ビットオーディオと同じようなデータ形式になってから、保存しやすいようになのか、あるいは軸変換がしやすく、フィルタリングしやすいようになのか分からないが、別の形式に置き換わるこれがWAVなどの標準的なフォーマットだ。
このフィルタリングしやすい形にして変換をかけてしまった劣化音源じゃなく、もう一段階元音源に近いのが1ビットオーディオになる。ファイル形式はDSDだ。
当然暗号化が1段階増えれば復号も1段階増える。結果、2つもエラーやノイズの原因となる変換を多く行っている。その反面でノイズキャンセラーはこの変換があるからこそ簡単に行えるわけで、取り扱いも楽だ。ここらへんはトレードオフだったんだろうね。
で、今回はこの標準的なほうを軽く触っていこうかと思う。
WAV形式は非圧縮の形式。1411kbpsだったっけ?そんな数字だった気がするが、非常に空間表現が上手く、音圧が出る感じがする。プラシーボかもしれないけど。現状としてオーディオ的にみてもっとも聴き疲れしにくい音を出す音源(自然に近い)
MP3は誰でも知ってる圧縮形式。圧縮効率がよく、音が細くなる。情報量はビットレートに依存する。全体的に元気がよくざっくりした音を鳴らす。
FLAC形式もやや音痩せする。が、圧縮の中ではもっとも高音質で、ビットレートなどの対応も豊富で非常に扱いやすい形式。SACD(高音質CD:DSD形式)の帯域にも対応していた記憶がある。
メジャーなものはこんなもんだけれども、聞き比べなしでぱっと提示されると音源によってはCDのレベルではあまりつかないと思う。SACDはやったことが無いのでわからない。
音源の差は空間メインなのでボーカルが出てくるとかの差が一番おおきい。でもこれが小音量でしっかり聞こえてくるかの大きな差になってくる。真ん中にあつまるとモノラルに近くなるのと同じだ。モノラルに近くなると人間はだんだん情報の境界線が分からなくなって ピアノとかの楽器の音が混ざってきて分からなくなったりする。
で、それを防ぐためにサラウンドをつけたりしているのが今のプレイヤー。でも、個人的にはあまり好きじゃない。違和感がたっぷりとでてくる。
圧縮と非圧縮、聞き分けられるほど違うか?
結論から言うと再生側による。ということだ。そしてそこまで音質(ピッチとか質感など)自体は変わらない。
後はイヤホンは装着によって全然音が変わるからそのスポットを見つけるのもオーディオの楽しみではあると思う。
というかRADWIMPSとかみたいに録音自体が糞みたいなものもあるのでなんともいえない。なのでよく聴く音源だけいいものにしておく、というのが一番効率がいいとは思う。
話ここまで。こっから脱線。
最近は面白いものもたくさん出ている。音楽再生に特化したHM-601がでたりね。フルデジタルアンプなるものもあり、これは小型化がしやすい。俺がプレイヤー組めたらいいのだが。。。まだ回路の勉強が進んでない(というかずっと忘れててやってない)からできないし、デジタル回路はまたアナログと違うから別物だし。
デジタル回路はすぐにできると思うんだ。半田さえ上手くいけば。アナログはちゃんと自分でオリジナルのパーツの組み合わせをしないといけないから大変なんだよね。。。エンベディッドやりてぇなぁ。。。 とまぁ そんなことはおいておいて。
とにかく、音源をつめるのは最後な気はする。強化したい点はイヤホン>アンプ>プレーヤー>音源の質(MP3の256以上)てな感じかな。でもイヤホンとかの出力段は高級になるとやたら非効率で鳴らしにくかったりするし、結局は財布と相談してバランスが気に入ったら物足りなくても次にしっかりとシステムが作れる見通しが立つまでは動かないのが賢いと思う。
身近に詳しい人がいればその人と視聴コーナーに行きましょう。いろいろと面白い情報があるかも。おれはまだまだひよっこだからこんなくらいのことしかかけないけど。
オーディオ理論学んでないオーディオ暦5年なんてこんなもんさ。。。と思ったらあのイヤホン2kのモデルの改造品なのに5年も持ってるのか。俺は物持ちいいほうって言われてたけど毎日のように使ってた割にはモってるなぁ。。。さすがにソニーの耐久性はしっかりしてる。うん。
オーディオ理論を学ぶくらいなら物理学勉強するけど、とりあえず、こんなところで。参考になるところが無かったのは内緒。
うーん。やっぱりまだまだ知らないことだらけだ。
PR
先生が ホワイトノイズのことに軽く触れた瞬間にちょっと気になることがあって、質問にいったのだ。
実は分らずにいったから勉強しろといわれたわけであるが、つまりレッド、ホワイト、ピンクノイズといったものを白色化するというのがどういうことか聞いた。しっかり質問できなかった。てなわけでしっかりと具体的な内容を提示できるように勉強してこいとのことだ。
で、いろいろと調べてみたのだが、先生が行っている音声信号処理、PCM方式が元になるものと思われる。確かにPCMのほうがベクトルの向きとしても触りやすいのだが、興味を持ったのはこっちではなく、1BITオーディオといわれるものだ。
まぁ 日常生活ではPCM音源しかないのだが、DSD音源というのは低周波になればなるほど原音との誤差が0に近づく。
で、PCMはというと誤差が一定で、簡単に言えば軽くホワイトノイズがかかった状態だね。
この状態で、DSDはPCMのノイズ域を超えない領域で表現することによってS/Nをあげているのだな。
さらに音源のデータを1ビットにまとめる(実質レンジは1ビットで足りる)と、階段状の電気信号にならずに滑らかにデータをアナログ送信できるというメリットを持っている。
実際に聞いた結果だが、圧力の感覚が桁違いにいい。
なんというか、空間どうのじゃなくて実物にしか感じられないレベル。
いや そんなことないけど。 実物の恐ろしいまでの肌の震えは無いが、それに近いものは多少含んでいる。
ここらへんはダイナミックレンジの問題だろうが、これはいい。
この方式を使っているのはCDでは、専用再生機を必要とするSACDといったものがそれにあたるようだ。
自分が最近導入した24ビット/192kHzの情報量とほぼ同じレベルだが、迫力やクリアーさはDSDの圧勝。この音質をこれから普及させていくのがオーディオ界の仕事でもあるな。
さて、問題の同じクラスのレンジをもつ192kHz16ビットとDSD2.8MHzを比べて、音質、データ効率、ともにDSDの勝ち。音質としては24bitもあるがこれもDSDの音質に勝てない。圧勝だ。
もうちょいと勉強していく必要がありそうだ。
それにしても、DSDファイルは8チャンネルとか出たんですが、どうやって再生するんですか?これ。
チャンネルの数に関してもDSDのほうが余裕はありそうだね。もう少し勉強が必要なようだ。
では。
LEDは二つだけです。
真ん中にあるのが演算のチップ。
左上のオレンジのが標準では意味の無いボタンですね。
ここらへんはプログラムしないと。
で、言語はC++が中心なようです。
いまいちまだ使い方わかってませんが、今の自分が使ってるサウンドカードより音がいいことはわかった。歪みがあるが、それ以上に情報量が多い。
しかもサウンドカードよりも音の聞こえ、伸び、輪郭、静けさなど、どれをとっても上回っている。
音楽性は同等だ。流石にミキサーの音には負ける。D/A変換がしっかりしてるから比べるのはフェアじゃないが。
それから、今の配置の仕方がこれ。
いやー。ちゃちい(笑)。
100均で買ってきたケースです。これに穴を開けてほこりが被らない様にしました。それだけです。
専用ケーブルを特注して取り回ししやすく、あとはケーブルが5mは長すぎたからもうチョイ短いのがほしいが。。。金が無いね。
てなわけで今回は報告。
開発に取り掛かるにはもうチョイかかりそうだ。
安定性も高くなったし、パソコンが行かれてもいつでもシステム変えられるだけの準備は整ったかな。
ひとまずはシステムがすっきりするまでは部屋の構成かえたままかな。早くコードまとめたいが、もうちょっとの辛抱。
てなわけで今回はここまで。
ま。そんなところでちょくちょくといじれたらいじっていこうと思います。
では。
率直に言おう。変わる。主にノイズが。
ノイズが消えると今まで膨らんで歪んだ帯域がきれいになってくれる。そんな印象。
一番はヒスノイズも含めた待機ノイズが消えたことだ。これが大きい。
実はこれが耳に一番負担となっていたことなのだ。
また、今回はUSB供給最大量を超えてると考え、AC供給のハブを買ってきた。
これによって不安定だったWEBCAMが非常に安定した状態で動くようになった。
また、オーディオケーブルは床付近にまとめてあるが、USBは机にまきつけるようにして引いておいた。これで多少はノイズの混入を防げるだろう。
今回のセッティングの変更は主に危機の電源ノイズによるUSB機器へのダメージの減少、ノイズ混入、また、電気的な優位性の改善、といったところだ。
機器というのはつないだ時点でお互いのノイズを渡しあって、互いに増幅し続ける。
ということでこの変更は音質向上に関して非常に効果があると考え、実際に今回やってみた。
その結果が最初の印象である。大成功だ。
よろしければ、前の記事に書いたケーブルですので、試してみては。最安値650円とかで2m、ハブが3kくらいだから4kもあれば十分機器の性能を改善できると。
今回はこれだけですかね。
ここらへんは実はアース、USBの提供電力、電源の影響力など、勉強すればすぐに出てきますので適当に。
では。
ノイズが消えると今まで膨らんで歪んだ帯域がきれいになってくれる。そんな印象。
一番はヒスノイズも含めた待機ノイズが消えたことだ。これが大きい。
実はこれが耳に一番負担となっていたことなのだ。
また、今回はUSB供給最大量を超えてると考え、AC供給のハブを買ってきた。
これによって不安定だったWEBCAMが非常に安定した状態で動くようになった。
また、オーディオケーブルは床付近にまとめてあるが、USBは机にまきつけるようにして引いておいた。これで多少はノイズの混入を防げるだろう。
今回のセッティングの変更は主に危機の電源ノイズによるUSB機器へのダメージの減少、ノイズ混入、また、電気的な優位性の改善、といったところだ。
機器というのはつないだ時点でお互いのノイズを渡しあって、互いに増幅し続ける。
ということでこの変更は音質向上に関して非常に効果があると考え、実際に今回やってみた。
その結果が最初の印象である。大成功だ。
よろしければ、前の記事に書いたケーブルですので、試してみては。最安値650円とかで2m、ハブが3kくらいだから4kもあれば十分機器の性能を改善できると。
今回はこれだけですかね。
ここらへんは実はアース、USBの提供電力、電源の影響力など、勉強すればすぐに出てきますので適当に。
では。
オンキョーなどの会社が出している 24bit,96kHz(or 192kHz)の高音質音源。
96kHzでも今までのCDの標準の44,1kHzの2倍以上で、基本的にアップサンプリングをする場合はこれに正の偶数倍をかけてその間を補間アルゴリズム的に情報の水増しをする。
しかし、これでは元の情報とそれほど変わらない。特に感情表現において、人間にその微小時間の音量の差を聞き分けられるなら、大きな差である。
が、個人的には時間当たりの情報量が増えるだけで、結果、受け取った電気信号の総和の比率が変わり、音が変わるのだろうと推測する。人間にそのような微小時間の音を聞き分ける能力はないと思っている。それは前の記事の目の情報のコンプレッションでも書いたとおりだ。
ということは、微小時間における微妙な空間的表現がこのサンプルの数によって変わってくるのではないかと考えられる。
お前言ってることおかしいぞというのは 自分でも。しかしオーディオ記事なのでそこらへんは許していただきたい。
つまり、微小時間とはいえ、時間差が細かく、何回も重なって変わっていく。つまりこれは時間的な滑らかさがあるということだ。ということは当然音は時間によっても耳に入る速度が変わるのだから、これは到着速度 すなわち空間表現能力ということになる。
という感覚的な想像ばかりの話だけれど、物理的にあってるのか高度な計算ができない。&図かくの面倒くさい。
ということでMP3(16bit,44.1kHz)の320kbpsでも人間の可聴域としては十分だし、正直解像度に関してはそれ以上を用いても差異は認められない(少なくとも空間表現以外のものを感じない)。ということはやはり一定以上の情報は人間は空間として受け取っているのだろう。
しかしながらなぜ。というのは実はレコーディングの際にA/Dで情報が一気に落ちてるんですね。それをできうる限り減らそうとするとレコーディングするデジタル側のレートをあげてやることになる。ということでより原音に近い音を取れるということでそのような高音質音源が動き出したわけです。
しかし、ミキサーなどの機材がいまだに44.1kHz なので、対応しているところ(だからこそオンキョーなどの少数の企業しかでてない)でしかできないのだ。
それから家庭用の機器の対応もまだおいついていない。ということで高音質音源といえど、PC専用なのだ。
しかしオーディオ業界ではピュアオーディオの温かみというか、丁寧さはでないといわれてきた。(新作の登場によってどうなるかはまだわからないが)
しかし、音源という点に関してはPCのほうが優れてきているという現状。これからどうなるか見ものだが。
ここらへんのオンキョーなどの対応がどうなるかに期待。
てなわけで今回はこんな感じで。
12月はUSB接続の注目商品が目白押しです。特にUSB AUDIO CLASS 2.0対応製品があつい。
ちょっと探してみては。
96kHzでも今までのCDの標準の44,1kHzの2倍以上で、基本的にアップサンプリングをする場合はこれに正の偶数倍をかけてその間を補間アルゴリズム的に情報の水増しをする。
しかし、これでは元の情報とそれほど変わらない。特に感情表現において、人間にその微小時間の音量の差を聞き分けられるなら、大きな差である。
が、個人的には時間当たりの情報量が増えるだけで、結果、受け取った電気信号の総和の比率が変わり、音が変わるのだろうと推測する。人間にそのような微小時間の音を聞き分ける能力はないと思っている。それは前の記事の目の情報のコンプレッションでも書いたとおりだ。
ということは、微小時間における微妙な空間的表現がこのサンプルの数によって変わってくるのではないかと考えられる。
お前言ってることおかしいぞというのは 自分でも。しかしオーディオ記事なのでそこらへんは許していただきたい。
つまり、微小時間とはいえ、時間差が細かく、何回も重なって変わっていく。つまりこれは時間的な滑らかさがあるということだ。ということは当然音は時間によっても耳に入る速度が変わるのだから、これは到着速度 すなわち空間表現能力ということになる。
という感覚的な想像ばかりの話だけれど、物理的にあってるのか高度な計算ができない。&図かくの面倒くさい。
ということでMP3(16bit,44.1kHz)の320kbpsでも人間の可聴域としては十分だし、正直解像度に関してはそれ以上を用いても差異は認められない(少なくとも空間表現以外のものを感じない)。ということはやはり一定以上の情報は人間は空間として受け取っているのだろう。
しかしながらなぜ。というのは実はレコーディングの際にA/Dで情報が一気に落ちてるんですね。それをできうる限り減らそうとするとレコーディングするデジタル側のレートをあげてやることになる。ということでより原音に近い音を取れるということでそのような高音質音源が動き出したわけです。
しかし、ミキサーなどの機材がいまだに44.1kHz なので、対応しているところ(だからこそオンキョーなどの少数の企業しかでてない)でしかできないのだ。
それから家庭用の機器の対応もまだおいついていない。ということで高音質音源といえど、PC専用なのだ。
しかしオーディオ業界ではピュアオーディオの温かみというか、丁寧さはでないといわれてきた。(新作の登場によってどうなるかはまだわからないが)
しかし、音源という点に関してはPCのほうが優れてきているという現状。これからどうなるか見ものだが。
ここらへんのオンキョーなどの対応がどうなるかに期待。
てなわけで今回はこんな感じで。
12月はUSB接続の注目商品が目白押しです。特にUSB AUDIO CLASS 2.0対応製品があつい。
ちょっと探してみては。