結局は音声品質が満足度を決める
「テレワーク」という言葉が使われるとき、文字通り離れた場所で仕事をするための環境があることが大前提となります。仕事するための環境として欠かせないオフィス機能の一つが、同僚とリアルタイムに意思疎通できる機会です。つまり「テレワーク」を成り立たせるためには、遠隔地間でコミュニケーションができるシステムが必須です。
「メールではなく対面で話しましょう」という言い方がありますが、相手の顔の表情から得られる情報の多さは認めるとしても、結局はテンポよく議論したいからその手段を取ります。また、最近はチャットツールの利用が盛んですが、報告が趣旨の会議ならまだしも、何かのアイディアを話し合ったり侃侃諤諤と議論するためのいわゆる「ミーティング」となればチャットではきついです。つまり、コミュニケーションするためのメディアとして映像や文字だけでは達成できることがとても限定されます。
一方で、声のみを伝達する電話が長きに渡って”テレコミュニケーション”の手段であったのは言わずもがなですが、その多対多を実現する「電話会議システム」も古くから存在し、今でも根強く使われます。音声情報は【人間の音声の周波数帯域の中で会話が成り立つ範囲】✕【ビット深度分】を送ることができるだけのネットワーク帯域があれば足り、それは映像に比べて遥かに小さくて済むため、ISDN時代からずっと現役です。つまり「テレワーク」で不便しないために相互伝達が必要なマルチメディアの中でも、音声情報は最も重要な位置を占めると言えるのではないでしょうか。
想像に難くないと思いますが、遠隔ミーティングの音声品質に下記のような問題が発生すると、とたんにミーティングは成立しなくなってしまいます。
- 相手の声が小さくて聞こえない
- 相手の声にノイズが入り明瞭度が低い
- 自分の声が相手側の音響空間で反射して自分側にエコーのように聞こえる
- 声の遅延が大きく、相槌がかみ合わない
このことは、人間が意思疎通をする上でいかに音声の微妙な特性で多くの情報を得ているかを再認識させます。しかしマルチメディアを売りとする現在の会議システムにとっては、音声偏重でカメラ映像や資料映像に手を抜くわけにもいかないので、過酷な事実です。
また、利用するほうとしては、スムーズなWEB会議進行の上で、映像に増して音声品質及び音響機器にこそ最大の配慮を払う必要があることを示します。
本記事は少し長文となりますが、テレビ会議をストレスなく執りおこなうためにどのような音響機器を選択すべきかについて提案することをゴールとします。
用語説明
まずは、本記事をスムーズに読んでもらうために、関連用語を説明します。やや専門用語も含みます。
マイクスピーカー(スピーカーフォン)のジレンマ
どうしてマイクスピーカーで失敗する例が後を断たないのか、動作の特性から考えてみましょう。
WEB会議が音響機器にあたえた苛酷
通常、コンサート・ライブ、または講演会などの場では、音響の専門家が事前にその会場の音響特性を把握します。
音源の種別は何か、機器をどう配置したらハウリングが起こらないか、マイクの感度やスピーカーのボリュームはどう調整した聴衆に満足してもらえるか、そういったことを細かく調整して本番に備えます。
エンジニアがツーツーハーハー声を出したりノイズを出したりして様々な特性の音について入念にチェックします。
一方で会議用の音響機器はそこまでの段取りは踏めないことが多々あります。
事前にマイク・スピーカー位置固定で入念に事前確認された会場であれば良いのですが、なにせWEB会議となるとその手軽で簡単で場所を選ばず使える、ということが売りにされるわけです。
WEB会議のその利点は、本来、音響機器としての理想的な使い方とは相反するものなのです。
「会議」というシーンの困難さ
音響設計の大原則として
「自分のスピーカーから出した音は自分のマイクで拾ってはいけない」
ということを守らなければいけません。カラオケでもおなじみの「ハウリング」が起きないようにするためです。
つまり、自分の声がスピーカーから拡声されるのは良いとして、その音を更にマイクで拾ってしまうと、無限ループに陥ります。
そのため、なんらかのアルゴリズムで、自分のスピーカーからの音はマイクで拾ってもキャンセルする、またはそもそも拾わないようにデジタル制御がなされます。
そうなると問題は、クロストークが発生した場合です。
上記の通りハウリングの発生を抑止するために、スピーカ出力またはマイク入力いずれかをキャンセル処理した結果、それが誤って本来必要な音に対してなされてしまうと、互いにとって声が聞こえていない・途切れるという状態に陥ります。
相手の発言の途中で質問しようとする人や、会話を遮る人、いるのではないでしょうか。
発表者が順番に発言して、QAは最後にまとめて、などというお行儀の良い会議ばかりならば良いのですが、本来の「会議」の真骨頂ともいえる、侃侃諤諤とした議論の場では非常に問題が多いことになります。
発表者が順番に発言して、QAは最後にまとめて、などというお行儀の良い会議ならば、無駄会議撲滅の昨今の風潮では、もはや事前に資料を共有した上でのテキストチャットでも十分です。わざわざ会議システムを使ってまでやる意味としては、本来の「会議」の真骨頂ともいえる、複数人でのフリートークや侃侃諤諤とした議論が重要なわけで、そうなると音響システムにとっては非常にシビアな状況といえます。
ハウリングの原理を理解すればクロストークの処理の難しさというのも理論的に納得できるものと思います。
つまり、自分が発言中に会議相手の話し声が自会場のスピーカーから出力されてしまうと、それを自分のマイクで拾ってしまっては相手に声が返ってしまうので、自会場マイク感度が下げられる(その結果、自分の声が相手に届かない)、もしくは自会場のスピーカー出力が減衰する(その結果、相手の声が聞こえない)という状況に陥るのです。
ならばなぜ私たちの誰もが使っている電話ではなぜこんな問題が発生しないかというと、マイクとスピーカーが干渉しない位置にあるためです。
また、専用機のテレビ会議システム付属のマイクスピーカーはこのあたりの処理が段違いに優れています(※)。したがい「SonyやCiscoのテレビ会議システムは問題なかったのに、WEB会議は音が悪くて使えない」という評価が下されることも珍しくないのです(ちなみにWebexもCisco製なので、メーカーの優劣ではないことがわかります)。
※専用機のマイクスピーカーは価格が桁違いです。同レベルの品質を求めるのは軽トラックに対してポルシェのように走れと言っているようなものです。それとWEB会議用の機器を比較するのは酷です。
「一体型」マイクスピーカーの困難
「一体型」のUSB接続型マイクスピーカーのうち、集音範囲360°の製品としてWEB会議での使用実績が一番多いもののひとつに、ClearOne の chat150があります。
この製品のように、マイクとスピーカーが同一の筐体に収められている場合、マイクとスピーカーの距離は常に一定です。それによって後述の「分離型」と比較してキャンセル制御のための複雑な計算が軽減できるメリットがあると思います。
一方で、後述する空間的に分離されていることで得られる音響的な手がかりというのがあるのですが、それが得られないため、単純で「決めうち」の制御にならざるを得ません。また、本体スピーカーから発生するノイズや物理的振動からは絶対に影響を受けてはいけないので、それらの消去が何より優先されるでしょう。
そのため、一体型マイクスピーカーでクロストーク時の自然な聞こえを実現するのは理論的に困難を極め、WEB会議用として見合うような安価な製品でそれができるものは皆無だとあえて私は言い切りたいと思います。
「分離型」マイクスピーカーの困難
一方でマイクとスピーカーが離れた製品があります。YamahaのYVC-1000です。
先に結論から言えば、設置・運用上の問題がなければ、この製品さえ使っていば「音が悪い」という問題の多くが解決できます。
マイクとスピーカーが空間的に分離していることで、自分のスピーカーからの音を認識できる物理的な手がかりのバリエーションが増えます。
周波数特性、反響音の特性、位相特性などがあるでしょう。
それらの手がかりを用いて自分で放出した音の周波数・レベル・位相が空間を経てどう減衰・遅延するかを把握できれば、スピーカーからの音にフォーカスしてキャンセルさせることも理論的には可能といえます。
こういった手がかりを駆使すれば、誤ったキャンセルによる音の途切れを軽減し、一体型よりもクロストークのような難しい状況でも違和感を緩和することが可能になるのです。
また、これは私の個人的な考えですが、「一体型」のような設計のしばりから解放されることで、スピーカー自体の音質もより聞きやすさを追求できるかもしれません。
つまり、一体型の場合は、本来はもっと低音を出したほうが自然な声に聞こえるけど、筐体に共振が発生してマイクに影響を及ぼすからできない、といった縛りがあるはずです。分離型のほうがスピーカーの音響設計の自由度が高まるのではないでしょうか。後述しますがこのYVC-1000はなんと他メーカーの任意のスピーカーを繋げることが可能ですが、それは推測を裏付けるものといえます。
さて、本節の題目の通り分離型はメリットだけではありません。
マイクを自由な場所に設置できるということは、その都度スピーカーとマイクの位置関係が変わるわけですから、その位置関係をシステムが把握していないと、キャンセル処理がうまくいきません。
そこでYVC-1000では、マイクの場所を決めたのちに、「初期設定」が必要となります。
スピーカーからノイズ音を数回発生させてマイクを集音することで、音場の物理特性を把握し、マイクの位置関係を認識するのです。この作業には確か1分くらいかかったはずです。
また、そのように初期設定をしたとしても、マイクの場所を変えたら設定が台無しです。自分が話す番になってマイクを近づけるなど言語道断です。
さらには、「初期設定」したときにはなかった物体がマイクとスピーカーの間に置かれたりしたら困ります。ノートパソコンを開いて壁を作ったりするのは厳禁。
下の動画はYamahaが公開しているものです。なぜか無機質なオフィスに不釣り合いな露出度高めの女性が説明しており説明が頭に入りにくいですが、ごく基本的な注意点を述べていますので、肝心の内容のほうをしっかり頭に入れておきましょう。
会議が求める「指向性」がもたらす困難
もうひとつ、音響機器を困らせるのが「複数の人がいろいろな場所でしゃべる」ことです。
システムとしては、話者の声のみを相手に届け、雑音やエコーはキャンセルしようとして処理します。
もし「マイクからみた話者の方向」が特定できれば、それがやりやすくなります。
マイクに指向性をもたせ、一番感度が高い位置に話者がいてくれれば、それ以外の角度からの音は減衰させることができます。
しかしながら実際の会議では、机を囲んで複数人が発言することが珍しくありません。
したがい、集音方向360°をうたう製品である程度高級なものになると、単に360°すべての音を均等に拾うというわけではなく、リアルタイムに指向性を変化させます。
簡単に言えば大きな音が入ってくる方向に対して感度を上げる制御をリアルタイムに行います。
ですが、あっちこっちから発言されると、指向性の自動調整が追いつきません。タイミングによっては本来拾うべき声が減衰させられてしまい、「なんだか聞こえにくい」という印象になってしまいます。
急に話者の位置が変わった時のシステム追従イメージ:
実は使いどころが難しい「ボリューム自動調整」
用語説明でも述べた「ボリューム自動調整」は、「話者との空間的距離」を埋める機能です。マイクから離れた人の減衰した音声を持ち上げて、相手に聞こえやすくします。
マイクスピーカー自体のマイク感度調整として備わっている場合もあれば、WEB会議の機能としてソフトウェア的に実現される場合もあります。
一見便利そうなこの機能ですが、持ち上げる音が「発言者の声」であることを正確に検出するアルゴリズムが備わっていてこそ成立するものです。
「発言」とは関係ない遠くの雑音や壁からの反射音などは、データ処理で消去されるに越したことはないですが、本来ボリュームとしては大きくありませんからもしそのまま相手に伝送しても致命的なものではありません。
しかし「自動調整」によって持ち上げられてしまったら大きく邪魔になってしまいます。
この「自動調整」は、WEB会議の仕様によってデフォルト設定でONになっている場合も少なくありませ。「こんなに離れて話しても伝わりますよ」なんて宣伝しているシステムがあればたいがい同様の機能がONです。しかし実際問題として、もし「音が途切れる」とか「雑音が入る」といった不具合が生じた際には、切り分けとしてまっ先にOFFにしてみる対象でした。
裏を返せばそれだけ弊害が考えられる機能だということです。
実例としては、「エアコンの音」「後ろのほうで議事録を取っているだけの人のキータッチ音」などが相手に耳障りになってしまうという体験があります。
我々が普段はさほど気にしない音であっても、「相手に伝えるべき音」として処理されてしまうケースがあるのです。
失敗しない音響機器の選択
いよいよ本題です。
ヘッドセットマイクを絶対に買わなければいけない理由
「ヘッドセットマイク」と「マイクスピーカー(スピーカーフォン)」を比べる上で音響的に大きなインパクトを生んでいるのは、耳や口との距離が近いか遠いかです。
ヘッドセットマイクは音場が限定されることで、さまざまな物理的な影響が排除されるため、高音質を確保するための条件は広い空間にマイクスピーカーを配置するよりも遥かに恵まれています。
したがって、マイクスピーカーならば一定の品質のものを用意するとなれば個人用でも3万円くらいする業務用の機器を購入するのが無難なのですが、ヘッドセットマイクならば10分の1の3千円のものでも十分実用性があります。
しかも3千円のヘッドセットマイクの音の方が高級なマイクスピーカーより明瞭に聞こえても何ら不思議ではありません。
下記はAmazonリンクですが、ロジクールのこのシリーズのモデルはAmazonなら三千円台〜五千円台で買えるものの、不具合に遭遇したことは私の経験上で言うと今の所ありません。
逆に言えば、ヘッドセットマイクを使ってもうまくいかなければ、そもそも製品のバグか、設定がおかしいか、ネットワーク環境がおかしい、というように要因が大きく絞られるため、不具合発生時の切り分けにもよく使われます。
ヘッドセットマイクが実用上使い道がなく、コードが邪魔だからBluetooth型のワイヤレスタイプにしたいとか、ピンマイクにしたいといったことは当然あるでしょう。
それらは確かに音響空間の影響を受けにくいという意味では共通しています。しかしBluetooth等ワイヤレスがゆえのノイズの影響が入り、余計な要因を増やしてしいます。
普段使わないとしても、前述のような安い製品で良いので有線のヘッドセットマイクは必ず2セットは持っていたいです(相手とワンペアで動作確認するため)。
「一体型」先駆者 ClearOne chat150 の評価
「一体型」の代表格として上で挙げたchat150についていうと、限界を十二分に認識した上で使うならば選択肢の一つとなります。
しかし私が知る限り、この製品では満足できずに買い換える、またはWEB会議自体をやめてしまうケースが少なくありません。
クロストーク時の減衰や途切れが不自然な場合が見受けられます。
前述のマイク指向性の自動調整に対して利用者側の理解不足もあるものと思います。
また、私がデモ用として複数台購入した際に、個体によって品質にバラツキもみられました。
chat150について詳しくは下記の別サイトに譲ります。
私個人の評価としては「素人には難しい商品」です。
一方、同じClearOne製品でも、集音が前方120°で距離も短い chat50 という製品がありますが、これは集音範囲が狭まったことでだいぶ難から逃れたのか、上位のchat150よりも音質が良いというユーザーさえいました。
それほど空間の許容度を広げることは難しいのです。
1〜3人くらいのフランクな会議ならば、chat50で十分ではないでしょうか。
「後発の利」Yamaha YVC-300
かつてYahamaにはPJP-50USBという製品があり、広い部屋でのWEB会議ではこれほぼ一択でした。
決して悪い製品ではありませんでしたが、一致型だったということもあり、設定や調整が難しい製品でした。
また、10万円を優に超える高価な製品で、使う側の期待値も高く専用機並みの品質を期待したが故に、その差に愕然としました。
個人的には、「WEB会議は音が悪い」が一般認識となった元凶の一つではないかとさえ思っています。
それを反省(?)してYamahaが出したのが後述のYVC-1000という名機なのですが、その流れを汲み一体型でも従来製品をかなり上回る品質に仕上げてきたのがこのYVC-300です。
この製品はchat150を意識して作ったものであることは明らかで、実際にヤマハの技術者からも、chat150は技術的に古い部分がありこちらのほうが優れると言われたことがあります(営業ではなく技術者ということで説得力がありましたが・・・)。
この製品は単一指向性マイクが3つ内蔵され、360°対応とされます。
集音範囲は推奨で半径1.5mと狭めですが、最大3.0mということでその程度までは余裕で拾えました。
3〜5人程度で机を囲んで会議するにはちょうどよいと思います。
WEB会議の救世主:Yamaha YVC-1000
「失敗しないマイクスピーカー(スピーカーフォン)」として私が一番に挙げたいのがYVC-1000です。
※新型コロナのテレワークによる需要拡大によりずっと品切れでしたが、ようやくちょくちょく供給されるようになってきました。
既に口コミやレビューサイトでも賞賛されていますが、どうも評価のポイントが曖昧であったり環境依存の影響が排除できていない口コミ、感想、レビューが多いような気がしています。
この製品のすばらしい点は下記です。
分離型でクロストークも大きな違和感がない
クロストーク時に音が途切れたり不自然な減衰があることで、人は「音が悪い」と感じます。
このYVC-1000であっても、完全にお互いの発話がバッティングしてしまうと、明瞭な音声が届けられなくなります。
しかし、「大きな違和感がない」というのが主観的な感想です。
私は最も悪条件下のクロストークをエミュレートするために、いくつかの製品で以下のような実験をしてみました。
- ルームAとルームBをWEB会議で接続。それぞれに同じマイクスピーカーを設置する。
- ルームAのマイクの真正面にスピーカーを置き、iPodで英会話の音声を流し続ける。
- ルームBで人に文章を読み上げてもらい、ルームAでそれをどれだけ聴き取ることができるか確認する。
その結果、YVC-1000は、英会話の発生タイミングによってBからの朗読音声の減衰が認められましたが、他の製品にみられたような「ブツブツ音が切れる」や「ノイズのように聞こえる」といった現象は一番少なく、「同時に話したら聞こえにくいのは仕方ないよね」程度の感覚で見過ごせる程度のものでした。
他の製品では、リアルタイム処理が追いつかないのか、英会話の一文が終わってブレイクが入っている間もルームBからの朗読音が途切れたままであったり、ブツブツと途切れる現象が発生し、とても気になるレベルでしたが、YVC-1000は「最大限マシ」と言えました。
初期設定で、設置環境に応じた調整が自動で行われる
前述の通り、YVC-1000は「初期設定」が必要となります。
スピーカーからホワイトノイズのような雑音を数回発生させてマイクで集音することで、音場の物理特性を把握し、マイクの位置関係を認識するのです。この作業には1分くらいかかります。
設定に手間がかかるという意味で前述ではデメリットとして取り上げましたが、この設定が必要な理由が理論的に納得できるのと、設置した空間に最適化してくれているという安心感が非常にポジティブに感じられます。
入出力レベルやエコーキャンセル強弱などのパラメーター、または本体の物理的な位置などを試行錯誤で変化させて最適解を得るような作業は、職人には楽しいかもしれませんが、一般ユーザーには苦以外の何者でもありません。(感覚論のようで、この「安心感」は実運用で非常に大事。)
拡張性が高く、比較的安価に拡張可能
「一体型」のマイクスピーカーでは、chat150にしてもYVC-300にしても、利用する部屋が広い場合にマイク集音範囲を広げるためには、本体を連結させて対応します。
そうなると問題は、本体の価格の倍数で費用が発生することです。
一方でYVC-1000は、専用機のテレビ会議システムのように、マイクの数を増やすことができます。
マイクは本体よりずっと安い価格で手に入ります。
従い、マイク一個付属のYVC-1000を買っておき、広い部屋に置きたければYVC-MIC1000EXを更につなげれば良いのです。
これは、10数万円した過去のPJP-50USBを2台3台買ったユーザーからすれば、反則級の便利さです。
入出力とも外部機器との接続が可能
これがなにせ画期的でした。
まず、外部スピーカーが接続できます。
これは「一体型」では絶対に真似できない仕業であり、まさに「離れ業」なのですが、前述の初期設定機能で外部スピーカーの音響特性を測定できるために可能になるのです。他メーカーの一般的なスピーカーであっても接続することができます。
また、同じ理由で外部マイクも接続できます。
これにより、セミナー会場や展示会など、ステージ上の話者が講演・説明する場合にも使用でき、複数拠点同時講演や、遠隔地と中継してのデモが可能になります。
もちろん、そのマイクでスピーカー出力音を拾ってハウリングが起きないようにするためにはスピーカーとマイクの位置関係に留意する必要があり、場合によっては別途エコーキャンセラーが必要になるでしょう。
まとめ:これに当てはまらなければ、YVC-1000 の一択!
ここまで絶賛してきたYamaha YVC-1000ですが、以下の場合には必ずしも最適な選択とはなりません。
- パーティションで区切られただけのような部屋で使う場合
- YVC-1000のマイク集音範囲は仕様表に最大5mとありますが、とにかくよく拾います。
線路近くのビルでは電車の音が相手に聞こえてしまうくらいです。
雑音が多いスペースには向きません。
- YVC-1000のマイク集音範囲は仕様表に最大5mとありますが、とにかくよく拾います。
- 前方にスピーカーの設置場所がない場合
- 本体兼スピーカーはそれなりの大きさで、設置には場所をとります。それを会議室の前方に置くスペースが要りますので、常設できる場所がない場合は向きません。
- 使うたびに機器を出し入れする必要がある場合
- 遠隔会議をやるときにだけスピーカーマイクを設置する運用となる場合、基本的にマイク位置が変わると「初期設定」が必要となるので不向きです。
ただしこの場合でも、マイクを置くべき位置にマーカーをつけておくなどして対処するユーザーもありました。それなら毎回の初期設定は不要になります。
- 遠隔会議をやるときにだけスピーカーマイクを設置する運用となる場合、基本的にマイク位置が変わると「初期設定」が必要となるので不向きです。
- マイクを個別にミュートしたい場合
- 5個まで連結可能なマイクは、一つをミュートにするとすべてがミュートされます。つまり、「発言したい人の近くのマイクだけONし、他はミュートしておく」ということはできません。
- しかしながら、YVC-1000のマイクは集音範囲が広いために、たとえ直近のマイクがミュートされていても、ONされているマイクが部屋のどこかにあればそこから音が拾われてしまうでしょう。
もし話者の声だけに限りたいならば、下記のようなグースネック型のマイクを常設するしかありません。マイクの真ん前の口元の声しか拾わないマイクを使うのです。
以上のようないくつかのケースに当てはまらないのであれば、私の意見としては「YVC-1000一択」とまで言い切りたいと思います。
価格は10万円以上しますので、予算が許さなければ小人数参加拠点にはYVC-300を入れたら良いと思いますが、たとえ1〜3人くらいの小規模な会議でも選択肢として考えるべきです。
ここまで言うのは、この製品ならばユーザークレーム受けることがほぼなかったという経験によりますが、WEB会議メーカーがこの製品にもつ信頼性の高さも説得力を与えます。
V-Cubeのセミナーに行っても、WebExのセミナーに行っても、WEB会議のデモで使われているのはこの製品でした。
「音が鮮明です」と説明されても、それはYVC-1000のおかげじゃないかと思って聞いていたほどです。
それだけ、WEB会議には欠かせない存在となっていました。