とにかく音声(WEB会議のマイクスピーカーはYVC-1000が至高)

目次

結局は音声品質が満足度を決める

「テレワーク」という言葉が使われるとき、文字通り取れば離れたところで仕事をすればテレワークと言えそうなものですが、実際は音声にカメラ映像や資料共有映像が加わった「テレビ会議システム」によって遠隔地間でコミュニケーションが取れることが前提とされることが多いです。

つまり少なくとも電話、ほとんどは電話会議システムやテレビ会議・Web会議システム等の「遠隔会議システム」の仕組みによって、従来は会社に集合しないとできなかった、会社としての機能的な部分が代替できてこそ「テレワーク」が成立するということでしょう。

しかしながら、「遠隔会議システム」でやりとりされるマルチメディア情報の中でも、とりわけ音声品質に下記のような問題が発生すると、とたんに会議が成立しなくなってしまいます

  • 相手の声が小さくて聞こえない
  • 相手の声にノイズが入り明瞭度が低い
  • 自分の声が相手側の音響空間で反射して自分側にエコーのように聞こえる
  • 声の遅延が大きく、相槌がかみ合わない

このことは、人間が意思疎通をする上でいかに音声の微妙な特性で多くの情報を得ているかを再認識させます。と同時に、カメラ映像や資料映像に手を抜くわけにもいかないテレビ会議にとって過酷な事実です。

また、利用するほうとしても、WEB会議の音声品質及び音響機器に最大の配慮を払う必要があることを示します。

本記事は少し長文となりますが、テレビ会議をストレスなく執りおこなうためにどのような音響機器を選択すべきかについて提案することをゴールとします。

用語説明

まずは、本記事をスムーズに読んでもらうために、関連用語を説明します。やや専門用語も含みます。

マイクスピーカー(スピーカーフォン) 会議相手に自分の声を伝送するために音を収集するマイクと、伝送されてきた会議相手の声を拡声するスピーカー両方を持ち合わせた音響機器。机上に設置し、2名以上から使用するものだがが、複数マイクを連結できるなど大会議室で大人数で使うのにも耐える製品がある。

マイクとスピーカーが一体となった「一体型」と、それらが離れている「分離型」に大別できる。

メーカーとしてはClearOne, Jabraといった海外勢が老舗だが、昨今は音響大手のゼンハイザー、Yamaha、そしてロジクールやサンワサプライといったPCメーカーも参入し戦国時代と化しています。

一体型の例:


分離型の例:

ヘッドセットマイク ヘッドフォンと、自分の口元で声を拾うマイクが一体となった機器。

マイクスピーカー(スピーカーフォン)との大きな違いは、ヘッドセットマイクは一人用/個人用であること。
テレフォンオペレーターが使っているものがイメージしやすい。

また、後で述べる理由により、個人用だけでなく大人数で会議するケースでも必ず1セット持っていた方が良い。

コーデック 音声信号の圧縮・解凍アルゴリズム。

つまり、デジタル化された生の音声データを効率良く伝送するためにデータサイズを小さくするアルゴリズムのこと。

エコーキャンセル 部屋の壁や天井などに反射した音声(間接波)が声の直接波から遅れてマイクに集音されることによって聞こえるエコーを、フィルタで除去する技術。

エコーキャンセルをかけすぎると、直接波を誤ってキャンセルしてしまうため、チューニングは慎重にする必要がある

 指向性 マイクならば集音方向、スピーカーならば音波の放出方向の物理特性。

マイクスピーカーは指向特性が製品ごとに異なるため、それを意識した機器選択と配置が必要。

集音範囲 製品のマイクが集音できる空間の広さ。マイクの指向性と、集音可能距離で決まる。

例:360°/半径3.0m、120°/半径1.5メートル

ボリューム自動調整  マイクで集音した音のボリュームを自動的に調整することで、遠くの人の小さな声を増幅したり、近い人の声の音割れを防いだりする。

自動調整によりマイク感度が上がりすぎると、ノイズやエコーを大きく拾ってしまう可能性がある

音場 ここでは音響機器を設置する空間のことで、会議室の広さはもちろん、天井の高さ、壁の材質、置かれている物など、音波に物理的な影響を与える全ての要素を含めて指す。
クロストーク 相手側と自分側の人間の両者が同時に発言した状態。後述の理由でいずれかの声が聴こえにくくなるのが通例。

マイクスピーカーの品質をみる上で、このクロストーク処理の上手さが会議に満足度に大きく影響を及ぼします

マイクスピーカー(スピーカーフォン)のジレンマ

どうしてマイクスピーカーで失敗する例が後を断たないのか、動作の特性から考えてみましょう。

WEB会議が音響機器にあたえた苛酷

通常、コンサート・ライブ、または講演会などの場では、音響の専門家が事前にその会場の音響特性を把握します。

音源の種別は何か、機器をどう配置したらハウリングが起こらないか、マイクの感度やスピーカーのボリュームはどう調整した聴衆に満足してもらえるか、そういったことを細かく調整して本番に備えます。

一方で会議用の音響機器はそこまでの段取りは踏めないことが多々あります。

事前にマイク・スピーカー位置固定で入念に事前確認された会場であれば良いのですが、なにせWEB会議となるとその手軽で簡単で場所を選ばず使える、ということが売りにされるわけです。

WEB会議のその利点は、本来、音響機器としての理想的な使い方とは相反するものなのです。

「会議」というシーンの困難さ

音響設計の大原則として

「自分のスピーカーから出した音は自分のマイクで拾ってはいけない」

ということを守らなければいけません。カラオケでもおなじみの「ハウリング」が起きないようにするためです。
つまり、自分の声がスピーカーから拡声されるのは良いとして、その音を更にマイクで拾ってしまうと、無限ループに陥ります。
ハウリングの仕組み

そのため、なんらかのアルゴリズムで、自分のスピーカーからの音はマイクで拾ってもキャンセルする、またはそもそも拾わないようにデジタル制御がなされます。

そうなると問題は、クロストークが発生した場合です。

上記の通りハウリングの発生を抑止するために、スピーカ出力またはマイク入力いずれかをキャンセル処理します。しかしそれが誤って本来必要な音に対してなされてしまうと、互いにとって声が聞こえていない・途切れるという状態に陥ります。

相手の発言の途中で質問しようとする人や、会話を遮る人、いるのではないでしょうか。

発表者が順番に発言して、QAは最後にまとめて、などというお行儀の良い会議ばかりならば良いのですが、本来の「会議」の真骨頂ともいえる、侃侃諤諤とした議論の場では非常に問題が多いことになります。

ハウリングの原理を理解すればクロストークの処理の難しさというのも納得できるものと思います。
つまり、自分が発言中に会議相手の話し声が自会場のスピーカーから出力されてしまうと、それを自分のマイクで拾ってしまっては相手に声が返ってしまうので、自会場マイク感度が下げられる(その結果、自分の声が相手に届かない)、もしくは自会場のスピーカー出力が減衰する(その結果、相手の声が聞こえない)という状況に陥るのです。

ならばなぜ私たちの誰もが使っている電話ではなぜこんな問題が発生しないかというと、マイクとスピーカーが干渉しない位置にあるためです

また、専用機のテレビ会議システム付属のマイクスピーカーはこのあたりの処理が段違いに優れています(※)。したがい「SonyやCiscoのテレビ会議システムは問題なかったのに、WEB会議は音が悪くて使えない」という評価が下されることも珍しくないのです。

専用機のマイクスピーカーは価格が桁違いです。同レベルの品質を求めるのは軽トラックに対してポルシェのように走れと言っているようなものです。それとWEB会議用の機器を比較するのは酷です。

「一体型」マイクスピーカーの困難

「一体型」のUSB接続型マイクスピーカーのうち、集音範囲360°の製品としてWEB会議での使用実績が一番多いもののひとつに、ClearOne の chat150があります。

この製品のように、マイクとスピーカーが同一の筐体に収められている場合、マイクとスピーカーの距離は常に一定です。それによって後述の「分離型」と比較してキャンセル制御のための複雑な計算が軽減できるメリットがあると思います。

一方で、後述する空間的に分離されていることで得られる音響的な手がかりというのがあるのですが、それが得られないため、単純で「決めうち」の制御にならざるを得ません。また、本体スピーカーから発生するノイズや物理的振動からは絶対に影響を受けてはいけないので、それらの消去が何より優先されるでしょう。

そのため、一体型マイクスピーカーでクロストーク時の自然な聞こえを実現するのは理論的に困難を極め、WEB会議用として見合うような安価な製品でそれができるものは皆無だとあえて私は言い切りたいと思います。

「分離型」マイクスピーカーの困難

一方でマイクとスピーカーが離れた製品があります。YamahaのYVC-1000です。

先に結論から言えば、設置・運用上の問題がなければ、この製品さえ使っていば「音が悪い」という問題の多くが解決できます

マイクとスピーカーが空間的に分離していることで、自分のスピーカーからの音を認識できる物理的な手がかりのバリエーションが増えます。
周波数特性、反響音の特性、位相特性などがあるでしょう。

それらの手がかりを用いて自分で放出した音の周波数・レベル・位相が空間を経てどう減衰・遅延するかを把握できれば、スピーカーからの音にフォーカスしてキャンセルさせることも理論的には可能といえます。

こういった手がかりを駆使することで、誤ったキャンセルによる音の途切れを軽減し、クロストーク時も一体型よりも自然に伝えることが可能です。

また、これは私の個人的な考えですが、「一体型」のような設計のしばりから解放されることで、スピーカー自体の音質もより聞きやすさを追求できるかもしれません。
例えば、一体型の場合は、本来はもっと低音を出したほうが自然な声に聞こえるけど、筐体に共振が発生してマイクに影響を及ぼすからできない、といった縛りがあるはずです。分離型のほうがスピーカーの音響設計の自由度が高まるのではないでしょうか。

さて、本節の題目の通り分離型はメリットだけではありません

マイクを自由な場所に設置できるということは、その都度スピーカーとマイクの位置関係が変わるわけですから、その位置関係をシステムが把握していないと、キャンセル処理がうまくいきません

そこでYVC-1000では、マイクの場所を決めたのちに、「初期設定」が必要となります。

スピーカーからノイズ音を数回発生させてマイクを集音することで、音場の物理特性を把握し、マイクの位置関係を認識するのです。この作業には確か1分くらいかかったはずです。

また、そのように初期設定をしたとしても、マイクの場所を変えたら設定が台無しです。自分が話す番になってマイクを近づけるなど言語道断です。

さらには、「初期設定」したときにはなかった物体がマイクとスピーカーの間に置かれたりしたら困ります。ノートパソコンを開いて壁を作ったりするのは厳禁

下記はYamahaが公開している動画です。なぜか薄着の女性が説明しており気が逸らされますが、ごく基本的な注意点を述べていますので内容のほうをしっかり頭に入れておきましょう。

会議が求める「指向性」がもたらす困難

もうひとつ、音響機器を困らせるのが「複数の人がいろいろな場所でしゃべる」ことです。

システムとしては、話者の声のみを相手に届け、雑音やエコーはキャンセルしようとして処理します。
もし「マイクからみた話者の方向」が特定できれば、それがやりやすくなります。
マイクに指向性をもたせ、一番感度が高い位置に話者がいてくれれば、それ以外の角度からの音は減衰させることができます。

しかしながら実際の会議では、机を囲んで複数人が発言することが珍しくありません。
したがい、集音方向360°をうたう製品である程度高級なものになると、単に360°すべての音を均等に拾うというわけではなく、リアルタイムに指向性を変化させます
簡単に言えば大きな音が入ってくる方向に対して感度を上げる制御をリアルタイムに行います。

ですが、あっちこっちから発言されると、指向性の自動調整が追いつきません。タイミングによっては本来拾うべき声が減衰させられてしまい、「なんだか聞こえにくい」という印象になってしまいます。

急に話者の位置が変わった時のシステム追従イメージ:
複数話者発生時のマイクスピーカーの指向性最適化処理問題

実は使いどころが難しい「ボリューム自動調整」

用語説明でも述べた「ボリューム自動調整」は、「話者との空間的距離」を埋める機能です。マイクから離れた人の減衰した音声を持ち上げて、相手に聞こえやすくします。
マイクスピーカー自体のマイク感度調整として備わっている場合もあれば、WEB会議の機能としてソフトウェア的に実現される場合もあります

一見便利そうなこの機能ですが、持ち上げる音が「発言者の声」であることを正確に検出するアルゴリズムが備わっていてこそ成立するものです。

「発言」とは関係ない遠くの雑音や壁からの反射音などは、データ処理で消去されるに越したことはないですが、本来ボリュームとしては大きくありませんからもしそのまま相手に伝送しても致命的なものではありません。
しかし「自動調整」によって持ち上げられてしまったら大きく邪魔になってしまいます。

この「自動調整」は、WEB会議の仕様によってデフォルト設定でONになっている場合も少なくありませ。「こんなに離れて話しても伝わりますよ」なんて宣伝しているシステムがあればたいがい同様の機能がONです。しかし実際問題として、もし「音が途切れる」とか「雑音が入る」といった不具合が生じた際には、切り分けとしてまっ先にOFFにしてみる対象でした。

裏を返せばそれだけ弊害が考えられる機能だということです。

実例としては、「エアコンの音」「後ろのほうで議事録を取っているだけの人のキータッチ音」などが相手に耳障りになってしまうという体験があります。
我々が普段はさほど気にしない音であっても、「相手に伝えるべき音」として処理されてしまうケースがあるのです。

失敗しない音響機器の選択

いよいよ本題です。

ヘッドセットマイクを絶対に買わなければいけない理由

「ヘッドセットマイク」「マイクスピーカー」を比べる上で音響的に大きなインパクトを生んでいるのは、耳や口との距離が近いか遠いかです。

ヘッドセットマイクは音場が限定されることで、さまざまな物理的な影響が排除されるため、高音質を確保するための条件は広い空間にマイクスピーカーを配置するよりも遥かに恵まれています。

したがって、マイクスピーカーならば一定の品質のものを用意するとなれば個人用でも3万円くらいする業務用の機器を購入するのが無難なのですが、ヘッドセットマイクならば10分の1の3千円のものでも十分実用性があります。

しかも3千円のヘッドセットマイクの音の方が高級なマイクスピーカーより明瞭に聞こえても何ら不思議ではありません

下記はAmazonリンクですが、ロジクールのこのシリーズのモデルはAmazonなら三千円台〜五千円台で買えるものの、不具合に遭遇したことは私の経験上で言うと今の所ありません

逆に言えば、ヘッドセットマイクを使ってもうまくいかなければ、そもそも製品のバグか、設定がおかしいか、ネットワーク環境がおかしい、というように要因が大きく絞られるため、不具合発生時の切り分けにもよく使われます

ヘッドセットマイクが実用上使い道がなく、コードが邪魔だからBluetooth型のワイヤレスタイプにしたいとか、ピンマイクにしたいといったことは当然あるでしょう。

それらは確かに音響空間の影響を受けにくいという意味では共通しています。しかしBluetooth等ワイヤレスがゆえのノイズの影響が入り、余計な要因を増やしてしいます。

普段使わないとしても、前述のような安い製品で良いので有線のヘッドセットマイクは必ず2セットは持っていたいです(相手とワンペアで動作確認するため)。

「一体型」先駆者 ClearOne chat150 の評価

「一体型」の代表格として上で挙げたchat150についていうと、限界を十二分に認識した上で使うならば選択肢の一つとなります。

しかし私が知る限り、この製品では満足できずに買い換える、またはWEB会議自体をやめてしまうケースが少なくありません

クロストーク時の減衰や途切れが不自然な場合が見受けられます。
前述のマイク指向性の自動調整に対して利用者側の理解不足もあるものと思います。
また、私がデモ用として複数台購入した際に、個体によって品質にバラツキもみられました

chat150について詳しくは下記の別サイトに譲ります。

私個人の評価としては「素人には難しい商品」です。

一方、同じClearOne製品でも、集音が前方120°で距離も短い chat50 という製品がありますが、これは集音範囲が狭まったことでだいぶ難から逃れたのか、上位のchat150よりも音質が良いというユーザーさえいました
それほど空間の許容度を広げることは難しいのです。

1〜3人くらいのフランクな会議ならば、chat50で十分ではないでしょうか。

「後発の利」Yamaha YVC-300

かつてYahamaにはPJP-50USBという製品があり、広い部屋でのWEB会議ではこれほぼ一択でした。

決して悪い製品ではありませんでしたが、一致型だったということもあり、設定や調整が難しい製品でした。

また、10万円を優に超える高価な製品で、使う側の期待値も高く専用機並みの品質を期待したが故に、その差に愕然としました。
個人的には、「WEB会議は音が悪い」が一般認識となった元凶の一つではないかとさえ思っています。

それを反省(?)してYamahaが出したのが後述のYVC-1000という名機なのですが、その流れを汲み一体型でも従来製品をかなり上回る品質に仕上げてきたのがこのYVC-300です。

この製品はchat150を意識して作ったものであることは明らかで、実際にヤマハの技術者からも、chat150は技術的に古い部分がありこちらのほうが優れると言われたことがあります(営業ではなく技術者ということで説得力がありましたが・・・)。

この製品は単一指向性マイクが3つ内蔵され、360°対応とされます。

集音範囲は推奨で半径1.5mと狭めですが、最大3.0mということでその程度までは余裕で拾えました。
3〜5人程度で机を囲んで会議するにはちょうどよいと思います。

WEB会議の救世主:Yamaha YVC-1000

「失敗しないマイクスピーカー(スピーカーフォン)」として私が一番に挙げたいのがYVC-1000です。
※新型コロナのテレワークによる需要拡大によりずっと品切れでしたが、ようやくちょくちょく供給されるようになってきました。

既に口コミやレビューサイトでも賞賛されていますが、どうも評価のポイントが曖昧であったり環境依存の影響が排除できていない口コミ、感想、レビューが多いような気がしています。
この製品のすばらしい点は下記です。

分離型でクロストークも大きな違和感がない

クロストーク時に音が途切れたり不自然な減衰があることで、人は「音が悪い」と感じます。

このYVC-1000であっても、完全にお互いの発話がバッティングしてしまうと、明瞭な音声が届けられなくなります。
しかし、「大きな違和感がない」というのが主観的な感想です。

私は最も悪条件下のクロストークをエミュレートするために、いくつかの製品で以下のような実験をしてみました


  1. ルームAとルームBをWEB会議で接続。それぞれに同じマイクスピーカーを設置する。
  2. ルームAのマイクの真正面にスピーカーを置き、iPodで英会話の音声を流し続ける
  3. ルームBで人に文章を読み上げてもらい、ルームAでそれをどれだけ聴き取ることができるか確認する。

クロストーク発生時のマイクスピーカー挙動模擬実験


その結果、YVC-1000は、英会話の発生タイミングによってBからの朗読音声の減衰が認められましたが、他の製品にみられたような「ブツブツ音が切れる」や「ノイズのように聞こえる」といった現象は一番少なく、「同時に話したら聞こえにくいのは仕方ないよね」程度の感覚で見過ごせる程度のものでした。

他の製品では、リアルタイム処理が追いつかないのか、英会話の一文が終わってブレイクが入っている間もルームBからの朗読音が途切れたままであったり、ブツブツと途切れる現象が発生し、とても気になるレベルでしたが、YVC-1000は「最大限マシ」と言えました。

初期設定で、設置環境に応じた調整が自動で行われる

前述の通り、YVC-1000「初期設定」が必要となります。

スピーカーからホワイトノイズのような雑音を数回発生させてマイクで集音することで、音場の物理特性を把握し、マイクの位置関係を認識するのです。この作業には1分くらいかかります

設定に手間がかかるという意味で前述ではデメリットとして取り上げましたが、この設定が必要な理由が理論的に納得できるのと、設置した空間に最適化してくれているという安心感が非常にポジティブに感じられます。

入出力レベルやエコーキャンセル強弱などのパラメーター、または本体の物理的な位置などを試行錯誤で変化させて最適解を得るような作業は、職人には楽しいかもしれませんが、一般ユーザーには苦以外の何者でもありません。(感覚論のようで、この「安心感」は実運用で非常に大事。)

拡張性が高く、比較的安価に拡張可能

「一体型」のマイクスピーカーでは、chat150にしてもYVC-300にしても、利用する部屋が広い場合にマイク集音範囲を広げるためには、本体を連結させて対応します。

そうなると問題は、本体の価格の倍数で費用が発生することです。

一方でYVC-1000は、専用機のテレビ会議システムのように、マイクの数を増やすことができます
マイクは本体よりずっと安い価格で手に入ります

従い、マイク一個付属のYVC-1000を買っておき、広い部屋に置きたければYVC-MIC1000EXを更につなげれば良いのです。

これは、10数万円した過去のPJP-50USBを2台3台買ったユーザーからすれば、反則級の便利さです。

入出力とも外部機器との接続が可能

これがなにせ画期的でした。

まず、外部スピーカーが接続できます

これは「一体型」では絶対に真似できない仕業であり、まさに「離れ業」なのですが、前述の初期設定機能で外部スピーカーの音響特性を測定できるために可能になるのです。他メーカーの一般的なスピーカーであっても接続することができます

また、同じ理由で外部マイクも接続できます

これにより、セミナー会場や展示会など、ステージ上の話者が講演・説明する場合にも使用でき、複数拠点同時講演や、遠隔地と中継してのデモが可能になります。

もちろん、そのマイクでスピーカー出力音を拾ってハウリングが起きないようにするためにはスピーカーとマイクの位置関係に留意する必要があり、場合によっては別途エコーキャンセラーが必要になるでしょう。

まとめ:これに当てはまらなければ、YVC-1000 の一択!

ここまで絶賛してきたYamaha YVC-1000ですが、以下の場合には必ずしも最適な選択とはなりません

  • パーティションで区切られただけのような部屋で使う場合
    • YVC-1000のマイク集音範囲は仕様表に最大5mとありますが、とにかくよく拾います。
      線路近くのビルでは電車の音が相手に聞こえてしまうくらいです。
      雑音が多いスペースには向きません。
  • 前方にスピーカーの設置場所がない場合
    • 本体兼スピーカーはそれなりの大きさで、設置には場所をとります。それを会議室の前方に置くスペースが要りますので、常設できる場所がない場合は向きません。
  • 使うたびに機器を出し入れする必要がある場合
    • 遠隔会議をやるときにだけスピーカーマイクを設置する運用となる場合、基本的にマイク位置が変わると「初期設定」が必要となるので不向きです。
      ただしこの場合でも、マイクを置くべき位置にマーカーをつけておくなどして対処するユーザーもありました。それなら毎回の初期設定は不要になります。
  • マイクを個別にミュートしたい場合

以上のようないくつかのケースに当てはまらないのであれば、私の意見としては「YVC-1000一択」とまで言い切りたいと思います。

価格は10万円以上しますので、予算が許さなければ小人数参加拠点にはYVC-300を入れたら良いと思いますが、たとえ1〜3人くらいの小規模な会議でも選択肢として考えるべきです。

ここまで言うのは、この製品ならばユーザークレーム受けることがほぼなかったという経験によりますが、WEB会議メーカーがこの製品にもつ信頼性の高さも説得力を与えます。

V-Cubeのセミナーに行っても、WebExのセミナーに行っても、WEB会議のデモで使われているのはこの製品でした。
「音が鮮明です」と説明されても、それはYVC-1000のおかげじゃないかと思って聞いていたほどです。
それだけ、WEB会議には欠かせない存在となっていました。