BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース MLow:Meta社、ローエンド・デバイス向けオーディオ・コーデックを発表

MLow:Meta社、ローエンド・デバイス向けオーディオ・コーデックを発表

原文リンク(2024-08-10)

Meta社はこのほど、ローエンドデバイスや低速接続でのリアルタイム通信(RTC)を強化することを目的としたMeta Low Bitrate(MLow)オーディオコーデックを発表した。この新しいコーデックは、低帯域幅の条件下でも効率的で高品質なオーディオストリーミングを実現するよう設計されている。

MLowは、オンライン会議、ゲーム、ライブストリーミングなど、低遅延・低ビットレートのオーディオが要求されるユースケース向けに最適化されている。開発者によると、この新しいコーデックは、Opusの2倍の品質(6 kbps WBでPOLQA MOS 1.89対3.9)を達成する一方で、計算の複雑さは10%低いままだという。

MLowは軽量に設計されているため、モバイル機器やその他のリソースに制約のあるプラットフォームに適しており、リアルタイム・シナリオにおけるネットワークの輻輳や遅延を軽減する。Jatin Kumar氏、Bikash Agarwalla氏、Sriram Srinivasan氏、King Wei Hor氏、Tim Wong氏がその目標を説明する。

私たちのユーザーの多くは、いまだにローエンド・デバイスを使用しています。例えば、WhatsAppの通話の20%以上はARMv7デバイスで行われており、WhatsAppの1日の通話の1,000万回以上は10年以上前のデバイスで行われています。すぐに利用できるコーデックの選択肢と、どのデバイスを使用しているかに関係なく、すべてのユーザーに高品質な通話体験を提供するという我々のコミットメントを考えると、最低ビットレートで高品質のオーディオを提供しながら、コンピューティング要件が非常に低いコーデックが必要なのは明らかです。

出典メタ・ブログ

通常、複雑さやビットレートを上げるとオーディオ品質は向上するが、新しいコーデックの目標は、複雑さとビットレートのバランスを取りながら、より高い品質を達成することだ。これは、オーディオ信号の性質に関する深い知識を活用し、音響心理学を活用することで達成される。

採用はもう一つの課題である。最後に広く知られた高品質のオープンソース・コーデックは、2012年にリリースされたOpusである。Kumar氏、Agarwalla氏、Srinivasan氏、Hor氏、Wongはこう付け加える。

MLowは、古典的なCELP(Code Excited Linear Prediction)コーデックのコンセプトをベースに、励起生成、パラメータ量子化、符号化方式を進化させたものです。(これらのスプリットバンド最適化により、ハイバンドを非常に少ないビット数でエンコードができ、MLowはスーパーワイドバンド(32kHzサンプリング)をより低いビットレートで実現できます。

Srinivasan氏、Kumar氏、Agarwalla氏の3人は最近、MetaがWhatsApp、Instagram、Messenger全体で、デバイスやネットワーク状況の多様性に対応しながら、自然なリアルタイムの音声コミュニケーションを大規模に管理する方法に関するセッションを発表した。Redditの人気スレッドで、ユーザーのBlueSwordM氏こう書いている。

低ビットレートオーディオコーデックの増え続けるライブラリに、新たに素晴らしいものが加わったようです。この紹介記事の唯一の問題は、この低ビットレートで使用されたOpusのバージョンが明記されていないことです。Opus 1.4が使用されたのかOpus 1.5が使用されたのかわからないです。Opus1.5が新しいMLコーディングツールによって低ビットレートで改善されたことを考えると、少し誤解を招きかねないです。

ユーザーのggRavingGamerは、技術的な成果を強調しながらも、こう警告している

それは問題ではないです。ほとんどのポッドキャスト、ほとんどのものは、20年後もMP3とAACを使うでしょう。

この新しいコーデックは、ウェブ開発、モバイルアプリ、組み込みシステムなど、さまざまなアプリケーションで使用できる。

作者について

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT