Googleの「HumToSearch」の曲識別のしくみ

どの映画を見るべきですか?
 

Googleは最近、ハミングに基づいて曲をすばやく識別することができる新しい「HumToSearch」機能をリリースしました。知っておくべきことは次のとおりです。





先月、 グーグル ユーザーが曲をハミングして曲を検索できる機能をリリースしました。 Shazamのようなアプリを使用すると、ユーザーはラジオで聞いた曲を検索できるため、このメロディースタイルの音楽検索方法は完全に新しいものではありません。しかし、グーグルは、ユーザーが言葉を完全に覚えていない曲を単に口ずさむことができるようにすることで、物事をさらに一歩進めています。






Googleのイノベーターは、何年もの間音楽認識技術に取り組んできました。 Googleは2017年にPixel2でNowPlayingをリリースしました。これは、モバイルデバイスに低電力の音楽認識をもたらす機能です。 1年後、同じテクノロジーがGoogleアプリのSoundSearch機能に導入されました。 2020年に早送りすると、Googleはユーザーの舌の先で曲を検索することを合理化する方法を見つけました。



関連:Google検索結果を過給する方法

ユーザーは最新バージョンのを開くことができます グーグル アプリ、マイクアイコンをタップし、「」と言います この曲は何ですか? 'または'をクリックします 曲を検索する 'ボタンをクリックし、10〜15秒間ハミングを開始します。 Googleの機械学習アルゴリズムは、ハミングを取り、それを潜在的な曲に一致させようとします。新機能は、 Googleアシスタント 同様に、単に 'と言うことによって ねえグーグル、この曲は何ですか? 'そして、曲をハミングします。新しいテクノロジーは現在、Androidでは20の異なる言語で利用できますが、iOSでは英語でのみ利用できます。






Googleの「HumToSearch」の背後にある科学

Googleによると、Hum To Searchテクノロジーは、曲を直接検索するのではなく、曲を既存のメロディバージョンのデータベースに一致させようとするメロディ検索の他のアプローチとは対照的に機能します。グーグルと 方法 、 テクノロジー ' 中間表現を生成せずに、曲のスペクトログラムからメロディの埋め込みを生成します 。」基本的に、このアプローチは、別のハミングされたバージョンと一致させる必要なしに、ハミングされたメロディーを元の録音に直接一致させることができると想定されています。 Googleは、以前のテクノロジーであるNow PlayingとSoundSearchで使用されていた音楽認識モデルを変更して、ハミングされた録音で機能するようにしました。これには、異なる楽器や歌声を使用して作成された場合でも、同じメロディーを含むオーディオのペアの埋め込みを作成するための機械学習テクノロジーのトレーニングが含まれていました。その結果、50万を超える曲データベースで高レベルの精度に到達するシステムができたとGoogleは言います。



これはすべて、グーグルが完全に覚えることができない曲を持っているという問題と戦う方法を科学的に見つけたという事実に追加されます。確かに、それは2020年の最も差し迫った問題ではないかもしれませんが、多くの人は、曲の名前を覚えて、1日中またはそれ以上頭に刺さった経験に精通しているでしょう。ユーザーが歌詞を思い出せない場合や、基本的なハムを超えた曲を思い出せない場合でも、Googleには解決策があります。






ソース: グーグル