Skip to content

Як працює Google Hum для пошуку

22 de Квітень de 2021

Ключові винос

  • Google випустив новий інструмент, який дозволяє користувачам шукати пісні, гудячи, співаючи чи свистячи.
  • Новий інструмент використовує машинне навчання, щоб поєднати гугнявий трек з базою даних із понад півмільйона пісень, яка постійно оновлюється.
  • Користувачі Google запитують, яка пісня звучить майже 100 разів на місяць.

laflor / Getty Images

Google випустив нову функцію під назвою “Hum to Search”, щоб вирішити проблему, що викликає неприємності: застряг у голові пісня і неможливість зрозуміти, як вона називається. Ідея наспівувати, щоб знайти пісню, здається неймовірно простою, так чому ж Google запускає цю функцію лише в 2020 році? Ну, виявляється, ідентифікація пісень таким чином насправді є досить складною, частково тому, що наші гудкі версії, як правило, значно відрізняються від оригінальної композиції. В нещодавньому дописі в своєму блозі AI Google пояснює, як він використовував машинне навчання, щоб вирішити цю проблему, і врешті-решт допомогти людям знайти пісню, наспівуючи, свистячи або співаючи мелодію, навіть коли їх виконання менш ніж точне. “Ми зосереджуємося на пошуку гуму на допомозі людям ідентифікувати та знайти музику, яка застрягла у них у голові”, – сказав представник Google tebapit в електронному листі.

Просто почніть наспівувати

Користувачі Google запитують, яка пісня звучить майже 100 мільйонів разів щомісяця, Апарна Ченнапрагада, віце-президент Google та генеральний менеджер із споживчих покупок, заявила, що відео представляє кілька нових функцій пошуку. Тепер є спосіб це дізнатись. Функція “Hum to Search” вбудована в мобільний додаток Google, віджет Google Search і Google Assistant. Щоб отримати доступ до нього через програму, торкніться піктограми мікрофона та скажіть “Що це за пісня?” Вибір кнопки “Шукати пісню” також працює. Для коректної роботи функція вимагає від вас гудіння щонайменше 10-15 секунд. Користувачі Android можуть гудіти, щоб знаходити пісні більш ніж на 20 мовах, тоді як на iPhone працюють лише англійські пісні. Інструмент не завжди може ідентифікувати пісню відразу, але як тільки це вдається, результати досить хороші.

“Більше половини пісень із широким набором змінних (тон, висота, гучність тощо) розпізнаються нашими алгоритмами, але, звичайно, точність залежить від якості гудіння, типу пісні тощо “, – сказав представник Google tebapit в електронному листі. “Але як тільки її визнають, приблизно чотири з п’яти відповідей є правильними”. Однак наспівування не вперше використовується в програмі, що ідентифікує музику. SoundHound пропонує подібну функцію, як зазначає CNN Business, а також доступний на Android та iOS. За словами представника Google, нова функція не викликає жодних проблем щодо конфіденційності, а також “не змінює спосіб, яким Google обробляє аудіо-взаємодії”, – сказали вони. tebapit в електронному листі.

Машинне навчання

Незважаючи на простоту концепції, наспівувати мелодію, щоб знайти студійний запис, технічно досить складно. Цьому є кілька причин, – пояснює Крістіан Френк з Google Research у публікації в блозі від 12 листопада. Перш за все, наспівувана версія пісні може сильно відрізнятися від фактичного запису, ускладнюючи відповідність обох. Тож, хоча Шазам та безліч інших додатків уже існують для ідентифікації тієї пісні, яку ви чуєте в ресторані чи в іншому громадському місці, використання гугнявої мелодії як основи для цього пошуку може бути складнішим. “З текстами пісень, фоновим вокалом та інструментами звук музичного чи студійного запису може зовсім не схожий на мелодію”, – пише Френк. “Помилково чи задумом, коли хтось гуде свою інтерпретацію пісні, часто висота тону, клавіша, темп або ритм можуть дещо змінюватися або навіть суттєво”.

Візуалізація компанією Google гулу кліпу поруч із відповідним студійним записом.

Google

Оскільки гудкі версії пісень можуть настільки відрізнятися від оригіналів, Френк зазначає, що багато минулих методів вимагали узгодження гуду людини з версією пісні, що містить лише мелодію, або композицією, що включає гудіння. Це зробило справжні випадки використання справ складними, оскільки бази даних із цими піснями можуть бути обмеженими та потребуватимуть оновлення вручну. Google пояснює, що для функції Hum to Search вона використовує моделі машинного навчання, щоб перетворити звук у “послідовність, засновану на цифрах”, яка представляє мелодію пісні – те, що, як вона каже, можна сприймати як “відбиток пальця”.

Більш зручний для користувачів

Використання машинного навчання в функції Google Hum to Search, зрештою, значно полегшує використання інструменту в реальному світі. Оскільки Hum to Search відповідає гудній мелодії шукача фактичній пісні, інструмент може працювати з новими піснями, коли вони виходять, замість бази даних, яку постійно потрібно поповнювати напівзвуковими версіями кожного треку. Крім того, для його використання вам не потрібен ідеальний звук. “Поточна система досягає високого рівня точності в базі даних пісень, що містить понад півмільйона пісень, які ми постійно оновлюємо”, – йдеться у повідомленні Google у пошуковій програмі Hum to Search. “Цьому пісенному корпусу ще є куди рости, щоб включати більше з багатьох мелодій у світі”.