Како функционишу апликације за идентификацију музике попут Схазама?

Апликације за идентификацију музике у почетку делују као магија, али испод хаубе се налази софистицирани алгоритам који може да пронађе песме у трену. Ево како они раде.

Магија музичке идентификације

То се вероватно свима нама догодило. Вечерате у лепом ресторану, дружите се у кафићу или шетате у продавници, када одједном чујете сјајну песму како свира преко звучника. Можда је то песма коју сте раније слушали или песма коју никада нисте чули. Дакле, извлачите телефон, отварате Схазам и држите уређај до плафона. У трену, апликација вам говори која је песма, ко је извођач и где да је стримујете.

Брзе су, изузетно тачне и могу да идентификују чак и најнејасније песме. Укратко, они раде тако што изолују песму из снимка и претражују је у опширној бази података. Али технологија која стоји иза тога како то раде је прилично сложена и импресивна.

Можда ћете бити шокирани када сазнате да је апликација Схазам коју данас познајемо објављена давне 2002. године, а систем је тада био тачан и брз као и сада. То је све захваљујући јединственом алгоритму који би направио револуцију у музичком свету.

Није само у стиховима

На први поглед, апликације за идентификацију музике као што је Схазам могу изгледати једноставне. Можда мислите да само слушају текст, исто као и било који гласовни асистент, и претражују га у бази података песама да би вам рекли која је песма.

  Бригхт Дата Цоллецтор чини Веб Сцрапинг лаким [No-Code Solution]

Међутим, већина апликација за идентификацију музике може да каже који је наслов инструментала или чак певач обраде песме. То је зато што, уместо да анализирају текст песме, они траже „отиске прстију” који су јединствени за сваку песму у њиховим обимним базама података.

Технологија отиска прста

Вероватно имате уређаје који се могу откључати помоћу вашег отиска прста, што је распоред малих линија на вашем прсту који су јединствени за вас. Слично томе, када подигнете микрофон да бисте снимили кратак снимак песме, овај клип се претвара у обрасце података које Схазам или нека друга апликација може потражити у својој бази података.

На први поглед, овај метод изгледа подложан неколико проблема. Већину времена када чујете музику у јавности, постоји позадинска бука и изобличење узроковано звучницима, што може да учини да се песме не могу идентификовати или да доведу до нетачних подударања. Такође, постоји много података ухваћених чак и у кратком звучном снимку, што може успорити претрагу ових образаца у бази података од милиона песама.

У интервјуу са Сциентифиц Америцан 2003. године, Ејвери Ли-Чун Ванг, главни научник података и суоснивач Схазама, објашњава како њихов алгоритам решава ове проблеме. Информације о аудио клипу могу се визуелизовати помоћу 3Д графикона познатог као спектрограм, који представља промену фреквенција током одређеног временског периода. Такође узима у обзир амплитуду, колико је гласан звук. Ово је представљено у спектрограму користећи интензитет боје.

На исти начин на који људи не могу да перципирају звук осим ако нису на одређеној фреквенцији, уместо да узме у обзир целину песме приликом претраживања, Схазам узима само „вркове“, што је највећи енергетски садржај у аудио клипу. . Отисци прстију које снима узимају само тачке највише фреквенције у датом временском оквиру, а затим тачке вршне амплитуде унутар тих фреквенција.

  8 Распберри Пи 5 додатака за ослобађање снаге вашег Пи

У истраживачком раду за Колумбија универзитет, Ванг је изјавио да им метода омогућава да уклоне већину непотребних делова аудио клипа као што је позадинска бука и да уклоне изобличење. Такође чини величину отисака довољно малом да су потребне само милисекунде да се песма идентификује у њиховој огромној бази података.

Схазам’с Импацт

Осим што су корисне за просечне слушаоце који чују песму која им се допада, апликације за идентификацију музике такође помажу у обликовању музичког света.

Радио станице и сервиси за стриминг често користе податке о томе шта људи највише шазају да би открили које нумере слуша јавност. Ово је корисно јер указује на привлачност и потенцијалну популарност песме, без обзира на извођача. Када идентификујете песму помоћу апликације, одмах ћете видети колико људи је такође покушало да је идентификује.

Од успона Схазама, појавило се и неколико конкурената. Соундхоунд тврди да може да идентификује песму једноставно по томе што је певате или певушите, са мешовитим резултатима. Ту је и идентификатор песме интегрисан са гласовним апликацијама као што је Гоогле Ассистант који раде веома слично Схазам-овом систему.