Monday, December 12, 2011

Hledat hudbu na internetu můžete chytře nebo chytřeji

Hudba došla. Tak nějak stručně se dá nazvat stav, kdy se vaše sbírka empétrojek na disku stala beznadějně oposlouchanou a současně člověka omrzí klikat na náhodná hudební videa na Youtube.

V ideálním světě zavoláte kamarádovi a ten vám hned doporučí výbornou kapelu přesně podle vašeho gusta, se kterou šťastně strávíte měsíc nebo dva. V praktickém světě vaši kamarádi poslouchají samé divné věci.

Svět internetový nabízí několik možností, jak poznat nové interprety, kteří se vám budou líbit. Můžete (1) zkoušet různá internetová rádia, která umí řadit hudbu podle žánrů, a čekat, až se vám prostě někdo strefí do noty a pak si dotyčného koupit stáhnout pořídit, nebo můžete dělat totéž, ale o trochu chytřeji (2).

Předností první varianty je zejména velké pohodlí. Internetových rádií jsou mraky (dokonce i těch bezplatných). Z těch nejznámějších stačí zapnout třeba AccuRadio (funguje celosvětově) nebo Slacker (bohužel s přehráváním v ČR jsou problémy), vybrat žánr, na jaký máte chuť a rádio hraje prakticky donekonečna, aniž byste se o něj museli jakkoliv dále starat.

Českou obdobou je třeba ABradio, které provozuje více než stovku žánrově rozličných rádií, mezi nimi třeba Vodopád písní Heleny Vondráčkové. ABradio je však variantou „nečistou“, protože je spojeno s terestriálním vysíláním několika klasických rozhlasových stanic kombinujících proud hudby s mluveným slovem. Od tohoto specifika se odvíjí í ráz vysílání – například tím, že abradio neumožňuje žádnou individualizaci (nelze dokonce ani přeskakovat písně, čímž okamžitě leze na nervy).

Kdo má ale pod čepicí, může jít na věc daleko chytřeji a využít vymožeností kolektivní inteligence, prostřednictvím třeba last.fm.

Víc hlav, víc ví

Služba Last.fm dokáže díky tagování milionů uživatelů rozřazovat hudební interprety podle relevance a podobnosti. Něco podobného umí třeba i Pandora, ta však využívá primárně poměrně složitých algoritmů analýzy harmonie, rytmu apod. Hodnocení uživatelů pomáhá následně zpřesňovat výsledky, které Pandora nabízí po zadání vzorových hudebních kapel. Jak dobře to ale funguje neumím posoudit, protože Pandora z důvodu ochrany autorských práv bohužel na území EU nefunguje.

Z vlastní zkušenosti ale mohu svědčit, že o něco méně známější a populárnější, ale za to globální služba Last.fm funguje spolehlivě. Princip je odlišný, ale jednoduchý.

Více než 30 milionů uživatelů mají nainstalovaný jednoduchý plugin ve svém hudebním přehrávači, který si přečte metadata z každé přehrané hudební skladby a zašle je na centrální datové úložiště. Z nasbíraných dat pak last.fm na personalizovaném profilu uživatele vytváří jednoduché statistiky. Tato forma produsage je sama o sobě pro velkou část uživatelů dostatečně zajímavým benefitem pro to, aby obsah, který sami produkují, aktivně využívali. Statistiky umožňují jednoduše sledovat vývoj hudebního vkusu s časem nebo sledovat, co poslouchají přátelé.



Z hlediska tématu tohoto článku (jak najít nové zajímavé kapely, pokud jste to mezitím zapomněli) je ale důležitější druhá forma zpracování dat. Na základě toho, jaké společné kapely různí uživatelé poslouchají vytváří Last.fm korelace, ze kterých usuzuje hudební příbuznost nebo nepříbuznost kapel. Není potřeba proto žádný složitý algoritmus, který by porovnával skutečnou podobnost hudebních skladeb.

Pokud jeden uživatel poslouchá současně Karla Plíhala a Jarka Nohavicu, systém si toho všimne. Tento průnik sám o sobě nemá žádnou relevanci. Pokud je ale stejná korelace obdobná pro tisíce uživatelů, lze ji považovat za relevantní a pravděpodobně důležitou. Toto praktické využití kolektivní inteligence je dále zpřesňováno nejen vyšším poměrem shod, ale navíc je vážena počtem přehrátí za shodný časový úsek.

K čemu to všechno je? Pokud jsou vaše statistiky Last.fm dostatečně podrobné na to, aby zachycovaly široké spektrum vašeho hudebního vkusu, mohou být (a jsou) využívány k doporučování hudby. Pokud proto internetové radio Last.fm zjistí, že posloucháte Jarka Nohavicu, ale Karla Plíhala nikoli, usoudí, že Plíhala neznáte a nabídne vám jej.


Blbuvzdorná metadata

No jo. Ale co když Plíhala neposloucháte prostě proto, že kvílí jako meluzína? Jednoduché. Jedním klikem přehrávanou písničku přeskočíte, už ji nikdy neuslyšíte a systém dostane signál, že pro vás není Plíhal ta správná volba. Naopak můžete zase skladbu otagovat jako „loved track,“ což je pro last.fm signál, že má hledat více Plíhalů.

Ohromnou výhodou tohoto vlastně dokonale jednoduchého sociálního systému je, že výběr hudby neomezuje žánrově ani jiným atributem. Základním a hlavním signálem kvality je, jak dotyčného interpreta lidé poslouchají. Pokud má hodně lidí současně rádo Jarka Nohavicu a Rammstein, systém vám německé drsňáky nabídne taky, ačkoliv pro to vlastně není rozumný důvod.

Nejdůležitější předností je ale blbuvzdornost této formy využití kolektivní inteligence. Cory Doctorow vyjmenovává hned několik kamenů úrazů, na kterém padají sebelépe vymyšlené systémy web2.0 založené na tagování. Last.fm ale svou podstatou do značné míry několik z nich eliminuje.

Uživatelé nemají například důvod lhát, pokud lze předpokládat, že je zájmem uživatelů mít co nejpřesnější statistiky. Je sice možné, že si někdo chce hrát na intelektuála a tak si otaguje kompletní diskografii Justina Biebra jako W. A. Mozart. Z hlediska masy uživatelů ale taková redundace nemá žádný význam a systém neovlivní.

Navíc tagovací systém last.fm není nijak závislý na ochotě uživatele starat se o tagování nebo dokonce na jejich inteligenci. Uživatelé sice mohou hudební interprety tagovat dle svého uvážení prostřednictvím aplikace last.fm nebo přímo webu, a je v takovém případě na uživatelích, jak přesně skutečně vědí, do jakého žánru hudbu řadit (což je nejčastější způsob tagování).

Hlavním zdrojem dat jsou však standardizovaná metadata, která v sobě obsahuje většina nejpoužívanějších komprimovaných hudebních formátů, nejčastěji ve formě ID3v2 tagu, který si můžete sice libovolně editovat, ale u většiny skladeb jej již dostanete korektně předvyplněný od vydavatele nebo autora rippu. Riziko překlepů a chyb v názvech snižuje snaha správců last.fm sjednocovat různé varianty zápisu názvu autora do jednoho. A to vše bez většího úsilí uživatele. Ten si pouze nainstaluje plugin a i když na něj o týden později zapomene, audioscrobller neunávně taguje a odesílá data.

Kolektivní inteligence ani v případě last.fm samozřejmě není neomylná. Minimálně pokud se s ní správě zachází. Nelze například zaměňovat statistiky poslechovosti, které nabízí last.fm s názory skutečných publik. Průnik množin skutečného publika kapely a publika, které využívá last.fm, může být velmi malý, v některých oblastech (klasika) dokonce minimální. Vyloženě nesmyslné výsledky pak systém nabízí, pokud se více různých kapel jmenuje stejně, last.fm takové výsledky neumí rozlišovat.

Problém je také v tom, že audioscrobller nezachycuje zdaleka veškerou hudbu, kterou uživatel poslouchá. Pokud jsou audiostopy neotagované, audioscrobller nemá šanci je zachytit. Daleko častěji je ale bezmocný prostě proto, že hudbu posloucháte jinak než přes mp3 uložené na vašem disku – třeba v autě, v mobilu, na hifivěži nebo sice na počítači ale pomocí CD (i takoví lidé ještě jsou) nebo pouštěním klipů na youtube.com.

Velkou míru nepřesnosti pak skýtají výsledky u méně známých kapel. Nižší poslechovost logicky zvyšuje nepřesnost, kolektivní inteligence zkrátka potřebuje dostatečně velký soubor, aby byly výsledky relevantní. Nemusíte sice poslouchat zrovna mainstream, pokud ale preferujete garážovky, které krom vašich kamarádů zná jen soused u zkušebny, žádné relevantní shody vám last.fm nenabídne. V takovém případě větší službu udělá třeba Bandcamp.

Tak jako tak je Last.fm zajímavou alternativou k zaběhnutým internetovým rádiím, kterou by každý hudební fajnšmekr, který občas jako já trpí pocitem, že hudba došla, měl vyzkoušet. Radio Last.fm je sice placené, službu kterou ale poskytuje co do přesnosti výsledků konkurence jako třeba GrooveShark nenabízí.

1 comment:

  1. Já teda hudbu v poslední době poslouchám hlavně přes Spotify. To mi vyhovuje. Doma ale moc ne, spíš na cestě do práce a tak. Hlavně teda v autě. V tom je super, že tam teď máme nové autoradio, které jsme si sehnali tady. K tomu se právě můžu připojit i přes bluetooth a pustit si v autě co chci. To u starého radia bohužel nešlo.

    ReplyDelete