Saturday, April 16, 2011

Slovo, smysl a kyberprostor

Tento příspěvek nepopisuje, jakým způsobem se zábava, ekonomická činnost nebo jiné oblasti společenského života modifikují v prostředí Internetu, ale jakým způsobem dochází k extenzi dříve striktně vědeckého oboru – lexikografie – do uživatelského rozhraní v kyberprostoru. Bude nás zajímat, jak se z této původně exkluzivní oblasti stává nástroj společenské sebereflexe.

Lexikografie tradičně patří mezi kolektivní činnost, která vyžaduje spolupráci v rámci skupiny odborníků. Jedná se o velmi náročný druh vědecké práce, ke kterému je potřeba především excerpce z široké základny zdrojů (např. pro Příruční slovník jazyka českého bylo zpracováno okolo 5 miliónů excerpčních lístků). Výroba klasického výkladového slovníku je úkolem, který v předdigitální éře zaměstnal skupinu výzkumníku na celá desetiletí, přestože výsledky dlouhodobého snažení vyústily v popis, který byl v podstatě v době vydání již zastaralý. Ještě markantnější je případ slovníků neologismů, které reflektují nejdynamičtější část slovní zásoby.

Nový rozměr vnesly do této oblasti informační technologie, začaly se vytvářet elektronické databáze, které nabízí komplexní popis daleko většího počtu hesel, údaje o prameni a všechny formální náležitosti klasického slovníku. Paralelně s aplikací nové technologie v lexikografii se objevily první slovníky vytvořené na základě konceptu kolektivní inteligence. Fenomén Wikipedie tak brzy doplnil i pandán v podobě Wikislovníku.

Tyto slovníky, založené na principu trvalé metaverze, umožňují sloučit celou řadu slovníkových funkcí, kromě výkladu slovních významů se často objevuje i tzv. thesaurus (nabízející synonyma, antonyma, hyponyma atd.), nezřídka nabízejí související kolokace, citáty a fráze, výslovnost i etymologii slova. Navíc zpravidla spojují výkladový a překladový slovník a nabízí tak ekvivalenty v několika cizích jazycích. Z výčtu je zřejmé, že slovník musí editovat obrovské množství uživatelů, kteří zároveň mohou být i jeho uživateli, fenoménem se tedy prolíná též princip produsage. Samozřejmě, počet hesel i rozsah jejich zpracování je závislý na konkrétním jazyku, v češtině je možné v současnosti na Wikislovníku prohlížet 23 577 hesel.

Není překvapivé, že výše charakterizovaný slovník, má své kořeny v americkém akademickém prostředí, právě zde, konkrétně na univerzitě v Princetonu vznikl na samém počátku devadesátých let slovník WordNet, který se vyvinul na základě myšlenky hnízdovat hesla na základě synonym (tzv. synsets), a tak vlastně sloučit klasický výkladový slovník s tematicky pojatou encyklopedií. Tento slovník nejen, že byl založen na nových poznatcích z oblasti psycholingvistiky a kognitivní vědy, ale především nabídl způsob vyhledávání, který u běžných výkladových slovníků nebyl dosud běžný. Právě díky tomu se stal v anglofonním prostředí jedním z nejoblíbenějších slovníků na Internetu.

Wikislovník a WordNet posloužily jako inspirace pro celou řadu dalších menších projektů (např. BabelNet nebo DBpedia) a obě tyto ideové platformy se staly zdrojem i na úrovni materiální, slovníky obvykle rozšiřují, obohacují a strukturují hesla již vypracovaná v slovníky nové. Následovaly slovníky připravované již na principu kolaborativní práce dobrovolníků, kteří spolupracují pomocí společného metajazyka (obvykle je explicitně demonstrován v podobě komentářů v hranatých závorkách dotýkajících se kvality zpracování hesla). Jako příklady těchto slovníků mohou posloužit projekty Open Dictionary a The Collaborative International Dictionary of English.

V současnosti se v klimatu kyberprostoru rozvíjí především dvě odvětví této tradice. Jednak interdisciplinární využití některých poznatků psychologie a kognitivní vědy napomohlo rozvinout encyklopedické zpracování hesel pomocí tzv. kognitivního mapování, jednak se princip otevřeného, kolaborativně vytvářeného slovníku ukázal značně užitečný při popisu nového lexika a specializované slovní zásoby.

Kognitivní mapování je způsob strukturace znalostí založený na tzv. mentálních mapách, které schematicky a vizuálně znázorňují propojení jednotlivých pojmů. Jedná se o způsob uspořádání vědění, individuálního i kolektivního. Pomáhá pojmy definovat skrze vztahy k pojmům ostatním. Je zřejmé, že tento koncept je z praktického hlediska teprve v zárodku, ale je jisté, že se stal příslibem do budoucnosti. Sám Tim Bernes-Lee poukázal na to, že tzv. sémantický web (sémantická strukturace kybernetického univerza) bude jednou ze základních charakteristik budoucího Webu 3.0.



Podrobněji bych se ale chtěla věnovat druhé větvi, která vzešla ze zmíněných průkopnických projektů webového slovníkářství. Spektrum internetových obsahů prozrazuje, že se zde objevuje poměrně široká uživatelská iniciativa, která usiluje o popis okrajových, příp. specializovaných vrstev slovní zásoby. Jako podstatná motivační síla těchto aktivit zde působí i možnost postihnout po lexikální stránce dosud nezaznamenané oblasti společenské komunikace. Kromě silně entusiastického naplnění pohání tvůrce-uživatele i praktická využitelnost takového slovníku, právě proto, že nemá ve svém zaměření obvykle konkurenci. Tvůrci hesel se nesnaží napodobovat profesionální podobu slovníků, ani si nepohrávají s nároky na normativnost popisu, realizace se naopak pohybuje v rámci experimentální linie technologického pokroku aplikovaného na poli kolektivní inteligence. Již výše jsme se zmiňovali o vhodnosti tohoto přístupu k popisu dynamického subsystému neologismů.

Nebývalý úspěch zaznamenala v tomto směru webová stránka Urban Dictionary. V roce 1998 ji založil Aaron Peckham, student informatiky na Státní polytechnické univerzitě v Kalifornii. Chtěl zaznamenat slova nebo fráze z městského slangu, které nelze nalézt v žádném klasickém slovníku. Navíc ho napadlo sesbírat je z pomocí svých přátel a jejich osobních postřehů. Mnoho uživatelů přicházelo na stránku ze zvědavosti, proto aby našli význam slova, které zaslechli například během jízdy v metru, nebo proto, aby mohli přispět svou definicí k realizaci tohoto netradičního projektu. V současnosti stránka obsahuje více než 5 miliónů definicí (spolu s úryvkem kontextu, v kterém byl daný výraz použit) a v roce 2008 se dostala dokonce do žebříku časopisu Time mezi 50 nejlepších webových stránek roku. V dubnu roku 2009 se stránka rozrůstala o 2000 definicí denně, za měsíc jí navštívilo 15 miliónů unikátních uživatelů, z čeho 80 % mladších 25 let. V tomto roce se Urban Dictionary umístila v prestižním žebříčku webových stránek společnosti Alexa na 701. místě na světě, na 335. místě ve Spojených státech a počet stránek , které na ní odkazují, dosáhl 17 571.

Peckham vytěžil ze své popularity dvě knihy, první pod názvem Urban Dictionary: Fularious Street Slang Defined vydal v roce 2005 a druhá Mo' Urban Dictionary: Ridonkulous Street Slang Defined se objevila na prodejních pultech o dva roky později.

Na základě jakých mechanizmů tato stránka funguje? Uživatelé mohou vkládat své definice bez nutnosti registrování, povinným údajem je pouze e-mailová adresa, která má usnadnit proces identifikace příspěvku v případě námitek ze strany ostatních uživatelů. Hesla kontroluje skupina editorů, která se zaměřuje na porušení pravidel webu (např. v heslech by se neměly objevovat sexuální narážky, editoři zvažují, zda se z teoretického hlediska jedná opravdu o slangový výraz, vymazávají nesmysly atd.). Navíc mají uživatele možnost vyjádřit se k jednotlivým variantám definic prostřednictvím palců. Po ohodnocení jednotlivých definic je ta nejlepší vybrána jako definitivní vypracované heslo. Mimo výběrový algoritmus má web k dispozici ještě vlastní fórum, kde se nejčastěji diskutují otázky týkající se struktury slovníku.

Na Internetu najdeme ale i unikátní slovník a překladač internetového slangu Internet Slang Dictionary, který mapuje akronymy a zkratky používané při rychlé internetové komunikaci. Zájem o výklad slov, tentokrát z hlediska etymologie, přináší také poněkud bizarní pojetí ruské filoložky žijící ve Spojených státech Mariny Orlové Hot For Words, zpracované do krátkých klipů publikovaných prostřednictvím kanálu na YouTube. Orlovová se snaží přilákat mladé lidi na spojení „sexy“ formy a vzdělávacího obsahu.

I když se na první pohled z výše uvedených tendencí a proměn na poli online lexikografie může zdát, že se jedná o pouhé představení rozmanitosti internetové nabídky, vývoj ukazuje, že slovníkářství hraje v tomto diskurzu stále výraznější roli. Stává se nástrojem k uchopení jen těžko zachytitelné reality a v obecném měřítku se dokonce lexikografické hnízdování a sémantická klasifikace promítá stále hlouběji do samotných struktur kyberprostoru.

Kristýna Tesařová


Zdroje pro teoretické přístupy:

BASCA, C. – CORLOSQUET, S. – CYGANIAK, R. – FERNÁNDEZ, S. – SCHANDL, T. Neologism: Easy Vocabulary Publishing. Digital Enterprise Research Institute National Univerisity of Ireland, Galway, Ireland; Fundación CTIC, Gijón, Asturias, Spain, 2008.

MILLER, A. G. – BECKWITH, R. – FELLBAUM, CH. – GROSS, D. – MILLER, K. Introduction to WordNet: An Online Lexical Database. In. J Lexicography, Vol. 3, No. 4. (1 January 1990), s. 235-244.

MEYER, M. CH. – GUREVYCH, I. How Web Communities Analyze Human Language:Word Senses in Wiktionary. In. Proceedings of the Sekond Web Science Conference (WebSci), April 2010. Raleigh, NC, USA.

No comments:

Post a Comment