Úvod
Arabština
Lingvistika
Dějiny
Typografie

Studie & práce
Software
Výuka

Odkazy
Aktuality
Album
Qualitative is nothing
but poor quantitative.
Ernest Rutheford
Fraktál - Serpinského trojúhelník

T
edy konkrétně kvantitativní lingvistika, i když se nebráním ani jiným větvím této ušlechtilé vědy; ovšem netajím se názorem, že bez kvantifikace je velmi obtížné přinášet vědecké zákony, falsifikovatelné hypotézy, jak je chápe Popper, a vyvést tuto vědu ze středověkého pojetí, jakési alchymie jazyka, která mnoho věcí definuje, aniž by o nich cokoli řekla a kde dojmy platí za argument. Z těchto pozic si pomalu vytvářím vlastní pohled na jazyk a na to, co je za ním.

T-T Relation

Ptám se, co je jazykům společné. Třeba: Lze zobrazit dva texty v rozdílných jazycích tak, aby bylo poznat, je-li jeden překladem druhého? Co vlastně spojuje dva texty se stejným významem psané v různých jazycích? Například to, že oba jsou rozčleněny do větších a menších celků; hranice celků by měly proporčně odpovídat. Jak ale tyto hranice určit, a ještě spíše, jak kvantifikovat ostrost (důležitost) těchto hranic? Když autor začíná popisovat novou myšlenku, častěji používá slova, která v textu do té chvíle nepoužil. Je tedy závislost velikosti lexikonu na délce daného textu (type-token relation) nástrojem, který hledáme? Podíváme-li se na křivku, která tento vztah vyjadřuje, vidíme, že její tvar o struktuře textu mlčí, je totiž daná z velké části kombinatoricky. Ovšem od křivky určené pouze pouze četností slov bez záměru autora se přeci jen liší. Odečtěme tedy křivku naměřenou na stejném textu s porušenou strukturou, abychom tuto strukturu odhalili. Ano, jenže úplné porušení textu (například náhodnou změnou pořadí všech slov) je komputačně náročné a výsledek je ovlivněn náhodou resp. pseudonáhodou. Nezbývá tedy, než určit matematický model, který by kopíroval průměr křivek měřených na všech permutacích slov zkoumaného textu. Takový model a způsob jeho odvození jsem popsal v článku Type-token and Hapax-token Relation: A Combinatorial Model, který vyšel v roce 2008 v Glottotheory 2/1. Postup je dále aplikován na hapax-token relation a dál zobecněn na vztah počtu slov o dané frekvenci k velikosti textu.

Graf, který vznikne odečtením měřené a modelované křivky hovoří výmluvným jazykem o významových předělech a jejich důležitosti, což se dá využít v literární vědě, jak jsem ukázal ve studii Nabíl Na''úm Gorgí a jeho Sen Otroka, ovšem hlavní místo má samozřejmě v textové lingvistice.

Jako fraktál

Nemůžeme si odpustit otázku - pokud se v hranicích větších celků ukrývají celky menší, není možné, že se na tomto grafu projeví fraktální povaha jazyka? Pomocí analytické geometrie jsem určil závislost obvodu grafu na velikosti měřítka a Hausdorffova dimenze vycházela u různých jazyků 1, popřípadě jen o nekolik setin větší, čili rovna topografické. Obsah grafem vymezeného útvaru má taktéž fraktální dimenzi rovnu topografické.

Další...

Další práce a odborné články naleznete v sekci Studie & práce.

Odkaz na SYN – beletrie Odkaz na SYN – oborová