Spisovatelia do naha!
Triky s grafologickou analýzou. V knihe o grafológii som čítala, že autorstvo textu sa dá rozpoznať aj podľa toho, ako často a aké slová pisateľ použil. Hľadám teraz program, ktorý by zoradil slová v texte podľa frekvencie ich použitia.
Ak nakuknete na túto adresu, nájdete tam recenziu programu NoteTab od Mariana Jaslovského. Takže ja už len doplním, že okrem iných zaujímavôstiek dokáže tento program vyfabrikovať práve aj textovú štatistiku (Tools – Text Statistics...). Z textu vám vyráta, koľkokrát sa v ňom vyskytuje ktoré slovo, určí počet jeho použití, percentuálny podiel, vie vytvoriť aj abecedný zoznam všetkých použitých slov a naznačiť tak, akú pestrú máte slovnú zásobu.

NoteTab nezobrazí slovíčka takto „sám od seba“ – normálne vám ponúkne ich abecedné poradie. Ak chcete slová zoradiť podľa frekvencie, musíte ťuknúť pravým uchom myši nad textom s výsledkami analýzy a zvoliť Sort by Frequency:

Triediť podľa výskytu bude už nabudúce automaticky, kým to zas nevypnete. V rovnakom menu nájdete aj možnosť uložiť do súboru všetky slová použité v dokumente, alebo tabuľku s frekvenciou výskytu.
Z takejto štatistiky sa dá všeličo zistiť. Až nepríjemne presne zobrazí okruh záujmov pisateľa, jeho šírku slovnej zásoby a hlavne veci, ktoré nemusia byť vždy na prvý pohľad celkom zrejmé. Stačí kuknúť na častejšie používané slová autora a hneď je jasno, ako povedal Columbo niekde okolo tridsiateho dielu. Napríklad:
Zoberme zopár posledných mojich článkov a porovnajme ich s podobne nereprezentatívnou vzorkou nášho zbožňovaného generalissimusa – šéfredaktora inZinu. (Meno radšej neuvádzam, lebo ho často skomolím. A tiež pre prípad, že by ma žaloval...) V jeho článkoch hneď v čelných pozíciách nájdeme slová ako rozdiel, medzi, všetci, rokov, napríklad, vtipkár, silueta, deti, človek, vtipy, našťastie, ľudí... Porovnajte to s mojím skromným, od človeka hodne odtrhnutým a bezemocionálnym repertoárom: Windows, program, www, počítač, záznam, zadarmo, zvukovej...
Nič sa však nevyrovná výsledku, ktorý dostaneme, ak vložíme niekoľko celých vydaní nemenovaného a už neexistujúceho denníka z roku 1998, vrátane športu a inzercie. Čelné miesta v štatistike častosti výskytu zaberajú slová ako: vlády, slovenskej, republika, Slovensku, proti, USA, povedal, strany, veľmi, predseda, republiky, Mečiar, Vladimír, maďarskej, štátu, HZDS, voľby, poslancov, premiér, premiéra, štátnej, republike, hnutia...
Vaša otázka ma však inšpirovala aj k nápadu, ako by som mohol rýchlo naučiť wordovský slovník „moje“ obľúbené a často používané slová. Stačí do NoteTabu vtiahnuť zopár článkov, čo som spísal (najlepšie až po jazykovej úprave, neprajte si vydyeť orygynáli) a s pomocou štatistiky trochu podrezúrovať Word.

Aj keď Word pozná hodne slov, každý z nás používa určitú terminológiu, má svoje obľúbené výrazy. Ak dáte do jedného dlhého textového dokumentu všetky svoje texty a prefúknete ich takouto analýzou, získate relatívne krátky zoznam všetkých slov, ktoré používate. Ak tento zoznam vložíte do Wordu a dáte ho skontrolovať, označí jemu neznáme slová. Dajte si ich pridať do slovníka a od tej chvíle sa Word „naučí“ váš žargón, alebo terminológiu vašej profesie.

Kontrola pravopisu vo Worde. Funkcia Pridať do slovníka sa dá buď klikať myšou a rozhodnúť o každom slove, alebo automatizovať držaním klávesovej skratky.
Rátajte s tým, že do slovníka pribudne niekoľko stoviek slov, preto sa oplatí, ak pri kontrole gramatiky vo Worde budete držať stále ALT a písmeno S, pridajú sa všetky Wordu neznáme slová. To je operácia na pár minút, ale Word môže vsiaknuť aj gramatické chyby, ktorých ste sa v minulosti dopustili. Preto nezaškodí ešte nakuknúť do nastavenia gramatiky vo Worde, len preto, aby ste zistili, kde presne je umiestnený váš slovník. (Je fajn nezabudnúť si ho občas zálohovať.) Ten môžete editovať v NoteTabe a overiť, či tam nie sú chybné slová. Viem, je to otrava, ale ak píšete viac, ušetrí to dosť času v budúcnosti: Word vás nebude rozptyľovať upozorňovaním na možnosť chyby v mene vášho šéfa, alebo obľúbeného slova, ktoré nepozná.

V nastavení slovníka vo Worde je nenápadko zobrazená aj cesta, kde sa slovníček presne ukrýva. Zrejme nemá rád svetlo, a preto je jeho umiestnenie veľmi hlboké. Vo Windows 98 je inde ako v dvetisíckach, a preto si to musíte nájsť sami.
Ak pracujete s naozaj veľkým množstvom slov (hlavne mená a odborné výrazy), asi sa oplatí nekŕmiť slovník zoznamom všetkých slov, ale zoznamom podľa častosti výskytu.
12.08.2001