Používáte-li Microsoft Word na psaní anglických textů, jistě víte, že umožňuje kromě překlepů (které podtrhává červeně) kontrolovat i chyby gramatické a stylistické (které podtrhává zeleně). Pro češtinu tato možnost dosud chyběla z několika důvodů. Tím nejzávažnějším je řádově větší složitost algoritmizovat náš rodný jazyk (pro bližší informace doporučuji navštívit např.
Ústav formální a aplikované lingvistiky na Matematicko-fyzikální fakultě UK).
Společnost Lingea, dodávající mj. cizojazyčné překladové a
výkladové slovníky (viz SWN 7/2003) nebo korektor pravopisu a slovník
synonym používaný např. v produktech Microsoftu, Adobe či Software602,
přišla koncem loňského roku na trh s prvním nástrojem nazvaným
Grammaticon, který kromě překlepů kontroluje i gramatiku a stylistiku. Jen
pro zajímavost — vývoj trval tři roky.
Grammaticon lze používat jednak samostatně v dodávaném jednoduchém
textovém editoru pro čistě textové formáty nebo pro soubory typu RTF anebo
jej můžete používat jako komponentu pro Microsoft Office. Protože v obou
případech pracuje téměř shodně, bude následující popis platit pro obě
varianty a na případné rozdíly upozorním.
Chybná slova či slovní spojení jsou v psaném textu barevně podtržena.
Word za pomocí Grammaticonu barevně rozlišuje pouze dvě skupiny chyb
(nikoliv však významově!), editor Grammaticonu tři (překlepy, gramatické
chyby a chyby stylistické). Pokud nad označeným slovem vyvoláte kontextové
menu, zobrazí se dle typu chyby možné náhrady slova, přidání slova do
uživatelského slovníku, popis gramatické chyby (krátké vysvětlení) či
možnost gramaticky zkontrolovat celou větu. Kontrolu lze používat jak během
psaní (tzv. aktivní kontrola), tak i dávkově na celý soubor.
Grammaticon dovoluje nastavit relativně velké množství možností
kontroly (viz obrázek). Jmenujme např. shodu podmětu s přísudkem, čárky
ve větách či správné skloňování. Vlastní vyhodnocování každé věty
pak probíhá v několika krocích. Nejprve se zkontrolují překlepy a pak
nastupují algoritmy na kontrolu pravopisu a stylistiky. Ukažme si to na větě
„Ženy se flákaly zatímko mužy pracovaly.“ Grammaticon nejprve upozorní
na překlep ve slově „zatímco“. Po případné opravě nalezne chybu ve
slově „mužy“. Nechme ji opravit a korektor pokračující dál upozorní
na chybějící čárku mezi větami. Tím jeho práce pro uvedenou větu
končí. Možná vás to zarazí podobně jako mne, ale slovo „muži“ zde
může mít dvou významů: jednak jako oslovení a pak je ypsilon ve slově
„pracovaly“ správně (Grammaticon neobsahuje databázi tvarů, které se
vylučují, takže z tohoto pohledu se mohou ženy flákat a pracovat
současně) a jednak jako entita, která opravdu pracuje.
Jak bylo právě ukázáno, při kontrole se musí algoritmus potýkat
s mnoha podobnými překážkami. Jen pro ukázku si ukažme několik
dalších: věta „Chlapci šly.“ je dobře v případě, že chlapec měl
hodinky, a ty mu šly. „Zítra bude vyset.“ může poukazovat na to, že
zemědělec dotovaný z fondů EU bude zítra sít geneticky upravený ječmen,
kterýžto opravdu bude nakonec vyset. Takových případů, kdy o chybu
může, ale nemusí, jít, nalezneme opravdu spoustu, přesto si s mnohými
Grammaticon poradí. Pro takové případy je totiž možné nastavit přísnou
kontrolu a při nalezení nerozhodných výskytů jste upozorněni na
případnou chybu, ačkoliv v daném kontextu o žádnou jít nemusí.

Při testování Grammaticonu jsem prošel poměrně velké množství textů
a díky němu v nich odhalil velké množství nedostatků. Ovšem našel jsem
i místa, kdy vyloženě zachyboval Grammaticon. Např. na větách
„Změnové řízení má kladný vliv na růst kvality výrobku.“ (údajně
nevhodný slovosled) či „Kvalitu výsledku nelze nijak zaručit.“ (údajně
chybí zvratné sloveso). Ale takovýchto špatných výsledků jsem na
přibližně stodesetistránkovém dokumentu (šlo o mou diplomovou práci)
našel pár a nepovažuji to tedy za závažný problém. S ohledem na to,
kolik nepřesností a chyb odhalil správně, jde do slova a do písmene
o kapku v moři (slov a vět).
Výtku mám k uživatelskému slovníku, do kterého si můžete zadat
vlastní slova, na něž vás nemá Grammaticon upozorňovat jako na špatná
(typicky jde o různé místní názvy apod.). Bohužel nemůžete určit,
o jaký slovní druh se jedná a případně vzor, podle kterého se slovo
skloňuje. Na první pohled se zdá, že je možné vypsat všechny tvary, ale
rozhodně to nepomůže při hledání chyb. Naopak. Program také nebere
v potaz spojovník např. v případě sci-fi (ačkoliv do slovníku zadat
jde) a hlásí jako chybu dvě slova „sci“ a „fi“.
Ohromnou výhodou, alespoň pro mě, je existence již zmíněného
textového editoru. Osobně totiž píšu všechny texty ve formátu XML
v alternativním nástroji, pak je převedu do souboru typu RTF, který
následně nechávám zkontrolovat korektorem překlepů ve Wordu. Díky
Grammaticonu mohu nyní Word, rozlezlý po disku a pro uvedené účely drahý,
smazat a dále nepoužívat. RTF soubor otevřu v Grammaticonu a nechám
zkontrolovat v něm. Život je hned krásnější, nepočítaje v to kromě
kontroly překlepů i kontrolu gramatiky a stylistiky.
Pokud bych měl označit cokoliv z dění v IT v roce 2003 za nejlepší
počin (tato recenze byla psána koncem prosince 2003), pak neváhám ani
chvíli a řeknu Grammaticon. Osobně jsem po takovém nástroji toužil od
prvního bouchnutí do klávesnice a tento produkt mé sny naplnil téměř
dokonale. Samozřejmě je stále co vylepšovat, ale již nyní jde
o plnohodnotný a funkční produkt s velmi dobrou dokumentací, který si
zaslouží nejvyšší možné hodnocení.
Plusy, mínusy, závěr
Plusy
- Kontrola gramatiky i stylistiky
- Možnosti nastavení
- Komponenta do MS Office i samostatný produkt
- Dokumentace
Mínusy
- Občas zachybuje
- Drobnosti v GUI editoru
Závěr
- Výborný nástroj pro kontrolu překlepů, gramatiky a stylistiky česky
psaných dokumentů. PRODUKT MĚSÍCE.
Výrobce
Cena
Nároky na HW, SW
- MS Windows 95/98/NT/2000/ME/XP, CD-ROM, 5 MB HDD.
Tento článek byl napsán pro časopis Softwarové noviny 3/2004.
Upozornění: tento text neprošel redakční úpravou, takže je
tak, jak byl napsán včetně případných chyb. Žádná část tohoto
článku nesmí být použita bez předchozího souhlasu autora.
Seznam mých dalších článků je v tomto přehledu.