kielitiede

Näin käytät Omorfia suomen morfologiaan

Omorfi on aivan mahtava tyĂśkalu suomen kielen morfologian prosessointiin ja generointiin tietokoneella. Sen käyttäminen ei ole kuitenkaan ihan yksinkertaista (H)FST:itä tuntemattomille ihmisille. 😅FST-mallien käytĂśn yksinkertaistaminen on yksi tärkeimmistä syistä sille, […]

Käytä Korppia Pythonin kautta

Jos olet tehnyt mitään kieliteknologista tyĂśtä pohjoismaisille kielille viimeaikoina, olet varmaan kuullut Korpista. Korpin käyttĂśliittymä on ihan kiva lelu, mutta siitä ei juurikaan ole hyĂśtyä, jos aineistoihin ei pääse rajapinnan […]

a drawn lost cat sign

Ah, sarkasmi, tuo epäsuoran ilmaisun muoto, joka askarruttaa meitä kaikkia. Tuntemattomasta ihmisestä on vaikeampaa ottaa selvää, onko hän sarkastinen, kuin tutusta. Riippumatta siitä, kuinka sarkastisia itse olisimme. Mutta mitä tiede […]

a pen and a syntactic tree

Suomi on suhteellisen hankala kieli tuottaa automaattisesti tietokoneella (NLG). Siinnä missä enkun kohdalla sanoja voi vain mäiskiä peräkanaa lauseeseen perusmuodossa, suomi vaatii taivuttelua. Tietokoneen on hallittava kongruenssi- ja rektiosäännĂśt, mikä […]

A green python ready to use HFST :-D

HFST (Helsinki Finite-State Transducer Technology) on loistava tyĂśkalu kielen morfologian mallintamiseen. Ongelmana on kuitenkin se, että sen Python-rajapinnan dokumentaatiossa on toivomisen varaa. Mutta älä vaivu epätoivoon! Tämä postaus opastaa, miten […]