kielitiede

Näin käytät Omorfia suomen morfologiaan

Omorfi on aivan mahtava työkalu suomen kielen morfologian prosessointiin ja generointiin tietokoneella. Sen käyttäminen ei ole kuitenkaan ihan yksinkertaista (H)FST:itä tuntemattomille ihmisille. 😅FST-mallien käytön yksinkertaistaminen on yksi tärkeimmistä syistä sille, […]

Käytä Korppia Pythonin kautta

Jos olet tehnyt mitään kieliteknologista työtä pohjoismaisille kielille viimeaikoina, olet varmaan kuullut Korpista. Korpin käyttöliittymä on ihan kiva lelu, mutta siitä ei juurikaan ole hyötyä, jos aineistoihin ei pääse rajapinnan […]

a drawn lost cat sign

Ah, sarkasmi, tuo epäsuoran ilmaisun muoto, joka askarruttaa meitä kaikkia. Tuntemattomasta ihmisestä on vaikeampaa ottaa selvää, onko hän sarkastinen, kuin tutusta. Riippumatta siitä, kuinka sarkastisia itse olisimme. Mutta mitä tiede […]

a pen and a syntactic tree

Suomi on suhteellisen hankala kieli tuottaa automaattisesti tietokoneella (NLG). Siinnä missä enkun kohdalla sanoja voi vain mäiskiä peräkanaa lauseeseen perusmuodossa, suomi vaatii taivuttelua. Tietokoneen on hallittava kongruenssi- ja rektiosäännöt, mikä […]

A green python ready to use HFST :-D

HFST (Helsinki Finite-State Transducer Technology) on loistava työkalu kielen morfologian mallintamiseen. Ongelmana on kuitenkin se, että sen Python-rajapinnan dokumentaatiossa on toivomisen varaa. Mutta älä vaivu epätoivoon! Tämä postaus opastaa, miten […]