NLP

Näin käytät Omorfia suomen morfologiaan

Omorfi on aivan mahtava työkalu suomen kielen morfologian prosessointiin ja generointiin tietokoneella. Sen käyttäminen ei ole kuitenkaan ihan yksinkertaista (H)FST:itä tuntemattomille ihmisille. 😅FST-mallien käytön yksinkertaistaminen on yksi tärkeimmistä syistä sille, että aloin kehittää omaa UralicNLP-kirjastoani Pythonille. Sen tarkoituksena on yksinkertaistaa luonnollisen kielen käsittelyä Uralilaisten kielten kohdalla

(lisää…)
a pen and a syntactic tree

Suomi on suhteellisen hankala kieli tuottaa automaattisesti tietokoneella (NLG). Siinnä missä enkun kohdalla sanoja voi vain mäiskiä peräkanaa lauseeseen perusmuodossa, suomi vaatii taivuttelua. Tietokoneen on hallittava kongruenssi- ja rektiosäännöt, mikä on jokseenkin haastavaa. 🤷🏼‍♂️

Onneksi sinun ei tarvitse moisella päätäsi vaivata! Olen tehnyt suomen tuottamista varten python-kirjaston, syntax makerin. Sitä saa käyttää aivan vapaasti. Oletko valmis vapauttamaan syntax maker -pedon? 😊😊 (lisää…)

A green python ready to use HFST :-D

HFST (Helsinki Finite-State Transducer Technology) on loistava työkalu kielen morfologian mallintamiseen. Ongelmana on kuitenkin se, että sen Python-rajapinnan dokumentaatiossa on toivomisen varaa. Mutta älä vaivu epätoivoon! Tämä postaus opastaa, miten HFST-tiedostoja ladataan pythonin kautta, ja miten niillä voidaan analysoida ja tuottaa kielen morfologiaa. 😃
(lisää…)