lingüística

PLN en español - etiquetado gramatical, lematización e inflexión automática

El PLN, o sea, el procesamiento de lenguajes naturales, forma parte de la disciplina conocida como la inteligencia artificial. Consiste en algoritmos y métodos de aprendizaje automático para realizar un análisis automático de texto. Es decir, ayuda a un ordenador a entender mejor el ser humano, y lo que se comunica mediante su lengua. Sin duda existen muchos recursos para realizar el PLN en inglés, pero ¿cómo se hace eso en español? En este tutorial, vamos a aprender a lematizar, analizar y generar español. 😃

(más…)
Korp y Python. ¡Accede a corpus desde tu código Python!

Si alguna vez has trabajado con lingüística computacional en un país nórdico, probablemente has escuchado sobre Korp. Y seguramente ya has aprendido a odiar y amar el plataforma al mismo tiempo. Mi primero pensamiento fue: Korp está bien, pero no tiene mucho uso 🤷🏼‍♂️, Yo necesito un acceso automático a los datos que Korp esconde detrás su horrible interfaz. El que la descripción de API no sea fácil de encontrar y que la mayoría de los proveedores de Korp no sean muy abiertos sobre la url de su API, no facilita la situación. 😩

Por suerte, otra vez más, yo llego cómo un héroe montado en su caballo a salvar el día. 🤓 Yo tengo mi propia librería de Python para usar Korp. 😊 (más…)

A green python ready to use HFST :-D

HFST (Helsinki Finite-State Transducer Technology) es una herramienta genial para crear un modelo computacional de la morfología de una lengua. El problema es que la documentación de HFST no explica en detalle cómo usarlo con Python. Por eso, trabajando en el mismo pasillo que sus autores, yo decidí de escribir este tutorial que te explica cómo cargar modelos HFST en Python y usarlos para generar y analizar palabras. 😃
(más…)