Ponentes
Descripción
La ortografía es el conjunto de normas que regulan la escritura de una lengua. Su función es garantizar y facilitar la comunicación escrita de los hablantes, mediante el establecimiento de un código común para su representación gráfica (Real Academia Española, 2010). El incumplimiento de las normas lleva al usuario a cometer errores de ortografía, que pueden dificultar la comprensión de un texto. Los errores ortográficos son una de las principales dificultades que enfrentan los estudiantes de todos los niveles educativos. Los errores ortográficos se deben principalmente al desconocimiento de las reglas ortográficas y al desinterés por la lectura. Algunos autores sostienen que estos factores inciden negativamente en la producción de un buen texto escrito. En el caso del idioma guaraní, esta problemática es aún más relevante, debido a que se trata de una lengua que presenta características fonéticas y gramaticales únicas. El guaraní es la lengua materna del Paraguay y representa una de las raíces más profundas de la identidad nacional del país. Paraguay es un país bilingüe, dado que los idiomas castellano y guaraní son utilizados por un alto porcentaje de la población. Teniendo en cuenta la importancia de la ortografía en la comunicación escrita, la presente investigación se propone revisar la ortografía del idioma guaraní. Para tal efecto, se aplicarán técnicas de Procesamiento de Lenguaje Natural (PLN).
Resultados
Los resultados de la revisión ortográfica en guaraní son prometedores.
El revisor reconoció en promedio el 87,84% de las palabras en una prueba posterior, lo que representa un aumento del 14,99% con respecto a la prueba inicial que tuvo como resultado un 73,85%. Este aumento se debe al enriquecimiento del corpus, que permitió incluir más palabras que no estaban originalmente reconocidas por el revisor.
Sin embargo, aún hay un 12,16% de palabras que no son reconocidas por el revisor. De estas palabras, el 42,32% no presenta sugerencias de corrección.
Esto indica que el revisor podría ser mejorado para detectar algunas palabras nuevas o poco comunes.
Conclusión
Este estudio presenta una herramienta de revisión ortográfica para el idioma guaraní. La herramienta es eficaz y puede ser utilizada por un amplio rango de usuarios. Además, se provee un corpus para el idioma guaraní de aproximadamente 20.632 palabras generado a partir de la recopilación y procesamiento de textos digitales extraídos de poemas, músicas, diccionarios, páginas web gubernamentales y otros.
Metodología
Se utilizó un modelo de probabilidad y la distancia de Levenshtein para la revisión ortográfica. Este algoritmo compara una palabra con una lista de palabras conocidas, y considera las operaciones de eliminación, inserción, reemplazo y transposición para calcular la distancia entre las palabras.y la distancia de Levenshtein mide la similitud entre dos palabras.
Objetivo
Desarrollar un revisor ortográfico para el idioma Guaraní aplicando técnicas de Procesamiento de Lenguaje Natural (PLN).
Introducción
Los errores ortográficos son una de las principales dificultades que enfrentan los estudiantes de todos los niveles educativos. En el caso del idioma guaraní, esta problemática es aún más relevante, debido a que se trata de una lengua que presenta características fonéticas y gramaticales únicas.
Area | Ingenierías, Matemáticas y Física |
---|