Trabajo terminológico basado en corpus: caso práctico de terminología del ajedrez
Sammalvuo, Tapani (2017-08-09)
Trabajo terminológico basado en corpus: caso práctico de terminología del ajedrez
Sammalvuo, Tapani
(09.08.2017)
Turun yliopisto
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe201708097959
https://urn.fi/URN:NBN:fi-fe201708097959
Kuvaus
Siirretty Doriasta
Tiivistelmä
El presente trabajo de fin de máster pertenece a los campos de Terminología y Lingüística de corpus y tiene tres objetivos principales: investigar los efectos de omitir la corrección manual de un corpus escaneado en el análisis de frecuencia de palabras, proponer un método completo de extracción de términos a partir de un corpus de texto escaneado y, presentar una terminología del ajedrez de 100 términos más comunes en mi corpus electrónico.
El trabajo se divide en parte teórica y la parte empírica. La parte teórica inicia con una breve presentación del proceso OCR y los problemas que puede encontrarse en él, y luego se revisa el estado de teorías de Lingüística de corpus y de Terminología, siempre y cuando estén relacionadas con la metodología aplicada en la parte empírica.
La parte empírica presenta el caso práctico en el cual se construye un corpus electrónico del ajedrez con más de 100 millones de palabras. Luego se lo evalúa y manipula con programas informáticos adecuados, obteniendo como resultado una lista de términos candidatos.
En la fase final yo, sirviendo como experto en la materia, elijo los 100 términos del ajedrez más frecuentes –más nueve casos de homonimia– y los analizo con los métodos terminográficos clásicos, siempre proponiendo los equivalentes asimismo en finés e inglés.
El trabajo se divide en parte teórica y la parte empírica. La parte teórica inicia con una breve presentación del proceso OCR y los problemas que puede encontrarse en él, y luego se revisa el estado de teorías de Lingüística de corpus y de Terminología, siempre y cuando estén relacionadas con la metodología aplicada en la parte empírica.
La parte empírica presenta el caso práctico en el cual se construye un corpus electrónico del ajedrez con más de 100 millones de palabras. Luego se lo evalúa y manipula con programas informáticos adecuados, obteniendo como resultado una lista de términos candidatos.
En la fase final yo, sirviendo como experto en la materia, elijo los 100 términos del ajedrez más frecuentes –más nueve casos de homonimia– y los analizo con los métodos terminográficos clásicos, siempre proponiendo los equivalentes asimismo en finés e inglés.