Resumo: |
O Processamento de Língua Natural (ou PLN) tem sido objeto de estudo de pesquisadores das mais diversas áreas do conhecimento. O léxico é, sem sombra de dúvida, elemento essencial para o tratamento automático de dados lingüísticos, sendo a sua análise semântica fator crucial para um efetivo processamento computacional que, não raro, encontra barreiras em questões ligadas a uma representação semântica eficaz e que permita ser representada em linguagem de máquina. Na Terminologia, esse tratamento semântico favorece o estabelecimento de relações existentes entre unidades lexicais especializadas, e determina a elaboração de definições terminológicas coerentes e representativas ao campo de especialidade ao qual pertencem. Nesse sentido, propomos neste trabalho traçar uma estrutura conceitual do domínio da Nanociência e Nanotecnologia, em língua portuguesa do Brasil, visando a criação do que modernamente se conhece por ontologias, cujos preceitos nortearam o desenvolvimento desta pesquisa. Aliada a essas práticas, encontra-se a importância da adoção de um modelo que permita representar formalmente as relações semânticas existentes entre os diversos termos que compõem essa área técnico-científica. A busca por essas unidades lexicais especializadas e suas relações deu-se em um córpus formado por textos de tipologia diversa, com o auxílio de ferramentas computacionais – de extração semiautomática de termos e um processador de córpus. A modelagem do domínio em questão e sua representação em uma linguagem corrente e atual (a saber, a linguagem OWL) fez-se com o auxílio da ferramenta Protégé. Defende-se neste trabalho a necessidade, cada vez mais crescente, da adoção de métodos eficazes para o delineamento de estruturas conceituais a fim de executar tarefas computacionais utilizando informação lingüística. Espera-se ainda... |
---|