Context Monitoring for Dialogues in Portuguese
| Main Author: | |
|---|---|
| Publication Date: | 2023 |
| Format: | Master thesis |
| Language: | eng |
| Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Download full: | https://hdl.handle.net/10316/110703 |
Summary: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
| id |
RCAP_4c5f5469e5acf24f31d6a9e6025fd1cf |
|---|---|
| oai_identifier_str |
oai:estudogeral.uc.pt:10316/110703 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
Context Monitoring for Dialogues in PortugueseMonitorização do Contexto para Diálogos em PortuguêsSistemas de DiálogoRastreio do Estado do DiálogoProcessamento de Linguagem NaturalExtração de InformaçãoPerguntas e RespostasDialogue SystemsDialogue State TrackingNatural Language ProcessingInformation ExtractionQuestion-AnsweringDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaOs Sistemas de diálogo têm testemunhado um crescimento notável no uso quotidiano, simplificando uma variedade extensa de tarefas. Seja para ações simples como verificar o tempo para o dia seguinte ou para processos mais complexos como a reserva de voos para destinos específicos em horários determinados, tornando-se estes sistemas indispensáveis. Para executar essas tarefas de forma eficaz, é crucial que os sistemas de diálogo normalmente monitorizem o contexto em que operam. Tal monitorização pode ser efetuada através do Rastreio do Estado do Diálogo (DST), um processo que acompanha o desenvolvimento de uma conversa enquanto mantém uma representação atualizada do seu estado. O DST é vital para os sistemas de diálogo, uma vez que permite a incorporação do contexto da conversa ao aplicar técnicas de Processamento de Linguagem Natural (NLP) e gerar respostas adequadas. Embora o DST tenha sido principalmente aplicado ao idioma inglês, neste trabalho estendemos a sua aplicação a diálogos em português. Pelo que sabemos, esta é a primeira vez que tal extensão foi realizada. O trabalho envolveu a criação de um conjunto de dados de diálogos, orientado a tarefas para português, adaptado do amplamente utilizado conjunto de dados MultiWOZ. Um componente crucial do DST é a Extração de Informação (IE), que preenche slots com informações específicas com base em restrições definidas pelo utilizador. Alcançou-se isso através de uma abordagem inovadora baseada em Perguntas e Respostas (QA), que extrai uma resposta baseada em uma pergunta e um contexto (frase do utilizador). Neste estudo, três modelos de QA foram testados para esse propósito: BERT-base, BERTlarge e T5. Concluímos que o modelo T5 apresentou o desempenho mais fraco. Os outros dois modelos geraram resultados semelhantes. A escolha entre estas duas alternativas dependerá da tarefa específica que o utilizador deseja realizar. Ambos (BERT-base e BERT-large) mostraram ser promissores em resolver tarefas na língua portuguesa. Adicionalmente, observamos que a inclusão de métodos como Detecção de Intenção e Pós-Processamento melhorou significativamente o desempenho de cada modelo. Essas descobertas não só contribuem para o desenvolvimento do DST em comunidades lusófonas, mas também abrem novas possibilidades para a implementação de sistemas de diálogo inovadores baseados no conjunto de dados criado.Dialogue systems have witnessed remarkable growth in everyday use, significantly simplifying a broad range of tasks. Whether it involves simple actions like checking the next morning’s weather or more complex processes like booking flights to specific destinations at designated times, these systems have become indispensable. To perform these tasks successfully, dialogue systems usually need to monitor context. This can be accomplished through Dialogue State Tracking (DST), a process that involves tracking the progress of a conversation while maintaining a representation of the current state. DST is essential for dialogue systems, as it allows them to consider the context of the conversation through the application of Natural Language Processing (NLP) techniques, and respondappropriately. While DST has been mainly applied to English, in this work, it is applied to Portuguese dialogues. To our knowledge, it is the first time that DST is applied to Portuguese. To make it possible, the work included the creation of a dataset of task-oriented dialogues in Portuguese, based on the adaptation of the widely-used MultiWOZ dataset. A key component of DST is Information Extraction (IE), where specific information is extracted and filled into slots based on user-defined constraints. This was achieved using a novel approach based onQuestion-Answering (QA), which extracts an answer based on a provided question and context (user’s utterance). In this work, three available QA models were tested for this purpose: BERT-base, BERT-large, and T5. We concluded that the model with the poorest performance was T5. The other two models yielded similar results. The choice between these two alternatives depends on the specific task the user aims to accomplish. Both (BERT-base, BERT-large) have demonstrated promise in solving tasks in the Portuguese language. Additionally, we found that the addition of methods such as Intent Detection and Post-Processing significantly improves the performance of each model. These findings not only contribute to the advancement of DST in Portuguese-speaking communities but also open new avenues for the implementation of new dialogue systems based on the dataset created.Universidade de Coimbra - This work is funded by the project POWER (grant number POCI-01-0247-FEDER- 070365), co-financed by the European Regional Development Fund (FEDER), through Portugal 2020 (PT2020), and by the Competitiveness and Internation- alization Operational Programme (COMPETE 2020).2023-09-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://hdl.handle.net/10316/110703https://hdl.handle.net/10316/110703TID:203397720engPais, Francisco Moitainfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2023-11-23T23:08:53Zoai:estudogeral.uc.pt:10316/110703Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T06:02:40.642424Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
Context Monitoring for Dialogues in Portuguese Monitorização do Contexto para Diálogos em Português |
| title |
Context Monitoring for Dialogues in Portuguese |
| spellingShingle |
Context Monitoring for Dialogues in Portuguese Pais, Francisco Moita Sistemas de Diálogo Rastreio do Estado do Diálogo Processamento de Linguagem Natural Extração de Informação Perguntas e Respostas Dialogue Systems Dialogue State Tracking Natural Language Processing Information Extraction Question-Answering |
| title_short |
Context Monitoring for Dialogues in Portuguese |
| title_full |
Context Monitoring for Dialogues in Portuguese |
| title_fullStr |
Context Monitoring for Dialogues in Portuguese |
| title_full_unstemmed |
Context Monitoring for Dialogues in Portuguese |
| title_sort |
Context Monitoring for Dialogues in Portuguese |
| author |
Pais, Francisco Moita |
| author_facet |
Pais, Francisco Moita |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Pais, Francisco Moita |
| dc.subject.por.fl_str_mv |
Sistemas de Diálogo Rastreio do Estado do Diálogo Processamento de Linguagem Natural Extração de Informação Perguntas e Respostas Dialogue Systems Dialogue State Tracking Natural Language Processing Information Extraction Question-Answering |
| topic |
Sistemas de Diálogo Rastreio do Estado do Diálogo Processamento de Linguagem Natural Extração de Informação Perguntas e Respostas Dialogue Systems Dialogue State Tracking Natural Language Processing Information Extraction Question-Answering |
| description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-09-20 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/10316/110703 https://hdl.handle.net/10316/110703 TID:203397720 |
| url |
https://hdl.handle.net/10316/110703 |
| identifier_str_mv |
TID:203397720 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833602558018453504 |