Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro)
Main Author: | |
---|---|
Publication Date: | 2023 |
Language: | por |
Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
Download full: | http://hdl.handle.net/10314/9099 |
Summary: | A Altice Labs tem se focado na criação de uma nova geração de serviços de Interactive Voice Response (IVR), com o uso de inteligência artificial para permitir a adaptação em tempo real das interações com os clientes. Um elemento fundamental desses serviços é a funcionalidade de Text-to-Speech (TTS), que é amplamente usada para fornecer informações em resposta às solicitações dos clientes imitando uma interação humana. O objetivo deste projeto é resolver os desafios associados ao uso de TTS em tempo real, em comparação com a utilização dos tradicionais anúncios pré-gravados. Os problemas residem no atraso percetível e nos custos associados à síntese em tempo real. Neste projeto foi desenvolvido um componente inovador que minimiza essas desvantagens, através da implementação de uma cache de arquivos de áudio previamente processados. Com a utilização desta cache, os serviços continuam a solicitar a síntese de texto em tempo real, mas o que é efetivamente reproduzido é um anúncio que foi previamente gerado e guardado na cache como resultado de uma síntese anterior. Esta abordagem proporciona uma resposta mais rápida e eficiente, enquanto, simultaneamente, reduz os custos associados à síntese em tempo real. No âmbito deste projeto foi implementada uma cache e conduzidas avaliações para analisar os benefícios desta abordagem, incluindo a redução de atrasos e custos operacionais. O trabalho foi desafiador devido à complexidade técnica envolvida na criação da cache de áudio em formato de hash table para os serviços de TTS já existentes. Além disso, foi necessário garantir que a solução fosse robusta e escalável para atender à procura crescente de interações de voz em tempo real. A conclusão bemsucedida deste projeto representará um avanço significativo na capacidade da Altice Labs em fornecer serviços de IVR aprimorados e económicos à empresa. |
id |
RCAP_bdc3f8d0e371666fc12eec08f8ca9263 |
---|---|
oai_identifier_str |
oai:bdigital.ipg.pt:10314/9099 |
network_acronym_str |
RCAP |
network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository_id_str |
https://opendoar.ac.uk/repository/7160 |
spelling |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro)TTSIVRHash TablecacheA Altice Labs tem se focado na criação de uma nova geração de serviços de Interactive Voice Response (IVR), com o uso de inteligência artificial para permitir a adaptação em tempo real das interações com os clientes. Um elemento fundamental desses serviços é a funcionalidade de Text-to-Speech (TTS), que é amplamente usada para fornecer informações em resposta às solicitações dos clientes imitando uma interação humana. O objetivo deste projeto é resolver os desafios associados ao uso de TTS em tempo real, em comparação com a utilização dos tradicionais anúncios pré-gravados. Os problemas residem no atraso percetível e nos custos associados à síntese em tempo real. Neste projeto foi desenvolvido um componente inovador que minimiza essas desvantagens, através da implementação de uma cache de arquivos de áudio previamente processados. Com a utilização desta cache, os serviços continuam a solicitar a síntese de texto em tempo real, mas o que é efetivamente reproduzido é um anúncio que foi previamente gerado e guardado na cache como resultado de uma síntese anterior. Esta abordagem proporciona uma resposta mais rápida e eficiente, enquanto, simultaneamente, reduz os custos associados à síntese em tempo real. No âmbito deste projeto foi implementada uma cache e conduzidas avaliações para analisar os benefícios desta abordagem, incluindo a redução de atrasos e custos operacionais. O trabalho foi desafiador devido à complexidade técnica envolvida na criação da cache de áudio em formato de hash table para os serviços de TTS já existentes. Além disso, foi necessário garantir que a solução fosse robusta e escalável para atender à procura crescente de interações de voz em tempo real. A conclusão bemsucedida deste projeto representará um avanço significativo na capacidade da Altice Labs em fornecer serviços de IVR aprimorados e económicos à empresa.Escola Superior de Tecnologia e Gestão2023-11-30T15:01:17Z2023-11-302023-11-01T00:00:00Zbachelor thesisinfo:eu-repo/semantics/publishedVersionhttp://hdl.handle.net/10314/9099http://hdl.handle.net/10314/9099porSantos, Filipeinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-01-05T03:03:11Zoai:bdigital.ipg.pt:10314/9099Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T19:26:54.088037Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
dc.title.none.fl_str_mv |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
title |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
spellingShingle |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) Santos, Filipe TTS IVR Hash Table cache |
title_short |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
title_full |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
title_fullStr |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
title_full_unstemmed |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
title_sort |
Projeto em Contexto de Estágio – TText-to-Speech-Cache de ficheiros de áudio gerados (Altice Labs - Aveiro) |
author |
Santos, Filipe |
author_facet |
Santos, Filipe |
author_role |
author |
dc.contributor.author.fl_str_mv |
Santos, Filipe |
dc.subject.por.fl_str_mv |
TTS IVR Hash Table cache |
topic |
TTS IVR Hash Table cache |
description |
A Altice Labs tem se focado na criação de uma nova geração de serviços de Interactive Voice Response (IVR), com o uso de inteligência artificial para permitir a adaptação em tempo real das interações com os clientes. Um elemento fundamental desses serviços é a funcionalidade de Text-to-Speech (TTS), que é amplamente usada para fornecer informações em resposta às solicitações dos clientes imitando uma interação humana. O objetivo deste projeto é resolver os desafios associados ao uso de TTS em tempo real, em comparação com a utilização dos tradicionais anúncios pré-gravados. Os problemas residem no atraso percetível e nos custos associados à síntese em tempo real. Neste projeto foi desenvolvido um componente inovador que minimiza essas desvantagens, através da implementação de uma cache de arquivos de áudio previamente processados. Com a utilização desta cache, os serviços continuam a solicitar a síntese de texto em tempo real, mas o que é efetivamente reproduzido é um anúncio que foi previamente gerado e guardado na cache como resultado de uma síntese anterior. Esta abordagem proporciona uma resposta mais rápida e eficiente, enquanto, simultaneamente, reduz os custos associados à síntese em tempo real. No âmbito deste projeto foi implementada uma cache e conduzidas avaliações para analisar os benefícios desta abordagem, incluindo a redução de atrasos e custos operacionais. O trabalho foi desafiador devido à complexidade técnica envolvida na criação da cache de áudio em formato de hash table para os serviços de TTS já existentes. Além disso, foi necessário garantir que a solução fosse robusta e escalável para atender à procura crescente de interações de voz em tempo real. A conclusão bemsucedida deste projeto representará um avanço significativo na capacidade da Altice Labs em fornecer serviços de IVR aprimorados e económicos à empresa. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-11-30T15:01:17Z 2023-11-30 2023-11-01T00:00:00Z |
dc.type.driver.fl_str_mv |
bachelor thesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10314/9099 http://hdl.handle.net/10314/9099 |
url |
http://hdl.handle.net/10314/9099 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Escola Superior de Tecnologia e Gestão |
publisher.none.fl_str_mv |
Escola Superior de Tecnologia e Gestão |
dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
repository.mail.fl_str_mv |
info@rcaap.pt |
_version_ |
1833598106284851200 |