A roadmap for building predictive models from the T cell receptor repertoire feature analysis

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Andrade, Dhiego Souto
Orientador(a): Costa, César Rennó
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/52485
Resumo: Embora a terapia do câncer forneça um vasto repertório de medicamentos e tratamentos, muitos tipos de câncer desenvolvem maneiras de escapar e continuam a proliferar. A imunoterapia, em particular, tem se mostrado eficiente na destruição de alguns tipos de câncer, mas não é uma opção infalível. Prever a eficiência de cada opção de tratamento seria uma ferramenta valiosa para o processo de tomada de decisão na prática clínica. A imunoterapia aumenta as células T do paciente para atacar as células cancerígenas. As células T usam uma proteína receptora de sua superfície para identificar possíveis alvos, como células cancerígenas. O advento do NGS (Next Generation Sequencing) trouxe uma velocidade considerável para sequenciar grandes quantidades de material genético, como o TCR (T Cell Receptor). A diversidade de receptores é colossal, e entender esses repertórios altamente complexos pode ser a chave para decifrar o comportamento do sistema imunológico. Aqui, avaliamos o processo de extração de recursos significativos dos dados do repertório do TCR para construir modelos preditivos para distinguir controles saudáveis de pacientes com câncer ou pacientes tratados com diferentes medicamentos. Diante disso, é essencial desenvolver ferramentas que possam gerar informações de maneira fácil e rápida a partir dos dados do repertório do TCR para prever resultados futuros. Desenvolvemos uma ferramenta de bioinformática chamada GENTLE (GENerator of T cell receptor repertoire features for machine LEARNING), voltada para qualquer pesquisador que trabalhe com dados de repertório TCR que visa explorar esses dados e construir ferramentas de previsão. O GENTLE é de código aberto, tem uma plataforma web, pode ser instalado localmente, implementa muitas métricas de diversidade, constrói redes usando a distância de Levenshtein, calcula a frequência de motivos, transforma os dados com métodos de redução dimensional, implementa métodos de normalização, realiza seleção de recursos, constrói, avalia e implanta classificadores. Usando esta ferramenta, pode-se obter grandes insights dos dados do repertório TCR.