Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas

Detalhes bibliográficos
Autor(a) principal: Pequeno, Alielson Ferreira
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/123456789/31483
Resumo: Com os avanços tecnológicos alcançados na área da computação, o paralelismo vem consequentemente sendo cada vez mais utilizado. Nesse contexto, ferramentas que calculam distância e interações atômicas, normalmente, são codificadas sem o uso desse artifício. Dessa forma, o objetivo deste trabalho é otimizar uma dessas ferramentas, o Ysera, para avaliação do impacto do uso do paralelismo em seu código. A otimização foi realizada com a reestruturação do seu código para que trabalhasse de forma paralela com recursos disponíveis para a linguagem Python, o multiprocessamento. A avaliação de ganho de desempenho foi feita através de diversas execuções do software de forma sequencial e de forma paralela, utilizando arquivos de entrada no formato PDB de tamanhos variados. Avaliando seu tempo de execução, consumo de memória e processamento. Também foi avaliado o impacto que o aumento do número de processos causa em seu desempenho. Como resultado, obteve-se uma melhora de desempenho de até mais de 50% comparando com a versão original da ferramenta, reduzindo o tempo computacional para obter os dados de saída desejados.
id UFPB-2_62ca271a7b76a760d5878b5f261e740a
oai_identifier_str oai:repositorio.ufpb.br:123456789/31483
network_acronym_str UFPB-2
network_name_str Repositório Institucional da UFPB
repository_id_str 2546
spelling 2024-08-19T17:06:41Z2023-06-272024-08-19T17:06:41Z2023-06-22https://repositorio.ufpb.br/jspui/handle/123456789/31483Com os avanços tecnológicos alcançados na área da computação, o paralelismo vem consequentemente sendo cada vez mais utilizado. Nesse contexto, ferramentas que calculam distância e interações atômicas, normalmente, são codificadas sem o uso desse artifício. Dessa forma, o objetivo deste trabalho é otimizar uma dessas ferramentas, o Ysera, para avaliação do impacto do uso do paralelismo em seu código. A otimização foi realizada com a reestruturação do seu código para que trabalhasse de forma paralela com recursos disponíveis para a linguagem Python, o multiprocessamento. A avaliação de ganho de desempenho foi feita através de diversas execuções do software de forma sequencial e de forma paralela, utilizando arquivos de entrada no formato PDB de tamanhos variados. Avaliando seu tempo de execução, consumo de memória e processamento. Também foi avaliado o impacto que o aumento do número de processos causa em seu desempenho. Como resultado, obteve-se uma melhora de desempenho de até mais de 50% comparando com a versão original da ferramenta, reduzindo o tempo computacional para obter os dados de saída desejados.With the technological advances achieved in the field of computing, parallelism has consequently been increasingly used. In this context, tools that calculate distance and atomic interactions are usually coded without using this device. Thus, this work aims to optimize one of these tools, Ysera, to evaluate the impact of using parallelism in your code. The optimization was carried out with the restructuring of its code so that it worked in parallel with resources available for the Python language, the multiprocessing. The performance gain evaluation was done through several software executions sequential and parallel, using input files in PDB format of different sizes. Evaluating its execution time, memory consumption, and processing. The impact that the increase in the number of processes causes on its performance was also evaluated. As a result, a performance improvement of up to more than 50% was obtained compared to the original version of the tool, reducing the computational time to obtain the desired output data.Submitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2024-08-19T17:06:41Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Alielson Ferreira Pequeno_TCC.pdf: 719935 bytes, checksum: f7ace2e9f199a4594536de16ba520bdd (MD5)Made available in DSpace on 2024-08-19T17:06:41Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Alielson Ferreira Pequeno_TCC.pdf: 719935 bytes, checksum: f7ace2e9f199a4594536de16ba520bdd (MD5) Previous issue date: 2023-06-22porUniversidade Federal da ParaíbaUFPBBrasilComputação CientíficaAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::OUTROSBioinformática estruturalProeômicaMultiprocessamentoPythonAvaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisRego, Thais Gaudencio do01211755452http://lattes.cnpq.br/316639063219910111173824430http://lattes.cnpq.br/2668804796235910Pequeno, Alielson Ferreirareponame:Repositório Institucional da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPBTEXTAlielson Ferreira Pequeno_TCC.pdf.txtAlielson Ferreira Pequeno_TCC.pdf.txtExtracted texttext/plain38237https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/4/Alielson%20Ferreira%20Pequeno_TCC.pdf.txt4de3efefed84d23883d276da566790a1MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-82390https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/3/license.txte20ac18e101915e6935b82a641b985c0MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/2/license_rdfc4c98de35c20c53220c07884f4def27cMD52ORIGINALAlielson Ferreira Pequeno_TCC.pdfAlielson Ferreira Pequeno_TCC.pdfTCCapplication/pdf719935https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/1/Alielson%20Ferreira%20Pequeno_TCC.pdff7ace2e9f199a4594536de16ba520bddMD51123456789/314832024-08-20 03:06:03.885oai:repositorio.ufpb.br:123456789/31483QVVUT1JJWkHDh8ODTyBFIExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBdXRvcml6byBlIGVzdG91IGRlIGFjb3JkbywgbmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbyBhdXRvLWRlcG9zaXRhZGEsIGNvbmZvcm1lIExlaSBuwrogOTYxMC85OCwgb3Mgc2VndWludGVzIHRlcm1vczoKIApEYSBEaXN0cmlidWnDp8OjbyBuw6NvLWV4Y2x1c2l2YSAKTyBhdXRvciBkZWNsYXJhIHF1ZTogCmEpIE8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0ZSB0ZXJtby4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuIApiKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0ZSB0ZXJtbywgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IGNvbnRlw7pkbyBkbyB0cmFiYWxobyBlbnRyZWd1ZS4gCmMpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCmQpIENvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBvIGRpcmVpdG8gZGUgcmVwcm9kdXppciwgdHJhZHV6aXIsIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KZSkgVm9jw6ogY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgcHVibGljYcOnw6NvIHBhcmEgcXVhbHF1ZXIgbWVpbyBvdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLgpmKSBWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKRG9zIEVtYmFyZ29zIGUgUmVzdHJpw6fDtWVzIGRlIEFjZXNzbwpPIGVtYmFyZ28gcG9kZXLDoSBzZXIgbWFudGlkbyBwb3IgYXTDqSAxICh1bSkgYW5vLCBwb2RlbmRvIHNlciBwcm9ycm9nYWRvIHBvciBpZ3VhbCBwZXLDrW9kbywgY29tIGEgbmVjZXNzaWRhZGUgZGUgYW5leGFyIGRvY3VtZW50b3MgY29tcHJvYmF0w7NyaW9zLiBPIHJlc3VtbyBlIG9zIG1ldGFkYWRvcyBkZXNjcml0aXZvcyBzZXLDo28gZGlzcG9uaWJpbGl6YWRvcyBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCLgpPIGRlcMOzc2l0byBkbyB0cmFiYWxobyDDqSBvYnJpZ2F0w7NyaW8sIGluZGVwZW5kZW50ZSBkbyBlbWJhcmdvLgpRdWFuZG8gZW1iYXJnYWRvLCBvIHRyYWJhbGhvIHBlcm1hbmVjZXLDoSBpbmRpc3BvbsOtdmVsIGVucXVhbnRvIHZpZ29yYXIgYXMgcmVzdHJpw6fDtWVzLiBQYXNzYWRvIG8gcGVyw61vZG8gZG8gZW1iYXJnbywgbyB0cmFiYWxobyBzZXLDoSBhdXRvbWF0aWNhbWVudGUgZGlzcG9uaWJpbGl6YWRvIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEIuIAo=Repositório InstitucionalPUBhttps://repositorio.ufpb.br/oai/requestdiretoria@ufpb.bropendoar:25462024-08-20T06:06:03Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.pt_BR.fl_str_mv Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
title Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
spellingShingle Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
Pequeno, Alielson Ferreira
CNPQ::OUTROS
Bioinformática estrutural
Proeômica
Multiprocessamento
Python
title_short Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
title_full Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
title_fullStr Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
title_full_unstemmed Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
title_sort Avaliação do uso de paralelismo em Python para um preditor de interações atômicas de estruturas tridimencionais de proteínas
author Pequeno, Alielson Ferreira
author_facet Pequeno, Alielson Ferreira
author_role author
dc.contributor.advisor1.fl_str_mv Rego, Thais Gaudencio do
dc.contributor.advisor1ID.fl_str_mv 01211755452
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3166390632199101
dc.contributor.authorID.fl_str_mv 11173824430
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/2668804796235910
dc.contributor.author.fl_str_mv Pequeno, Alielson Ferreira
contributor_str_mv Rego, Thais Gaudencio do
dc.subject.cnpq.fl_str_mv CNPQ::OUTROS
topic CNPQ::OUTROS
Bioinformática estrutural
Proeômica
Multiprocessamento
Python
dc.subject.por.fl_str_mv Bioinformática estrutural
Proeômica
Multiprocessamento
Python
description Com os avanços tecnológicos alcançados na área da computação, o paralelismo vem consequentemente sendo cada vez mais utilizado. Nesse contexto, ferramentas que calculam distância e interações atômicas, normalmente, são codificadas sem o uso desse artifício. Dessa forma, o objetivo deste trabalho é otimizar uma dessas ferramentas, o Ysera, para avaliação do impacto do uso do paralelismo em seu código. A otimização foi realizada com a reestruturação do seu código para que trabalhasse de forma paralela com recursos disponíveis para a linguagem Python, o multiprocessamento. A avaliação de ganho de desempenho foi feita através de diversas execuções do software de forma sequencial e de forma paralela, utilizando arquivos de entrada no formato PDB de tamanhos variados. Avaliando seu tempo de execução, consumo de memória e processamento. Também foi avaliado o impacto que o aumento do número de processos causa em seu desempenho. Como resultado, obteve-se uma melhora de desempenho de até mais de 50% comparando com a versão original da ferramenta, reduzindo o tempo computacional para obter os dados de saída desejados.
publishDate 2023
dc.date.available.fl_str_mv 2023-06-27
2024-08-19T17:06:41Z
dc.date.issued.fl_str_mv 2023-06-22
dc.date.accessioned.fl_str_mv 2024-08-19T17:06:41Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/31483
url https://repositorio.ufpb.br/jspui/handle/123456789/31483
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
dc.publisher.initials.fl_str_mv UFPB
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Computação Científica
publisher.none.fl_str_mv Universidade Federal da Paraíba
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Repositório Institucional da UFPB
collection Repositório Institucional da UFPB
bitstream.url.fl_str_mv https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/4/Alielson%20Ferreira%20Pequeno_TCC.pdf.txt
https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/3/license.txt
https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/2/license_rdf
https://repositorio.ufpb.br/jspui/bitstream/123456789/31483/1/Alielson%20Ferreira%20Pequeno_TCC.pdf
bitstream.checksum.fl_str_mv 4de3efefed84d23883d276da566790a1
e20ac18e101915e6935b82a641b985c0
c4c98de35c20c53220c07884f4def27c
f7ace2e9f199a4594536de16ba520bdd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br
_version_ 1833858249040855040