Use este identificador para citar ou linkar para este item: https://repositorio.ufpa.br/jspui/handle/2011/12798
Registro completo de metadados
Campo DCValorIdioma
dc.creatorGAIA, Antonio Sérgio Cruz-
dc.date.accessioned2020-10-28T19:56:28Z-
dc.date.available2020-10-28T19:56:28Z-
dc.date.issued2019-12-02-
dc.identifier.citationGAIA, Antonio Sérgio Cruz. Ferramenta baseada em cuckoo filter para remoção de redundância em dados de sequenciadores de segunda geração (NGS - next generation sequencing). Orientador: Adonney Allan de Oliveira Veras. 2019. 108 f. Dissertação (Mestrado em Computação Aplicada) - Núcleo de Desenvolvimento Amazônico em Engenharia, Universidade Federal do Pará, Tucuruí, 2019. Disponível em: http://repositorio.ufpa.br:8080/jspui/handle/2011/12798. Acesso em:.pt_BR
dc.identifier.urihttp://repositorio.ufpa.br:8080/jspui/handle/2011/12798-
dc.description.abstractThe second-generation sequencing platforms, also known as NGS – Next Generation Sequencing, produce a great amount of data, which demands high complexity and computational cost in the processing of these data. These platforms generate duplicated reads that come from the preparation of the genomic library and are included in the amplification stage by PCR (Polymerase Chain Reaction). This redundancy can increase the computational requirements and processing time of subsequent analyses (for instance, de novo assembly). To reduce the computational cost of theses analyses, it is necessary to remove these reads from the data set of the sequenced organism. In this work, we present the NGSReadsTreatment, a computational tool to remove duplicated reads in paired-end or single-end data sets. The input for NGSReadsTreatment consists of reads from any sequencing platform with same or different read lengths. Its engine uses a Cuckoo Filter probabilistic structure to identify and remove redundant readings. The identification is done by comparing the reads among themselves, this way, not any pre-requisite is necessary besides the reads set. The validation of the tool was carried out by using a set of real and simulated data. To assess the efficiency of the tool, it was compared to other tools of redundancy removal. The results indicate the efficiency of the NGSReadsTreatment, for it produced the best outcome, both in the number of redundancies removed and the use of memory, in all tests done. Developed in JAVA, the NGSReadsTreatment is compatible with UNIX/Linux and Windows operating systems and has a version with a graphic interface to facilitate its use.pt_BR
dc.description.provenanceSubmitted by Ronald Brandão (ronald23706@gmail.com) on 2020-10-13T12:22:01Z No. of bitstreams: 2 Dissertacao_FerramentaBaseadaCuckoo.pdf: 2544929 bytes, checksum: 702709a0f32f14398b8432c46556ac16 (MD5) license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)en
dc.description.provenanceApproved for entry into archive by Mayara Menezes (mayara@ufpa.br) on 2020-10-28T19:56:15Z (GMT) No. of bitstreams: 2 Dissertacao_FerramentaBaseadaCuckoo.pdf: 2544929 bytes, checksum: 702709a0f32f14398b8432c46556ac16 (MD5) license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5)en
dc.description.provenanceMade available in DSpace on 2020-10-28T19:56:28Z (GMT). No. of bitstreams: 2 Dissertacao_FerramentaBaseadaCuckoo.pdf: 2544929 bytes, checksum: 702709a0f32f14398b8432c46556ac16 (MD5) license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Previous issue date: 2019-12-02en
dc.languageporpt_BR
dc.publisherUniversidade Federal do Parápt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.source.uriDisponível na internet via site: https://ppca.propesp.ufpa.br/index.php/br/teses-e-dissertacoes/dissertacoespt_BR
dc.subjectSoftware - Desenvolvimentopt_BR
dc.subjectEstruturas de dados (Computação)pt_BR
dc.subjectCuckoo Filterpt_BR
dc.subjectRedundância de stringspt_BR
dc.subjectSequenciamento de DNApt_BR
dc.titleFerramenta baseada em cuckoo filter para remoção de redundância em dados de sequenciadores de segunda geração (NGS - next generation sequencing)pt_BR
dc.typeDissertaçãopt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentNúcleo de Desenvolvimento Amazônico em Engenharia - NDAE/Tucuruípt_BR
dc.publisher.initialsUFPApt_BR
dc.subject.cnpqCNPQ::ENGENHARIASpt_BR
dc.contributor.advisor1VERAS, Adonney Allan de Oliveira-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2201652617167877pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/8976210146540043pt_BR
dc.description.resumoAs plataformas de sequenciamento de segunda geração também conhecidas como NGS – Next Generation Sequencing produzem grande volume de dados, o que demanda alta complexidade e custo computacional no processamento destes dados. Essas plataformas geram leituras duplicadas que surgem na preparação da biblioteca genômica e são introduzidas na etapa de amplificação por PCR (Polymerase Chain Reaction). Essa redundância de leituras pode aumentar os requisitos computacionais e tempo de processamento de análises subsequentes (por exemplo, a montagem de novo). Para reduzir o custo computacional dessas análises é necessário realizar a remoção dessas leituras do conjunto de dados do organismo sequenciado. Neste trabalho apresentamos o NGSReadsTreatment uma ferramenta computacional para a remoção de leituras duplicadas em conjuntos de dados pareados ou fragmentos. A entrada de dados para o NGSReadsTreatment consiste em leituras oriundas de qualquer plataforma de sequenciamento com o mesmo ou diferentes comprimentos. A sua engine utiliza a estrutura probabilística Cuckoo Filter para identificar e remover as leituras redundantes, a identificação é feita comparando as leituras entre si, assim, nenhum pré-requisito é necessário além do conjunto de leituras. A validação da ferramenta foi realizada utilizando-se conjuntos de dados reais e simulados. Para aferir a eficiência da ferramenta, a mesma foi comparada com outras ferramentas de remoção de redundância. Os resultados indicam a eficiência do NGSReadsTreatment, pois obteve-se melhor resultado, tanto na quantidade de redundâncias removidas quanto no uso de memória em todos os testes realizados. Desenvolvido em JAVA, o NGSReadsTreatment é compatível com os sistemas operacionais UNIX/Linux e Windows e dispoẽ de uma versão com interface gráfica para facilitar seu uso.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Computação Aplicadapt_BR
dc.subject.linhadepesquisaDESENVOLVIMENTO DE SISTEMASpt_BR
dc.subject.areadeconcentracaoCOMPUTAÇÃO APLICADApt_BR
dc.contributor.advisor1ORCIDhttps://orcid.org/0000-0002-7227-0590pt_BR
Aparece nas coleções:Dissertações em Computação Aplicada (Mestrado) - PPCA/NDAE/Tucuruí

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertacao_FerramentaBaseadaCuckoo.pdf2,49 MBAdobe PDFVisualizar/Abrir


Este item está licenciado sob uma Licença Creative Commons Creative Commons