Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.ufpa.br/jspui/handle/2011/2829
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.creatorLOBATO, Fábio Manoel França-
dc.date.accessioned2012-06-01T14:23:08Z-
dc.date.available2012-06-01T14:23:08Z-
dc.date.issued2011-07-01-
dc.identifier.citationLOBATO, Fábio Manoel França. Abordagem probabilística para caracterização do sistema de marcação de sequenciamento multiplex na plataforma ABI SOLID. Orientador: Ádamo de Lima Santana. 2011. 85 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2011. Disponível em: http://repositorio.ufpa.br/jspui/handle/2011/2829. Acesso em:.-
dc.identifier.urihttp://repositorio.ufpa.br/jspui/handle/2011/2829-
dc.description.abstractThe next generation sequencers such as Illumina and SOLiD platforms generate a large amount of data, commonly above 10 Gigabytes of text files. Particularly, the SOLiD platform allows the sequencing of multiple samples in a single run (called multiplex run) through a marking system called Barcode. This feature requires a computational process for separation of data per sample, therefore, the sequencer provides a mixture of all samples in a single output. This process must be secure to avoid any harm that may scramble further analysis. In this context, this dissertation proposes development of a probabilistic model capable of characterizing the marking system used in multiplex sequencing. The results corroborate the adequacy of the model obtained, which allows, among other things, identify faults in some step in the sequencing process, adapt and develop new protocols for sample preparation, and assign a grade to the reliability of data generated and guide a filtering process that respects the characteristics of each sequence, without discarding sequences useful in an arbitrary manner.pt_BR
dc.description.provenanceSubmitted by Samira Prince (prince@ufpa.br) on 2012-06-01T14:22:25Z No. of bitstreams: 2 Dissertacao_AbordagemProbabilisticaCaracterizacao.pdf: 2216925 bytes, checksum: 41db7a9e13836866a105b019e2d7ea99 (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)en
dc.description.provenanceApproved for entry into archive by Samira Prince(prince@ufpa.br) on 2012-06-01T14:23:08Z (GMT) No. of bitstreams: 2 Dissertacao_AbordagemProbabilisticaCaracterizacao.pdf: 2216925 bytes, checksum: 41db7a9e13836866a105b019e2d7ea99 (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5)en
dc.description.provenanceMade available in DSpace on 2012-06-01T14:23:08Z (GMT). No. of bitstreams: 2 Dissertacao_AbordagemProbabilisticaCaracterizacao.pdf: 2216925 bytes, checksum: 41db7a9e13836866a105b019e2d7ea99 (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Previous issue date: 2011en
dc.description.sponsorshipCNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico-
dc.language.isoporpt_BR
dc.publisherUniversidade Federal do Pará-
dc.rightsAcesso Aberto-
dc.subjectBioinformáticapt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.subjectSequenciamento multiplexpt_BR
dc.subjectModelagem matemáticapt_BR
dc.subjectBioinformaticsen
dc.subjectData miningen
dc.subjectSolid plataformen
dc.subjectBarcodeen
dc.subjectMultiplex sequencingen
dc.subjectMathematical modelingen
dc.subject-
dc.titleAbordagem probabilística para caracterização do sistema de marcação de sequenciamento multiplex na plataforma ABI SOLIDpt_BR
dc.typeDissertaçãopt_BR
dc.publisher.countryBrasil-
dc.publisher.departmentInstituto de Tecnologia-
dc.publisher.initialsUFPA-
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::PROCESSOS MARKOVIANOS-
dc.contributor.advisor1SANTANA, Ádamo Lima de-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4073088744952858-
dc.creator.Latteshttp://lattes.cnpq.br/8320014491229434-
dc.description.resumoOs sequenciadores de nova geração como as plataformas Illumina e SOLiD geram uma grande quantidade de dados, comumente, acima de 10 Gigabytes de arquivos-texto. Particularmente, a plataforma SOLiD permite o sequenciamento de múltiplas amostras em uma única corrida (denominada de corrida multiplex) por meio de um sistema de marcação chamado Barcode. Esta funcionalidade requer um processo computacional para separação dos dados por amostra, pois, o sequenciador fornece a mistura de todas amostras em uma única saída. Este processo deve ser seguro a fim de evitar eventuais embaralhamentos que possam prejudicar as análises posteriores. Neste contexto, o presente trabalho propõe desenvolvimento de um modelo probabilístico capaz de caracterizar sistema de marcação utilizado em sequenciamentos multiplex. Os resultados obtidos corroboraram a suficiência do modelo obtido, o qual permite, dentre outras coisas, identificar faltas em algum passo do processo de sequenciamento; adaptar e desenvolver de novos protocolos para preparação de amostras, além de atribuir um Grau de Confiança aos dados gerados e guiar um processo de filtragem que respeite as características de cada sequenciamento, não descartando sequências úteis de forma arbitrária.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica-
dc.audience.educationlevelCódigo de barraspt_BR
Aparece en las colecciones: Dissertações em Engenharia Elétrica (Mestrado) - PPGEE/ITEC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Dissertacao_AbordagemProbabilisticaCaracterizacao.pdf2,16 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons