Export Ready — 

Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species

Bibliographic Details
Main Author: Ilahi, Wafa
Publication Date: 2020
Format: Master thesis
Language: eng
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/10198/23703
Summary: Mestrdo de dupla diplomação com a High Institute of Biotechnology of Monastir
id RCAP_e3993e64b28c57f2ef3d224ffa55312c
oai_identifier_str oai:bibliotecadigital.ipb.pt:10198/23703
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant speciesPollen identificationBee plant speciesITS2DNA metabarcodingPalynologyReference databaseDomínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e AlimentarMestrdo de dupla diplomação com a High Institute of Biotechnology of MonastirSequence analysis of complex DNA samples is an important approach to monitoring species distribution in biodiversity and population studies. Although many traditional methods can be used to identify bee plant resources (e.g., direct observations, microscopy), high-throughput sequencing technologies have transformed our ability to explore more complex plant communities without necessity of experts and in a time cost effective-manner, in comparison with the classical techniques. Recently, metabarcoding, which combines DNA barcoding with high-throughput sequencing, of bee pollen has been used to successfully identify which plants bees are foraging on. This is achieved most commonly by sequencing short, conserved marker genes amplified with universal PCR primers. The ITS region has already been proposed and mainly used as universal barcode marker for plants. ITS sequences are often compared against an annotated reference sequence database to identify the likely taxonomic origin of each sequence with as much specificity as possible. So, accurate and specific taxonomic information is an important step in pollen metabarcoding analysis. The aim of this study was to assess performance of the ITS2 reference database before and after enrichment with sequences of bee plant species collected from across Europe. A total of 100 plant samples were collected in six countries and were identified morphologically at the species level. The DNA of these plant samples was extracted and then Sanger-sequenced for the ITS2 region. The sequences were curated and blasted against ITS2 sequences in GenBank to obtain taxonomic identification and assess similarity with the morphological identification. Next, a reference database of ITS2 sequences was generated using the 100 sequences. The newly-developed sequences were added to a comprehensive ITS2 reference database publicly available and the performance of the two databases (with and without the 100 sequences generated herein) was compared on a set of 108 mixed pollen samples that were identified by metabarcoding and classical palynology. The analyses of the data showed a positive correlation (r>0.7; P<0.05) between the two methods at both family (most countries) and genus levels (one third of countries), even though metabarcoding identified 12 families and 26 genera and palynology 13 families and 22 plant genera. Classification of mixed pollen samples, using the ITS2 database before enrichment with the new sequences developed herein, retrieved (i) 76 and 67 families before and after removing taxa that are not present in Europe, respectively, and (ii) 69 families after enrichment. At the genus level, before database enrichment, there were 230 and 214 genera identified before and after removing taxa that are not present in Europe, respectively, and 216 genera after enrichment. Results showed a positive correlation (r>0.9; P<0.001) between the different databases, but variation in the number of families and genera was noticed, which indicates an increase in the resolution and accuracy of classification. This study thus offers improvements in the ITS2 metabarcoding with more available sequences in the reference dataset providing heightened sensitivity and resolution.A análise de sequências de amostras complexas de DNA é uma abordagem importante na monitorização da distribuição de espécies em estudos populacionais e de biodiversidade. Embora possam ser utilizados métodos tradicionais como meio de identificar plantas melíferas, como por exemplo, observações diretas, microscopia, entre outros, as tecnologias de sequenciação de última geração transformaram a nossa capacidade de explorar floras mais complexas sem que haja a necessidade de recorrer a especialistas, tornando se também numa técnica mais económica, quando comparada às tecnologias clássicas. O metabarcoding, uma técnica que combina DNA barcode com sequenciação de última geração, tem sido usado para a identificação das espécies botânicas mais visitadas pelas abelhas forrageiras através da análise de pólen colhido pelas mesmas. Esta técnica baseia-se na sequenciação de marcadores genéticos de tamanho curto e que se localizem em zonas de DNA conservadas. A amplificação destes fragmentos é feita recorrendo a primers universais, para uma maior abrangência botânica. O ITS, uma região intergénica ribossomal, foi proposta e largamente utilizada, principalmente, como marcador genético universal em plantas. As sequências deste fragmento são, frequentemente, comparadas com uma base de dados de referência para que se estabeleça a identificação mais provável, e com a máxima especificidade possível, da origem taxonómica de cada fragmento sequenciado. Assim, informações taxonómicas precisas e específicas são um passo importante na análise de misturas de pólen colhidas pelas abelhas forrageiras através do metabarcoding. O objetivo deste estudo foi avaliar o desempenho da base de dados ITS2 de referência antes e depois do enriquecimento com sequências de espécies de plantas melíferas colhidas pela Europa. Um total de 100 amostras de plantas foram colhidas em seis países e foram identificadas morfologicamente ao nível da espécie. Procedeu-se à extração do DNA e sequenciação pelo método de Sanger da região ITS2. As sequências foram curadas e alinhadas com sequências do GenBank, através de um BLAST, para obter a identificação taxonómica e avaliar a similaridade com a identificação morfológica. Em seguida, uma base de dados ITS2 de referência foi gerada usando as 100 recém-desenvolvidas sequências. Estas foram adicionadas a uma vasta base de dados da região ribossomal, que está publicamente disponível, e o desempenho das duas (com e sem as 100 sequências geradas aqui) foi comparado num conjunto de 108 amostras de pólen colhido por abelhas, e previamente identificadas por metabarcoding e palinologia clássica. As análises mostraram uma correlação positiva (r> 0,7; P <0,05) entre os dois métodos para dois níveis taxonómicos, família (maioria dos países) e género (um terço dos países), embora o metabarcoding tenha identificado 12 famílias e 26 géneros e a palinologia 13 famílias e 22 géneros de plantas. A classificação das amostras de pólen, usando a base de dados ITS2 antes do enriquecimento com as novas sequências aqui desenvolvidas, recuperou (i) 76 e 67 famílias antes e depois da remoção dos táxons que não estão presentes na Europa, respetivamente, e (ii) 69 famílias após o enriquecimento. Ao nível do género, antes do enriquecimento da base de dados, havia 230 e 214 géneros identificados antes e depois da remoção dos táxons que não estão presentes na Europa, respetivamente, e 216 géneros após o enriquecimento. Os resultados mostraram uma correlação positiva (r> 0,9; P <0,001) entre as diferentes bases de dados, mas foi observada uma variação no número de famílias e géneros, o que indica um aumento na resolução e precisão da classificação. Este estudo oferece, assim, melhorias no metabarcoding da região ITS2 com mais sequências disponíveis no conjunto de dados de referência, proporcionando uma maior sensibilidade e resolução.This study was developed in the framework of the international project “INSIGINA: Pilot study on environmental monitoring of pesticide use through honey bees”, SANTE/E4/SI2.788418-SI2.788452-INSIGINIA-PP-1-1-2018, financed by the Health and Food Safety Directorate General, European Commission.Pinto, M. AliceQuaresma, AndreiaSelmi, BoulbebaBiblioteca Digital do IPBIlahi, Wafa2021-07-01T09:42:52Z202120202021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10198/23703TID:202735664enginfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-02-25T12:14:08Zoai:bibliotecadigital.ipb.pt:10198/23703Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T11:41:34.569985Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
title Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
spellingShingle Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
Ilahi, Wafa
Pollen identification
Bee plant species
ITS2
DNA metabarcoding
Palynology
Reference database
Domínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e Alimentar
title_short Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
title_full Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
title_fullStr Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
title_full_unstemmed Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
title_sort Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
author Ilahi, Wafa
author_facet Ilahi, Wafa
author_role author
dc.contributor.none.fl_str_mv Pinto, M. Alice
Quaresma, Andreia
Selmi, Boulbeba
Biblioteca Digital do IPB
dc.contributor.author.fl_str_mv Ilahi, Wafa
dc.subject.por.fl_str_mv Pollen identification
Bee plant species
ITS2
DNA metabarcoding
Palynology
Reference database
Domínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e Alimentar
topic Pollen identification
Bee plant species
ITS2
DNA metabarcoding
Palynology
Reference database
Domínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e Alimentar
description Mestrdo de dupla diplomação com a High Institute of Biotechnology of Monastir
publishDate 2020
dc.date.none.fl_str_mv 2020
2021-07-01T09:42:52Z
2021
2021-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10198/23703
TID:202735664
url http://hdl.handle.net/10198/23703
identifier_str_mv TID:202735664
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833592151548624896