Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species
| Main Author: | |
|---|---|
| Publication Date: | 2020 |
| Format: | Master thesis |
| Language: | eng |
| Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Download full: | http://hdl.handle.net/10198/23703 |
Summary: | Mestrdo de dupla diplomação com a High Institute of Biotechnology of Monastir |
| id |
RCAP_e3993e64b28c57f2ef3d224ffa55312c |
|---|---|
| oai_identifier_str |
oai:bibliotecadigital.ipb.pt:10198/23703 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant speciesPollen identificationBee plant speciesITS2DNA metabarcodingPalynologyReference databaseDomínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e AlimentarMestrdo de dupla diplomação com a High Institute of Biotechnology of MonastirSequence analysis of complex DNA samples is an important approach to monitoring species distribution in biodiversity and population studies. Although many traditional methods can be used to identify bee plant resources (e.g., direct observations, microscopy), high-throughput sequencing technologies have transformed our ability to explore more complex plant communities without necessity of experts and in a time cost effective-manner, in comparison with the classical techniques. Recently, metabarcoding, which combines DNA barcoding with high-throughput sequencing, of bee pollen has been used to successfully identify which plants bees are foraging on. This is achieved most commonly by sequencing short, conserved marker genes amplified with universal PCR primers. The ITS region has already been proposed and mainly used as universal barcode marker for plants. ITS sequences are often compared against an annotated reference sequence database to identify the likely taxonomic origin of each sequence with as much specificity as possible. So, accurate and specific taxonomic information is an important step in pollen metabarcoding analysis. The aim of this study was to assess performance of the ITS2 reference database before and after enrichment with sequences of bee plant species collected from across Europe. A total of 100 plant samples were collected in six countries and were identified morphologically at the species level. The DNA of these plant samples was extracted and then Sanger-sequenced for the ITS2 region. The sequences were curated and blasted against ITS2 sequences in GenBank to obtain taxonomic identification and assess similarity with the morphological identification. Next, a reference database of ITS2 sequences was generated using the 100 sequences. The newly-developed sequences were added to a comprehensive ITS2 reference database publicly available and the performance of the two databases (with and without the 100 sequences generated herein) was compared on a set of 108 mixed pollen samples that were identified by metabarcoding and classical palynology. The analyses of the data showed a positive correlation (r>0.7; P<0.05) between the two methods at both family (most countries) and genus levels (one third of countries), even though metabarcoding identified 12 families and 26 genera and palynology 13 families and 22 plant genera. Classification of mixed pollen samples, using the ITS2 database before enrichment with the new sequences developed herein, retrieved (i) 76 and 67 families before and after removing taxa that are not present in Europe, respectively, and (ii) 69 families after enrichment. At the genus level, before database enrichment, there were 230 and 214 genera identified before and after removing taxa that are not present in Europe, respectively, and 216 genera after enrichment. Results showed a positive correlation (r>0.9; P<0.001) between the different databases, but variation in the number of families and genera was noticed, which indicates an increase in the resolution and accuracy of classification. This study thus offers improvements in the ITS2 metabarcoding with more available sequences in the reference dataset providing heightened sensitivity and resolution.A análise de sequências de amostras complexas de DNA é uma abordagem importante na monitorização da distribuição de espécies em estudos populacionais e de biodiversidade. Embora possam ser utilizados métodos tradicionais como meio de identificar plantas melíferas, como por exemplo, observações diretas, microscopia, entre outros, as tecnologias de sequenciação de última geração transformaram a nossa capacidade de explorar floras mais complexas sem que haja a necessidade de recorrer a especialistas, tornando se também numa técnica mais económica, quando comparada às tecnologias clássicas. O metabarcoding, uma técnica que combina DNA barcode com sequenciação de última geração, tem sido usado para a identificação das espécies botânicas mais visitadas pelas abelhas forrageiras através da análise de pólen colhido pelas mesmas. Esta técnica baseia-se na sequenciação de marcadores genéticos de tamanho curto e que se localizem em zonas de DNA conservadas. A amplificação destes fragmentos é feita recorrendo a primers universais, para uma maior abrangência botânica. O ITS, uma região intergénica ribossomal, foi proposta e largamente utilizada, principalmente, como marcador genético universal em plantas. As sequências deste fragmento são, frequentemente, comparadas com uma base de dados de referência para que se estabeleça a identificação mais provável, e com a máxima especificidade possível, da origem taxonómica de cada fragmento sequenciado. Assim, informações taxonómicas precisas e específicas são um passo importante na análise de misturas de pólen colhidas pelas abelhas forrageiras através do metabarcoding. O objetivo deste estudo foi avaliar o desempenho da base de dados ITS2 de referência antes e depois do enriquecimento com sequências de espécies de plantas melíferas colhidas pela Europa. Um total de 100 amostras de plantas foram colhidas em seis países e foram identificadas morfologicamente ao nível da espécie. Procedeu-se à extração do DNA e sequenciação pelo método de Sanger da região ITS2. As sequências foram curadas e alinhadas com sequências do GenBank, através de um BLAST, para obter a identificação taxonómica e avaliar a similaridade com a identificação morfológica. Em seguida, uma base de dados ITS2 de referência foi gerada usando as 100 recém-desenvolvidas sequências. Estas foram adicionadas a uma vasta base de dados da região ribossomal, que está publicamente disponível, e o desempenho das duas (com e sem as 100 sequências geradas aqui) foi comparado num conjunto de 108 amostras de pólen colhido por abelhas, e previamente identificadas por metabarcoding e palinologia clássica. As análises mostraram uma correlação positiva (r> 0,7; P <0,05) entre os dois métodos para dois níveis taxonómicos, família (maioria dos países) e género (um terço dos países), embora o metabarcoding tenha identificado 12 famílias e 26 géneros e a palinologia 13 famílias e 22 géneros de plantas. A classificação das amostras de pólen, usando a base de dados ITS2 antes do enriquecimento com as novas sequências aqui desenvolvidas, recuperou (i) 76 e 67 famílias antes e depois da remoção dos táxons que não estão presentes na Europa, respetivamente, e (ii) 69 famílias após o enriquecimento. Ao nível do género, antes do enriquecimento da base de dados, havia 230 e 214 géneros identificados antes e depois da remoção dos táxons que não estão presentes na Europa, respetivamente, e 216 géneros após o enriquecimento. Os resultados mostraram uma correlação positiva (r> 0,9; P <0,001) entre as diferentes bases de dados, mas foi observada uma variação no número de famílias e géneros, o que indica um aumento na resolução e precisão da classificação. Este estudo oferece, assim, melhorias no metabarcoding da região ITS2 com mais sequências disponíveis no conjunto de dados de referência, proporcionando uma maior sensibilidade e resolução.This study was developed in the framework of the international project “INSIGINA: Pilot study on environmental monitoring of pesticide use through honey bees”, SANTE/E4/SI2.788418-SI2.788452-INSIGINIA-PP-1-1-2018, financed by the Health and Food Safety Directorate General, European Commission.Pinto, M. AliceQuaresma, AndreiaSelmi, BoulbebaBiblioteca Digital do IPBIlahi, Wafa2021-07-01T09:42:52Z202120202021-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10198/23703TID:202735664enginfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-02-25T12:14:08Zoai:bibliotecadigital.ipb.pt:10198/23703Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T11:41:34.569985Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species |
| title |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species |
| spellingShingle |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species Ilahi, Wafa Pollen identification Bee plant species ITS2 DNA metabarcoding Palynology Reference database Domínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e Alimentar |
| title_short |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species |
| title_full |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species |
| title_fullStr |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species |
| title_full_unstemmed |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species |
| title_sort |
Metabarcoding identification of botanical origin of bee-collected pollen samples: comparison of ITS2 reference database performance before and after enrichment with sequences of bee plant species |
| author |
Ilahi, Wafa |
| author_facet |
Ilahi, Wafa |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Pinto, M. Alice Quaresma, Andreia Selmi, Boulbeba Biblioteca Digital do IPB |
| dc.contributor.author.fl_str_mv |
Ilahi, Wafa |
| dc.subject.por.fl_str_mv |
Pollen identification Bee plant species ITS2 DNA metabarcoding Palynology Reference database Domínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e Alimentar |
| topic |
Pollen identification Bee plant species ITS2 DNA metabarcoding Palynology Reference database Domínio/Área Científica::Ciências Agrárias::Biotecnologia Agrária e Alimentar |
| description |
Mestrdo de dupla diplomação com a High Institute of Biotechnology of Monastir |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020 2021-07-01T09:42:52Z 2021 2021-01-01T00:00:00Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10198/23703 TID:202735664 |
| url |
http://hdl.handle.net/10198/23703 |
| identifier_str_mv |
TID:202735664 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833592151548624896 |