Quaderni dei Georgofili

Produzione e analisi delle sequenze metagenomiche

Marco Galardini; Alessio Mengoni; Marco Bazzicalupo

Accademia dei Georgofili
Pagine: 15
Collana: Quaderni dei Georgofili
Contenuto in: La biodiversità nel terreno agrario

Copyright 2010 Accademia dei Georgofili

La metagenomica sta diventando un approccio di studio sempre più utilizzato anche in laboratori di ricerca medio-piccoli e la metagenomica del suolo, sicuramente l’ambiente microbico più complesso, può essere oggi oggetto di progetti di ricerca. Può essere perciò importante in questa fase cercare di illustrare quali siano le procedure necessarie al corretto svolgimento di un progetto metagenomico. La prima fase è quella di pre-sequenziamento, nella quale sono definiti gli obbiettivi del progetto e la sua estensione, entrambe correlate alla potenza di sequenziamento e di analisi computazionale che si può mettere in gioco. Nel pre-sequenziamento deve anche essere compresa una valutazione della complessità della comunità microbica che si studia, perché a questa sono connesse anche le decisioni riguardanti tutte le fasi successive del progetto. La seconda fase è quella del campionamento durante il quale deve essere compiuto il massimo sforzo per preservare la qualità del DNA; in questa fase si raccolgono anche i cosiddetti “metadati” e si procede a collezionare campioni supplemetari di suolo per ulteriori possibili analisi. La fase del sequenziamento è quella nella quale si producono effettivamente la sequenze di DNA, questa dipende in modo determinante dalla piattaforma tecnologica usata per il sequenziamento, in particolare di quale sistema di ultima generazione dispone il progetto. La fase successiva prevede l’assemblaggio delle sequenze ottenute in insiemi continui più possibile lunghi detti contig. La qualità dell’assemblaggio può risultare decisiva in alcuni progetti metagenomici e può richiedere l’impiego di una notevole potenza di calcolo. La fase dell’annotazione è quella nella quale si cerca di attribuire un nome alle sequenze assemblate, cioè se ne indica la funzione presunta; a questo punto il lavoro metagenomico comincia a mostrare i suoi frutti in termini di descrizione della comunità microbica. Oltre all’annotazione la metagenomica del suolo richiede anche una fase in cui le sequenze vengono attribuite a specifici gruppi tassonomici; l’assegnazione tassonomica si basa sulla presenza di marcatori filogenetici e fornisce un quadro delle specie che svolgono un ruolo primario nella comunità. Infine, per il completamento dell’analisi metagenomica, si deve anche procedere all’analisi di singoli geni; questa volta, in modo indipendente dalla loro apparternenza a un particolare gruppo tassonomico, l’identificazione di singoli geni contribuisce a dare importanti informazioni sui processi che si svolgono nella comunità del suolo. I progetti di metagenomica del suolo sono in realtà una sfida notevole, tuttavia grazie agli eccezionali sviluppi della tecnologia e della bioinformatica, possono essere oggi affrontati e dare un grande contributo alla scienza del suolo.

Abstract

Metagenomic projects are becoming increasingly accessible also to medium and small size laboratories and even the metagenomics of soil, that is the more complex of the microbial environments, is currently under investigation. It is important at this point to present a short account of the procedures involved in the metagenomic project with the aim to give a general picture of the most relevant steps necessary to proceed through in order to set up a successful research work. Steps, in chronological order, are: Pre-sequencing issues involving the extent and the scope of the project which in turn are linked with the availability of sequencing and analysis power; this step also includes the evaluation of the complexity of the soil community to be investigated and its connections with the following steps of the project. The second step is the sampling procedure, where much of the effort should be put in the quality of the DNA to be extracted and purified, but including also the gathering of metadata referred to the sampling site and the collection of supplementary samples for securing the possibility of further analysis. Sequencing is the step when DNA sequences are actually generated, for which the approach is strongly related to the type of technological platform available, particularly which of the next-generation sequencing machines will be used. After sequencing the obtained sequences should be assembled into continuous stretches, as long as possible, called contigs. The quality of assembly could be critical for the success of certain metagenomic projects and could require a very powerful computational effort. Annotation is the step when the assembled sequences are named, that is they are attributed to some function. This is when results finally come out from the sequencing work and the microbial communities start to be described. Beyond annotation the soil metagenomic project should also include the step of taxonomic attribution of the sequences, that is based on the occurrence of phylogenetic markers and give a picture of the species playing a major role in the community functioning. The completion of the metagenomic analysis finally includes the recognition and analysis of single genes that could be unrelated to the taxonomic position of the species to which the gene belongs, but nevertheless can give important information on the processes of the soil community. Any soil metagenomic project is indeed a tremendous challenge, however, thanks to the astounding progresses in technology and bioinformatics, it can be afforded and greatly contribute to the soil science.