Wednesday, October 26, 2016

Conservation genomics of natural and managed populations building a conceptual and practical framewo






+

genomica conservazione delle popolazioni naturali e gestiti: costruire un quadro concettuale e pratico astratto Il boom della tecnologia di sequenziamento massivo parallelo (MPS) e le sue applicazioni nel campo della conservazione delle popolazioni naturali e gestiti porta nuove opportunità e sfide per rispondere alle domande scientifiche che possono essere affrontate. conservazione genomica offre una vasta gamma di approcci e tecniche analitiche, con i loro rispettivi punti di forza e di debolezza che si basano su diverse ipotesi implicite. Tuttavia, trovare gli approcci più idonei e le analisi relative alla nostra domanda scientifica sono spesso difficili e che richiede tempo. Per colmare questa lacuna, un laboratorio di recente dal titolo & lsquo; CONGEN 2015 & rsquo; si è tenuta presso l'Università Montana, al fine di riunire le conoscenze accumulate in questo campo e per fornire formazione in aspetti concettuali e pratici di analisi dei dati applicate al campo della conservazione e della genomica evolutivi. Qui, riassumiamo la resa competenza per ogni istruttore che ci ha portato a considerare l'importanza di mantenere in mente la questione scientifica da campionamento alle pratiche di gestione insieme con la selezione di adeguati strumenti di genomica e bioinformatica sfide. Conservazione e genetica evoluzionistica stanno rapidamente spostando da una genetica ad una prospettiva genomica, dove gli studi valutano migliaia di marcatori del DNA in centinaia di individui (Allendorf et al 2010;. Ouborg et al 2010;. Stapley et al 2010;. Narum et al 2013. ; McMahon et al 2014).. Il campo ha beneficiato di precedenti sviluppi della popolazione studi di genomica di organismi modello, soprattutto in umano (si vedano gli esempi esaminati nel Allendorf et al. 2010). Per esempio, il Progetto Genoma Umano ha rimodellato le scienze della vita e la medicina, rendendo digitale la vita come una parte del & lsquo; Big Data & rsquo; epoca (Tyler-Smith et al. 2015). Un quadro pratico e concettuale per un efficace disegno dello studio e approcci analitici è necessario per aiutare a guidare la nuova generazione di genetisti di popolazione nell'utilizzo su larga scala insieme di dati genomici. Infatti, integrando conoscenze su molti dei nuovi strumenti molecolari e computazionali disponibili per l'analisi di insiemi di dati genomici è fondamentale per rispondere alle domande di biologia evolutiva e la conservazione. Con la conoscenza degli strumenti disponibili, i ricercatori dovrebbero utilizzare la questione scientifica di base per guidare tutti gli aspetti di una conservazione o evolutivo studio genomico, dal disegno sperimentale attraverso l'analisi dei dati (vedi Fig. 1). Figura 1. quadro pratico con passaggi per la progettazione di uno studio MPS. Tutti insieme i ricercatori di processo coinvolti nei progetti MPS si trovano ad affrontare logistici compromessi al fine di rispondere in modo accurato ed efficiente la loro domanda scientifica. Il processo non è semplice e unidirezionale ma feedback e / o interazioni sono possibili e comuni tra tutti i passi. & Lsquo; Che tipo & rsquo; di loci si riferisce a caratteristiche quali loci nei geni, collegato loci o aplotipi (per informazioni genealogiche), mappato loci spesso necessario per gli studi QTL o piste di omozigosi o lungo loci (ad esempio lunghe contigs RAD da abbinato-end letture). Il & lsquo; distribuzione delle popolazioni & rsquo; si riferisce alla necessità di campionare le popolazioni provenienti da diverse posizioni di paesaggio o attraverso gradienti ambientali per lo svolgimento di paesaggio studi genetici o genomici. & lsquo; SNP per locus & rsquo; si riferisce al fatto che i ricercatori possono utilizzare solo un SNP per RAD locus (per garantire SNP indipendenti). Rapture, MAF, LD e IBD sono acronimi per RAD-capture (Ali et al. 2015), Minor Allele Frequency, linkage disequilibrium, e Identità per discendenza, rispettivamente. Si noti che i chip SNP sono uno strumento genomica alternativa (non in questa figura), spesso utilizzano MPS per la scoperta SNP. Per aiutare ad educare genomica popolazione ricercatori, 15 esperti nel campo della genomica conservazione diretto un laboratorio di 1 settimana chiamato & lsquo; CONGEN 2015 & rsquo; (Abbreviato dal Conservation Genetics) presso l'Università di stazione biologica Montana Flathead Lake. Questa recensione incontro è stato scritto per chiunque sia interessato alla genomica di popolazione, da studenti laureati a docenti e responsabili delle risorse. Qui, si evidenziano i temi chiave e messaggi casa importanti si discusse durante il workshop, con l'accento sulla recente letteratura pertinente in questo campo. Più in particolare, abbiamo descritto studio (i) come progettare un sequenziamento massivamente parallelo (MPS) per un modello o di una specie nonmodel, (ii) come filtrare dati della sequenza del DNA dai dati MPS (vale a dire l'estrazione loci e / o SNPs sulla base di criteri) e (iii) per analizzare i dati MPS utilizzando classici (ad esempio algoritmi di clustering) e gli approcci più recenti (ad esempio algoritmi di probabilità), all'interno di tubazioni tradizionali o nuovi (ad esempio Galaxy). Questa panoramica consentirà ai ricercatori di comprendere meglio alcuni dei punti di forza e dei limiti dei recenti approcci molecolari e computazionali. Progettare uno studio MPS: tenendo a mente la tua domanda biologica Una delle maggiori differenze nell'utilizzo dei dati MPS vs. dati genetici (ad esempio microsatelliti) classici è la quantità di tempo speso per l'analisi dei dati, con la produzione di dati superando la nostra capacità di analizzarlo. Come affermato da istruttore CONGEN Paul Hohenlohe, non si tratta solo di generazione di dati. genomica conservazione offre una prospettiva genomica senza precedenti, utilizzando un gran numero di marcatori al genotipo contemporaneamente loci putativamente neutro e adattivo, quindi offrendo scorci in potenziale adattativo (Allendorf et al 2010;. Harrisson et al 2014).. Poi, la progettazione di uno studio MPS richiede l'esame di un gran numero di fattori rappresentati da Fig. 1 e recentemente recensito da Andrews et al. (2016). Il più importante punto di partenza rimane, & lsquo; Qual è la questione scientifica / biologico & rsquo; Questo dovrebbe determinare come un ricercatore naviga a tutte le domande successive, come & lsquo; Qual è il suo disegno di campionamento e come si dovrebbe ripartire il budget fra i campioni, le popolazioni, gli individui, loci e la profondità della copertura sequenza & rsquo; Domanda-driven piuttosto che la ricerca metodo-driven permette ai ricercatori di non essere limitati dagli strumenti metodologici a disposizione, offrendo così la flessibilità e l'apertura necessaria per trovare il metodo appropriato che rispondere alla loro domanda. Per esempio, studi di simulazione recenti hanno dimostrato che un disegno di campionamento con geograficamente vicine popolazioni (con flusso recente dei geni e quindi a basso genome-wide F ST) attraverso un gradiente di selezione (ambientalmente posizioni distinte) aveva ad alta potenza per rilevare adattamento locale (Lotterhos & amp; Whitlock 2015). Quando avete bisogno di sequenziare l'intero genoma vs genotipo solo centinaia o migliaia di loci per rispondere alla tua domanda (Ellegren al 2014)? Per budget equivalenti, un gran numero di individui può essere genotipizzati con una copertura inferiore, se siete interessati a stime accurate dei parametri di popolazione (ad esempio, il flusso genico, F ST - outlier loci), mentre alcuni campioni potrebbero essere genotipizzati in una copertura maggiore quando si bisogno di genotipo individui con precisione (ad esempio, per valutare il livello di consanguineità individuale). Avete una ipotesi a priori sulle caratteristiche del sistema modello biologico o di una specie (ad esempio, la storia della colonizzazione, il tempo di generazione, piccola e isolata contro grandi e panmittica popolazioni, le capacità di dispersione, eterogeneo vs habitat omogenei) che potrebbero aiutare di prevedere il livello di diversità genetica, l'effetto della deriva genetica e la misura delle pressioni selettive? Gli attuali metodi di analisi dei dati MPS Low-copertura metodi di genotipizzazione e verosimiglianze genotipo (Mike Miller) Nuovi metodi bayesiani che mirano ad analizzare in modo efficiente a bassa copertura genomica dati sono in fiore (Le & amp; Durbin 2011; Yu & amp; Sun 2013;. Cantarel et al 2014). Comprendere teoria che sta dietro l'applicazione di modelli bayesiani a bassa copertura di dati genomici è di fondamentale importanza e inizia con l'apprendimento come calcolare verosimiglianze genotipo da sequenze di DNA. Così, Mike Miller istruito studenti come calcolare il genotipo probabilità sulla base di errori di sequenziamento, la copertura e priori probabilità (cioè uniforme o Hardy & ndash; Weinberg modello di equilibrio). Ha mostrato come questi fattori chiave potrebbero influenzare significativamente i risultati di probabilità genotipo e poi molte analisi a valle (Sims et al. 2014). Queste analisi possono quindi soffrire di SNP chiamata e l'incertezza del genotipo, che portano a conclusioni inesatte demografici (Nielsen et al. 2011). Un modo per superare questo pregiudizio potrebbe essere quello di campione più ampio numero di individui a scapito della profondità di copertura al fine di raccogliere ulteriori informazioni sui parametri di popolazione, come suggerito da Buerkle & amp; Gompert (2013). L'importanza della rimozione dei duplicati PCR (legge risultante da amplificazione PCR clonale dello stesso filamento di DNA originale) è stato anche sottolineato a causa della loro influenza potenzialmente distorsivo sul calcolo delle verosimiglianze genotipo (eccesso di fiducia in un genotipo chiamato solo sulla base di duplicati PCR) come suggerito dal Puritz et al. (2014b). duplicati di PCR possono essere facilmente rimossi dal set abbinato-end sito di restrizione del DNA associato (RAD) di dati di sequenziamento identificando abbinato-end si legge a partire dalla posizione identica (Davey et al. 2013) e dalla genotipizzazione-by-sequenziamento (GBS) set di dati di utilizzando adattatori degenerato-base (Tin et al. 2015). Allo stesso modo, paraloghi dovrebbero essere esclusi dall'analisi rilevando legge ad alta copertura, anche se i set di dati genomici hanno spesso ad alta varianza copertura in loci (vedi Fig. 2; Malhis & amp; Jones 2010). Infine, M. Miller ha presentato anche nuovi approcci computazionali per rilevare gli errori di genotipizzazione, insieme a un nuovo approccio che combina genotipizzazione RAD-ss con array di cattura del DNA per basso costo genotipizzazione (Ali et al 2016;.. Norgaard et al in corso di stampa). Chiamata genotipi in base alle loro verosimiglianze può essere facilmente eseguita con angsd (Korneliussen et al. 2014) e gatk (DePristo et al. 2011) programmi. Figura 2. Tabella di marcia per il filtraggio legge dal sequenziamento massivamente parallelo (MPS). Mappatura legge di un genoma di riferimento (Paul Hohenlohe) Allineamento sequenza di letture anonime contro un assemblaggio del genoma di riferimento fornisce numerosi vantaggi per il filtraggio dei dati (ad esempio, la rimozione errata o clonale duplicato PCR legge) e identificare loci (Hand et al. 2015A). Se un genoma di riferimento non è disponibile per la specie focali, pag Hohenlohe consigliato utilizzando genomi ben assemblato da taxa correlati. Gli sforzi come il progetto Genome 10K (https://genome10k. soe. ucsc. edu/) e il progetto di i5k Insect Genoma (https://arthropodgenomes. org/wiki/i5K) sono in rapida crescita il numero di taxa per cui questo è possibile. La questione di come strettamente correlato è & lsquo; strettamente legato abbastanza & rsquo; per essere utile per l'allineamento dipende dettagli del set di dati, come la sequenza di lettura lunghezza e se le regioni più conservati quali geni sono mirati per il sequenziamento. Un genoma di riferimento mal assemblato può essere ancora utile per assegnare le legge loci e trovare geni funzionali legati ai marcatori candidati, anche se non fornisce una mappa fisica completa del genoma (ad es Mano et al. 2015A, b). Tecniche come accoppiato-end RAD sequenziamento (o la cattura esone) possono anche essere usati per costruire un insieme di sequenze contig per le specie nonmodel, che poi forniscono un punto di riferimento per i dati di sequenza ulteriormente a livello di popolazione (Hohenlohe et al 2013;. Jones & amp; Buona 2016). Di fronte a risorse limitate, pag Hohenlohe in guardia contro piscina-sequencing (sequenziamento cioè pool di molti individui senza codice a barre) a causa delle insidie ​​associate alla stima frequenze alleliche (mancano varianti rare), identificando paraloghi, distinguendo i veri alleli da errori di sequenziamento e nascosto struttura della popolazione. Che mediante lo scambio ha mostrato risultati promettenti per accurati frequenze alleliche stime (Futschik & amp; Schl & ouml; tterer 2010; Ferretti et al 2013;.. Lynch et al 2014), questo approccio è spesso meno desiderabile di sequenziamento individuale per una vasta gamma di applicazioni quali la struttura di analisi, di assegnazione dei genitori e del genoma scansioni (revisione a Cutler & amp; Jensen 2010). pile workflow tutorial, pacchetto stackr e Galaxy (Laura Benestan e Tiago Antao) Vi è la necessità per la standardizzazione e la documentazione delle numerose fasi di filtraggio e di elaborazione (Fig. 2) necessari per pulire e utilizzare i dati MPS (ad esempio da parte di più ricercatori all'interno di un gruppo di ricerca o la comunità scientifica più ampia). Laura Benestan ha anche sottolineato che la normazione contribuisce a garantire la ripetibilità. Il tutorial pile flusso di lavoro creato da & eacute; ric Normandeau per il gruppo di ricerca di Louis Bernatchez a Laval University è stato progettato per facilitare, standardizzare e documenti (in un file di log) ciascuno dei molti passi di filtraggio e di analisi nella scoperta e la genotipizzazione di marcatori SNP putativi da GBS / dati di sequenziamento RAD utilizzando il programma di pile (catchen et al. 2013). stack è una pipeline ampiamente utilizzato per l'analisi dei dati RAD-ss ma altri gasdotti, come pyrad (Eaton al 2014), radtools (Baxter et al. 2011), gatk (McKenna et al. 2010), ddocent (Puritz et al. 2014A) potrebbe anche essere utilizzato per chiamare SNP. Più in particolare, pyrad. ddocent e più recentemente gli stack sono promettenti programmi di flusso di lavoro in grado di gestire l'inserimento & ndash; delezione polimorfismo nel allineamento della legge. Il flusso di lavoro stack utilizza strumenti universali, tra cui script personalizzati, per standardizzare e rendere ripetibile tutti gli aspetti del gasdotto, ma anche di evidenziare le aree in cui il ricercatore dovrebbe esercitare cautela nella scelta dei valori dei parametri. Il flusso di lavoro è liberamente disponibile su GitHub (https://github. com/enormandeau/stacks_workflow). Il manuale incluso descrive ogni passo necessario per l'esecuzione di analisi di MPS in pile da scaricare e installare pile a filtrare i risultati. Sono supportati i dati single-end prime prodotte da Illumina o la tecnologia Ion Proton. pile post-analisi e filtraggio dei dati (Fig. 2) possono essere condotte con il stackr R pacchetto (Gosselin & amp; Bernatchez 2016). Questo pacchetto è liberamente disponibile su GitHub (https://github. com/thierrygosselin/stackr). stackr contiene diverse funzioni r che consentono agli utenti di: (i) leggere e modificare le uscite da pile. (Ii) i marcatori di filtro in base alla copertura, il genotipo probabilità, il numero di persone, numero di popolazioni, la frequenza dell'allele minore, ha osservato eterozigosi e coefficiente di inbreeding (F IS), (iii) esplorare le distribuzioni di statistiche riassuntive e creare figure ggplot2 pronti per la pubblicazione, (iv) imputare i dati mancanti utilizzando un algoritmo foresta casuale e (v) set di dati di esportazione in vcf, genepop, fstat file o come oggetti genind per essere facilmente integrato in altri pacchetti R per la genomica delle popolazioni analisi. Tiago Antao anche dimostrato piattaforma software galassia web-based (https://galaxyproject. org), che potrebbe aiutare con la standardizzazione di filtraggio e genotipizzazione. Galaxy produce diagrammi diagramma di flusso (di passaggi filtranti) e file di log per aiutare i ricercatori la riproduzione e la condivisione completa & lsquo; gasdotto & rsquo; analisi con gli altri. Galaxy è uno strumento interessante per la visualizzazione dei dati in quanto potrebbe efficacemente disegnare elementi grafici (cioè grafica delle distribuzioni dei punteggi di qualità) che consentono agli utenti di esplorare e navigare i loro dati. pile in corso e relativi approcci di filtraggio potrebbero essere anche fatto facilmente da questa piattaforma web. Il & lsquo; F-word & rsquo ;: filtraggio (Jim Seeb) Genomics comporta la genotipizzazione di migliaia di loci, genome-wide, per portare una risoluzione senza precedenti di problemi di pianificazione della conservazione (Allendorf et al 2010;. Shafer et al 2015).. Tuttavia, questo luminoso futuro per la genomica nasconde i numerosi problemi di filtraggio inerenti ai set di dati MPS, che Jim Seeb indicato come il & lsquo; F-word & rsquo; . Per esempio, la fusione insiemi di dati filtrati utilizzando parametri diversi potrebbe creare falsi risultati come i valori - outlier F ST forti e significative (ma falsi) tra campioni di popolazione in modo diverso filtrati. La mancanza di dettagli necessari sui gradini di filtraggio in molte delle pubblicazioni di oggi utilizzando i dati di MPS potrebbe influenzare la trasparenza e la riproducibilità dei risultati. Ciò contribuirà alla tendenza che la maggior parte degli studi MPS non è possibile verificare in modo accurato (Nekrutenko & amp; Taylor 2012). Per incoraggiare scienziato per pubblicare e comprendere questi importanti passaggi filtranti, fig. 2 riporta alcune delle principali questioni di filtraggio (associati alla sequenza e gli errori di montaggio) che devono essere affrontati in un progetto MPS. Una pubblicazione completa ed esaustiva porterà raccomandazioni dettagliate e gasdotti per condurre operazioni di filtraggio accurate sui dati MPS in una prossima Popolazione Genomics in R & mdash; Molecular Ecology Risorse numero speciale. Identificare i marcatori di interesse attraverso passaggi filtranti potrebbe essere fatto in base al singolo SNP o approccio aplotipo, quest'ultimo è una possibile alternativa per superare i problemi riguardanti linkage disequilibrium (LD; Fig. 2). Tuttavia, è importante tenere presente che il livello appropriato di filtraggio dipenderà sempre questione scientifica e il set di dati disponibili (Andrews et al. 2016). Inoltre, la scoperta locus RAD e la genotipizzazione è spesso inibita dalla presenza di geni duplicati e regioni genomiche (Allendorf et al 2015;. Andrews et al 2016).. Duplicazione genica si verifica a causa della duplicazione segmentale (ineguale crossing over) o tutta la duplicazione del genoma (Amores et al. 2011). Loci può essere analizzato in regioni duplicati con la costruzione di mappe e genotipizzazione linkage con i chip SNP o potenzialmente con una copertura molto profondo GBS (al. Waples et 2015). Distinguere compreso loci paralogous sulla mappa di associazione permetterà ai ricercatori di aggirare i problemi di produzione di un quadro incompleto del genoma (Brieuc et al 2014;. Kodama et al 2014). E l'introduzione di pregiudizi nei parametri stime genetici (Meirmans & amp; Van Tienderen 2013). Struttura del programma intuizioni e suggerimenti (Jonathan Pritchard) Jonathan Pritchard ha fornito una panoramica e consigli pratici circa l'applicazione del programma di struttura (Pritchard et al. 2000). J. Pritchard ha spiegato che spesso è realistico aspettarsi che c'è un & lsquo; vero & rsquo; K che è meglio per modellare un particolare insieme di dati. Attraverso simulazioni, Kalinowski (2010) ha mostrato che a volte Structure individui raggruppati in modi imprevedibili, che è perché il modello Struttura è un cartone animato (semplificazione) della popolazione naturale più complicato. Pertanto, la visualizzazione e reporting trame per più - Valori K è un passo importante (Gilbert et al. 2012) a causa diversi valori di K possono dare intuizioni in diversi livelli della struttura. Analogamente, la selezione ottimale K non è una procedura esaustiva e deve essere fatto per quanto riguarda la biologia e la storia di popolazioni studiate (Kalinowski 2010). Ad esempio, il numero ottimale di cluster (K) trovata Struttura o successiva analisi (es Evanno et al. 2005) possono non avere realtà biologica e potrebbe derivare da un contesto di isolamento da distanza, dove Struttura tende a sovrastimare struttura genetica (Frantz et al. 2009). Allo stesso modo, uno studio di simulazione recente ha dimostrato che la dimensione del campione sbilanciato conduce a conclusioni errate demografici in cui i campioni più piccoli tendono ad essere fuse insieme (Puechmaille 2016). Per superare questi problemi, metodi alternativi come l'analisi delle componenti principali o alberi evolutivi potrebbero essere testati in quanto riguarda la struttura di analisi (Jombart et al 2010;. Kalinowski 2010; Kanno et al 2011;.. Benestan et al 2015). I revisori spesso richiedono molto lunghe percorrenze struttura (milioni di iterazioni). J. Pritchard ha affermato che è in genere inutile e uno spreco di tempo ricercatore (e emissioni di anidride carbonica). Per la maggior parte insiemi di dati, si raccomanda di fare circa 10 000 gradini, ma più volte per valutare la robustezza e la convergenza dei risultati. Struttura tende a convergere abbastanza rapidamente, ma il programma non fa un grande lavoro di esplorazione tra i picchi locali nello spazio dei parametri della distribuzione a posteriori. Pertanto, per un'analisi esplorativa, sarebbe più efficiente di trascorrere il tempo di calcolo su percorsi indipendenti (che hanno una buona possibilità di trovare modi distinti) che facendo estremamente lunghe percorrenze in cui l'algoritmo sarà semplicemente a passeggiare all'interno di una modalità. Tuttavia, un certo minimo burn-in e run di lunghezza aiuta a superare la stocasticità dell'approccio Monte Carlo, come raccomandato da Gilbert et al. (2012). Migliorare la nostra rilevazione di adattamento locale (Lisa Seeb) La comprensione base genetica di adattamento locale è uno dei più interessanti potenziali contributi di genomica alla biologia di conservazione (Allendorf et al. 2010). I metodi più utilizzati per rilevare le prove di selezione sono approcci di scansione del genoma basata sulla differenziazione (F ST) test di valori anomali originariamente sviluppati da Lewontin & amp; Krakauer (1973), poi raffinato, più recentemente, da Beaumont & amp; Nichols (1996) e altri (Beaumont & amp; Balding (2004), Foll & amp; Gaggiotti 2008). Diversi programmi sono stati progettati per eseguire l'analisi dei valori anomali scansione genome-wide, come Lositan. che si basa su una distribuzione stocastica nullo F ST (Antao et al 2008)., Arlequin (Excoffier & amp; Lischer 2010) che include un modello gerarchico, e BayeScan (Foll & amp; Gaggiotti 2008) che si basa su una distribuzione bayesiana F ST . Dal momento che ogni metodo ha i suoi inconvenienti, valori anomali che richiedono (geni adattativi candidato) per essere identificati in più metodi possono contribuire a ridurre l'incidenza di falsi positivi (Narum & amp; Hess 2011; Villemereuil et al 2014;. Fran & ccedil;. Ois et al 2016) perché questi metodi differenti possono tendono a essere più d'accordo su veri positivi che su falsi positivi. Lisa Seeb ha descritto il lavoro di DeMita et al. (2013) che ha indagato la robustezza di otto metodi per rilevare loci potenzialmente sotto selezione in base a otto scenari demografici lungo un gradiente ambientale. Il loro lavoro ha dimostrato che, mentre genotipo & ndash; ambiente metodi di correlazione hanno più potere di rilevare il segnale di selezione di scansioni del genoma, questi metodi erano più inclini a falsi positivi nel valutare queste associazioni. L'importanza di incorporare struttura genetica neutrale in genotipo & ndash; metodi ambiente di correlazione ha portato alla nascita di due pacchetti software più recenti: bayescenv e LFMM (al Frichot et al 2013.) (Villemereuil et al 2014).. Tuttavia, così come con metodi adatti, L. Seeb sottolineato che un disegno di campionamento appropriata è cruciale per verificare la prova di adattamento locale. Per esempio, analizzando serie di popolazioni indipendenti (& lsquo; replica & rsquo;) attraverso gradienti ambientali simili aiutato Larson et al. (2014) per trovare segnali di selezione in salmone Chinook. Inoltre, la mappatura valori anomali per trovare isole cromosomiche di divergenza può aiutare a identificare i geni funzionali coinvolti nella adattamento locale. Si consiglia di scienziati interessati l'utilizzo di analisi di associazione ambientale nella genomica per leggere mano et al. (2015b), Rellstab et al. (2015) o Van Heerwaarden et al. (2015). I ricercatori devono essere consapevoli che le prove nuove e migliorate così come le valutazioni dei test sono pubblicati frequentemente (ad esempio, vedere Foll et al 2014;. Whitlock & amp; Lotterhos 2015; Jensen et al 2016).. L'uso della genomica per le decisioni di gestione dimensione effettiva della popolazione (N e) valutazione (Robin Waples) Robin Waples insegnato concetti della dimensione effettiva della popolazione utilizzando un'analogia di una lotteria. Immaginate la capacità dei genitori di produrre prole vitale per la prossima generazione dipende da un sistema di lotteria. In una popolazione di Wright-Fisher (ideale), tutti hanno lo stesso numero di biglietti, e il campionamento è con la sostituzione. Nelle popolazioni reali, diversi individui hanno un diverso numero di biglietti della lotteria, perché alcuni di loro si riproducono più di altri, e di conseguenza, essi hanno diverse probabilità di essere genitori, riducendo in tal modo N e rispetto alle dimensioni censimento. Enumerò i diversi metodi che possono essere utilizzati per stimare contemporanea N e. metodi temporali, metodi LD, metodi approssimati di calcolo bayesiano (ABC), e altri stimatori singoli sulla base di eccesso eterozigote (Pudovkin et al. 1996), co-discendenza molecolare (Nomura 2008), e sibship analisi (Wang 2009). partecipanti CONGEN sono stati anche ricordato che questi metodi fanno alcuni importanti presupposti: nessuna migrazione, nessuna selezione, la mutazione non è importante, le generazioni discreti, il campionamento casuale di un'intera generazione e loci non fisicamente collegati. R. Waples detto che le stime genetici di entrambi i N e beneficio contemporaneo o di lunga durata dalla proliferazione del numero ei tipi di marcatori, ma questo introduce anche le sfide, in gran parte a causa di un LD), che è inevitabile quando un gran numero di marcatori hanno da confezionare in un piccolo numero di cromosomi, e b) pseudo-replication causa di linkage, marcatori non sono indipendenti, in modo da aggiungere più loci non aumenta la precisione veloce come farebbero in completa indipendenza. LD è previsto per essere il prossimo grande problema nel trattare con i dati genomici dal campionamento multilocus migliora mentre classica analisi come N e la stima, la scansione del genoma e algoritmi di clustering trattati loci come indipendente (Baird 2015). Kemppainen et al. (2015) presentare uno strumento esplorativo utile (denominato LDna) in grado di dare una visione globale di LD associato a fenomeni evolutivi diversi e identificare loci potenzialmente correlati. Sulla base di simulazioni, (R. K. Waples, W. A. Larson, R. S. Waples, in revisione) ha mostrato che più loci non aumentano la frazione che è fisicamente collegata, dal momento che la maggior parte delle coppie casuali di loci non sono collegati. Se loci legati polarizzazione verso il basso N e stime (Larson et al. 2014), il bias da ignorare legame è meno grave quando il numero di cromosomi è grande. Infine, le strategie che filtrano un locus in coppie di valori anomali di loci sono solo parzialmente efficaci e un fattore di correzione di polarizzazione in base al numero di cromosomi è probabilmente più efficace (R. K. Waples, W. A. Larson, R. S. Waples, in revisione). Video registrazione R. Waples & rsquo; N e conferenza può essere visionato a https://www. youtube. com/watch? v=ErhACWXRLss e https://www. youtube. com/watch? v=N3JbKZbKO5w Definizione di unità di conservazione: Esus e MU (Robin Waples) L'integrazione di dati genomici nella gestione può essere difficile in pratica. Per esempio, non c'è modo migliore o correggere unico per rispondere alle domande e lsquo; quello che è una popolazione & rsquo; e & lsquo; come identificare l'unità idonea conservazione & rsquo; (Ad esempio ESU, MU, ecc), perché le definizioni di questi termini possono essere vaghi, non quantitativo, e dipendono l'obiettivo di gestione (Waples & amp; Gagiotti 2006). Dal momento che molti & lsquo; popolazione & rsquo; concetti possono essere trovati in letteratura (Fraser & amp; Bernatchez 2001), R. Waples ha suggerito la scelta del concetto di popolazione (ESU, MU, etc.) che è appropriato per l'obiettivo (s) di ciascuno studio. Un modo per rilevare il numero di popolazioni è controllare statisticamente significativa differenziazione genetica. potenza statistica è influenzato dalle differenze (i) di popolazione (dimensioni effetto) e (ii) la ricchezza di dati (numero di individui, numero di campioni, numero di loci e alleli). Poi, importanti differenze biologiche potrebbero perdere se i dati sono limitati (a bassa potenza). D'altra parte, la significatività statistica non garantisce significato biologico, soprattutto quando grandi quantità di dati sono disponibili (cioè ad alta potenza rileva anche le differenze banali, vedi Palsboll et al. (2007). Questo difetto dovrebbe essere una delle principali preoccupazioni in età di . genomica Inoltre, i test statistici standard di solito non rispondono adeguatamente alla domanda & lsquo; e 'abbastanza diverso & rsquo;? perché rifiutano solo l'ipotesi nulla di nessuna differenziazione (panmixia). Un altro modo per rilevare la struttura della popolazione e di identificare le unità di popolazione è quello di utilizzare metodi di clustering bayesiano come la struttura (Pritchard et al. 2000), BAPS (Corander et al. 2004) e Additivo (Alexander et al. 2009), ma questi metodi possono avere potenza ridotta con specie di flusso elevato di geni (Jombart et al 2010;. Kanno et al 2011;.. Benestan et al 2015). Tuttavia, l'assenza di differenziazione genetica a marcatori neutrali non significa assenza di differenze adattivi (Allendorf et al. 2010). Pertanto, utilizzando i marcatori influenzati dalla selezione potrebbe essere una strada promettente ricerca per delineare importanti unità di conservazione (vedi studio condotto su aringhe da Limborg et al. (2012a) per un esempio), in particolare nelle specie di flusso elevato di geni (Gagnaire et al. 2015) . Tuttavia, un modello di divergenza adattativa potrebbe non necessariamente corrispondere al modello neutro (ad esempio, quando un gruppo di adattamento sovrappone due neutri) come i processi che interessano marcatori genetici adattivi e neutri sono diversi. Quindi, combinando marcatori neutrali e adattative in un approccio gerarchico per definire unità di conservazione, come suggerito da Funk et al. (2012) può incontrare problemi pratici nel delineare unità di conservazione. Tuttavia, pochi studi già utilizzate le informazioni sulla differenziazione adattiva per migliorare le decisioni di conservazione (Limborg et al 2012a, b;. Bourret et al 2013;.. Larson et al 2014). Tuttavia, data la notevole percentuale di falsi positivi nel rilevamento valori anomali (DeMita et al 2013;. Fran & ccedil;. Ois et al 2016), è fondamentale per completare il modello di divergenza adattativa derivanti dalla genomica dati con ecologica, fenotipici e dati ambientali. Sono necessarie ulteriori ricerche per valutare la questione in futuro. genomica Adaptive come un primo passo (Michael Schwartz) Michael Schwartz, direttore del Laboratorio di Genomica Nazionale per la fauna selvatica e la conservazione di pesce (in Montana), ha portato una discussione che si è concentrato sul grado di utilizzo diretto dei dati genomici in conservazione e gestione delle risorse naturali (Shafer et al 2015;. Garner et al. 2016). Un lato del dibattito suggerisce che la genomica ha avanzato pesci e conservazione della fauna selvatica, aumentando il numero di marcatori analizzati, ma non è riuscito a vivere fino alla sua promessa di chiarire le basi genetiche per l'adattamento in un modo che può essere utilizzato dai gestori (Shafer et al., 2015). L'altro lato rileva che la genomica è attualmente utilizzato dalle agenzie di gestione in una varietà di taxa, ma che la natura non accademica di alcuni laboratori che applicano la genomica alla conservazione può portare ad un ritardo nella pubblicazione in riviste accademiche. I partecipanti e gli istruttori hanno suggerito ragioni di un potenziale divario tra genomica e applicazione per la gestione diretta, più evidente, quello di costo e la mancanza di familiarità (ad esempio, alcuni dirigenti sono più a suo agio con il vocabolario o concetti che circondano i dati microsatelliti (e analisi dei dati) che con il romanzo tecniche di genomica nel processo decisionale). Il gruppo ha poi discusso come evitare falsi positivi nell'identificazione valori anomali applicando la correzione statistica per test multipli come Bonferroni o correzione false discovery rate (FDR) (Narum 2006). Potere di individuare i veri valori anomali sembra essere fortemente dipendente campionamento e statistica test utilizzato, sia che si controlla o non per la struttura della popolazione (Lotterhos & amp; Whitlock 2015). Ringraziamenti J. K. SIGNORINA. B. G. ausiliario Articolo Informazioni




No comments:

Post a Comment