Jun 23, 2023
イソギンチャク毒表現型のミクロ進化とマクロ進化
Nature Communications volume 14、記事番号: 249 (2023) この記事を引用する 3264 アクセス数 1 引用数 27 Altmetric Metrics の詳細 毒は、実質的な種間および種内での複雑な形質です。
Nature Communications volume 14、記事番号: 249 (2023) この記事を引用
3264 アクセス
1 引用
27 オルトメトリック
メトリクスの詳細
毒は、多くの有毒タンパク質の発現に作用する強い選択圧によって生じる、種間および種内の実質的な変動を伴う複雑な形質です。 しかし、毒の表現型を決定する毒素発現動態の基礎となるプロセスの理解は未解決のままです。 種間の比較により、イソギンチャクの毒素発現は急速に進化し、各種の異なる毒素ファミリーが大規模な遺伝子重複イベントによって毒表現型を決定することが明らかになりました。 イソギンチャク Nematostella vectensis の詳細な分析により、独立した拡張/収縮イベントに起因して、集団全体で優勢な毒素 (Nv1) 二倍体コピー数 (1 ~ 24 コピー) が顕著に変動し、それが異なるハプロタイプを生成することが明らかになりました。 Nv1 コピー数は、転写レベルとタンパク質レベルの両方で発現と相関しており、1 つの集団では Nv1 産生がほぼ完全に失われています。 最後に、動物が毒を形成する際に同様の戦略を収束的に進化させたという他の有毒系統の観察を組み込んだ、優勢毒素仮説を確立します。
種、集団、個体間の表現型の多様性を促進する分子プロセスを理解することは、ミクロ進化とマクロ進化の間のつながりを解明するために不可欠です。 ほとんどの形質は多遺伝子性であり、その表現型は複数のゲノム遺伝子座の影響を受けることを意味します1、2、3、4、5。 しかし、これらの複雑な形質の遺伝性を理解することは困難です。 遺伝子発現は、遺伝子が多遺伝子形質に及ぼす影響の種類を決定する上で重要な特徴であると考えられます。 これは、種内および種間の表現型の変動に寄与する遺伝的遺伝子発現の動態から明らかです6,7。 シスおよびトランス制御要素の変異 8,9、エピジェネティック修飾 7,10,11、および遺伝子重複 12,13,14 を含む、これらの遺伝子発現動態を駆動するメカニズムは、適応形質をもたらす可能性がある選択圧の影響を受けます。生物の中で。
遺伝子発現ダイナミクスの急速な変化を引き起こす可能性のあるメカニズムの 1 つは遺伝子重複であり、これは転写物の存在量の増加を引き起こし、種内および種間の表現型の変動につながる可能性があります。 コピー数変動 (CNV) を引き起こす遺伝子重複は、複製のずれ、減数分裂中の不等交差、遺伝子転写物の逆位置、全ゲノム重複の組み合わせから発生する可能性があります 15,16。 遺伝子重複から生じる CNV は、多様化を介して作用する分子進化の基質を提供することに加えて、投与量による遺伝子発現の増加による即時的なフィットネス効果も引き起こす可能性があります 17。 実際、表現型への即時の影響の可能性と重複遺伝子の高い突然変異率は、CNVが新しい生態的ニッチへの迅速な適応のための重要なメカニズムである可能性を示唆しています。 CNV は主にヒトの遺伝病と最近の適応に関連して研究されています 18,19,20 が、他の種の生態学的および進化の過程における個体および集団規模の CNV の役割と、その複雑な形質への影響についての認識が高まっています 21。 22、23。
強い選択圧力の下で進化していると仮説が立てられている複雑な形質は、捕食と防御に関連する生態学的役割に不可欠な毒である 24,25,26。 毒の表現型は、複数の毒素をコードする遺伝子の協調的な発現に依存しているため、多くの場合複雑な形質になります。 これらの毒素が組み合わされて、非常に特徴的な毒プロファイルが生成され、種内および種間で大きく異なります 26,27。 種間の毒素遺伝子発現の違いが、毒表現型の急速な進化の主な原因であることを裏付ける証拠がある 28,29。 毒素遺伝子ファミリーは、これらのタンパク質が栄養と生存の両方の相互作用を媒介する個体の適応度の中心であるため、適応進化の誕生と死のモデルを通じて進化すると仮説が立てられています 24,25。 比較ゲノミクスにより、多くの有毒生物がゲノム内に遺伝子重複を急速に蓄積するという仮説を支持する証拠が明らかになりました。例としては、クモ 30,31、イモガイ 32、サソリ 33 が挙げられますが、オオグモ 34 などの例外もあります。
95% at nodes. B Representative images of the three sea anemone superfamilies included in the phylotranscriptomic analyses (Edwardsioidea—N. vectensis; Actinioidea—Aulactinia veratra; Metridioidea—Calliactis polypus). Actinioidea and Metridioidea photos courtesy of Peter Prentis. C Models of trait evolution fitted to toxin expression highlights that pulsed evolutionary process best describes sea anemone venom evolution. Model of best fit highlighted in color based on weighted AIC and are colored according to the toxin family key in panel A. See Supplementary Data 1 for species code and reference./p>50% of the total toxin expression (Supplementary Data 2). During diversification of Actinioidea, ASR suggests that KTx3 evolved to become the dominant toxin family. The KTx3 family is the dominant toxin family in 10 of the 17 Actinioidea species, with Actinoporin, KTx1, and KTx2 dominant in four, one and two species, respectively. Outside of Actinioidea, the Edwardsiid Scolanthus callimorphus Gosse, 1853 convergently evolved to have KTx3 as the dominant toxin. These shifts in the dominant toxin can be explained by a model of punctuated evolution53,54. We tested this by modeling the rates of evolution acting on the expression of toxins. We find evidence that all sea anemone venom components undergo dramatic and unique shifts that is best explained through a mode of rapid pulses (Pulsed) as opposed to Brownian motion (BM), Ornstein–Uhlenbeck (OU), or early burst (EB) models (Fig. 1C)./p>90%, except for Massachusetts (Supplementary Data 10, BUSCO = 72.2%). In all, 2589 single-copy orthologs were identified using OrthoFinder and used to generate a well-supported maximum-likelihood phylogenetic tree (Fig. 4B). Broadly, populations clustered according to geographical location, with populations from North (Massachusetts, Maine, New Hampshire, New Jersey, and Nova Scotia) and South (North Carolina, South Carolina, and Florida) clustering independently together. This phylogenetic analysis also supports that the Maryland population, which serves as the source for the most common N. vectensis lab strain61, clusters more closely with southern populations, consistent with the previous analyses62. Differences among populations from close geographical locations are also observed, specifically with South Carolina populations clustering more closely with Florida than North Carolina./p>2, red dots are proteins with significant P value and Log2 fold change./p>500, while Florida had a TPM of five (Supplementary Data 11A). Expression differences of Nv1 among populations were further validated using nCounter platform, revealing that indeed Nv1 gene expression is massively reduced in the Florida population (Supplementary Data 11B). This striking result suggests that the Nv1 cluster in Florida has undergone a massive contraction./p>50% of the total conotoxin expression69. These dominant toxin superfamilies convergently evolve in a highly dynamic manner, where closely-related species have different dominant toxins69. From these results, we suggest that given venom is a polygenic trait in many other venomous animals, a single dominant toxin family is the major dictator of the venom phenotype and the shift in the dominant toxin is likely driven by selection to meet the ecological requirements of these animals./p>300 bp. In snakes, transposable elements have been proposed as the NAHR substrate90,91; however, this does not appear to be the case for the Nv1 locus as TEs are largely absent from within the Nv1 locus. If NAHR is the mechanism driving the expansion and contraction of the Nv1 haplotypes, it is unclear why it would not occur across haplotypes because sufficient NAHR substrate is evident between haplotypes despite the presence of haplotype-specific paralogs. An alternative hypothesis would be that expansions and contractions at the locus are a result of backward replication slippage92. We suggest that this mechanism is more likely responsible for the tandem duplications at the Nv1 locus as there is the sufficient substrate, the duplication sizes are consistent with past observations of replication slippage, and importantly, would maintain the strong haplotype structure./p> 2.2100). This included individual reads being mapped back to reference de novo transcriptome assemblies independently for each species using Bowtie2101, and abundance estimated using RSEM102. Normalized abundance estimates of the transcript were calculated and corrected for their length to generate TPM values. Finally, we calculated the cumulative TPM values for each toxin family and the venom phenotype was generated as the percentage that each family contributes./p>100 amino acids in length were retained and redundant sequences with >88% similarity were removed to produce a predicted proteome for the 29 transcriptomes using CD-HIT103./p> 8). Sequencing libraries were prepared using the Kapa Stranded mRNA-seq kit (Roche, Switzerland) and sequenced on an Illumina HiSeq 4000 using 150 bp paired-end chemistry performed at Duke Center for Genomic and Computational Biology (Durham, NC, USA). Raw reads from each population were cleaned using Trimmomatic94 to retain only high-quality reads and to remove non-biological sequence and assembled into nine transcriptomes using the Trinity 2.6.695. To assess the completeness of de novo transcriptomes, BUSCO (v3.0) was performed on each transcriptome to assess the completeness of each assembly, by determining the percentage of full-length sequences in each transcriptome corresponding to a conserved set of metazoan orthologs114./p>88% sequence similarity were removed using CD-HIT103. Protein sequences >100 amino acids in length were used to identify single-copy orthologs using OrthoFinder115 and leveraged using DIAMOND116. In addition, we added S. callimorphus and Edwardsiella carnea as outgroups to the N. vectensis populations. This resulted in 2589 single-copy orthologs shared among the 11 transcriptomes. Protein sequences for each single-copy ortholog were individually aligned using MAFFT99. Protein alignments were then concatenated and imported into IQ-TREE, and the best-fit model of evolution selected using ModelFinder106, and posterior mean site frequency models were used to reduce long-branch attraction artefacts117. A maximum-likelihood phylogenetic tree was generated using 1000 ultrafast bootstrap iterations./p>