Analisis mikrosatelit lan pangembangan marker polimorfik adhedhasar transkriptom lengkap Camellia chekiangoleosa

Identifikasi lan karakterisasi SSR ing transkriptom

Mikrosatelit bisa dipérang dadi SSR sampurna, SSR ora sampurna lan SSR gabungan29. Ing panliten iki, SSR sing sampurna lan komposit ing transkriptom lengkap saka C. chekiangoleosa dianalisis sacara statistik, lan sawetara informasi mikrosatelit ditampilake ing Tabel 1. Total 97.510 SSR (kalebu 17.690 SSR komposit) dijupuk saka 65.215 urutan unigene kanthi dawa total 188.333.521 bp, ing antarane yaiku 48.281 seri SSR. Frekuensi kedadeyan SSR yaiku 74,03%, kanthi rata-rata 1 SSR kedadeyan saben 1,93 kb. Ana prabédan sing signifikan ing frekuensi saben jinis baleni SSR ing transcriptome lengkap saka C. chekiangoleosa. Pengulangan mononukleotida minangka jinis pengulangan utama, nyathet 51,29% saka total SSR, banjur dinukleotida (34,36%), trinukleotida (11,24%), tetranukleotida (1,44%), heksanukleotida (1,11%) lan pengulangan pentanukleotida (0,5%). Bagan 1).

Tabel 1 Jumlah lan frekuensi SSR ing C. chekiangoleosa.

Miturut motif sawetara jinis ulang SSR utama (Tabel Tambahan S1), ana 2, 4, 12 lan 30 motif kanggo jinis ulang mono-, di-, tri- lan tetranukleotida. Baleni mononukleotida didominasi dening motif baleni A / T, kanthi jumlah 49,95% saka baleni kasebut, dene jumlah motif baleni C / G relatif cilik, yaiku 1,34% saka pengulangan kasebut. Ing antarane ulangan dinukleotida, jumlah ulangan AG (23,66%) paling dhuwur, banjur AT (7,89%) lan ulangan AC (2,67%), dene jumlah ulangan CG (0,04%) paling sithik. Antarane mbaleni trinukleotida, AAG (2,29%) mbaleni nyumbang proporsi paling gedhe, ngiring dening ATT (1,28%) lan ACC (1,83%), lan proporsi saka sangang motif baleni liyane kabeh kurang. Antarane ulangan tetranukleotida, motif ulang kaya A/T (AAAT, AAAG, AAAC, AACT, AATC, AATG, AATT, AGAT, ATAC, ATTT) nyumbang 1,24% saka kabeh jinis ulangan SSR, dene motif kaya G/C. padha relatif langka. Kita nemokake manawa kabeh motif baleni utama saka macem-macem jinis ulangan SSR sugih ing nukleotida A / T.

Ana beda sing signifikan ing variasi dawa saka macem-macem jinis ulang SSRs ing kabèh transcriptome saka C. chekiangoleosa (Gambar 1). Jumlah bagean ing bagan pai nuduhake variasi ing dawa SSR. Sing luwih akeh bagean, luwih dhuwur polimorfisme saka SSR. Adhedhasar owah-owahan ing jumlah bagean, variasi dawa sing paling dhuwur ditemokake kanggo pengulangan mononukleotida, dene sing paling sithik ditemokake kanggo pengulangan pentanukleotida. Kanggo mononukleotida kanggo pentanukleotida mbaleni, variasi ing SSRs proporsional kuwalik karo dawa jinis ulang.

Gambar 1

Dawane macem-macem jinis mikrosatelit. Saben bagean saka bagan pai cocog karo SSRs dawa padha. Yen frekuensi dawa SSR cocog kurang saka utawa padha karo 0,01, SSRs digabungake bebarengan ing bagean ireng.

Miturut statistik ing distribusi SSR ing unigenes ing C. chekiangoleosa database SSR transkriptomi lengkap, proporsi SSR ing 5’UTR lan 3’UTR masing-masing yaiku 43,62 lan 37,54%, lan mung bagean cilik saka SSR (10,76%) sing disebarake ing wilayah CDS (Gambar 2a) . Adhedhasar analisis statistik saka SSR sampurna sing ana ing wilayah CDS lan UTR, proporsi SSR saben jinis ulangan ing 3’UTR lan 5’UTR nampilake urutan ing ngisor iki saka dhuwur nganti ngisor: mono-, di-, tri-, tetra-, hexa- lan pentanukleotida (Gambar 2b). Ing wilayah CDS, pengulangan trinukleotida minangka jinis utama SSR (42,95%), banjur diulang dinukleotida (37,39%), dene pengulangan pentanukleotida paling ora umum, mung 0,36% saka SSR (Gambar 2b). SSR kanthi mononukleotida, tetranukleotida lan pentanukleotida mbaleni utamane disebarake ing 3’UTR, masing-masing 50,61, 54,81 lan 49,88% saka total SSR (Gambar 2c). SSR kanthi trinukleotida (44,80%) lan ulangan heksanukleotida (38,06%) utamane disebarake ing wilayah CDS, lan 56,26% pengulangan dinukleotida disebarake ing 5’UTR.

Gambar 2
tokoh 2

Distribusi SSR ing unigenes ing transkriptom lengkap saka C. chekiangoleosa. (wis) Distribusi SSR ing unigenes. (b) Proporsi SSR saka macem-macem jinis repetitive sing disebarake ing wilayah 3’UTR, 5’UTR lan CDS. (vs) Proporsi SSR sing disebarake ing wilayah 3’UTR, 5’UTR lan CDS ing antarane SSR sing diulang-ulang.

Analisis fungsional lan prediksi faktor transkripsi adhedhasar transkrip sing ngemot SSR

Gunggunge 65,215 unigenes (48,323 ngemot SSR) dibandhingake karo database GO lan KEGG. Analisis kasebut nuduhake manawa jumlah unigenes sing ngemot SSR lan jumlah unigenes nuduhake korélasi sing signifikan (P <0.01) babagan rasio distribusi gugus fungsi GO sing dianotasi lan jalur metabolik KEGG sing dianotasi. Ana 31,382 unigenes (69,93% ngemot SSR) ing basis data GO sing dianotasi (Tabel Tambahan S2, Gambar 3). Gunggunge 35.095 (70.64% ngemot SSR), 38.455 (69.55%), lan 49.670 (69.70%) unigen diklasifikasikake dadi komponen seluler, fungsi molekul lan proses biologis, masing-masing. Ing kategori komponen seluler, sel lan bagéan sel (6393 unigenes; 70,20% ngemot SSRs) minangka klompok unigen paling gedhe, diikuti struktur membran (5799; 72,03%), dene nukleoid (3; 33,33%) minangka klompok paling cilik. . Ing kategori iki, proporsi paling dhuwur saka unigenes sing ngemot SSR digandhengake karo persimpangan sel (100,00%), lan proporsi paling murah digandhengake karo nukleoid (33,33%). Kajaba iku, ing kategori fungsi molekuler, unigenes sing melu ikatan (19,147; 70,15%) minangka klompok paling gedhe, lan ana sawetara unigenes sing ana hubungane karo aktivitas pemancar sinyal sing ora bisa digunakake (5; 20,00%) utawa aktivitas panrima kargo (2; 100,00). %). Proporsi unigenes (20,0%) sing ngemot SSR sing ana hubungane karo aktivitas pemancar sinyal absolut paling murah, dene sing ana hubungane karo aktivitas panrima kargo paling dhuwur (100%). Umume unigen sing melu ing kategori proses biologis dianotasi menyang proses metabolisme (14.921; 69.33%) lan proses seluler (13.520; 69.55%). Kabeh unigenes annotated kanggo pemanfaatan nitrogen, pigmentasi lan mitokondria lungse Komplek chain ambegan IV klompok biogenesis ngemot SSRs. Ing pemanfaatan karbohidrat lan gugus fungsi mateni sel, mung 33,3% saka unigen sing ngemot SSR.

Gambar 3
gambar 3

GO anotasi saka C. chekiangoleosa transkrip urutan. Persentase ing ndhuwur bagan garis nuduhake proporsi transkrip sing ngemot SSR ing antarane transkrip anotasi.

Gunggunge 54,366 unigenes (72,63% ngemot SSR) dianotasi ing basis data KEGG; unigenes iki melu ing 6 kategori (metabolisme, pangolahan informasi genetik, pangolahan seluler, pangolahan informasi lingkungan, sistem awak lan penyakit manungsa) lan 357 jalur metabolisme (Tabel Tambahan S3, Fig. 4). Umume unigenes ana hubungane karo metabolisme (12,920), diikuti dening penyakit manungsa (9212), lan sing paling sithik ana hubungane karo proses seluler (4296). Proporsi unigen sing ngemot SSR sing melu metabolisme, pangolahan informasi genetik, proses seluler, pangolahan informasi lingkungan, sistem biologi lan penyakit manungsa yaiku 73,35, 70,72, 75,54, 75,63, 74,73, lan 71,79%. Ana papat jinis jalur metabolisme sing ana hubungane karo lenga: metabolisme asam lemak (272 unigenes, 76,10% ngemot SSR); biosintesis asam lemak (188; 77,66%); biosintesis asam lemak ora jenuh (100; 71,00%); lan metabolisme asam alfa-linolenat (107; 74,77%). Kajaba iku, sawetara jalur metabolisme ana hubungane karo glikolisis (357; 77.31%), sistem sinyal fosfatidilositol (212; 72.64%), transduksi sinyal hormon tanduran (508; 78.94%), jalur sinyal MAPK (103; 64.08%), jalur sinyal AMPK (345; 81.16%) lan jalur sinyal kalsium (108; 71.30%) (Tabel Tambahan S3, Fig. 4). Kita prédhiksi manawa 3091 unigenes nyandi TF, ing antarane 74.60% uga ngemot SSR (Tabel Tambahan S4a, b). TFs iki dipérang dadi 86 kulawargané TF, antarane kang kulawargané utama SNF2 (149; 5,84%), C3H (140; 5,48%), MYB-related (102; 4,00%), PHD (98; 3,84%), SET (96; 3,76%) lan C2H2 (93; 3,64%) (Tabel Tambahan S4c, Gambar 5).

Gambar 4
tokoh 4

Kategori metabolik KEGG ing C. chekiangoleosa transkriptom. Persentase ing sisih tengen bagan garis nuduhake proporsi transkrip sing ngemot SSR ing antarane transkrip sing dianotasi.

Gambar 5
tokoh 5

Analisis TF ing transkrip sing ngemot SSR.

SSR primer screening lan verifikasi polimorfisme

Asil amplifikasi PCR saka macem-macem jinis SSR nuduhake ana 30 (60,00%), 34 (68,00%), 33 (66,00%) lan 36 pasangan (72,00%) primer amplifiable kanggo di-, tri-, tetra- , jinis pengulangan pentanukleotida, dene ana 28 (56,00%), 20 (40,00%), 19 (38,00%) lan 31 pasang (62,00%) primer polimorfik, lan proporsi primer polimorfik yaiku 93,33%, 58,82% , 57,58% lan 86,11% (Tabel 2, Fig. 6a). Ing antawisipun primer amplifiable, proporsi primer kanthi dawa basa ≥ 20 bp nyathet 73,33%, 29,41%, 57,58% lan 86,11% saka primer. Pungkasan, 580 pasangan primer SSR diitung. Sawise screening, 300 pasangan (51,72%) primer bisa nggedhekake pita sing cetha, ing antarane 155 pasangan (26,72%) primer SSR polimorfik diidentifikasi (Tabel Tambahan S5), lan proporsi total primer polimorfik yaiku 51,67%. Gunggunge 360 ​​pasangan primer sing nargetake wilayah 3’UTR (120 pasang), 5’UTR (120 pasang) lan CDS (120 pasang) kanthi acak saka 580 pasangan primer SSR sing disintesis. Asil statistik nuduhake yen efisiensi amplifikasi primer sing ditargetake 3’UTR lan 5’UTR yaiku 62,50% lan 54,17%, efisiensi pengembangan primer polimorfik yaiku 33,33% lan 25,00%, lan proporsi primer polimorfik yaiku 53,33%. lan 46,15%. Efisiensi amplifikasi primer, efisiensi pengembangan primer polimorfik lan proporsi primer polimorfik ing wilayah CDS yaiku 50,83%, 20,83% lan 40,98% (Gambar 6b).

Tabel 2 Asil eksperimen kanggo di-, tri-, tetra- lan pentanukleotida panandha SSR baleni.
Gambar 6
tokoh 6

Efisiensi pangembangan primer SSR polimorfik. (wis) Efisiensi pangembangan primer polimorfik kanggo dinukleotida dadi pengulangan pentanukleotida. (b) Efisiensi pangembangan primer polimorfik ing wilayah UTR lan CDS.

Efektivitas primer SSR adhedhasar analisis populasi

Kita milih 44 sampel saka C. chekiangoleosa kanggo luwih ngevaluasi polimorfisme ing 27 pasangan primer. Asil tes nuduhake yen total 103 alel dijupuk, jumlah alel (N / A) antara 2 nganti 7 saben lokus, lan rata-rata jumlah alel ana 4 (Tabel 3). Nilai heterozigositas sing diamati (waah) lan heterozigositas sing dikarepake (Hey) kisaran saka 0 nganti 0,795 lan 0,087 nganti 0,782, lan nilai rata-rata yaiku 0,402 lan 0,585. Populasi Leping (LP) lan Xiapu (XP) nuduhake keragaman genetik paling dhuwur (0,504) lan paling murah (0,390) (Tabel Tambahan S6). Isi informasi polimorfisme (PIC) saka 27 marker SSR berkisar antara 0,083 nganti 0,748, kanthi nilai rata-rata 0,528. Adhedhasar metode clustering UPGMA, 44 C. chekiangoleosa genotipe padha cetha dipérang dadi papat kluster (Fig. 7). Kabeh individu ing populasi XP, Wuyishan (WYS) lan Wuyuan (WY) dikelompokake dadi cluster I, cluster II, lan cluster III. Kluster kaping papat dicampur lan kalebu telu populasi Kaihua (KH), Dexing (DXY) lan LP, lan meh ora ana wates antarane populasi DXY lan LP.

Tabel 3 Parameter keragaman genetik EST-SSR saka 44 C. chekiangoleosa individu.
Gambar 7
tokoh 7

Peta klaster UPGMA 44 C. chekiangoleosa individu adhedhasar tandha SSR.

Leave a Comment

Your email address will not be published. Required fields are marked *