Ilmuwan Ngenalake Toolkit “Pantranscriptome” kanggo Nganalisis Data Urutan RNA Genome-Wide

Nganalisis ekspresi gen wong mbutuhake pemetaan lanskap RNA menyang referensi standar kanggo ngerteni tingkat gen “diuripake” lan nindakake fungsi ing awak. Nanging peneliti bisa nemoni masalah nalika referensi ora nyedhiyakake informasi sing cukup kanggo ngidini pemetaan akurat, masalah sing dikenal minangka bias referensi. Peneliti ing UC Santa Cruz (UCSC) saiki wis nglaporake babagan apa sing disaranake yaiku metode pisanan kanggo nganalisis data sekuensing RNA genom kanthi nggunakake “pantranscriptome,” sing nggabungake transkriptom lan pangenome-referensi sing ngemot materi genetik saka kohort saka macem-macem individu, tinimbang mung siji untaian linear.

Tim kasebut, sing dipimpin dening profesor asosiasi UCSC Teknik Biomolekul Benedict Paten, PhD, wis ngrilis toolkit sing ngidini para peneliti bisa nggambar data RNA individu menyang referensi sing luwih sugih, ngatasi bias referensi lan ngarahake pemetaan sing luwih akurat.

“Iki minangka pangenome plus transkriptom-kombinasi kasebut durung nate ditindakake sadurunge,” ujare Jordan Eizenga, PhD, sing dadi penulis pisanan saka kertas diterbitake peneliti lan sarjana postdoctoral ing UCSC Computational Genomics Lab. “Iki pisanan ana sing nyoba nggabungake pangenome minangka fitur standar pemetaan urutan RNA.” Para peneliti wis nggawe alat kasebut ujar manawa alat kasebut kasedhiya kanggo umum-diakses liwat Github-lan ujar manawa bakal nulungi para ilmuwan sing makarya kanggo mangerteni ekspresi gen liwat analisis urutan RNA. “Pantranscriptome kasusun saka sakumpulan transkrip khusus haplotype (HSTs) lan dibangun kanthi proyeksi (ngangkat) transkrip kasebut ing anotasi transkrip menyang sakumpulan haplotipe sing dikenal,” rangkuman kasebut, ing laporan sing diterbitake ing Metode Alam.

“Kanthi toolkit iki, kita nggunakake data sing luwih maneka warna sing saiki bisa dipikolehi saka pangenome kanggo nambah pangukuran data ekspresi gen, sing bisa beda-beda ing antarane individu,” ujare Paten. “Tujuane kanggo nggawe pengaruh data sing luwih maneka warna iki ing studi sing nyinaoni ekspresi gen, ngasilake analisis sing luwih apik kanggo model sel, model organoid, lan aplikasi riset liyane.”

Paten, Eizenga lan kanca-kanca njlèntrèhaké pangembangan toolkit anyar ing makalah kanthi judhul “Haplotype-aware transcriptome analysis using spliced ​​​​pangenome graphs,” sing nyatakake, “Pipa bioinformatika kita nyedhiyakake tumpukan lengkap alat kanggo analisis pantranscriptomic. Bisa mbangun pantranskriptom, peta RNA-seq diwaca menyang pantranskriptom kasebut, lan ngitung transkripsi kanthi resolusi haplotipe.

Fungsi RNA sing paling umum diakoni yaiku nerjemahake DNA dadi protèin, nanging para ilmuwan saiki ngerti yèn akèh-akèhé RNA iku nonkoding lan ora gawé protèin, nanging bisa main peran kayata mengaruhi struktur sel utawa ngatur gen. Kabeh lanskap RNA dikenal sacara kolektif minangka transkriptom, lan pemetaan iki ngidini peneliti luwih ngerti ekspresi gen individu. “Profil transkriptom kanthi urutan RNA (RNA-seq) wis diwasa dadi alat standar lan penting kanggo nyelidiki negara sel,” ujare panulis. “Alur kerja bio-informatika kanggo ngolah data RNA-seq umume diwiwiti kanthi mbandhingake maca menyang genom referensi utawa transkriptom referensi. Iki minangka cara sing migunani sing ndadekake praktis kanggo nganalisa volume data sing akeh sing diasilake kanthi urutan throughput sing dhuwur.

Pantranskriptom dibangun ing konsep “pangenomics” sing muncul ing bidang genomik. Biasane nalika ngevaluasi data genom individu kanggo variasi, para ilmuwan mbandhingake genom individu kasebut karo referensi sing digawe saka untaian linier tunggal basa DNA. Nggunakake pangenome ngidini peneliti mbandhingake genom individu karo klompok referensi urutan sing beda-beda sacara genetis, sing asale saka individu sing makili macem-macem leluhur biogeografis. Iki menehi luwih akeh titik perbandingan kanggo para ilmuwan supaya luwih ngerti variasi genomik individu. “Pangenomics komputasi wis muncul minangka metodologi sing kuat kanggo nyuda bias referensi,” tim terus. “Pangenomics nyedhaki akeh banget, data sing kasedhiya kanggo umum babagan variasi genomik umum kanggo spesies tartamtu (utamane kalebu manungsa).”

Pemetaan data urutan RNA kanggo mangerteni ekspresi gen bisa dadi angel amarga urutan RNA disambungake dening mekanisme seluler, tegese siji set data RNA bisa teka saka wilayah genom sing ora nyambung, saengga angel nyelarasake kanthi bener menyang referensi. . Situs splicing iki ora seragam antarane populasi manungsa, nanging beda-beda antarane individu. Sampeyan uga angel ngerti haplotipe RNA asale – apa klompok gen kasebut khusus saka set kromosom sing diwarisake saka ibune individu, utawa set sing diwarisake saka bapakne.

Pipa anyar alat open source ngidini peneliti njupuk bagean spliced ​​saka RNA individu, peta ngendi padha selaras ing pangenome, ngenali haplotype data belongs, lan nganalisa ekspresi gen.

Pisanan, pipeline ngenali wilayah genom saka data urutan RNA, kalebu situs splice, lan menehi tandha titik kasebut ing referensi pangenome. Titik-titik kasebut banjur dibandhingake karo pantranskriptom sing dumadi saka transkrip khusus haplotipe sing diasilake saka data referensi sing ana ing pangenome. Langkah iki mbutuhake metode algoritma khusus lan tantangan.

Pungkasan, ngasilake prakiraan tingkat ekspresi gen adhedhasar perbandingan iki antarane data sing dipetakan lan transkrip ing pantranskriptom, lan ngenali haplotipe sing asale saka gen kasebut. “Toolchain kita, sing kalebu tambahan ing toolkit VG lan alat mandiri, RPVG, bisa nggawe grafik pangenome sing disambung, peta data urutan RNA menyang grafik kasebut, lan nindakake kuantifikasi ekspresi transkrip kanthi haplotype ing pantranscriptome,” peneliti nulis. “Kaping pisanan, VG RNA bisa nggabungake data variasi genomik lan anotasi transkrip kanggo nggawe grafik pangenome sing disambung. Sabanjure, VG MPMAP bisa nyelarasake RNA-seq maca menyang grafik kasebut kanthi akurasi sing dhuwur. Pungkasan, RPVG bisa nggunakake alignment saka VG MPMAP kanggo ngitung ekspresi transkrip khusus haplotype.

“Temtunipun minangka panaliten sing maju banget babagan metode ekspresi genom liyane sing durung nggunakake informasi pangenomes lan haplotype,” ujare Jonas Sibbesen, PhD, panulis pisanan ing panliten kasebut lan mantan sarjana postdoctoral ing UCSC Computational. Genomics Lab sing saiki dadi asisten profesor ing Universitas Copenhagen. “Saiki kita mikir babagan pangenomics apa sing bisa ditambahake ing tabel ing analisis transkriptom.”

Sawetara aplikasi hilir wis katon, tim kasebut nyathet ing kertas kasebut. Pipa kasebut bisa digunakake kanggo nyinaoni panyebab ekspresi diferensial khusus haplotype. “Kita nduduhake salah sawijining conto kanthi nyelidiki imprinting genomik, nemokake bukti sing sugestif babagan pola imprinting kompleks ing tingkat isoform,” ujare. Pipa kasebut bisa uga digunakake kanggo nyinaoni sumber ekspresi diferensial khusus haplotype liyane, para ilmuwan luwih nyaranake.

Aplikasi liyane yaiku ciri genotipe lan haplotipe ing wilayah kodhe saka data RNA-seq. “Kita nuduhake kemampuan iki kanthi nelpon genotipe lan diplotipe HLA,” ujare, ngakoni yen “karya isih dibutuhake kanggo nambah efisiensi lan akurasi komputasi ing wilayah HLA.” Nanging, peneliti nyatakake, “Kanggo kabeh aplikasi kasebut, pipa VG MPMAP-RPVG nambah informasi sing kasedhiya saka data RNA-seq tanpa urutan genomik sing dipasangake. Iki bakal ngidini desain sinau sing murah lan analisis maneh data sing wis ana.

Ing ngarep, para peneliti kasengsem ngembangake alat kasebut supaya migunani kanggo analisis informatika hilir, lan nyelarasake alat kanggo kekhususan riset babagan data sel tunggal. Saiki, klompok ngarep-arep toolkit anyar bakal nuduhake kepiye migunani nggunakake analisis asale pangenomics.

“Kita kudu bisa nerangake kanggo sawetara peneliti carane referensi pangenome bakal entuk manfaat,” ujare Paten. “Pipeline iki pancene pisanan kanggo nindakake iki kanggo RNA, kanggo data fungsional, kanggo data ekspresi.”

Leave a Comment

Your email address will not be published. Required fields are marked *