隨著生物科學(xué)技術(shù)的迅猛發(fā)展,,很多醫(yī)院都逐漸認(rèn)識到生物信息學(xué)分析的重要性,,醫(yī)院也陸續(xù)引進(jìn)一些生信專業(yè)的人才。但是跟很多臨床醫(yī)生閑聊過程中,,小編發(fā)現(xiàn)很多老師不清楚測序的意義,,生信分析可以給他們帶來什么好處以及公共數(shù)據(jù)庫或測序數(shù)據(jù)的使用。下面小編就簡單介紹下TCGA數(shù)據(jù)庫,、GEO數(shù)據(jù)庫及生信分析帶來的好處。
TCGA(The cancer genome atlas,,癌癥基因組圖譜)由National Cancer Institute(NCI,,美國國家癌癥研究所)和National Human Genome Research Institute(NHGRI,美國國家人類基因組研究所)于2006年聯(lián)合啟動的項目,收錄了各種人類癌癥(包括亞型在內(nèi)的腫瘤)的臨床數(shù)據(jù),,基因組變異,,mRNA表達(dá),甲基化等數(shù)據(jù),,是癌癥研究者很重要的數(shù)據(jù)來源,。
TCGA數(shù)據(jù)庫收錄的基因組測序數(shù)據(jù)涉及到的癌癥達(dá)33種,包含的組織類型達(dá)26種:ACC,、BLCA,、BRCA、CESC,、CHOL,、COAD、DLBC,、ESCA,、GBM、HNSC,、KICH,、KIRC、KIRP,、LAML,、LGG、LIHC,、LUAD,、LUSC、MESO,、OV,、PAAD,、PCPG、PRAD,、READ,、SARC、SKCM,、STAD、TGCT,、THCA,、THYM,、UCEC,、UCS,、UVM。
TCGA中的數(shù)據(jù)類型主要有SNV(單核苷酸變異)數(shù)據(jù),、RNA-seq數(shù)據(jù),、CNV(基因拷貝數(shù)變異)數(shù)據(jù)、甲基化數(shù)據(jù),、臨床數(shù)據(jù)、miRNA-seq數(shù)據(jù),,以及生物樣本數(shù)據(jù),。
GEO數(shù)據(jù)庫全稱GENE EXPRESSION OMNIBUS,是由美國國立生物技術(shù)信息中心NCBI創(chuàng)建并維護(hù)的基因表達(dá)數(shù)據(jù)庫,。它創(chuàng)建于2000年,,收錄了世界各國研究機(jī)構(gòu)提交的高通量基因表達(dá)數(shù)據(jù),也就是說只要是目前已經(jīng)發(fā)表的論文,,論文中涉及到的基因表達(dá)檢測的數(shù)據(jù)都可以通過這個數(shù)據(jù)庫中找到,。
那既然知道有這么好的數(shù)據(jù)庫,那可以為我們的科研帶來什么好處呢,?
答案是可以預(yù)測疾病相關(guān)的潛在基因,,以及該基因潛在的作用靶點、上游調(diào)控轉(zhuǎn)錄因子等,,從而指導(dǎo)實驗方向,,縮小試驗范圍,,簡化試驗流程,。為基金申請?zhí)峁┲С郑ㄟ^強(qiáng)大的信息數(shù)據(jù)的收集整理,,減少投入增強(qiáng)研究目的性,;且通過整合技術(shù)優(yōu)勢,指導(dǎo)提高臨床診斷水平,。說的更簡單一點就是我們可以從成千上萬個基因里沿著研究疾病方向?qū)⒎秶s小至幾個基因,,從而助力于醫(yī)學(xué)科學(xué)研究。
隨著二代測序技術(shù)的収展,,測序價格變的越來越低,。越來越多的二代測序項目陸續(xù)被開展,從而產(chǎn)生了大量的測序數(shù)據(jù),。然而,,測序公司可以提供的多為標(biāo)準(zhǔn)化的流程分析,而標(biāo)準(zhǔn)化分析對于文章發(fā)表而言,,可能遠(yuǎn)未足夠,。多數(shù)研究者雖然對研究設(shè)計了如指掌,但對于如何對測序數(shù)據(jù)進(jìn)行高級分析從而達(dá)到研究目的,,所知甚少,。深圳市拓普生物科技有限公司提供對研究人員自身測序數(shù)據(jù)或者公共數(shù)據(jù)庫測序數(shù)據(jù)的高級數(shù)據(jù)分析服務(wù),距今已有上百個項目的操作經(jīng)驗,。
說了這么多,,我們可以提供哪些個性化分析呢?
1,、 差異分析
2,、 GO功能富集
3、KEGG通路富集
4,、miRNA-mRNA結(jié)合預(yù)測
5,、轉(zhuǎn)錄因子結(jié)合位點預(yù)測
6、 蛋白質(zhì)因果關(guān)系
7,、 STEM時間序列趨勢分析
8,、WGCNA功能模塊分析
9、LncRNA-mRNA共表達(dá)
10,、蛋白質(zhì)互作網(wǎng)絡(luò)(PPI)
11,、 ceRNA分析
12、腫瘤SNPs統(tǒng)計分析
13,、 生存分析:預(yù)后與臨床表型,、基因表達(dá)的關(guān)聯(lián)
14、 Cox多因素模型預(yù)測腫瘤預(yù)后
15,、 腫瘤預(yù)后模型的列線圖可視化
16,、 免疫細(xì)胞浸潤比例分析
17,、疾病相關(guān)免疫基因篩選
18、基于機(jī)器學(xué)習(xí)算法的多組學(xué)疾病診斷/腫瘤預(yù)后預(yù)測模型
最后,,歡迎各位交流合作,,特別是做動物科研的老師,希望我們精準(zhǔn)的生信分析能大大減少您實驗的工作量,。最后祝您多多出Paper,多多中國自然,!