次世代定序

PacBio HiFi Reads在17天內成功組裝六倍體的加州紅杉全基因體!!

加州紅杉是世界上最高的植物之一,其基因體為27Gb,六倍體,是個具有巨大且複雜基因體的植物!其基因體大約是人類的9倍!可謂一隻基因體大怪獸!enlightened (點我看詳細報導)

使用其他定序平台的研究團隊花費了一年多的時間才完成組裝,但PacBio從採樣、建庫、定序、生資分析僅花了17天就完成!對!你沒有看錯!就是17天!

根據SMRT定序結果,共獲得了 606 Gb HiFi 數據,而HiFi Reads最密集的長度分布落在20-30 Kb之間!甚至長達50Kb的HiFi Reads的準確度都可以高達QV20 (99%),而大部分HiFi Reads準確度都接近QV30 (99.9%)呢!這就是可用於高品質基因體組裝的HiFi Reads!

組裝工作使用Hifiasm、64-Core 512 Gb RAM、產生HiFi數據使用了 46,000 CPU hours,基因體組裝僅使用 7,200 CPU hours,也就是說不需要超級強大的服務器,整個分析時間只花了6天,就組裝出非常棒的加州紅杉基因體!總共獲得22X HiFi coverage、Contig N50長達 1.92Mb!無論是實驗流程或生資分析效率皆高出許多!

以前科學家以為組裝需要大量計算資源與時間,但加州紅杉這個實例告訴我們,PacBio可以做到!並且顯示了Pacbio HiFi Reads應用在複雜且巨大基因體的強大優勢!

或許你會對上表PacBio HiFi組裝結果的BUSCO評分只有59%感到疑惑,不是一般較好的組裝結果BUSCO值都要高達90%以上嗎?這是因為裸子植物 (加州紅杉屬於裸子植物) 的BUSCO基因集 (Gene Orthologs) 與被子植物的BUSCO基因集相差很多。這意味著針對加州紅杉使用通用的BUSCO基因集來評估基因組完整性是不準確的,只是目前我們還沒有其它更好的評估方法。

了解更多HiFi Reads的應用

請參閱以下連結: