北大提公升二代測序精度的新方法的具體原理是什麼?有什麼創新點?

時間 2021-05-31 14:36:19

1樓:韓默

拖了好幾天才把文章看完。自己不是做底層測序技術的,隨便談談好了。

首先是一些基礎知識和技術細節,不感興趣的可以跳過。

作者在正文裡也提到了,第二代測序技術裡的SBS(邊合成邊測序)又可以分成兩種子類別。文章作者按照領域內的習慣把它們稱為CRT(迴圈可逆鏈終止法)和SNA(單核苷酸追加法),不過我更喜歡用另一種分法——檢測合成以後的DNA分子,還是,檢測合成DNA時釋放的小分子化合物。

CRT可以說是隨機鏈終止法的直接發展。每輪反應同時投入四種修飾了3'羥基的dNTPs,每種鹼基對應不同的螢光標記。理想情況下,每輪反應中,模板鏈的反向互補鏈會且僅會延伸1個鹼基、且只有新合成的這1個鹼基有螢光訊號,只要用光學系統識別這個螢光訊號即可判斷這1個新和成的鹼基是什麼(例如Illumina/Solexa)。

接下來去掉螢光基團和3'羥基上的修飾(往往螢光基團就是用來修飾3'羥基的),就可以進行下一輪的合成也就是對下乙個鹼基進行測序了。通過把不可逆的雙脫氧修飾變成可逆修飾,大幅度減少了對每個模板鏈進行測序時需要合成的新鏈的條數——如果裝置的檢測能力下限是100個分子同時發出的訊號,那麼測100個鹼基序列時隨機鏈終止法理論上需要至少合成100x100條新鏈,而CRT法只需要合成99+100條,這就為提高測序通量提供了基礎。

這種方法的缺點在於,任何化學反應實際上都不可能是「完全」的,前面輪次摻入的螢光基團不可能被完全清除乾淨、可供新一輪反應使用的底物也會越來越少、拍照時的激發光也可能損傷DNA分子,所以隨著反應輪次的增加訊號會越來越弱、雜訊會越來越大,最終錯誤率高到不可容忍。

SNA相比於CRT,在反應步驟上進行了大幅度的簡化——投入的dNTPs是不修飾或摻入時自動去修飾的,因此不再需要用單獨的反應步驟去除3'羥基的修飾基團和新摻入鹼基的螢光基團。既然新摻入的dNTPs是沒有修飾的,那當然就不能再一股腦把四種全加進去了,所以每次只投入1種dNTP,如果它正好跟模板鏈上的下1個或下n個鹼基配對,那就會被摻入到新合成的DNA鏈上去,同時釋放出某些小分子(DNA的合成是典型的縮合反應,A+B=A'B'+C)。通過定量地檢測小分子C(例如羅氏的454焦磷酸測序)或者C進一步反應產生的產物(例如Life的Ion Torrent檢測H+濃度變化),就可以判斷這輪反應裡模板鏈的反向互補鏈到底被延伸了幾個鹼基,也就讀出了這一段序列。

通過簡化反應步驟,SNA可以達到比CRT更長的測序讀長,還可以節省試劑成本、縮短測序時間。

而這種方法的缺點則在於,現有技術對小分子的定量檢測的準確性/解析度不夠,所以如果模板鏈上有多個連續的相同鹼基(在生物中很常見)時可能會出現定量錯誤,導致測得的連續相同鹼基個數出現錯誤。

個人認為,這個方法的創新顯然不是測序原理,而是測序原理的實現方法。注意,實現方法。也就是說,它有極大的可能是為了繞開智財權壁壘而產生的。

意義不在於在原理上有多大幅度的創新(並沒有)或者在效能指標上有多少提高(並沒有),而在於這個實現方法很可能不侵犯任何現有的NGS相關的智財權。

綜上,中國可能會在不久的將來有一台(一系列)新的擁有自主智財權的、效能基本達到主流水平的NGS測序儀問世。這可能才是這篇文章的作者們真正想要達成的目標吧。

最後,留幾個個人的小疑問:

對於多個連續相同鹼基,這個方法的糾錯能力到底有多強?

SNA成本低、反應速度快的優勢能抵消三遍測序帶來的成本和時間開銷嗎?

這個方法能體現出SNA的長讀長優勢嗎?

2樓:核酸2蛋白

測序原理樓上已經說的很清楚,不在贅述。關於創新之處其實就是每個鹼基都測三遍,可能會在一定程度上提公升測序準確度。但我沒有看nature biotech的原文,更沒有深入研究過業內同行是否對這種方法的測試,不太好說到底是否提公升了準確率,提公升了多少。

其實solid測序平台,每個鹼基測兩次,號稱提公升了準確率,可實際效果也並不太明顯。至於說這種測序儀的測序費用,實際應用和市場推廣方面我是不太看好的,畢竟現在是illumina公司一統二代測序江湖,而且三代測序也是方興未艾!

3樓:

就知道一定會有人提問。真開心我認識原作者,手動@Alexis Voinov,文章主要作者之一。鼓掌~

我只能簡單解釋一下他們創新的原理,更詳細的還需要作者親自解釋。

二代測序都是Sequencing by synthesis(SBS),即邊合成邊測序,合成所需的鹼基底物都被加上了螢光基團,在合成的過程中,每配對成功乙個鹼基,這個新連上的鹼基就釋放出乙個螢光基團。

現在普遍使用的Illumina機器就是基於這種原理,把四種合成所需的基本鹼基ATCG,每一種都加上顏色不同的螢光基團,每一輪反應都新增四種鹼基,每完成一輪反應(即合成時產物上多新增乙個和模板互補配對上的鹼基)拍一次照,通過顏色訊號確認是哪種鹼基。

黃老師組的方法是在SBS的思路上做的優化。

首先,他們只用一種螢光基團,叫做Tokyo Green(因為我喜歡Tokyo所以我喜歡這個名字)。

其次,他們每一次反應只新增2種鹼基,一輪反應新增2次以cover4種鹼基,而且4種鹼基的螢光顏色相同。

最後,他們需要通過3次合成來確認鹼基。

那他們是怎麼做到的呢?

答案是用腦子,哈哈哈。

先來看個圖。

看起來不知道要做什麼對不對?

我一步步解釋下。

我們都知道,DNA基本的鹼基有ATCG共4種(不包括修飾等)。

如上圖,我們可以把這4個鹼基兩兩分為一組,即上圖兩兩鹼基之間的連線,可以分為6組(每組內的2個鹼基沒有先後順序)。給他們的小組都起個名字吧。

AT:W

AG:R

AC:M

CG:S

TG:K

CT:Y

再按能cover 4種鹼基把6個小組分成3個大組:

兩條橫線對應的兩個組(W和S),兩條豎線對應的兩個組(M和K),兩條對角線對應的兩個組(Y和R)。

測序合成時,每次都是順著模板鏈把整個一條DNA合成完,下一次合成時把合成產物擦掉沿著模板鏈再來一次。在每乙個鹼基位置等待互補配對時,都要加入某乙個鹼基大組(即先後加入2個小組),即WS、MK或YR。每加入乙個小組,就讀一次螢光訊號;每次合成中,同乙個位置就會讀2次訊號。

對一條序列,共進行3次合成,每個位置總共就會讀6次有或無的訊號。

那麼,理論上,這個位置如果是A,機器就會在且僅在加入的小組是W、M和R時讀到一共3次綠色的訊號,即A=W∩M∩R。

對T、C和G,同理。

所以,由三次測序後得到綠色訊號的是哪三組,取並集就可以得到這個位置的鹼基了。

再反過來看上面的圖,你會發現,其實A=W∩M或M∩R或W∩R,理論上測兩輪就夠了。

那為什麼還要測3輪呢?

為了防止某一輪讀錯咯。

看,是不是靠腦子做到的?

最近剛接觸二代測序,請問barcode是什麼意思,我只查到barcode在反向接頭中

張柏菜 DNA 條形碼 DNA barcode 是通過一段短的標準DNA 片段實現物種的快速 準確和標準化鑑定。線粒體細胞色素C 氧化酶亞基I COI 約600bp 基因作為動物的DNA 條形碼已廣泛應用於物種鑑定中,在植物上已選定葉綠體rbcL和matK 基因作為基本的DNA 條形碼。目前世界各國...

家庭優越少年(富二代,官二代,黑二代)的生活是怎麼樣的?

霧都的貓Cat 我問問我兒子吧。好吧我沒兒子。過幾年再來回答。具體是哪一年我也不太清楚 我會盡量讓這個時間來的快一點 但是我好想我不是富一代阿? 少年時期是富二代,父親暴發戶,90年代鍾情進口車,幾輛幾十萬的車,流動資金幾千萬上億那種。不知道自己家有錢,只是吃喝玩樂從來不缺錢,沒為錢發愁過。別人有的...

iPhone SE會出第二代嗎?對第二代的SE有什麼期待?

百利本無金 按目前來說是不可能的 iPhone es是iPhone6s的縮小版,因為6s多了3D touch,se實際元器件大小更像iPhone6,故拿iPhone6作比。通過計算可以得到ip6的體積為63.84cm,se的為55.14cm,這個體積縮小幅度是可以通過縮小電池螢幕做到的。把體積為78...