Page 20 - My FlipBook
P. 20
亮
計 染色體層級之新世代定序組裝策略:
畫
Spotlight Projects 運用於個人基因體精準醫療與經濟生物之基因體育種
計畫主持人:林仲彥博士
計畫期程:2018/1~2021/12
日新月異的生物序列次世代定序技術、單細胞基因分析、 目前研究團隊透過手邊已有大量數 TB 的高品質的自產
經濟作物的全基因體解析與個人化精準醫學等,將生物 資料 ( 包括次世代定序資料、第三代單分子定序及 10x
醫學研究推進至巨量資料層級,特別是個人的基因體組 Genomics 短片段標誌序列等 ),研發了新的混合組裝演
裝(正常與癌化組織),伴隨巨量生物序列的累積,將 算法。除了能在組裝前後進行序列的分析,也能動態地
能揭露更多致病機制與提供未來治療的可能策略,讓我 以遞迴 (Spiral assembling) 與多樣定序平台混搭的方式,
們人類有機會邁向更為健康長壽的新境界。 來 優 化 整 個 組 裝 的 基 因 體, 同 時 也 能 利 用 大 量 的 10x
Genomics 短片段標誌序列,來重新組裝與修補在原有序
2019 年 10 月 30 日由行政院所積極推動的「台灣精準醫 列中的遺缺,以及透過組裝序列間的拓樸關係,來連結
療 Biobank 整合平台」,將帶領台灣個人化精準醫學, 與修補可能相鄰的長序列大片段。目前在日本鰻、台灣
與 個 人 基 因 體 定 序 分 析 相 關 研 究 的 大 步 邁 進。 然 而, 鯛及個人基因體組裝上,已有相當不錯的進展,能大幅
對 於 混 合 不 同 平 台、 不 同 品 質 與 定 序 長 度 所 產 出 之 大 減少序列中的遺缺,並連結組裝片段,同時增加基因內
量序列,來進行高品質的基因體重組 (de novo genome 涵。
assembly),目前並沒有很好的工具程式。由於基因定序
平台的快速演進與多樣化,定序長度已由原來的數百鹼 在非模式物種方面,對於已有不同平台定序資料的之雛
基,進展到五千以上甚至數十萬的鹼基長度,同時一些 形基因體,我們已發展可動態組合的演算法,依其定序
與染色體結構的相關定序技術 ( 如 Hi-C 等 ),也提供染 量與類型,來找出最佳的組裝方式。對於全新的定序計
色體層級的對應資訊。此外新的策略如 Bionano Genome 畫,我們則建議直接以三代定序為主,結合加上標誌序
Mapping Systems 等,以光學方式重新進行染色體基因體 列 的 二 代 定 序 ( 以 10x Genomics 所 產 出 的 短 序 列 標 誌
長片段測繪 (Genome Mapping) 的方式,可以讓我們得以 連鎖組 ) 與染色體構象 Hi-C 定序為輔,在考量定序成
瞭解染色體層級的真實排列順序與大片段的基因結構差 本與基因體覆蓋倍率的平衡下,利用所開發新一代組裝
演算法模組,將可提供全新高品質基因體組裝新策略。
異。然而,現今既存之基因重組演算法大多無法結合不 基於前項的成功經驗,已有院內生多中心、台大、海大
同定序策略的優點,少數可用之方法的組裝結果不佳且 與台灣水產試驗所等團隊與我們接觸商討合作,並簽訂
速度緩慢。針對這樣的現況,必需發展新一代的快速高 MOU,希望透過我們的經驗,來完成複雜的基因體解碼
效率演算法,利用雲端平台與分散式運算的優勢,才能 工作(如白蟻、海水台灣鯛、白帶魚及金目鱸等),作
將結合二代定序、三代定序及基因體光學解析等技術, 為後續基因體育種的重要基礎 ( 圖一 )。
將基因體組裝推進至染色體層級。以更為完整的面貌,
來解析複雜的基因上下游調控機制、找尋個人精準治療
策略與協助基因體育種等之複雜課題。然而,如何在有
限的定序經費與計算資源下,在定序策略與組裝品質之
間取得平衡,是基因體研究領域當今所遇到的最大挑戰。
圖一:開發新的組裝策略並結合新的定序技術,大幅提昇基因體組裝的質與量。
18
計 染色體層級之新世代定序組裝策略:
畫
Spotlight Projects 運用於個人基因體精準醫療與經濟生物之基因體育種
計畫主持人:林仲彥博士
計畫期程:2018/1~2021/12
日新月異的生物序列次世代定序技術、單細胞基因分析、 目前研究團隊透過手邊已有大量數 TB 的高品質的自產
經濟作物的全基因體解析與個人化精準醫學等,將生物 資料 ( 包括次世代定序資料、第三代單分子定序及 10x
醫學研究推進至巨量資料層級,特別是個人的基因體組 Genomics 短片段標誌序列等 ),研發了新的混合組裝演
裝(正常與癌化組織),伴隨巨量生物序列的累積,將 算法。除了能在組裝前後進行序列的分析,也能動態地
能揭露更多致病機制與提供未來治療的可能策略,讓我 以遞迴 (Spiral assembling) 與多樣定序平台混搭的方式,
們人類有機會邁向更為健康長壽的新境界。 來 優 化 整 個 組 裝 的 基 因 體, 同 時 也 能 利 用 大 量 的 10x
Genomics 短片段標誌序列,來重新組裝與修補在原有序
2019 年 10 月 30 日由行政院所積極推動的「台灣精準醫 列中的遺缺,以及透過組裝序列間的拓樸關係,來連結
療 Biobank 整合平台」,將帶領台灣個人化精準醫學, 與修補可能相鄰的長序列大片段。目前在日本鰻、台灣
與 個 人 基 因 體 定 序 分 析 相 關 研 究 的 大 步 邁 進。 然 而, 鯛及個人基因體組裝上,已有相當不錯的進展,能大幅
對 於 混 合 不 同 平 台、 不 同 品 質 與 定 序 長 度 所 產 出 之 大 減少序列中的遺缺,並連結組裝片段,同時增加基因內
量序列,來進行高品質的基因體重組 (de novo genome 涵。
assembly),目前並沒有很好的工具程式。由於基因定序
平台的快速演進與多樣化,定序長度已由原來的數百鹼 在非模式物種方面,對於已有不同平台定序資料的之雛
基,進展到五千以上甚至數十萬的鹼基長度,同時一些 形基因體,我們已發展可動態組合的演算法,依其定序
與染色體結構的相關定序技術 ( 如 Hi-C 等 ),也提供染 量與類型,來找出最佳的組裝方式。對於全新的定序計
色體層級的對應資訊。此外新的策略如 Bionano Genome 畫,我們則建議直接以三代定序為主,結合加上標誌序
Mapping Systems 等,以光學方式重新進行染色體基因體 列 的 二 代 定 序 ( 以 10x Genomics 所 產 出 的 短 序 列 標 誌
長片段測繪 (Genome Mapping) 的方式,可以讓我們得以 連鎖組 ) 與染色體構象 Hi-C 定序為輔,在考量定序成
瞭解染色體層級的真實排列順序與大片段的基因結構差 本與基因體覆蓋倍率的平衡下,利用所開發新一代組裝
演算法模組,將可提供全新高品質基因體組裝新策略。
異。然而,現今既存之基因重組演算法大多無法結合不 基於前項的成功經驗,已有院內生多中心、台大、海大
同定序策略的優點,少數可用之方法的組裝結果不佳且 與台灣水產試驗所等團隊與我們接觸商討合作,並簽訂
速度緩慢。針對這樣的現況,必需發展新一代的快速高 MOU,希望透過我們的經驗,來完成複雜的基因體解碼
效率演算法,利用雲端平台與分散式運算的優勢,才能 工作(如白蟻、海水台灣鯛、白帶魚及金目鱸等),作
將結合二代定序、三代定序及基因體光學解析等技術, 為後續基因體育種的重要基礎 ( 圖一 )。
將基因體組裝推進至染色體層級。以更為完整的面貌,
來解析複雜的基因上下游調控機制、找尋個人精準治療
策略與協助基因體育種等之複雜課題。然而,如何在有
限的定序經費與計算資源下,在定序策略與組裝品質之
間取得平衡,是基因體研究領域當今所遇到的最大挑戰。
圖一:開發新的組裝策略並結合新的定序技術,大幅提昇基因體組裝的質與量。
18