Computational methods for analyzing ngs data to discover clinically relevant mutations

Tez KünyeDurumu
Computational methods for analyzing ngs data to discover clinically relevant mutations / Klinikle ilişkili mutasyonların keşfinde etkin yeni nesil dizileme verisi analiz metotları
Yazar:BEKİR ERGÜNER
Danışman: PROF. DR. İSMAİL ÇAKMAK
Yer Bilgisi: Sabancı Üniversitesi / Mühendislik ve Fen Bilimleri Enstitüsü / Moleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
Konu:Biyoloji = Biology ; Biyomühendislik = Bioengineering ; Biyoteknoloji = Biotechnology
Dizin:
Onaylandı
Doktora
İngilizce
2017
82 s.
Yeni nesil dizileme (YND) teknolojileri sayesinde, genom çapında dizileme yapmanın herkes tarafından erişilebilir olduğu bir devir başladı. Bu teknolojiler aracılığıyla devasa boyutlarda veri üretilmesi yeni analiz metotlarının ve yazılımlarının geliştirilmesi için acil ihtiyaçlar doğurdu. En basit YND çalışması bile birçok analiz basamağı gerektirmektedir. Bununla birlikte her bir analiz basamağı da kendine özgü zorluklara ve yanılsamalara sahiptir. Günümüzde, ham YND verisini verimli bir şekilde analiz ederken yanlış pozitif sinyallerin de düşük miktarda tutulması genomik sahasının en önemli sorunu haline gelmiştir. YND verisinin doğru analiz edilmesi ve yorumlanması sayesinde kalıtsal hastalıklara yol açan mutasyonların keşfinde çok etkili olduğu birçok araştırma tarafından gösterilmiştir. Bu çalışmada, özgün mutasyonların bulunmasında çok etkin bir tüm genom ve tüm ekzom verisi analiz yöntemi sunulmuştur. Geliştirdiğimiz bu yöntemle Serebrofasiotorasik Displazi, Klippel-Feil Sendromu, Spastik Paraparezi and Kuzey Epilepsi hastalıklarına sebep olan özgün mutasyonları keşfetmeyi başardık. Bunun yanı sıra, yapısal varyasyonların hassas haritalanması için kullanılan, de novo birleştirme ve lokal hizalamadan faydalanan k-mer bazlı bir metot geliştirdik. Haritalama verisine bağlı metoda kıyasla k-mer bazlı metot her çeşit yapısal varyasyonun tespitinde daha iyi sonuç verdi. Ayrıca geliştirdiğimiz bu metot daha önce başarılamamış olan kompleks yapıdaki yapısal varyasyonların çözümünü de yapabilmektedir.
The advent of Next Generation Sequencing platforms started a new era of genomics where affordable genome wide sequencing is available for everyone. These technologies are capable of generating huge amounts of raw sequence data creating an urgent demand for new computational analysis tools and methods. Even the simplest NGS study requires many analysis steps and each step has unique challenges and ambiguities. Efficiently processing raw NGS data and eliminating false-positive signals have become the most challenging issue in genomics. It has been shown that NGS is very effective identifying disease-causing mutations if the data is processed and interpreted properly. In this dissertation, we presented an effective whole genome/exome analysis strategy which has successfully identified novel disease-causing mutations for Cerebrofaciothoracic Dysplasia, Klippel-Feil Syndrome, Spastic Paraplegia and Northern Epilepsy. We also presented a k-mer based method for finely mapping genomic structural variations by utilizing de novo assembly and local alignment. Compared to the mapping based read extraction method, the k-mer based method improved detection of all types of structural variations, in particular detection rate of insertions increased 21%. Moreover, our method is capable of resolving complete structures of complex rearrangements which had not been accomplished before.

Download: Click here