Proteinlerin düzensiz bölgelerinin tahmininde yeni öznitelik kodlama yöntemleri

Tez KünyeDurumu
Proteinlerin düzensiz bölgelerinin tahmininde yeni öznitelik kodlama yöntemleri / New feature coding methods in disorder region estimate of protein
Yazar:SEBAHATTİN BABUR
Danışman: DOÇ. DR. MURAT GÖK
Yer Bilgisi: Yalova Üniversitesi / Fen Bilimleri Enstitüsü / Bilgisayar Mühendisliği Ana Bilim Dalı
Konu:Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control ; Biyoistatistik = Biostatistics ; Biyoloji = Biology
Dizin:
Onaylandı
Yüksek Lisans
Türkçe
2016
70 s.
Canlıların temel yapıtaşlarından olan proteinler, biyokimyasal aktivitelerin hemen hemen tümünde rol alırlar. Biyokimyasal aktivitelerdeki değişimler canlı için kritik öneme sahiptir. Örneğin, protein işlev bozukluğundan kaynaklanan biyokimyasal reaksiyon değişimleri ciddi bir takım hastalıklara neden olabilmektedir. Bu nedenle proteinlerin yapısının tespit edilmesi hayati önem arz etmektedir. Proteinlerin işlevlerini anlayabilmek için ilk olarak yapılarının anlaşılması gerekmektedir. Bu yapıları tespit etmek amacıyla, Nuclear Magnetic Resonance Spectroscopy (NMR), Nuclear Overhauser Effect, X-Ray Crystallography, DNA microarray teknolojisi gibi in vitro (laboratuvar ortamı) yöntemler kullanılmaktadır. In silico (bilgisayar, hesaplamalı ortamı) yöntemlerin uygulaması in vitro yöntemlere göre maliyet / fayda ve zaman açısından daha çok tercih edilmektedir. Bu durum beraberinde aminoasitlerin birbirleri ile olan fizikokimyasal ilişkilerinin tespit edilmesi, proteinlerin yapılarının modellenmesi, metabolik yolların tahmin edilmesi gibi çalışmaları hızlandırmıştır. Bu tez çalışmasında, proteinlerdeki düzensiz bölgelerin tahmini için proteini oluşturan amino asitlerin (kalıntı) farklı biyokimyasal ve fiziksel özellikleri kullanılarak yeni iki adet öznitelik kodlama yöntemi geliştirilmiştir. Geliştirilen birinci yöntem proteinlerin amino asitlerin fizikokimyasal özellikleri, proteinlerin pozisyon-skor matrisi (PSM) ve SPINE-X protein özellikleri temelinde geliştirilmiştir. İkinci yöntemin geliştirilmesinde ise, dalgacık teoremi kullanılmıştır. Bu öznitelik kodlama yöntemleri makine öğrenmesi algoritmaları ile Protein Structure Prediction Center tarafından yayınlanan CASP 10 veri seti üzerinde test edilmişlerdir. Elde edilen deneysel sonuçlar literatürdeki yöntemlerle kıyaslanmıştır.
The proteins which are the main constituent of bios (living creatures), take part in almost every biochemical activities. For instance, changes of biochemical reaction, derived from protein dysfunction, causes a set of serious illnesses. Therefore determining the structure of proteins is of vital importance. Firstly it must be understood the structure of proteins to understand the fuctions of them. To determine these structures, it is used such in vitro (laboratory environment) methods like Nuclear Magnetic Resonance Spectroscopy (NMR), Nuclear Overhauser Effect, X-Ray Crystallography, DNA microarray technology. Application of in silico (computer, calculating environment) methods are more favored over in vitro methods in terms of cost/benefit and time. This is accelerated the studies like determination of the physicochemical relations of amino acids, modeling of proteins’s structures, prediction of pathways. In this study it has been developed two pieces new feature codification methods by using different biochemical and physical features, of protein builder amino acids (resudiue) to predict the irregular zones of proteins. First method has been developed on the basis of physicochemical features of proteins and amino acids, position-score matris of proteins (PSM) and SPINE-X protein features. It has been used the theory of ripple in developing of second method. This feature codification methods has been tested on CASP 10 dataset which is issued by machine learning algorithms and Protein Structure Prediction Center. Acquired experimental results have been compared with the methods in the literature.

Download: Click here