Biyoloji'de geleceği parlak bir alan:Biyoinformatik

Biyoinformatik Nedir?

Biyoinformatik,biyolojinin çeşitli dalları,ancak özellikle moleküler biyoloji ile bilgisayar teknolojisini ve bununla
ilişkili veri işleme aygıtlarını bünyesinde barındıran bilimsel disiplin.


Ortaya Çıkışı

1960'larda başlayan bilgisayar uygulamalarının biyolojide kullanılması girişimi,her iki alandaki teknolojik
gelişime paralel olarak hızla ilerlemiş ve böylelikle ortaya çıkan Biyoinformatik dalı bugün en popüler
akademik ve endüstriyel sektörlerin başına geçmiştir.Bilgisayarların moleküler biyolojide kullanımı üç boyutlu
moleküler yapıların grafik temsili,moleküler dizilimler ve üç boyutlu moleküler yapı veritabanları
oluşturulması ile başlamıştır.Kısa sürede çok yüksek miktarlarda veri üreten,endüstri düzeyinde gen ekspresyonu,
protein-protein ilişkisi,biyolojik olarak aktif molekül araştırmaları,bakteri,maya, hayvan ve insan genom
projeleri gibi biyolojik deneylerin doğurduğu talep sonucunda,bu alandaki bilişim uygulamaları neredeyse takip
edilemez bir hızda gelişmiştir.Biyoinformatik dalının ayrı bir (disiplinlerarası) bilim dalı olarak tanınması da
son 10 yılda gerçekleşmiştir.


Çalışma Alanları

Biyoinformatik genel olarak biyolojik problemlerin çözümünde bilişim teknolojilerinin kullanılması olarak tanımlanabilir.En dar tanımı ile genomik sekansları destekleyen biyolojik veritabanlarının oluşturulması ve işletilmesi,en geniş tanımı ile de mevcut tüm bilgisayar uygulamalarının biyolojik problemlerin çözümünde kullanılması olarak anlaşılır.

Biyoinformatik modern biyolojinin iki temel bilgi akışını kapsar:

1.Genetik bilgi akışı:Bir organizmanın DNAsı incelenerek özelliklerinin belirlenmesinden,incelenen bu organizma türünün oluşturduğu toplulukların karakteristik özelliklerine kadar olan bilgi akışı.Elde edilen DNA bilgisi tekrar genetik havuzun tanımlanması için kullanılır.

2.Deneysel bilgi akışı:Biyolojik olaylar gözlenerek elde edilen enformasyon,açıklayıcı modeller ile tarif edilir,daha sonra bu modellerin doğruluğu yeni deneyler ile test edilir.

Son yirmi yılda temel biyolojik araştımaların klinik tıp uygulamaları ve klinik tıp bilgi sistemleri üzerindeki etkisi daha da belirleyici olmuş ve bugün yeni kuşak epidemiyolojik, tanı,teşhiş ve tedavi amaçlı modüllerin ortaya çıkmasına yol açmıştır.Biyoinformatik çalışmalar temel bilimsel araştırmalara yönelik görünmekle beraber önümüzdeki on yıl içinde kilinik bilişim için vazgeçilmez olacaktır.Örneğin hastaların medikal formlarında giderek artan bir sıklıkla DNA dizilim bilgileri yer almaya başlayacaktır.Bugün ABD'de bazı sigorta şirketleri,risk primleri belirlenirken mevcut genetik tarama test sonuçlarını talep edebilmektedir.Biyoinformatik araştırmalar için geliştirilen algoritmaların çok yakında klinik bilişim sistemlerine entegre olması beklenmektedir.

Bu alanı kısaca tanımlamanın bir yolu da,biyoinformatik araçların kullanıldığı genel araştırma konularını özetlemek olabilir:


Metodolojik çalışmalar

1. DNA sıra ve dizilimi araştırmaları
2. Protein sıra ve dizilimi araştırmaları
3. Makromoleküler yapıların (DNA,RNA,protein) üç boyutlu dizilim araştırmaları
4. Küçük moleküllerin (potansiyel terapötik maddeler,aktif peptidler,ribozimler vs.) ligandlarıyla etkileşiminin araştırılması
5. Heterojen biyolojik veritabanlarının entegrasyonu
6. Biyolojik enformasyonun paylaşımının kolaylaştırılması
7. Bilgisayar ile otomize edilmiş veri analizi ve iletimi
8. Etkileşimde bulunan gen ürünleri için bilgi ağları oluşturulması
9. Kimyasal reaksiyonlardan hücrelerarası iletişime kadar pek çok biyolojik faaliyet sürecinin simülasyonu
10. Büyük çaplı biyolojik deneylerden (GENOM projeleri gibi) çıkan sonuçların analizi

Biyolojik çalışmalar

1. Protein yapı ve fonksiyonun belirlenmesi
2. Herhangi bir biyolojik fonksiyonu arttıran ya da engelleyen küçük moleküllerin tasarlanması
3. Karmaşık genetik fonksiyon ya da regülasyon faaliyetlerinin tanımlanması
4. Tıbbi ya da endüstriyel amaçlı yeni makromoleküller üretmek
5. Genetik faktörlerin hastalık yatkınlığına etkilerini ortaya çıkarmak


Biyoinformatik çalışmalar moleküler biyolojinin ana paradigması üzerine temellendirilmiştir :

Genetik enformasyon : DNA -> protein

DNA _ nükleotidler : G,A,T,C 4 harfli alfabe -> üçlü kodonlar -> genler -> protein
Protein _ amino asitler: gly, glu,ala, vs. 20 harflik alfabe

Protein molekülleri özgün üç boyutlu bir yapı oluşturacak biçimde katlanma vafına sahiptir. Böylelikle enzimatik kataliz, yapısal destek, hareket jenerasyonu, hücreler arası sinyal iletişimi, ışık, basınç vb. kuvvetleri kimyasal sinyallere dönüştürmek gibi biyolojik aktivitelerin gerçekleştirilmesini sağlar. Proten aktiviteleri hücre içinde yaşamsal birimler oluşturulmasının temelidir. Tek ya da çok hücreli bu organizmalar yaşam ortamlarıyla etkileşime geçerek beslenir ve ürerler. Zaman içinde değişen çevresel faktörlerin yarattığı baskı, kısıtlı yaşamsal kaynaklardan daha iyi faydalanmak adına mevcut proteinlerin geliştirilmesini gerektirir. Yaşamsal faaaliyetlerin sürdürülmesini kolaylaştıran bu değişiklikler ise avantajlı olmalarından dolayı kalıtsal (DNA) değişikliklere yol açar.

Kimi zaman kompütasyonal biyoloji, biyoinformatik ile eş anlamlı olarak kullanılsa da, halihazırda biyoinformatik daha çok moleküler biyolojiye odaklıdır. Zaman içinde bu ayrımın ortadan kalkması ise kaçınılmazdır çünkü artık tüm biyolojik faaliyetlerin "moleküler" bir temeli olduğu bilinmektedir.

Bugün biyoinformatik alanında yapılan çalışmalar sadece yaygın kullanım bulan veritabanları ve algoritmalar geliştirilmesiyle sınırlı kalmamış, kısa denebilecek bir sürede hem bu alandaki araştırmalara hem de alansal eğitime yön veren bazı temel prensiplerin de ortaya çıkmasına yol açmıştır. Bu prensipleri genel olarak özetlemek gerekirse :


1. Mutasyon, delesyon, insersiyon gibi evrimsel değişikler hep gerçekleşse de protein moleküllerin yapısı neredeyse değişmez biçimde korunur.Amino asit dizinleri çok farklı olsa da (ikili dizilimde 10% dan az amino asit eşleşmesi) yapısal benzerlik gösteren pek çok makro molekül bulunsa da, dizilim benzerliği taşımasına rağmen yapısal benzerlik göstermeyen iki molekül neredeyse yoktur.

2. Dinamik programlama temelli algoritmalar , biyolojik dizilimlerde en optimal sonuçları vermektedir. Matematiksel optimizasyon iki dizin arasında yüksek benzerlik durumunda (>30% özdeş) daha güvenilirdir.

3. Moleküller arası fiziksel etkileşimler, enerji denklemleri ile tanımlanabilir. Atomlar arasındaki temel fiziksel çekim ve itme kuvvetlerini göz önünde bulunduran metodlar sayesinde, sadece temel enerji denklemleri ile moleküllerin dinamik hareketlerinin modellenmesi mümkündür.

4. Proteinlerin biyolojik fonksiyonlarının pek çoğu , amino asit dizini içinde rastlanan lineer parçalar (dizin motifleri) üzerinde kodludur. Toplam dizin analizinde büyük farklılıklar gösterse de benzer fonksiyonlara sahip tüm proteinlerde aynı "motifi" bulmak mümkündür. Diğer fonksiyonlar biyofiziksel ve biyokimyasal özelliklere bağlı olarak oluşturulan üç boyutlu düzenlemeler (3-Dimensional structure) ile sağlanır. Bu yapılanma, farklı dizilimde moleküllerin nasıl benzer aktif mikroortamlar yaratabildiğini gösterir.

5. Dizin modellemede probabilistik yaklaşımlar (örneğin Hidden Markov Models), birbiriyle ilişikli dizinlerin sınıflandırılmasında ve bu sınıfların yeni üyelerinin belirlenmesinde çok etkindir.

6. Üç boyutlu biyolojik yapıların diziliminde geometrik algoritmaların kullanılması etkin sonuç vermektedir.Bu metodda atomlar arasındaki mesafelerin yanı sıra , incelenen molekülün bilinen fonksiyonu da atomsal iletişimin tarifi için gözönünde bulundurulmaktadır.

7. Biyolojik makromoleküllerin üç boyutlu yapısı belirlenirken, gerekli bilginin bir bölümü 70% doğruluk oranı ile sadece lokal dizinden ( 20 aminoasitlik süregelen sıralanmalar) elde edilebilir. Üç boyutlu yapının bütünüyle ortaya konabilmesi için gerekli bilgi dizin içinde mevcut olmakla birlikte molekül içinde uzun mesafeli etkileşimler göz önünde bulundurulmalıdır.

8. Yeni bir dizinin, bilinen bir yapıyı alabilme ihtimalinin araştırılması, hangi yapıyı aldığının araştırmaktan daha kolaydır.
Bu dizin, bilinen bu yapıyı alabilir mi?
Bu dizin hangi yapıyı alır?

9. Konak ve patojen DNA bilgilerindeki varyasonlar ve varyasyon korrelansı, bir hastlıkta hangi proteinlerin rol aldığının ve nasıl bir etkileşime geçtiklerinin belirlenmesinde kullanılabilir.


Geliştirilen ve artık rutin olarak kullanılan algoritmalar ve veritabanlarının yanısıra, mevcut biyoinformatik araçlarının da daha iyi anlaşılabilmesi için bir senaryo düşünelim:

Doktora giden hastamız kendisine bir tür genetik diabet tanısı konduğunu belirtir. Bunun hangi sendrom olduğuna emin olamayan uzman hekim, internete (WWW) girerek diabetle ilintili genetik sendromları araştırmaya karar verir.


1. Doktorumuz NCBI (Amerikan Ulusal Biyoteknoloji Enformasyon Merkezi) sitesine girerek bu sendromu araştırabilir. NCBI bünyesinde, biyoloji ve moleküler tıp odaklı birkaç veri tabanı mevcut.

2. OMIM (Online Mendelian Inheritance of Man) kaynağında bilinen tüm insan genetik bozukluklarını içeren bilgi, literatürde konuyla ilgili yer almış yayınlara ve bu hastalıkla ilişikli görünen tüm bilinen genleri içeren veritabanlarına otomatik link verecek biçimde yer alıyor. Diabetes kelimesi kullanılarak yapılan bir arama sonucu Diabetes Mellitus, Otozomal Dominant, Tip II bilgisine ulaşmak mümkün. Ayrıca bozukluğun temelinde glukokinaz proteinini kodlayan genin regulasyonunda bir aksama olduğu belirtiliyor ve glukokinaz proteinin dizilimini içeren veritabanlarına da otomatik link veriyor.

3. Protein dizini veritabanında "glukokinaz" kelimesi kullanılarak yapılan aramada, insan glukokinaz geni, değişik fizyolojik koşullarda yaratılmış versiyonları ile birlikte bulunuyor. Aynı zamanda DNA dizilimi, protein dizilimi ve ilgili referans linkleri mevcut.

4. MEDLINE literatür veritabanı için sunulan link kullanılarak, bu gendeki bir değişikliğin, diabet hastalığı ile ilişkisinin ortaya çıkarıldığı orijinal yayın bulunabiliyor.

5. Protein dizini veritabanı kullanılarak, bu genin kodladığı amino aist dizini bulunabiliyor. Bu dizin üzerinden algoritma kullanılarak yapılan protein veritabanları araştırmasında (SWISS_PROT, PIR), tüm ilintili dizinleri bulmak mümkün. Bunun yanısıra, fonksiyon tanımlayan dizin motifleri için oluşturulmuş bilgi bankası kullanılarak bu motiflerin glukokinaz enzimi yapısında bulunup bulunmadığı da araştırılabilir. Bunun sonucunda bu enzimin glukoz ve ATP gibi küçük moleküllere bağlandığı görülür.

6. Genetik veri bankası GENBANK kullanılarak protein dizini üzerinden geni kodlayan DNA dizini detaylı olarak elde edilebilir. GENBANK kayıtları bu genin belli bir bölgesinde, gen regulasyonunda değişikliklre yol açan bir DNA insersiyonuna rastlandığı bilgisini de içeriyor.

7. Protein dizini girdisi aynı zamanda Protein Veri Bankası üzerinden üç boyutlu protein yapısı veritabanına da bağlanıyor. Bu girdi, glukokinaz proteini yapısında yer alan tüm atomların x-ray kristalografisi ile belirlenmiş koordinatlarını içeriyor. Aynı zamanda belirleyici yapısal özelliklerin resimlendirilmiş bir özeti de mevcut. Yapısal benzerlik ölçümleri yolu ile, benzerlik gösteren başka organizma kökenli proteinlere de link veriliyor. Ayrıca kilit yapısal lokasyonların belirlenmesini sağlayan algoritmalar da mevcut. Böylelikle glukoz ya da ATP bağlanma noktalarını tam olarak belirlemek mümkün.


Bu noktada doktorumuz birkaç mevcut veritabanından yararlanarak hastalık hakkında bilgi toplamakla kalmadığı gibi, aynı zamanda bu hastalıkla ilintili moleküler mekanizmaları da belirlemiş oluyor.Rutin olarak mevcut olmasa da daha sonra doktorumuz başka araçlardan yararlanarak


1. DNA analizi testi yaptırarak tanıyı doğrular
2. Hastalığın semptomları ve diagnostik genetik testlerin sonuçlarından yola çıkarak uygun bir tedavi formüle eder
3. Hastası ile olası uzun vade sonuçları (eğer herhangi bir tedavi uygulanmazsa ne olabileceği, kalıtsal bir hastalık olması sebebi ile doğacak çocuklara aktarım ihitimali, vs.) paylaşır ve yol gösterir.
4. Eğer böyle bir çalışma mevcut ise, hastasını bu sendromun genetik temellerinin daha iyi anlaşılması için süregelen bir kilnik deneye dahil olmak üzere davet edebilir.


Bu örneklerden de çıkarılabileceği gibi, biyoinformatik alanında yönlendirici bir takım temel "prensipler" ortaya konmuştur.

Ne gerekiyor?

Hastaların özgün genetik yapılarına uygun genetik tedavi yöntemleri geliştirilmesi ve uygulanması için biyoinfirmatik araçların, öncelikle hasta bakımı ile ilgilenen kilinik bilişimle daha entegre olması gerekmekte.


1. Moleküler bilginin, populasyonlara simülasyonu : hastalık süreçlerini ve ilinitli moleküler oyuncuları anlamak için kapsamlı fizyolojik modeller
2. Biyomedikal verilerin, klinik genomik uygulamalar için etkin biçimde işlenmesi : yeni biyolojik ve tıbbı araştırma sonuçlarının etkin organizsyonu ve birbiriyle ilintilendirilmesi bilgi ve veri tabanları oluşturmada yeni paradigmalar gerektirmekte
3. Veri kirliliği çağında biyomedikal araştırmalara gelişkin destek : hem klinik hem de temel bilimci araştırmacıların yüksek miktarda veri analizlerini daha hızlı ve etkin kılacak uygulamalar geliştirilmeli.



Bu kadar bilgiden sonra size olayın özünden bahsedeceğim.Bu alan neden git gide dahada önem kazanıyor.

Öncelikle yurtdışından yola çıkarak anlatacağım sizlere.Yurtdışında Bilim insanları şöyle yapmışlar:

Bilim insanları elde edebildikleri proteinleri,enzimleri vs. tek tek incelemişler.Proteini ele alırsak bu proteinin önce ne işe yaradığını tespit etmişler.Daha sonra yapısındaki aminoasitleri çıkarmışlar.Bu aminoasitlerden yola çıkarak bu proteninin DNA dizisini çıkarmışlar.
Bir çok protenin,enzimin vs.bu şekilde DNA dizilerini çıkarmışlar ve bu dizileri bir veri bankasında toplamışlar.
Peki bu veri bankası nasıl birşey?Örneğin bilim insanları bir A proteinin DNA dizisi elde ettikten sonra A proteininin oluşmasını sağlayan aminoasitler şunlardır,bu aminoasitlerin DNA dizileri şunlardır diye kaydetmişler.Kısaca A proteini bu dizi tarafından oluşturulur demişlerdir.

Peki bu bizim işimize nasıl yarayacak?

Örneğin laboratuarda bulduğunuz bir yeni hayvan türünden bir enzim elde ettiniz ve bu enzimin görevinin ne olduğunu bilmiyorsunuz.Klasik yöntemlerle bunu öğrenmeniz uzun sürecektir.İşte burda bu veri bankaları devreye giriyor.El ettiğiniz enzimin DNA dizisini çıkarıp bu diziyi alıyorsunuz.Bu veri bankalarının internet üzerinden online hizmet veren siteleri var.Bu diziyi bu sitelerden birine girerek diziyi veri bankasında arıyorsunuz.
Eğer bu enzim daha önce araştırılmışsa bu veri bankasında çıkıyor.Eğer çıkmıyorsa bu veri bankası elinizdeki DNA dizisini diğer dizilerle eşleştirerek bu diziye en yakın benzer dizileri % değer olarak bu dizilerin ürünleri ile beraber çıkarıyor.Elinizdeki dizinin %80 oranında bir B enziminin dizisine benzediğini gördüğünüz.Burdan yola çıkarak elinizdeki enzim hakkında yorum yapabiliyorsunuz.

Bu uygulama özellikle yeni bir tür tayininde,türler arası akrabalıkların belirlenmesinde vs. gittikçe yaygınlaşmakta.Elde ettiğiniz bir yapının DNA dizisinin çıkararak bu veri tabanları sayesinde neye benzediğini görevinin ne olduğunu bulabilirsiniz.
Ülkemizde henüz bunun gibi bir veritabanı yok ama ilerde oluşturulacağını düşünüyorum.Ülkemizde de bu alanda yavaş yavaş çalışmalar yapmaya başlamıştır.Bu veri bankaları ilerde daha da yaygınlaşacak ve bir çok işi kolaylaştıracak diye düşünüyorum.Bu nedenden dolayı biyoinformatik alanı gelecek zamanda popüler bir alan olacaktır.
Bizlerde bu alana yönelip kendimizi geliştirsek ilerde ülkemizde bu alanın öncülerinden olabiliriz.

Beğeniler: 0
Favoriler: 0
İzlenmeler: 1587
favori
like
share