Özet:
Biyoinformatik çalışmalar; genetik hastalık araştırmaları, hastalık tespiti ve tespit edilen hastalıklara çözüm üretilebilmesi amacıyla DNA dizilimleri yöntemleri üzerinde yoğunlaşmıştır. Genetik verilerin analizindeki temel problemler, bu veri dizilimlerinin boyutlarına bağlı karmaşıklıklarından meydana gelmektedir. Bu karmaşıklık, Yeni Nesil Dizileme (YND) cihazları tarafından yapılan veri okuma hatasından kaynaklanmaktadır. Büyük veri dizilimlerinin tek seferde okunması mümkün olmadığından, verilerin parçalar halinde dizileme yapılabilmektedir. YND cihazları yardımıyla büyük genetik verilerinin okunması mümkün kılınmıştır. Ayrıca YND cihazları, genetik veri dizilimlerinin okunması sırasında %1 ile %3 arasında hatalı okuma gerçekleştirmektedir. Bu çalışmada, günümüzde en yaygın kanser hastalıklarından biri olan Braf Mürin Sarcoma Viral Onkogen Homolog B1 (BRAF) gen mutasyonunun tespiti için sıkça rastlanan veri okuma hatasının düzeltilmesi üzerine bir yöntem önerilmiştir. Bu yöntemde, Ulusal Biyoteknoloji Bilgi Merkezi (NCBI) üzerinden paylaşılan sağlıklı BRAF geni kullanılmıştır. YND okumaları simüle edilerek oluşan hata oranları ile orantılı sentetik veri üretilmiştir. Hatalı gen, belirlenen derinlik boyutunda okunmuş ve fasta formatında kaydedilmiştir. Referans dizilim ile sekanslar karşılaştırılmış ve hatalar tespit edilerek düzeltme işlemleri uygulanmıştır.