kapak

Biyoenformatik Veri Analizinde R ile Hiyerarşik Kümeleme

Prof. Dr. Zeynel CEBECİ

 

 

 farkımız, kitaplarımızda...

 

ISBN: 978-605-9594-44-8, Mayıs 2019

300 sayfa, (16,5 x 24 cm2), 80 gr 1. hamur kağıt           şimdi satın al


Biyoenformatik Veri Analizinde R ile Hiyerarşik Kümeleme PDF içindekiler


Önsöz. Hiyerarşik kümeleme, veri madenciliğinde örüntü tanıma, makine öğrenmesi, pazarlama ve müşteri yönetimi, gen keşfi, ilaç tasarımı gibi birçok fen, sosyal ve yaşambilimleri alanında en yaygın kullanılan keşifçi ya da açınsal istatistiksel analizdir. Çoğu kez, analiz öncesi belli bir küme sayısı (k parametresi) ve küme merkezleri için başlatma değerleri istememesi gibi önemli avantajlar sunması nedeniyle K-ortalamalar ve K-ortancalar gibi yine yaygın olarak kullanılan hiyerarşik olmayan yöntemlere göre tercih edilmektedir. Analiz için ihtiyaç duyulan yegâne şey veri öğeleri arasındaki benzerlik ölçüsü olduğundan uygulanması kolay bulunmaktadır.

 

R, istatistik ve grafik analiz için güçlü bir hesaplama ortamı ve programlama dilidir. R projesi kapsamında GNU lisansı ile dağıtılan açık kaynak ve özgür yazılım olması, yeni algoritmaları geliştirmek ve test etmek için etkin ve kolay bir programlama ortamı sunması nedeniyle istatistik, matematik, bilgisayar bilimleri ve biyoinformatik gibi alanlarda hızla popüler olmasını sağlamıştır. Dünya genelinde hemen her kuramsal ve uygulamalı alanda çalışan araştırmacılar, veri analizcileri ve öğrenciler tarafından yaygın şekilde kullanılmaktadır. Günümüzde R için çok çeşitli alanlarda çalışan araştırmacılar tarafından geliştirilmiş 16000’e yaklaşan sayıda R paketi bulunmakta olup CRAN, BioConductor ve Github üzerinden dağıtılmaktadır.

 

Bu kitap veri madenciliğinde ya da bilgi keşfinde önemli bir açınsal istatistik aracı olarak hiyerarşik kümeleme analizine yöntemler, R ile uygulamalar ve bazı gerçek verisetleri üzerinde analiz örnekleriyle kapsamlı bir bakış sağlamaktadır. Kitabın ilk bölümünde küme, kümeleme terminolojisi ve kümeleme yöntemleri taksonomisi anlatılmaktadır. İkinci bölümde birleştirici kümeleme yöntemlerinin teorik temelleri küçük bir veri kümesinde uygulamalı olarak tüm ayrıntıları ile sunulmaktadır. Üçüncü bölüm ise ayrıcı kümeleme yöntemlerini açıklamakta ve örneklemektedir. Dördüncü bölümde kümeleme sonuçlarının görselleştirilmesi için kullanılan temel grafik türleri açıklanmıştır. Beşinci bölümde küme sayısının belirlenmesinde kullanılan ölçütler ve teknikler tanıtılmıştır. Altıncı bölümde R istatistiksel hesaplama ve grafik analiz yazılımının indirilmesi ve kurulması, R’de çalışma, R dilinin tanıtımı ve R fonksiyonlarına giriş yapılmıştır. Veri okuma ve önişleme örnekleri ise yedinci bölümde sunulmuştur. Sekizinci bölüm detaylı şekilde R ile birleştirici kümeleme; dokuzuncu bölüm ise R ile ayırıcı kümeleme analizini açıklamaktadır. Onuncu bölümde ileri düzeyde görselleştirme araçları ve grafik türleri sunulmaktadır. On birinci bölüm gen ifade profillerinin analizi ve gen keşfi çalışmalarında kullanılan teknik ve yöntemlerin üç gerçek veri kümesine uygulanması ve yorumlanmasını kapsamaktadır.

 

Bu kitap, daha önce R ile çalışmamış olanların birkaç gün içinde ileri düzeyde kümeleme analizi yapmalarını sağlayacak bir yaklaşımla yazılmıştır. Kitap, hem veri madenciliği ve istatistik konulu dersler için bir uygulama rehberi hem de biyoteknoloji ve biyoinformatik bilim dallarında çalışan araştırmacılar için bir başvuru eseri olacak şekilde tasarlanmıştır.



İÇİNDEKİLER

Önsöz 

İngilizce Türkçe Terimler Kılavuzu
Kısaltmalar


Kümeleme Analizine Giriş
Küme ve Kümeleme
Kümeleme Yöntemleri
Kümeleme Analizinin Aşamaları
Kümeleme Analizinin Uygulama Alanları
Hiyerarşik Kümeleme Yöntemleri
Birleştirici Kümeleme Yöntemleri 12
Örnek Veri ve Uzaklık Matrisinin Oluşturulması
Tek Bağlantı Yöntemi
Tam Bağlantı Yöntemi 23
Ortalama Bağlantı Yöntemi 29
Merkezci Yöntemler 33
Yöntemlerle İlgili Genel Özetleme 50
Ayırıcı Kümeleme Yöntemleri 52
Monotetik Ayırıcı Yöntemler 53
Politetik Ayırıcı Yöntemler 58
İleri Algoritmalar 64
Kümeleme Sonuçlarını Görselleştirme 66
Dendrogram (Ağaç Grafiği) 66
Afiş Grafik 68
Arapsaçı Grafiği 69
Korelasyon Grafikleri 70
Isı Haritaları 71
Küme Sayısının Belirlenmesi 73
Kofenetik Korelasyon Katsayısı 74
Birleşme Uzaklığındaki Değişim 76
Birleşme Katsayısı 76
Calinski ve Harabasz İndeksi 77
Sahte T2 İndeksi 77
Kübik Kümeleme Kriteri 78
Hata Kareler Ortalamasının Karekökü 78
Ortak Standart Sapma 79
R2 İstatistiği 80
Yarı Kısmi R2 İstatistiği 81
Diğer Ölçütler 82
R'nin Kurulması ve Çalıştırılması 86
R’nin İndirilmesi 87
R’nin Kurulması 90
R’de Çalışma 93
R Paketleri 96
R Betikleri 101
R ile Programlama 102
R Fonksiyonları 105
R’den Çıkma 110
Veri Kümeleri ve Veri Önişleme 113
Veri kümesi Oluşturma 113
Veri Kümeleri ve Önişleme 130
R'de Birleştirici Kümeleme Analizi 147
Uzaklık Matrisinin Oluşturulması 147
Kümeleme İşlemi 147
Dendrogram Çizme 150
Kümeler ve Küme Elemanlarının Belirlenmesi 153
Dendrogram Kesme 159
Küme Serpilme Grafiği 161
Esnek Beta ile Kümeleme 163
Kümeleme Sonuçlarının Karşılaştırılması 164
R'de Ayırıcı Kümeleme Analizi 181
Diana ile Ayırıcı Kümeleme Analizi 181
Mona ile Ayırıcı Kümeleme Analizi 188
Kümeleme Geçerlilik Testleri 191
İleri Görselleştirme Araçları 197
Hclust nesnesinin diğer nesnelere dönüştürülmesi 201
Dendextend ile grafik analiz 213
Isı haritaları 236
Mikrodizilerde Kümeleme Analizi 246
Akciğer Kanseri Verikümesi İle Analiz 246
Küçük Yuvarlak Mavi Hücre Tümörleri Verikümesi ile Analiz 256
Akut Lenfositik Lösemi Verikümesi İle Analiz 264
Kaynakça 275
Dizin 281
Biyografi 285


http://www.tdk.com.tr/images_buyuk/f67/Algoritma-Gelistirme-ve-Veri-Yap_5767_1.jpg



Mürekkep kokulu kitaplar; Papatya Bilim Yayınevi; farkımız kitaplarımızda...