Veri Madenciliği: Kavram ve Algoritmaları

Prof. Dr. Gökhan SİLAHTAROĞLU

 

 

 

 

 

 farkımız, kitaplarımızda...

ISBN: 978-975-6797-81-5,  4. Basım, Şubat 2020

320 sayfa, (16,5x24 cm2), 80 gr 1. hamur kağıt                        şimdi satın al


Bu eserde, hemen her disiplinde çeşitli amaçlar için kullanılan “veri madenciliği” konusu teknik açıdan incelenmiş ve alanında adı sıkça geçen algoritmalara ilişkin çözümlü örnekler verilmiştir. Bu amaçla veri madenciliği modelleri, sınıflandırma teknikleri, sınıflandırma algoritmaları, birliktelik kuralları, ilişki analizi ve kümeleme analizi gibi konular yalın bir dille ve örneklerle ele alınmıştır.

Kitabın oldukça genişletilmiş bu baskısında okuyucuya daha fazla örneklerle veri madenciliği algoritmaları anlatılmaya çalışılmıştır. Ayrıca, literatürde öne çıkan yeni yeni algoritmalar da ele alınmıştır. Destek Vektör Makineleri, Bulanık C- Ortalamalar algoritması gibi yeni algoritmalara yer verilirken, sınıflandırma algoritmalarının ve öğrenmenin denetimiyle ilgili kullanılan güncel algoritmalar da kitaba eklenmiştir; büyük veri kavramı ile veri bilimi içinde gerçekleştirilen yeni teknolojilerin veri analizdeki yeri de kitapta yerini almıştır.

Yapay Sinir Ağları, Genetik Algoritmalar, DBSCAN, BIRCH algoritmalarının nasıl çalıştığına dair sayısal örnekler eklenmiştir.

Bu baskıda, KNIME açık kaynak kodlu veri madenciliği yazılımı tanıtılmış ve örnek uygulamalar adım adım anlatılmıştır.



  Veri Madenciliği PDF indir                  şimdi satın al


İÇİNDEKİLER

Önsöz  

Bölüm 1.  Verİ Madencİlİğİ   

1.1.      Veri Madenciliğinin Uygulama Alanları   

1.2.      Veri Ambarları ve OLAP  19

1.3.      Büyük Veri                          23

1.3.1.   Büyük Veri Kullanımı     25

1.3.2.   Büyük Veri Türleri      27

1.3.3.   Uçtan uca Veri Analizi ve Teknolojileri             28

1.4.      Veri Madenciliği İçin Verilerin Hazırlanması          33

                      1.4.1.   Verilerin Temizlenmesi                          34

                   1.4.1.1.  Kayıp Veriler     34

                   1.4.1.2.  Verilerdeki Gürültünün Temizlenmesi 43

             1.4.2.   Verilerin Yeniden Yapılandırılması              45

                   1.4.2.1.  Normalizasyon  46

                   1.4.2.2.   Verilerde Boyut İndirgeme                   47

                   1.4.2.3.  Verilerde Dönüştürme İşlemleri            53

1.4.      Özet     58

1.5.      Sorular    58

 

Bölüm 2.  Verİ madencİlİğİ Modellerİ

2.1.      Değer Tahmini Modeli      62

2.2.      Bağlantı Analizi                 64

2.3.      Birliktelik Kuralları            64

2.4.      Örüntü Tanıma                  66

2.5.      Ardışık Zaman Örüntüleri     67

2.6.      Dolandırıcılık Tespiti        70

2.7.      Kümeleme Analizi             71

                   2.7.1.     Kümeleme Analizinin Kullanım Alanları 74

2.8.      Veri Madenciliği Model ve Algoritmalarına Genel Bakış   74

2.9.      Özet     76

2.10     Sorular    77

 

Bölüm 3.  Sınıflandırma TEKNİKLERİ VE ALGORİTMALARI

3.1.      Karar Ağaçları                    80

3.1.1.   ID3 Algoritması           86

3.1.2.   C 4.5 ve C5 Algoritmaları    92

3.1.3.   CART Algoritması      94

3.1.4.   SLIQ Algoritması        97

3.1.5.   SPRINT Algoritması   98

3.1.6.   Değişken Merkezli Karar Ağacı Algoritması   100

3.2.      İstatistiğe Dayalı Algoritmalar    109

      3.2.1.   Bayesyen Sınıflandırma  109

      3.2.2.   Regresyon            114

      3.2.3.   CHAID Algoritması     116

3.3.      Mesafeye Dayalı Sınıflandırma Algoritmaları    129

             3.3.1. K-En Yakın Komşu Algoritması 129

             3.3.2. En Küçük Mesafe Sınıflandırıcısı 130

      3.4.      Kolektif Öğrenme Kavramı ve Rasgele Ormanlar    133

3.5.      Yapay Sinir Ağları        135

            3.5.1.   İleri Sürümlü Yapay Sinir Ağları         139

                   3.5.2. Hata Geriye Yayma Yöntemi 143

3.6. Destek Vektör Makinesi      152

3.7. Sınıflandırmada Öğrenmenin Sınanması        156

3.7.1. Performans Ölçümü  157

3.8.      Sınıf Dengesizliği             161

3.8.1.   Dengesiz Veri Kümeleriyle Başa Çıkma Yöntemleri     161

3.9.      Özet   162

3.10.    Sorular  163

 

Bölüm 4.  Bİrlİktelİk Kuralları ve İlİşkİ Analİzİ

4.1.      AIS Algoritması         167

4.2.      SETM Algoritması      167

4.3.      Apriori Algoritması         168

4.4.      AprioriTid Algoritması   171

4.5.      Diğer Algoritmalar       172

4.6.      Weka Yazılımı         173

4.7.      Özet   178

4.8.      Sorular  179

 

Bölüm 5.  Kümeleme Analizi

     5.1.     Benzerlik ve  Uzaklık             182

     5.2.     Kümeleme Analizinin Sınıflandırılması             189

     5.3.     Hiyerarşik Yöntemler       189

     5.3.1.    SLINK Algoritması ve Tek Bağlantı Tekniği        190

     5.3.2.    CURE Algoritması          195

     5.3.3.    CHAMELEON Algoritması     195

     5.3.4.    BIRCH    201

     5.3.5.    Hiyerarşik Yöntemle Kategorik Verilerin Kümelenmesi (CLUCDUH)        203

     5.4.     Bölümlemeli Yöntemler        212

     5.4.1.    K-Ortalama (K-Means) Algoritması            213

     5.4.2.    PAM Algoritması        215

     5.4.3.    CLARA Algoritması       217

     5.4.4.    CLARANS Algoritması  217

     5.5.     Yoğunluğa Dayalı Algoritmalar     219

     5.5.1.    DBSCAN Algoritması     220

     5.5.2.    OPTICS Algoritması       224

     5.5.3.    DENCLUE Algoritması  226

     5.6.     Grid Temelli Algoritmalar      229

     5.6.1.    STING Algoritması         229

     5.6.2.    Dalga Kümeleme             231

     5.6.3.    CLIQUE Algoritması      233

     5.7.     Genetik Algoritmalar        233

     5.8.     Bulanık Algoritmalar             239

5.8.1. Xie Beni İndeks Değeri     242

5.8.2. Bölme Katsayısı               244

5.8.3. Bölme Entropi                   244

5.8.4. Bulanık Hipervolum        245

     5.9.     Optimum Küme Sayısının Hesaplanmasında İndeks ve Algoritma         246

     5.8.1.    Dunn Geçerlilik İndeksi  246

     5.8.2.    Davies-Bouldin Geçerlilik İndeksi       247

     5.8.3.    Silhouette Geçerlilik Yöntemi 250

     5.8.4.    C İndeksi                           251

     5.8.5.    Jaccard İndeksi                254

     5.9.     Özet     254

     5.10.   Sorular     255

 

     Bölüm 6.  KNIME Programı ve Kullanımı

 

    Ek 1.  Veri Madenciliği Alanında Geliştirilmiş Programlar

 

    Kaynakça

 

    Dizin        311

 

Tüm üniversite kitap ihtiyaçlarınız için www.TDK.com.tr

 

Konuyla ilgili kitaplar; üniversite ders kitapları:

Veri Madenciliği - Dr. Gökhan SİLAHTAROĞLU

Veri Madenciliği Yöntemleri - Dr. Yalçın ÖZKAN

Yapay Sinir Ağları - Prof. Dr. Ercan ÖZTEMEL

Bilgi Yönetimi ve Uygulamaları - Editör: Prof. Dr. Murat DİNÇMEN

Bilgi ve Bilginin Yönetimi - Editör: Prof. Dr. Sevinç GÜLSEÇEN

Bilgisayar Mühendisligine Giris - Editör: Dr. Rifat ÇÖLKESEN

Endüstri Mühendisligine Giris - Editör: Prof. Dr. Ercan ÖZTEMEL

Modern Sezgisel Teknikler ve Uygulamalar -

Elektronik Mühendisligine Giris Ortak Yazarli - Editör: Prof. Dr. Ali OKATAN ve Prof. Dr. Mahmut ÜN

Veritabanı ve Uygulamaları Yılmaz KAYA ve Ramazan TEKİN

Sistem Analizi ve Tasarımı - Prof.Dr. Oya KALIPSIZ ve ark.

Sistem Analizi ve Tasarımı - Dr. Gökhan SİLAHTAROĞLU

Yazılım Mühendisliği   - Dr.Erhan SARIDOĞAN

Veri Yapıları ve Algoritmalar  - Dr.Rifat ÇÖLKESEN

Veri Yapıları Algoritma Temelleri - Dr.Sefer KURNAZ

MATLAB Kılavuzu - Dr.Aslan INAN


Akademik bilimsel ve üniversite kitapları; bilişim ve bilgisayar kitapları