Veri Madenciliği: Teori, Uygulama ve Felsefesi

Dr. İlker KÖSE

Eitör: Prof. Dr. Gökhan SİLAHTAROĞLU

 

 farkımız, kitaplarımızda...

 

 

 

 

 

ISBN: 978-605-9594-34-9, Nisan 2018

280 sayfa, (16,5x24 cm2), 80 gr 1. hamur kağıt 


Veri üretiminin ivmelenen bir hızla arttığı modern dünyamızda veri madenciliği ve makine öğrenmesi en önemli çalışma alanları arasında yer alıyor. Bu kitabımızda, önce, veri madenciliği üzerine temel kavramlar açıklanmış; ardından da veri ön işleme, veri dönüştürme ve veri transferi gibi veri madenciliğinin tüm aşamaları ayrıntılı olarak ele alınmıştır. Kavramlar ve algoritmalar anlatılırken, okuyucunun ihtiyaç duyacağı düşünülen pek çok önemli bilgi “tasarımcıya not” olarak ayrıca belirtilmiş, bu sayede veri madenciliğinin felsefesinin daha iyi anlaşılması hedeflenmiştir. Ayrıca algoritmaların teorik gelişimi hem literatürdeki bilgiler ışığında ele alınmış; hem de özgün uygulama örnekleriyle okuyucunun pratik yapması sağlanmıştır.

Uygulamalar için veri madenciliğinde giderek daha popüler hale gelen KNIME aracı kullanılmıştır. Diğer bir yaygın veri madenciliği aracı olan WEKA aracındaki algoritmaları da içinde barındırabilen KNIME ile kitaptaki her algoritma için örnekler yer almaktadır. KNIME ile ilgili kurulum ve konfigürasyon bilgileri de ayrı bir bölümde ayrıntılı olarak sunulmuştur.

Kitabımızın üniversitelerde ders kitabı olarak kullanılmaya da uygun olabilmesi için ders/öğrenim çıktıları belirtilmiş, ders sunumları ve uygulama örnekleri paylaşılmıştır. Tüm bu özellikleriyle elinizdeki bu kitap, sadece öğrenci ve profesyonel veri madencilerine değil; araştırmacılara da hitap eden ve alanındaki kapsamlı kaynaklardan birisidir.



  Veri Madenciliği PDF indir    şimdi satın al


İÇİNDEKİLER

Önsöz

Bölüm 1. Giriş Kitap Hakkında

1.1.  Kitap Kimler İçin?       13

1.2.  Hedeflenen Öğrenme Çıktıları     13

1.3.  Tercih Edilen Teknik Dil            14

1.4.  Teknolojik Kavramların Evrimi   15

1.5.  Tümevarım ve Tümdengelim İkilemi         16

1.6.  Veri Madenciliği Araçları           17

1.7.  Örneklerde İzlenen Yöntem        18

Bölüm 2. Ön Bilgiler Kavramlar

2.1.  Veri19

2.2.  Veri Türleri   21

2.3.  Veritabanı     23

2.3.1.  Varlık   24

2.3.2.  Nitelik  27

2.3.3.  İlişki     28

2.3.4.  İlişkisel Tutarlılık 31

2.3.5.  Normalizasyon     31

2.4.  Veri Ambarı  37

2.4.1.  Neden Veri Ambarı?           37

2.4.2.  Veri Ambarı ve Veri Mağazaları        38

2.4.3.  OLTP ve OLAP   40

2.4.4.  Veri Ambarı ve Veri Mağazası Modelleri          40

2.4.5.  ETL           44

2.5.  İstatistik        46

2.6.  Veri Madenciliği          48

2.7.  Veri Madenciliği ve İstatistik      49

2.7.  Karar Destek Sistemi ve İş Zekâsı50

2.8.  Büyük Veri   51

2.8.1.  Hacim   51

2.8.2.  Hız       53

2.8.3.  Çeşitlilik             53

2.8.4.  Geçerlilik            53

2.8.5.  Değişkenlik         53

2.8.6.  Değer    54

2.9.  Özet      54

2.10. Çalışma Soruları         55

Bölüm 3.  KNIME Aracı Giriş

3.1.  Kurulum       59

3.2.  KNIME Çalışma Ortamı             60

3.2.1.  Çalışma Ortamı Bileşenleri  61

3.2.2.  KNIME İş Akışları ve İş Akışı Grupları            61

3.2.3.  İş Akışlarının İçeriye/Dışarıya Aktarılması        63

3.2.4. Düğümler  ve Meta Düğümler           65

3.2.5. İş Akışını Çalıştırmak         70

3.2.6. Uyarılar71

3.3.  Hazır KNIME Örnekleri             71

3.3.1. KNIME Eklentilerinin Yüklenmesi    72

3.4.  KNIME’a Weka Kütüphanelerinin Yüklenmesi         73

3.5.  Yardımcı Kaynaklar     74

Bölüm 4. Veri Madenciliği Süreci

4.1.  Gerçek Hayat Problemleri ve Veri Madenciliği         75

4.1.1.  Veri Madenciliği Sayılmayan Uygulamalar       75

4.1.2. Ne Zaman Veri Madenciliği Yaparız? 77

4.1.3. Bazı Gerçek Hayat Problemleri ve Veri Madenciliği        77

4.2.  Neden Bir Sürece İhtiyacımız Var?            81

4.3.  Veri Madenciliği Sürecinin Temel Adımları82

4.4.  Nitelik Seçimi             83

4.4.1. Nitelik Seçimi Neden Önemlidir?       83

4.4.2. Nitelik Vektörü     83

4.4.3. Veri Kaynaklarımız Neler Olabilir?     84

4.4.4. Nitelik Seçimi Nasıl Yapılır?84

4.4.5. Uzman Görüşü İle Nitelik Seçimi       85

4.4.6.  Fazlalık Niteliklerin Nitelik Vektöründen Çıkartılması     88

4.4.7.  İlgisiz Niteliklerin Nitelik Vektöründen Çıkartılması        90

4.5.  Veri Ön işleme            95

4.5.1. Neden Veri Ön İşleme Yapılır?          95

4.5.2. Veri Kalite Kriterleri          97

4.5.3. Veri Temizleme   99

4.5.4. Veri İndirgeme    108

4.5.5. Veri Ayrıklaştırma ve Kavram Hiyerarşisi Oluşturma       111

4.5.6. Veri Ön İşleme İş Akışı ve Karşılaşılan Problemler          113

4.6.  Veri Dönüştürme         115

4.6.1. Neden Veri Dönüştürme Yapılır?       115

4.6.2. Min-Maks Normalizasyonu 116

4.6.3. Z-Skor Normalizasyonu      117

4.6.4. Ondalık Esaslı Normalizasyonu         117

4.6.5. Nitelik Oluşturma119

4.6.6. Genelleştirme      121

4.6.7. Toparlama           121

4.7.  Veri Madenciliği - Hangi Yöntem?            125

4.7.1. Küme Analizi      125

4.7.2. Birliktelik Kuralı Analizi    126

4.7.3. Sınıflama Analizi 127

4.7.4. Hibrit Yöntemler 129

4.8.  Sonuçların Değerlendirilmesi (Evaluation) 129

4.9.  Özet      130

4.10. Çalışma Soruları         131

Bölüm 5. Tanımlayıcı Analiz Yöntemleri

5.1.  Küme Analizi135

5.1.1. Kümelemenin Amacı          135

5.1.2. Küme Analizinin Temel Mantığı        136

5.1.3. Benzerlik ve Uzaklık          137

5.1.4. Küme Analizi Yöntemleri   140

5.1.5. Doğru Kümeleme Yöntemi Seçimi İçin İpuçları143

5.2. SLINK Algoritması       144

5.3. k-Ortalamalar Algoritması           150

5.4. DBSCAN Algoritması   154

5.5. Beklenti Maksimizasyonu Algoritması         168

5.6. Bölüm Sonu Değerlendirmeler     181

5.7. Özet182

5.8. Çalışma Soruları           183

Bölüm 6. Birliktelik Kuralları ve İlişki Analizi

6.1.  Birliktelik Kuralı Öğrenme         185

6.1.1. Destek  187

6.1.2. Güven   188

6.1.3. İlgi       188

6.1.4. Kanaat  188

6.2. SETM (Set-Oriented Mining) Algoritması   190

6.3. Apriori ve AprioriTid Algoritmaları           194

6.4. Özet202

6.5. Çalışma Soruları           203

Bölüm 7. Tahminsel Analiz Yöntemleri

7.1.  Giriş      205

7.2.  Karar Ağaçları ile Sınıflama       207

7.2.1. Karar Ağaçlarında Belirsizliğin ve Bilgi Kazancının Ölçümü          207

7.2.2. Karar Ağaçlarında Bölümleme Sayısı ve Yönetimi           216

7.2.3. Öğrenme Verisi ve Test Verisi Problemleri       218

7.2.4. Veri Fragmantasyonu         220

7.2.5. Yetersiz Öğrenme ve Aşırı Öğrenme  222

7.2.6. Karar Ağacını Budamak      225

7.3.  Karar Ağacı Algoritmaları          226

7.3.1. ID3 Algoritması   226

7.3.2. C4.5 Algoritması 232

7.3.3. SPRINT Algoritması          236

7.3.4. CART Algoritması             237

7.4.  Bayes İle Sınıflama      244

7.4.1. Koşullu Olasılık   244

7.4.2. Bayes Teoremi     245

7.4.3. Sade Bayes Sınıflayıcısı      248

7.5.  Özet      250

7.6.  Çalışma Soruları          251

Bölüm 8. Sonuçların Değerlendirilmesi

8.1. Giriş253

8.2. Doğruluk       254

8.3. Hassasiyet, Kesinlik ve Hatalı Pozitif Oranı 255

8.4. Eğri Altı Alan (AUC - Area Under Curve)  258

8.5. Kıyaslama      258

8.6. Maliyet Etkinlik           260

8.7. Özet262

8.8. Çalışma Soruları           263

Kaynakça

Dizi

 

Tüm üniversite kitap ihtiyaçlarınız için www.TDK.com.tr

 

Konuyla ilgili kitaplar; üniversite ders kitapları:

Veri Madenciliği - Dr. Gökhan SİLAHTAROĞLU

Veri Madenciliği Yöntemleri - Dr. Yalçın ÖZKAN

Yapay Sinir Ağları - Prof. Dr. Ercan ÖZTEMEL

Bilgi Yönetimi ve Uygulamaları - Editör: Prof. Dr. Murat DİNÇMEN

Bilgi ve Bilginin Yönetimi - Editör: Prof. Dr. Sevinç GÜLSEÇEN

Bilgisayar Mühendisligine Giris - Editör: Dr. Rifat ÇÖLKESEN

Endüstri Mühendisligine Giris - Editör: Prof. Dr. Ercan ÖZTEMEL

Modern Sezgisel Teknikler ve Uygulamalar -

Elektronik Mühendisligine Giris Ortak Yazarli - Editör: Prof. Dr. Ali OKATAN ve Prof. Dr. Mahmut ÜN

Veritabanı ve Uygulamaları Yılmaz KAYA ve Ramazan TEKİN

Sistem Analizi ve Tasarımı - Prof.Dr. Oya KALIPSIZ ve ark.

Sistem Analizi ve Tasarımı - Dr. Gökhan SİLAHTAROĞLU

Yazılım Mühendisliği   - Dr.Erhan SARIDOĞAN

Veri Yapıları ve Algoritmalar  - Dr.Rifat ÇÖLKESEN

Veri Yapıları Algoritma Temelleri - Dr.Sefer KURNAZ

MATLAB Kılavuzu - Dr.Aslan INAN


Akademik bilimsel ve üniversite kitapları; bilişim ve bilgisayar kitapları