|
Veri Madenciliği: Teori, Uygulama ve Felsefesi Dr. İlker KÖSE Eitör: Prof. Dr. Gökhan SİLAHTAROĞLU
farkımız, kitaplarımızda...
ISBN: 978-605-9594-34-9, Nisan 2018 280 sayfa, (16,5x24 cm2), 80 gr 1. hamur kağıt | ||||
Veri üretiminin ivmelenen bir hızla arttığı modern dünyamızda veri madenciliği ve makine öğrenmesi en önemli çalışma alanları arasında yer alıyor. Bu kitabımızda, önce, veri madenciliği üzerine temel kavramlar açıklanmış; ardından da veri ön işleme, veri dönüştürme ve veri transferi gibi veri madenciliğinin tüm aşamaları ayrıntılı olarak ele alınmıştır. Kavramlar ve algoritmalar anlatılırken, okuyucunun ihtiyaç duyacağı düşünülen pek çok önemli bilgi “tasarımcıya not” olarak ayrıca belirtilmiş, bu sayede veri madenciliğinin felsefesinin daha iyi anlaşılması hedeflenmiştir. Ayrıca algoritmaların teorik gelişimi hem literatürdeki bilgiler ışığında ele alınmış; hem de özgün uygulama örnekleriyle okuyucunun pratik yapması sağlanmıştır. Uygulamalar için veri madenciliğinde giderek daha popüler hale gelen KNIME aracı kullanılmıştır. Diğer bir yaygın veri madenciliği aracı olan WEKA aracındaki algoritmaları da içinde barındırabilen KNIME ile kitaptaki her algoritma için örnekler yer almaktadır. KNIME ile ilgili kurulum ve konfigürasyon bilgileri de ayrı bir bölümde ayrıntılı olarak sunulmuştur. Kitabımızın üniversitelerde ders kitabı olarak kullanılmaya da uygun olabilmesi için ders/öğrenim çıktıları belirtilmiş, ders sunumları ve uygulama örnekleri paylaşılmıştır. Tüm bu özellikleriyle elinizdeki bu kitap, sadece öğrenci ve profesyonel veri madencilerine değil; araştırmacılara da hitap eden ve alanındaki kapsamlı kaynaklardan birisidir. Veri Madenciliği PDF indir şimdi satın al İÇİNDEKİLER Önsöz Bölüm 1. Giriş Kitap Hakkında 1.1. Kitap Kimler İçin? 13 1.2. Hedeflenen Öğrenme Çıktıları 13 1.3. Tercih Edilen Teknik Dil 14 1.4. Teknolojik Kavramların Evrimi 15 1.5. Tümevarım ve Tümdengelim İkilemi 16 1.6. Veri Madenciliği Araçları 17 1.7. Örneklerde İzlenen Yöntem 18 Bölüm 2. Ön Bilgiler Kavramlar 2.1. Veri19 2.2. Veri Türleri 21 2.3. Veritabanı 23 2.3.1. Varlık 24 2.3.2. Nitelik 27 2.3.3. İlişki 28 2.3.4. İlişkisel Tutarlılık 31 2.3.5. Normalizasyon 31 2.4. Veri Ambarı 37 2.4.1. Neden Veri Ambarı? 37 2.4.2. Veri Ambarı ve Veri Mağazaları 38 2.4.3. OLTP ve OLAP 40 2.4.4. Veri Ambarı ve Veri Mağazası Modelleri 40 2.4.5. ETL 44 2.7. Veri Madenciliği ve İstatistik 49 2.7. Karar Destek Sistemi ve İş Zekâsı50 2.8.1. Hacim 51 2.8.2. Hız 53 2.8.4. Geçerlilik 53 2.8.5. Değişkenlik 53 2.8.6. Değer 54 2.9. Özet 54 2.10. Çalışma Soruları 55 Bölüm 3. KNIME Aracı Giriş 3.1. Kurulum 59 3.2. KNIME Çalışma Ortamı 60 3.2.1. Çalışma Ortamı Bileşenleri 61 3.2.2. KNIME İş Akışları ve İş Akışı Grupları 61 3.2.3. İş Akışlarının İçeriye/Dışarıya Aktarılması 63 3.2.4. Düğümler ve Meta Düğümler 65 3.2.5. İş Akışını Çalıştırmak 70 3.3.1. KNIME Eklentilerinin Yüklenmesi 72 3.4. KNIME’a Weka Kütüphanelerinin Yüklenmesi 73 Bölüm 4. Veri Madenciliği Süreci 4.1. Gerçek Hayat Problemleri ve Veri Madenciliği 75 4.1.1. Veri Madenciliği Sayılmayan Uygulamalar 75 4.1.2. Ne Zaman Veri Madenciliği Yaparız? 77 4.1.3. Bazı Gerçek Hayat Problemleri ve Veri Madenciliği 77 4.2. Neden Bir Sürece İhtiyacımız Var? 81 4.3. Veri Madenciliği Sürecinin Temel Adımları82 4.4.1. Nitelik Seçimi Neden Önemlidir? 83 4.4.3. Veri Kaynaklarımız Neler Olabilir? 84 4.4.4. Nitelik Seçimi Nasıl Yapılır?84 4.4.5. Uzman Görüşü İle Nitelik Seçimi 85 4.4.6. Fazlalık Niteliklerin Nitelik Vektöründen Çıkartılması 88 4.4.7. İlgisiz Niteliklerin Nitelik Vektöründen Çıkartılması 90 4.5. Veri Ön işleme 95 4.5.1. Neden Veri Ön İşleme Yapılır? 95 4.5.2. Veri Kalite Kriterleri 97 4.5.5. Veri Ayrıklaştırma ve Kavram Hiyerarşisi Oluşturma 111 4.5.6. Veri Ön İşleme İş Akışı ve Karşılaşılan Problemler 113 4.6. Veri Dönüştürme 115 4.6.1. Neden Veri Dönüştürme Yapılır? 115 4.6.2. Min-Maks Normalizasyonu 116 4.6.3. Z-Skor Normalizasyonu 117 4.6.4. Ondalık Esaslı Normalizasyonu 117 4.6.7. Toparlama 121 4.7. Veri Madenciliği - Hangi Yöntem? 125 4.7.2. Birliktelik Kuralı Analizi 126 4.8. Sonuçların Değerlendirilmesi (Evaluation) 129 4.9. Özet 130 Bölüm 5. Tanımlayıcı Analiz Yöntemleri 5.1.2. Küme Analizinin Temel Mantığı 136 5.1.3. Benzerlik ve Uzaklık 137 5.1.4. Küme Analizi Yöntemleri 140 5.1.5. Doğru Kümeleme Yöntemi Seçimi İçin İpuçları143 5.2. SLINK Algoritması 144 5.3. k-Ortalamalar Algoritması 150 5.5. Beklenti Maksimizasyonu Algoritması 168 5.6. Bölüm Sonu Değerlendirmeler 181 5.7. Özet182 5.8. Çalışma Soruları 183 Bölüm 6. Birliktelik Kuralları ve İlişki Analizi 6.1. Birliktelik Kuralı Öğrenme 185 6.1.1. Destek 187 6.1.2. Güven 188 6.1.3. İlgi 188 6.1.4. Kanaat 188 6.2. SETM (Set-Oriented Mining) Algoritması 190 6.3. Apriori ve AprioriTid Algoritmaları 194 6.4. Özet202 6.5. Çalışma Soruları 203 Bölüm 7. Tahminsel Analiz Yöntemleri 7.1. Giriş 205 7.2. Karar Ağaçları ile Sınıflama 207 7.2.1. Karar Ağaçlarında Belirsizliğin ve Bilgi Kazancının Ölçümü 207 7.2.2. Karar Ağaçlarında Bölümleme Sayısı ve Yönetimi 216 7.2.3. Öğrenme Verisi ve Test Verisi Problemleri 218 7.2.4. Veri Fragmantasyonu 220 7.2.5. Yetersiz Öğrenme ve Aşırı Öğrenme 222 7.2.6. Karar Ağacını Budamak 225 7.3. Karar Ağacı Algoritmaları 226 7.3.1. ID3 Algoritması 226 7.3.2. C4.5 Algoritması 232 7.3.3. SPRINT Algoritması 236 7.3.4. CART Algoritması 237 7.4.3. Sade Bayes Sınıflayıcısı 248 7.5. Özet 250 Bölüm 8. Sonuçların Değerlendirilmesi 8.1. Giriş253 8.2. Doğruluk 254 8.3. Hassasiyet, Kesinlik ve Hatalı Pozitif Oranı 255 8.4. Eğri Altı Alan (AUC - Area Under Curve) 258 8.5. Kıyaslama 258 8.6. Maliyet Etkinlik 260 8.7. Özet262 8.8. Çalışma Soruları 263 Kaynakça Dizi
Konuyla ilgili kitaplar; üniversite ders kitapları: Veri Madenciliği Veri Madenciliği Yöntemleri
Yapay Sinir Ağları
Bilgi Yönetimi ve Uygulamaları
Bilgi ve Bilginin Yönetimi Bilgisayar Mühendisligine Giris Endüstri Mühendisligine Giris Modern Sezgisel Teknikler ve Uygulamalar Elektronik Mühendisligine Giris Veritabanı ve Uygulamaları Yazılım Mühendisliği Veri Yapıları ve Algoritmalar MATLAB Kılavuzu |