DATA Veri Madenciliği Veri Analizi

Prof. Dr. Haldun AKPINAR

 

Farkımız, kitaplarımızda  Papatya Bilim

 

 

 

 

 

Genişletilmiş 2. Basım

ISBN: 978-605-4220-81-6

532 sayfa, (16,5 x24 cm2), 80 gr 1. hamur kağıt


Kitabın içeriği yazarın özellikle veri tabanı yönetim sistemleri, yapay zekâ, karar destek sistemleri, coğrafi enformasyon sistemleri, çok değişkenli istatistik analiz ve enformasyon sistemleri disiplinlerindeki bilgi birikiminin, veri analizi ve veri madenciliği alanlarına harmanlanmış yansımasıdır.

Bu kitap karar destek sürecini temel alarak, veriden bilgiye giden yolun keşfedilmesini amaçlayan bir rehber niteliğindedir. Verinin edinimi, saklanması ve ön işleme aşamalarının tamamen güncel teknolojiler dikkate alınarak anlatıldığı kitapta, büyük veriyi bilgiye dönüştürebilecek veri madenciliği yöntemlerinin önemli bir kısmı okuyucu ile paylaşılmaktadır.

Derin Öğrenme, Convolutional Yapay Sinir Ağları, Örüntü Madenciliği, Lineer ve Lojistik Regresyon Analizleri, Algoritmik Geometri, ROC Eğrisi gibi konular kitabın yeni baskısında işlenmiştir.

Yedi bölümden oluşan kitapta, bilgiye giden yolda verinin aşama aşama bilgiye doğru yükselişini takip edebilirsiniz. Yedi engeli geçtiğinizde, veri madenciliği ve veri analizinin kapılarını aralamış olacaksınız.

-------------------------------

Enformasyon Teknolojileri dünyasındaki olağanüstü gelişmeler, doğal olarak zaman içerisinde aşama aşama diğer disiplinleri de etkilemeye başlamıştır. Basit istatistik analiz teknikleri, süratle yerlerini çok değişkenli ve karmaşık tekniklere bırakırken, yapay zekâ araştırmaları olağanüstü bir süratle gelişmiş, Kasparov ile satranç oynayan Deep Blue, Jeopardy’de IBM Watson insanları şaşkına çeviren düzeylere erişmiştir. Son olarak muhteşem bilim adamı Alan Turing’in, Turing Testi’nin de gerçekleştiği bu ay içinde gazetelerde yer bulmuştur.

Data (Veri) kavramı giderek önemini artırmış ve data ile başlayan kavramlarda olağanüstü bir artış ortaya çıkmıştır. İlk dönemlerdeki işletmelerin itici gücü, yerini giderek genetik çalışmalardaki olağanüstü veri analizi ihtiyacına bırakmıştır. Bir taraftan veri saklama ve erişimi için yeni teknolojiler devreye girerken, bu veri dizilerinin analizi yeni algoritmaların geliştirilmesini gerekli kılmıştır. Çeşitli disiplinlerle gerçekleşen arakesitler ve uygulama ihtiyaçları yeni yaklaşımların ortaya çıkmasına neden olmuştur.

Veri madenciliği birçok disiplinin katkılarıyla inşa edilmiş yığma bir yapıdır. Bu yapıda taşıyıcı birimler yapay zekâ, veri tabanı yönetim sistemleri, özellikle çok değişkenli istatistik analiz teknikleridir. Son dönemde bu disiplinlere uygulama alanlarındaki gelişmelerle birlikte her geçen gün yeni disiplinler katılmaktadır. Kitapta bu disiplinlere ilişkin bir takım özet bilgilere yer verilmişse de, okuyucunun enformasyon sistemleri ve teknolojileri, yapay zekâ, veri tabanları ve istatistik alanlarında bilgi sahibi olması kaçınılmazdır.

Bu kitap hem profesyoneller için hem de üniversitelerde verilen "veri madenciliği", "veri analizi" gibi dersler için önemli bir kaynak niteliğindedir.



  Veri Madenciliği PDF indir                  şimdi satın al


İÇİNDEKİLER (2. Basım)

Önsöz

Teşekkür

Geçmiş Zaman Olur ki

BÖLÜM 1 . Data

1.1. Scientia Potestas Est

1.2. Ölçmek ya da Ölçememek

1.3. Ölçü Skalası

1.3.1. Nominal (isimsel) Skala

1.3.2. Ordinal (sıralı) Skala

1.3.3. Interval (aralıklı) Skala

1.3.4. Ratio (oransal) Skala

1.4. Veri Yönetimi

1.5. Örnek Veri Dizileri

1.5.1. Iris / Süsen Çiçeği

1.5.2. Karaciğer Verisi

1.5.3. Bilgisayar Alımı

1.6. Veri Gösterimi

1.7. Veri Saklama Ortamları

1.8. Veri Saklama Yönetimi

1.9. Veri Betimleme

1.10. Görselleştirme

1.10.1. Çizgi, Sütun Grafiği ve Histogram

1.10.2. Box-Whisker Çizimi

1.10.3. Serpilme Çizimleri

1.10.4. Serpilme Matris Çizimi

1.10.5. Survey Plot

1.10.6. Paralel Koordinatlar

1.10.7. Yüzey, Eşyükselti ve Gofret Grafikleri

1.10.8. Chernoff Yüzleri

1.11. Coğrafi Görselleştirme Uygulaması

 

BÖLÜM 2 . Veri Madenciliği

2.1. Veri Analizi  1

2.2. Yapay Zekâ

2.2.1. Durum Uzayını Arama

Su Testisi Problemi

Köprüden Nasıl Geçmeli 

Tic-Tac-Toe

2.2.2. Heuristic Arama 

A* Heuristic Algoritması 

Tepe Tırmanma Algoritması

2.3. Veri Madenciliği Modelleri

2.3.1. Sınıflandırma 

2.3.2. Kümeleme   

2.3.3. Örüntü Madenciliği   

2.4. Veri Madenciliği Süreci

2.4.1. CRISP-DM Süreç Modeli   

2.4.2. Semma Süreci – SAS

2.4.3. Süreç Önerisi

 

BÖLÜM 3. Veri Ön İşleme

3.1. Veri Kalitesi

3.2. Veri Ön İşleme

3.3. Veri Entegrasyonu

3.3.1. Veri Konsolidasyonu

ETL Süreci, ELT Süreci

3.3.2. Veri Yayınımı / Federasyonu

3.4. Veri Temizleme

3.4.1. Veri Tutarsızlıklarının Saptanması

3.4.2. Gramer İncelemesi

3.4.3. Çifte Kayıtların Ayıklanması    

3.4.4. Temizlenmiş Verinin Bakımı    

3.4.5. Sanal Entegrasyonda Veri Temizleme     

3.4.6. Veride Parazit Azaltımı 

Veri Dilimleme    

Görüntü İşlemede Dilimleme 

Veri Perdahlama   

3.5. Eksik Verinin Tamamlanması

3.5.1. Eksik Veri Örüntüsünün Betimlenmesi    

3.5.2. Eksik Verinin Tesadüfilik Düzeyinin Belirlenmesi    

Tamamen Tesadüfi Eksiklik

Tesadüfi Eksiklik

Tesadüfi Olmayan Eksiklik 

Tesadüfilik Sınıfının Belirlenmesi 

3.5.3. Eksik Verinin Giderilmesi 

Silme Yöntemleri  

Tam Gözlem Yöntemi 

Mevcut Gözlem Yöntemi

Tekli Atama Yöntemleri

Aritmetik Ortalama Değeri ile Tamamlama

Medyan Değeri ile Tamamlama

Tanımlanan Sayıda Komşunun Aritmetik

Ortalaması / Medyan Değeri ile Tamamlama

Model Temelli Yöntemler

Maksimum Olabilirlik

Beklenti-Maksimizasyon Yöntemi

Markov Zinciri Monte Carlo Yöntemi

3.6. Sıra Dışı Değer Analizi

3.6.1. Tek Değişkenli Veri Dizilerinde

Standart Sapma Kullanımı

Kartiller Arası Uzaklık

Dean Dixon Q Testi

3.6.2. Çok Değişkenli Veri Dizilerinde

3.7. Veri Dönüştürme 

3.7.1. Veri Normalleştirme / Veri Standardizasyonu

z-Skor Normalleştirmesi

[0,1] Aralığında Normalleştirme 

[-1,1] Aralığında Normalleştirme  

10 Tabanına Göre Logaritma 

Aritmetik Ortalamanın 1 Olduğu Normalleştirme

Standart Sapmanın 1 Olduğu Normalleştirme

3.7.2. Sürekli Veri Dizisi Değerlerinin Kategorik Değerlere Dönüştürülmesi

3.7.3. Nominal Veri Dizisi Değerleri için Kavram Hiyerarşisi

3.8. Veri İndirgeme

3.8.1. Öznitelik / Boyut Sayısının Azaltılması

3.8.2. Öznitelik Alt Dizisi Seçimi 

Paketleyici Yöntemler

Filtre Kullanan Yöntemler

Gömülü Yöntemler

Weka Uygulaması

3.9. Faktör Analizi

3.9.1. Korelasyon / Kovaryans Matrisi

3.9.2. Barttlett Küresellik Testi  

3.9.3. Anti-Image Korelasyon Matrisi

3.9.4. Faktör Çıkartımı

3.9.5. Faktör Yüklemeleri

3.9.6. Faktör Rotasyonu

3.10. Örnekleme

3.11. ROC Eğrisi

 

BÖLÜM 4 . Uzaklık ve Benzerlik Ölçüleri

4.1. Uzaklık ve Benzerlik Ölçüleri

4.2. Uzaklık Ölçüleri

4.2.1. Aralık Ölçek için Uzaklık Ölçüleri

Euclid ve Kareli Euclid Uzaklık Ölçüleri

Minkowski Uzaklığı

Chebyshev Uzaklığı

Manhattan Uzaklığı 

Mahalanobis Uzaklığı

4.2.2. Frekans Uzaklık Ölçüleri

4.2.3. İkil Veri için Uzaklık Ölçüleri

4.3. Benzerlik Ölçüleri

4.3.1. Aralık Ölçek için Benzerlik Ölçüleri

Pearson Korelasyonu

Kosinüs Benzerliği

Karakter Dizisi Karşılaştırması

4.3.2. İkil Veri için Benzerlik Ölçüleri

4.4. Uzaklık ve Benzerlik Ölçüleri Yeterli midir?

 

BÖLÜM 5 . Örüntü Madenciliği

5.1. Giriş

5.2. Sıklık Örüntüleri Madenciliği

5.3. Sıklık Örüntüleri Algoritmaları

5.3.1. Apriori Algoritması

5.3.2. FP-Growth Algoritması

5.3.3. Eclat Algoritması

5.4. Birliktelik Kurallarının Üretimi

5.5. Ardışık Zamanlı Örüntüler

5.6. Diğer Örüntü Tipleri

 

BÖLÜM 6 . Sınıflandırma

6.1. Giriş    

6.2. Lineer Diskriminanz Analizi    

6.2.1. Diskriminanz Analizi Süreci   

6.2.2. Kanonik Diskriminanz Fonksiyonu Katsayıları

6.2.3. Sonuçların Değerlendirilmesi  

6.3. Karar Ağacı Öğrenimi    

6.3.1. Karar Ağaçları

6.3.2. Karar Ağaçlarından Karar Ağacı Öğrenimine   

6.3.3. En İyi Bölen Özniteliğin Seçilmesi    

Entropi Endeksi     

Gini Endeksi    

Sınıflandırma Hatası Endeksi    

6.3.4. Budama Süreci   

6.3.5. Karar Ağacı Algoritmaları    

CLS Ailesi  

AID Ailesi  

CART   

QUEST

6.3.6. Karar Ağaçlarının Doğruluğunun Test Edilmesi

Ensemble Öğrenim

REPTree

RandomTree

DecisionStump

RandomForest

NBTree

6.3.7. Kullanılan Yazılımlar

6.4. k-En Yakın Komşu Algoritması

6.5. Regresyon Analizi

6.5.1. Kovaryans ve Pearson Korelasyon Katsayısı

6.5.2. Lineer Regresyon Analizi

6.5.3. Lojistik Regresyon Analizi

6.6. Destek Vektör Makineleri

6.6.1. Lineer Sınıflandırma 

6.6.2. Lineer Olmayan Sınıflandırma

I. Tip Problemler – Aylak Değişken Kullanımı

II. Tip Problemler – Kernel Trick Kullanımı

6.7. Yapay Sinir Ağları

6.7.1. Temel Sinir Fizyolojisi

6.7.2. Biyolojik Sinir Hücrelerinden Yapay Sinir Ağlarına

6.7.3. Yapay Sinir Ağı Araştırmalarının Gelişimi

McCulloch-Pitts Modeli

Hebbian Öğrenimi

Perceptron

Perceptron Kuramının Yıkılışı

Duraklama Dönemi

Adaline

Duraklama Döneminde Gerçekleştirilen

Diğer Araştırmalar

Yapay Sinir Ağlarının Yeniden Doğuşu

6.7.4. Geriye Yayınım Ağları

Genelleştirilmiş Delta Kuralı

GY Ağlarının Kullanımında Karşılaşılan Sorunlar

Eğitim Verisinin Seçilmesi

Kurulacak Ağın Boyutlarının Belirlenmesi

Başlangıç Ağırlık Değerlerinin ve

Öğrenme Parametresinin Belirlenmesi

Ağırlık Matris Değerlerinin Hesaplanması

Örnek Uygulama

6.7.5. Yapay Sinir Ağı Modellerinin Sınıflandırılması

İleri Beslemeli

Radyal Temelli Fonksiyonlar

Kendini Düzenleyen Haritalar

Modüler Yapay Sinir Ağları

Learning Vector Quantization

6.7.6. Derin Öğrenme

Derin Öğrenmede Önemli Kilometre Taşları ve

Temel Kavramlar 

Derin Öğrenme Yazılımları

6.7.7. Convolutional Yapay Sinir Ağları

Convolution + ReLU

Birleştirme

Sınıflandırma

Hata Azaltma

ConvNet Genel Öğrenim Süreci

Görüntü Tanıma Algoritmaları İçin Veri Tabanları

 

BÖLÜM 7. Kümeleme Algoritmaları

7.1. Giriş

7.1.1. Biyoloji, Hesapsal Biyoloji ve Biyoenformatik

7.1.2. Tıp

7.1.3. İşletme

7.1.4. Enformatik 

7.1.5. Astronomi  

7.1.6. Antropometri 

7.1.7. Schelling’in Segregation Modeli

7.1.8. Görüntü Renklendirme ve İşleme

7.1.9. Mekânsal Veri Madenciliği

7.2. Kümeleme Algoritmalarının Sınıflandırılması

7.3. Hiyerarşik Küme Analizi

7.3.1. Tekli Bağlantı / En Yakın Komşu Yöntemi

7.3.2. Tam Bağlantı / En Uzak Komşu Yöntemi  

7.3.3. Aritmetik Ortalamalı Bağlantı / Gruplar Arası Bağlantı 

7.3.4. Merkezi Bağlantı

7.3.5. Medyan Bağlantı

7.3.6. Ward Bağlantısı

7.3.7. Lance & Williams Yöntemi

7.3.8. Bağlantı Yöntemlerinin Karşılaştırılması

7.4. Bölümleyici Küme Analizi  

7.4.1. k-means Algoritması  

7.4.2. Siluet Katsayısı

7.4.3. k-medoids Algoritması   

7.4.4. k-modes Algoritması  

7.4.5. k-median Algoritması 

7.4.6. k-means++ Algoritması

7.4.7. Canopy Kümeleme Algoritması

7.5. Hiyerarşik Temelli Küme Analizi Algoritmaları   

7.5.1. BIRCH

Küme içi Homojenlik Ölçüleri

Kümeler Arası Heterojenlik Ölçütleri  

Kümeleme Özelliği 

Kümeleme Özelliği Ağacı

BIRCH Algoritmasının Temel Yapısı

Yazılım

Log-Likelihood Uzaklık Ölçüsü 

7.5.2. CURE

Tesadüfi Örnekleme  

Örnek Kütlenin Kümelenmesi

Sıra Dışı Değerlerin Giderilmesi 

Ana Kütlenin Kümelere Atanması 

7.5.3. ROCK

Komşuluk

Link

7.5.4. Chameleon

Veri Dizilerinden Seyrek Bir Çizgenin

Yapılandırılması

Çizgenin Alt Kümelere Ayrılması

Alt Kümelerin Birleştirilmesi 

Nispi Interconnectivity

Nispi Yakınlık

Alt Kümelerin Birleştirilmesi

7.6. Yoğunluk Temelli Algoritmalar

7.6.1. DBSCAN 

7.6.2. OPTICS

7.6.3. DENCLUE

7.7. Izgara Temelli Algoritmalar

STING

7.8. Kendini Düzenleyen Haritalar

Örnek Uygulama

7.9. Fuzzy Kümeleme

7.10. Yüksek Boyutlu Veri Dizilerinin Kümelenmesi0

7.11. Algoritmik Geometri

Voronoi Diyagramları

7.12. Küme Analizi Algoritmalarında Darboğazlar

7.13. Küme Analizi Sonuçlarının Değerlendirilmesi

7.13.1. İçsel Değerlendirme

Davies – Bouldin Endeksi

Dunn Endeksi

7.13.2. Dışsal Değerlendirme

Rand Endeksi

F-Ölçüsü

Jackard Endeksi

Fowlkes-Mallows Endeksi

 

Kaynakça

Dizin

-----------------------------------------------------------

1. Basım İçindekiler

BÖLÜM 1 : Ölçmek

1.1. Scientia Potestas Est

1.2. Ölçmek ya da Ölçememek

1.3. Ölçü Skalası

1.3.1.      Nominal (isimsel) Skala

1.3.2.      Ordinal (sıralı) Skala

1.3.3.      Interval (aralıklı) Skala

1.3.4.      Ratio (oransal) Skala

 

 BÖLÜM 2 : Veri

2.1. Veri Yönetimi

2.2. Örnek Veri Dizileri

2.2.1. Iris / Süsen Çiçeği

2.2.2. Karaciğer

2.2.3. Bilgisayar Alımı

2.3. Veri Gösterimi

2.4. Veri Saklama Ortamları

2.5. Veri Saklama Yönetimi

2.6. Veri Betimleme

2.7. Görselleştirme

2.7.1. Çizgi, Sütun Grafiği ve Histogram

2.7.2. Box-Whisker Çizimi

2.7.3. Serpilme Çizimleri

2.7.4. Serpilme Matris Çizimi

2.7.5. Survey Plot

2.7.6. Paralel Koordinatlar

2.7.7. Yüzey, Eşyükselti ve Gofret Grafikleri

2.7.8. Chernoff Yüzleri

          2.8. Coğrafi Görselleştirme Örneği

 

 BÖLÜM 3 : Veri Madenciliği

          3.1. Veri Analizi

          3.2. Yapay Zekâ

3.2.1. Durum Uzayını Arama

                   Su Testisi Problemi

                   Köprüden Nasıl Geçmeli

                   Tic-Tac-Toe

3.2.2. Heuristic Arama

                   A* Heuristic Algoritması

                   Tepe Tırmanma Algoritması

          3.3. Veri Madenciliği Modelleri

3.3.1. Sınıflandırma

3.3.2. Kümeleme

3.3.3. Birliktelik Kuralları ve Ardışık Zamanlı Örüntüler

3.4. Veri Madenciliği Süreci

3.4.1. CRISP-DM Süreç Modeli

3.4.2. Semma Süreci – SAS

3.4.3. Süreç Önerisi

 

 BÖLÜM 4 : Veri Ön İşleme

 4.1. Veri Kalitesi

4.2. Veri Ön İşleme

4.3. Veri Entegrasyonu

4.3.1. Veri Konsolidasyonu

          ETL Süreci

          ELT Süreci

4.3.2. Veri Yayınımı / Federasyonu

4.4. Veri Temizleme

4.4.1. Veri Tutarsızlıklarının Saptanması

4.4.2. Gramer İncelemesi

4.4.3. Çifte Kayıtların Ayıklanması

4.4.4. Temizlenmiş Verinin Bakımı

4.4.5. Sanal Entegrasyonda Veri Temizleme

4.4.6. Veride Parazit Azaltımı

Veri Dilimleme

Görüntü İşlemede Dilimleme

Veri Perdahlama

          4.5. Eksik Verinin Tamamlanması

4.5.1. Eksik Veri Örüntüsünün Betimlenmesi

4.5.2. Eksik Verinin Tesadüfilik Düzeyinin Belirlenmesi

                   Tamamen Tesadüfi Eksiklik

                   Tesadüfi Eksiklik

                   Tesadüfi Olmayan Eksiklik

                   Tesadüfilik Sınıfının Belirlenmesi

4.5.3. Eksik Verinin Giderilmesi

Silme Yöntemleri

          Tam Gözlem Yöntemi

          Mevcut Gözlem Yöntemi

Tekli Atama Yöntemleri

          Aritmetik Ortalama Değeri ile Tamamlama

          Medyan Değeri ile Tamamlama

Tanımlanan Sayıda Komşunun Aritmetik Ortalaması / Medyan Değeri ile Tamamlama

Model Temelli Yöntemler

          Maksimum Olabilirlik

          Beklenti-Maksimizasyon Yöntemi

          Markov Zinciri Monte Carlo Yöntemi

          4.6. Sıra Dışı Değer Analizi

                   4.6.1. Tek Değişkenli Veri Dizilerinde

                                      Standart Sapma Kullanımı

                                      Kartiller Arası Uzaklık

                                      Dean Dixon Q Testi

                   4.6.2. Çok Değişkenli Veri Dizilerinde

4.7. Veri Dönüştürme

4.7.1. Veri Normalleştirme / Veri Standardizasyonu

                   z-Skor Normalleştirmesi

                   [0,1] Aralığında Normalleştirme

                   [-1,1] Aralığında Normalleştirme

                   10 Tabanına Göre Logaritma

                   Aritmetik Ortalamanın 1 Olduğu Normalleştirme

                   Standart Sapmanın 1 Olduğu Normalleştirme

4.7.2. Sürekli Veri Dizisi Değerlerinin Kategorik Değerlere Dönüştürülmesi

4.7.3. Nominal Veri Dizisi Değerleri için Kavram Hiyerarşisi

4.8. Veri İndirgeme

4.8.1. Öznitelik / Boyut Sayısının Azaltılması

4.8.2. Öznitelik Alt Dizisi Seçimi

Paketleyici Yöntemler

Filtre Kullanan Yöntemler

Gömülü Yöntemler

4.9. Faktör Analizi

                   4.9.1. Korelasyon / Kovaryans Matrisi

4.9.2. Barttlett Küresellik Testi

4.9.3. Anti-Image Korelasyon Matrisi

4.9.4. Faktör Çıkartımı

4.9.5. Faktör Yüklemeleri

4.9.6. Faktör Rotasyonu

4.10. Örnekleme

 

 BÖLÜM 5 : Uzaklık ve Benzerlik Ölçüleri

5.1. Uzaklık ve Benzerlik Ölçüleri

5.2. Uzaklık Ölçüleri

          5.2.1. Aralık Ölçek için Uzaklık Ölçüleri

                             Euclid ve Kareli Euclid Uzaklık Ölçüleri

          Minkowski Uzaklığı

          Chebyshev Uzaklığı

          Manhattan Uzaklığı

          Mahalanobis Uzaklığı

5.2.2. Frekans Uzaklık Ölçüleri

5.2.3. İkil Veri için Uzaklık Ölçüleri

          5.3. Benzerlik Ölçüleri

                   5.3.1. Aralık Ölçek için Benzerlik Ölçüleri

          Pearson Korelasyonu

          Kosinüs Benzerliği

          Karakter Dizisi Karşılaştırması

5.3.2. İkil Veri için Benzerlik Ölçüleri

          5.4. Uzaklık ve Benzerlik Ölçüleri Yeterli midir

 

BÖLÜM 6 : Sınıflandırma

6.1. Giriş

6.2. Lineer Diskriminanz Analizi

6.2.1. Diskriminanz Analizi Süreci

6.2.2. Kanonik Diskriminanz Fonksiyonu Katsayıları

6.2.3. Sonuçların Değerlendirilmesi

6.3. Karar Ağacı Öğrenimi

6.3.1. Karar Ağaçları

6.3.2. Karar Ağaçlarından Karar Ağacı Öğrenimine

6.3.3. En İyi Bölen Özniteliğin Seçilmesi

          Entropi Endeksi

          Gini Endeksi

          Sınıflandırma Hatası Endeksi

6.3.4. Budama Süreci

6.3.5. Karar Ağacı Algoritmaları

          CLS Ailesi

          AID Ailesi

          CART

          QUEST

                   6.3.6. Karar Ağaçlarının Doğruluğunun Test Edilmesi

          Ensemble Öğrenim

          REPTree

          RandomTree

          DecisionStump

          RandomForest

          NBTree

6.3.7. Kullanılan Yazılımlar

          6.4. k-En Yakın Komşu Algoritması

          6.5. Yapay Sinir Ağları

6.5.1. Temel Sinir Fizyolojisi

6.5.2. Biyolojik Sinir Hücrelerinden Yapay Sinir Ağlarına

6.5.3. Yapay Sinir Ağı Araştırmalarının Gelişimi

          McCulloch-Pitts Modeli

          Hebbian Öğrenimi

          Perceptron

          Perceptron Kuramının Yıkılışı

          Duraklama Dönemi

          Duraklama Döneminde Gerçekleştirilen Diğer Araştırmalar

          Yapay Sinir Ağlarının Yeniden Doğuşu

6.5.4. Geriye Yayınım Ağları

          Genelleştirilmiş Delta Kuralı

          GY Ağlarının Kullanımında Karşılaşılan Sorunlar

                    Eğitim Verisinin Seçilmesi

                    Kurulacak Ağın Boyutlarının Belirlenmesi

                    Başlangıç Ağırlık Değerlerinin ve

                    Öğrenme Parametresinin Belirlenmesi

          Ağırlık Matris Değerlerinin Hesaplanması

          Örnek Uygulama

6.5.6. Yapay Sinir Ağı Modellerinin Sınıflandırılması

          İleri Beslemeli

          Radyal Temelli Fonksiyonlar

          Kendini Düzenleyen Haritalar

          Tekrarlı Yapay Sinir Ağı Modelleri

          Learning Vector Quantization

          Modüler Yapay Sinir Ağları

          6.6. Destek Vektör Makineleri

6.6.1. Lineer Sınıflandırma

6.6.2. Lineer Olmayan Sınıflandırma

I.     Tip Problemler – Aylak Değişken Kullanımı

II.    Tip Problemler – Kernel Trick Kullanımı

 

BÖLÜM 7 : Kümeleme Algoritmaları

          7.1. Giriş

          7.1.1. Biyoloji, Hesapsal Biyoloji ve Biyoenformatik

7.1.2. Tıp

7.1.3. İşletme

7.1.4. Enformatik

7.1.5. Astronomi

7.1.6. Antropometri

7.1.7. Schelling’in Segregation Modeli

7.1.8. Görüntü Renklendirme ve İşleme

7.1.9. Mekânsal Veri Madenciliği

          7.2. Kümeleme Algoritmalarının Sınıflandırılması

          7.3. Hiyerarşik Küme Analizi

                   7.3.1. Tekli Bağlantı / En Yakın Komşu Yöntemi

                   7.3.2. Tam Bağlantı / En Uzak Komşu Yöntemi

                   7.3.3. Aritmetik Ortalamalı Bağlantı / Gruplar Arası Bağlantı. 305

7.3.4. Merkezi Bağlantı

7.3.5. Medyan Bağlantı

7.3.6. Ward Bağlantısı

7.3.7. Lance & Williams Yöntemi

7.3.8. Bağlantı Yöntemlerinin Karşılaştırılması

          7.4. Bölümleyici Küme Analizi

                   7.4.1. k-means Algoritması

                   7.4.2. Siluet Katsayısı

7.4.3. k-medoids Algoritması

7.4.4. k-modes Algoritması

7.4.5. k-median Algoritması

7.4.6. k-means++ Algoritması        

7.4.7. Canopy Kümeleme Algoritması

          7.5. Hiyerarşik Temelli Küme Analizi Algoritmaları

                   7.5.1. BIRCH

                                      Küme içi Homojenlik Ölçüleri

          Kümeler Arası Heterojenlik Ölçütleri

          Kümeleme Özelliği

          Kümeleme Özelliği Ağacı

          BIRCH Algoritmasının Temel Yapısı

          Yazılım

          Log-Likelihood Uzaklık Ölçüsü

                   7.5.2. CURE

          Tesadüfi Örnekleme

          Örnek Kütlenin Kümelenmesi

          Sıra Dışı Değerlerin Giderilmesi

          Ana Kütlenin Kümelere Atanması

                   7.5.3. ROCK

          Komşuluk                    

          Link                               

                   7.5.4. Chameleon

          Veri Dizilerinden Seyrek Bir Çizgenin Yapılandırılması

          Çizgenin Alt Kümelere Ayrılması

          Alt Kümelerin Birleştirilmesi

          Nispi Interconnectivity

          Nispi Yakınlık        

          Alt Kümelerin Birleştirilmesi

          7.6. Yoğunluk Temelli Algoritmalar

7.6.1. DBSCAN                    

7.6.2. OPTICS                    

7.6.3. DENCLUE

          7.7. Izgara Temelli Algoritmalar

                            STING                    

          7.8. Kendini Düzenleyen Haritalar

                            Örnek Uygulama        

7.9. Fuzzy Kümeleme

7.10. Yüksek Boyutlu Veri Dizilerinin Kümelenmesi

7.11. Küme Analizi Algoritmalarında Darboğazlar

7.12. Küme Analizi Sonuçlarının Değerlendirilmesi

          7.12.1. İçsel Değerlendirme

          Davies – Bouldin Endeksi

          Dunn Endeksi

7.12.2. Dışsal Değerlendirme

          Rand Endeksi

          F-Ölçüsü        

          Jackard Endeksi

          Fowlkes-Mallows Endeksi

Kaynakça

Dizin


Akademik bilimsel ve üniversite kitapları; bilişim ve bilgisayar kitapları