Veri madenciliği (Data Mining), yüksek veriler arasından yararlı bilgiye ulaşma, bilgiyi madenleme görevidir. Büyük veri yığınları arasından gelecekle ilgili fikir yürütmemizi sağlayabilecek bağlantıların bilgisayar programı kullanarak taranması olarak da tanımlanabilir.
Mevcutta bilişim alanında faaliyet gösteren firmalar big data üzerine çalışmaktadır. Bu kadar fazla datadan bizim için önemli olan ve istediğimiz veriyi almak son derece yorucu olabilir. Veri madenciliği sayesinde elde edilen sonuçları düşünürsek firmalar için söz konusu sadece mevcut verileri saklamak değil hali hazırda artmakta olan ve dışarıdan gelen verileri de kendi içlerinde kullanmak ve muhafaza etmek önemli bir durum haline gelmiştir. Günümüz dünyasında her sektörde ve farklı durumlarda Veri Madenciliği yapılabilmektedir.
Veri madenciliği (Data mining) sonucunda, alıcıların sizlerden istedikleri belirlenerek bu yönde taktikler üretilir. Güncel müşteri ve müşteri adaylarının birçok kişisel bilgileri analiz edilerek bu doğrultuda tahminleme yapılabilir ve çözümlemeler üretilir. Bunun sonucunda da ihtimali olan riskler minimum seviyeye indirgenerek yeni olasılıklara imkan tanır.
Nasıl Bir Süreç İzlenmektedir?
İşimize yarayacak verinin büyüklüğü ve bunun doğrultusunda gerçekleşen işleme yönteminin süresine bağlı olarak çeşitli büyüklüklerde süreçler takip edilse de genel anlamda Veri Madenciliğinin prosedürü aşağıdaki gibidir.
- Veri yığınını elde etme ve güvenliğini sağlama,
- Veri Temizleme (Smoothing),
- Veri Bütünleştirme (Damy-Optimization),
- Veri İndirgeme,
- Veri Dönüştürme (Normalization),
- İlgili Veri Madenciliği Algoritmaları Uygulama (Kümeleme, Sınıflandırma, Karar Destek Ağaçları),
- Sonuçları ilgili yazılım dillerinde test ve eğitim aşamasına sokma (R, Python, Java – Makine öğrenmesine giriş),
- Sonuçların değerlendirilmesi ve sunulması.
Data Mining Amacı Nedir?
- Müşteri segmentlerini ve tercihlerini anlamak,
- Müşteri memnuniyetini artırmak,
- Müşteri kaybını önlemek,
- Müşteri bağlılığını artırmak,
- Yeni müşteriler edinmek,
- Çapraz satışı ve ek satışı geliştirmek,
- Operasyonel performansın takip edilmesi,
- Bir ürün veya hizmetle ilgili olarak kampanya programından tutunda hedef kitlenin seçimi, hangi kanallardan sunulacağına kadar tüm sürecin belirlenmesinde veri madenciliğinden faydalanılabilir,
- Teknik kaynakların en elverişli biçimde kullanılmasını sağlamak,
- Olası risklerin tespit edilmesi,
- Dolandırıcılık olaylarının tespitinde kullanılabilir.
Veri Madenciliğini Kimler Yapmaktadır?
Abartısız söyleyecek olursak milyarlarca çeşide sahip data üzerinde çalışma yapmak, sabırlı ve dirayetli olmayı gerektirmektedir. Bilgisayar sistemlerinde çoğunlukla karşılaştığımız birbirinden farklı yanlışlara ve datalarda ortaya çıkan anlık değişikliklere karşı datayı muhafaza etmek gerektiğinden çok daha fazla dikkat gerektirmektedir. Çok iyi düzeyde matematik, istatistik, lineer cebir, optimizasyon bilgisi, yöneylem modelleme teknikleri ve ileri seviye yazılım yapma yeteneğine sahip olmak ise vazgeçilmezlerdendir. Yazılım dillerinden Veri Madenciliği için en uygun olanlar R ve Python dilleridir. Bazı test süreçleri ve deneme aşamaları yapmak için ise Java dili kullanılabilir.
Kişiden kişiye değişiklik gösteren hizmet kalitesinin hemen hemen her sektördeki şirketlerin anlaşma noktası haline gelmesi, mevcutta bulunan ve daha da artacak datayı doğru elde etme ve düzgün işleme mecburiyetini yanında getirmiştir. Mevcuttaki araştırmalar sonucunda teknoloji sektörüne hakim olma seviyesinin, veriyi düzgün kullanma ve işleme yeteneğiyle bağlantılı olacağını göstermiştir.
Ödül Köklü