Veri Madenciliği- Data Mining Nedir?

Veri Madenciliği-Data Mining Nedir?

Pek çok kişinin merak ettiği veri madenciliği bir diğer adıyla; data mining nedir? Günümüzün gelişen teknolojisi aracılığıyla büyük kurumlar geniş veriler üzerine çalışabilmektedir. Geniş bir veri arşivinden faydalı olacak bilgiyi almak uğraş isteyen bir konudur.

Madencilik meselesi şirketler açısından hem kendi verilerinin işlenmesi ve korunması hem de dışarıdan alınan verilerin de işleme sokulabilmesi açısından önemlidir. Peki dilimize veri madenciliği olarak geçmiş olan kavram tam olarak ne anlama gelmektedir ve işlevi nedir? Konunun ayrıntılarını birlikte değerlendirelim:

 Veri Madenciliği Ne Anlama Gelir?

 Veri madenciliği genelde kurumlarda yer alan ve büyük ölçekli şekilde tanımlanabilecek sayısız veriye sahip yazılım sistemleri içerisinden ihtiyaç halinde belli verilerin alınması işlemidir. Bu şekilde veriler arasındaki mevcut ilişkiye ortaya çıkarmak ve gerekli olduğunda ileriye dönük faydalı tahminler yürütmek de mümkün olmaktadır.

Veri madenciliği esnasında milyarlarca farklı veri ile çalışılabilir. Madencilik yapılmasının temel amacı ise,  kurumlarda karar destek uygulamaları şeklinde isimlendirilen sistemler açısından değerli olan verileri belli işlem ve yöntemler neticesinde ortaya çıkarmaktır.

Veri Madenciliğinin Uygulama Alanları

Veri madenciliği nasıl yapılır? Piyasada yer alan pek çok alanda özellikle son 10 senede veri madenciliği yaygın olarak yapılmaktadır. Madencilik işlemi elektronik ortamda yapılan neredeyse her işte; pazarlamacılık, sigortacılık ve bankacılık gibi çok sayıda alanda temel bir yöntem olarak kullanılmaktadır.

Örnek olarak pazarlama sisteminde kullanılmakta olan veri madenciliği uygulaması aracılığı ile, müşterilerin satın alma deneyimleri ve alışkanlıkları tespit edilmekte ve buna yönelik farklı stratejiler izlenmektedir. Müşterilerin cinsiyet, lokasyon, eğitim ve yaş gibi temel çok sayıda özelliğinin incelenmesi ile belli bir veri ortaya çıkmakta; buna bağlı olarak pazar analizleri ve satış tahminleri yapılmaktadır.

Alınmak istenen verinin büyüklük derecesi ve bu sürece bağlı olarak gelişen işleme süresi farklılık göstermektedir. Ancak genel anlamda veri madenciliği sistemi şu şekilde işlemektedir:

  • Veriyi ağına alma ve güvenlik sağlama
  • Veri temizleme işlemi
  • Veri bütünleştirme işlemi
  • Veri indirgeme aşaması
  • Veri dönüştürme aşaması
  • İlgili veri üzerinden Madencilik algoritmaları uygulaması
  • Sonuçların gerekli yazılım dilleri aracılığıyla eğitim ve test aşamasına tabi tutulması
  • Sonuçların değerlendirerek sunuma hazır hale getirilmesi

Veri Madenciliği-Data Mining Nedir?

Veri Madenciliği Yapmak İçin Gereken Adımlar

Çok sayıda değişik özellikteki veri üzerinde çalışabilmek;  öncelikle uzmanlık gerektiren bir iştir. Aynı zamanda sabır ve dikkat işlemi yapabilmek için gerekli diğer özelliklerdir. Bilgisayar sistemlerinde rastlanabilen farklı hata ve velilerde oluşan ani değişikliklere karşı verinin korunabilmesi önem arz eden işlemlerden birisidir.

Veri madenciliği yapabilmek için ileri derecede gelişmiş yazılım becerisi, optimizasyon bilgisi, lineer cebir, istatistik, yöneylem modelleme teknikleri ve matematik bilgisi olmazsa olmaz özelliklerdendir. Veri madenciliği için uygun birkaç farklı yazılım dile getirilmektedir. Bunlardan bazıları; Python ve R dilleri olmaktadır. İşlem dahilinde kimi zaman test aşamaları için ve gerekli denemeleri yapmak adına Java dili kullanılabilmektedir.

Veri Madenciliğinin Geleceği

Kişisel özelliklere göre bilgilerin edinilmesi işlenmesi ve bu sayede farklı hizmetleri meydana getirilerek satışların oluşturulabilmesi amacıyla uygulanan veri madenciliği sistemi; geleceğe dönük yoğun olarak kullanılacak içeriklerden birisi olarak gösterilmektedir. Örnek olarak telefondan internet aracılığı ile yapılan herhangi bir ürün araması sonrasında girilen farklı sitelerde reklamlar o ürüne ait olabilmektedir.

Bu durum elbette ki tesadüf değildir. Veri madenciliği sayesinde çeşitli verilerin işlenmesi ve gerektiği takdirde alınarak uygulanması esasına dayanır. Yani büyük firmalar bu yöntemi sıklıkla değerlendirmektedir. Yapılan araştırmalara göre teknolojiye hakimiyet düzeyinin, ileriye dönük veriyi doğru kullanma ile doğrudan bağlantılı olacağı düşünülmektedir.

Bir cevap yazın