Mesele Büyük: Big Data Nedir?

The Digital Universe 2020 (Dijital Evren 2020) isimli araştırma önümüzdeki yıl yaklaşık 40 trilyon gigabayt veriye sahip olacağımızı söylüyor.

Doğru analiz metotları ile yorumlandığında şirketlerin stratejik planlarını etkin biçimde almalarına, risklerini daha iyi yönetmelerine ve inovasyon geliştirmelerine imkân sağlayan ve gelecek yıl 40 zetabayta ulaşması beklenen Büyük Veri; eğitim, sağlık, finans, enerji ve politika gibi birçok alana veri sunuyor.

Dijitalleşen verilerin toplanıp düzenlenmesi; insan davranışlarını anlamaya, analizler yapmaya ve işletmelerin sahip olduğu verilerden yola çıkarak akıllı yönetim stratejileri geliştirmeye olanak tanıyor. Müşteri kaybı sebepleri, gerçek zamanlı analizler, işlem süreleri odaklı çalışmalar, çeşitlilik ve fiyat optimizasyonu, performans geliştirme, akıllı şehirler gibi pek çok başlık günümüzde Büyük Veri ışığında şekilleniyor.

Büyük Verinin ne anlama geldiğine dair daha fazla bilgi sahibi olmak isterseniz; gelin sizin için derlediğimiz başlıklara birlikte göz atalım:

Büyük Verinin özellikleri neler?

Herhangi bir mecra üzerinden toplanan verilerin Büyük Veri olarak sınıflandırılabilmesi için çeşitli özelliklere sahip olması gerekiyor. İngilizcede 5V olarak tanımlanan bu özellikleri 5 madde altında toplamak mümkün:

1. Hız (Velocity): Veri yüksek hızlarda ve sürekli üretiliyor olmalı.

Verilerin üretilme hızı çok yüksektir. Her geçen gün bu hızın daha da arttığı biliniyor. Hız yalnızca Büyük Veri için değil; tüm iş süreçleri için gereklidir. Bu açıdan; veriyi işleyecek, analiz edecek süreçlerin de büyük verinin üretimiyle aynı hızda olması gerekiyor. Büyük verinin ne kadar hızda üretildiğine örnek olarak sıklıkla; Facebook’ta günde 2,7 milyar kez tıklama yapılması ya da Twitter üzerinden dakikada 350 bin ve günde 500 milyon tweet’in atılması gösteriliyor.

2.Hacim (Volume): Veri akışı sürekli ve büyük hacimlerde olmalı.

Son yıllarda elektronik posta kullanımı, mesajlaşma uygulamaları, sosyal medyada fotoğraf ve video paylaşım sayıları büyük bir hızla artıyor. Yapılan araştırmalara göre dünyadaki verinin %90’ı son iki yıl içerisinde üretildi ve her geçen gün bu veri paylaşma hızı ve hacmi büyümeye devam ediyor. Bu nedenle kesintisiz şekilde akan ve hızla artan bu verilerin anında işlenerek bilgiye dönüştürülmesi gerekiyor. Günümüzde Facebook, Instagram, Twitter gibi veri akışının hızlı ve hacmin büyük olduğu şirketler Büyük Veriyi kullanarak oluşan bu verileri kayıt ediyor ve anlamlı bilgiye dönüştürüyor.

3.Değer (Value): Toplanan verilerden anlamlı bilgi edinilebilmeli.

Kayıt altına alınan verilerin Büyük Veri olarak kabul edilmesi için diğer önemli bir kriter ise verilerin işlendikten sonra bir anlam ifade etmesinin gerekliliği... Sadece kayıt altına almış olmak için toplanan ve içerisinden işe yarayacak anlamlı bilgi elde edilemeyen bir veri tabanı, hiçbir işe yaramıyor. Bu nedenle eldeki verilerin veri madenciliği yöntemleri kullanılarak işlenmesi ve anlamlı sonuçların üretilebiliyor olması önem taşıyor. 

4.Çeşitlilik (Variety): Farklı türden veriler içermeli.

 

Kişinin internet aktivitesine dair bilgiler, konum bilgisi, demografik bilgileri, finansal ve sağlık bilgileri farklı veri kaynağı örnekleri arasında yer alıyor.

Örneğin; mobil kullanımın yaygın olmadığı zamanlarda kullanıcılar bilgisayarla sisteme giriş yapıyordu. Dolayısıyla anlık paylaşımlarda kullanıcının mevcut konumu bilinmediğinden kayıt edilmiyordu. Fakat mobil kullanımın yaygınlaşması ile mobil cihazın konum servislerinden yararlanarak kullanıcının paylaşımı yaptığı andaki konum bilgisi de mevcut verilere eklendi. Böylece daha önce var olmayan fakat bundan sonraki kayıtlarda yer alacak yeni bir veri türü oluştu.

5.Doğruluk (Veracity): Güvenilir ve doğru bilgiler içermeli.

Son olarak işlenen verilerin güvenilir bir kaynaktan gelen ve doğru veriler olması gerekiyor. Doğru olmayan veri zaten anlamlı bilgiye dönüştürülemiyor. Bundan dolayı doğruluğundan şüphe duyulan verileri Büyük Veri olarak adlandırmak mümkün değil.

Büyük Veri nasıl kayıt altına alınıyor ve nasıl işleniyor?

Geleneksel veri tabanı sistemleri, veriyi; satır ve sütun olarak kayıt altına alıyor. Bundan dolayı bu veri tabanına işlenecek verilerin özelliği ve çeşidinin önceden biliniyor olması önem taşıyor.

Veri depolama sistemlerinde ve sistemler üzerinde çalışan yazılımlarda, Büyük Verinin sağlıklı kayıt altına alınması adına değişikliklere gidilmiştir. Yeni veri türleri doğdukça; varlık analizi, ağ analizi, metin analizi ve gerçek zamanlı skorlama gibi yeni algoritmaların kullanımına ihtiyaç duyulacağının anlaşılması ile veri depolama sistemlerinin sorgu dillerinin güncellenmesine devam edileceği öngörülüyor. Açık kaynak kodlu yazılım mimarilerinin dışında Yahoo, Amazon, Facebook, Linkedin, Twitter ve IBM başta olmak üzere birçok lider bilişim şirketinin kayıtları da büyük veri analitiğinde kullanılıyor.

Büyük Veri örnekleri neler, nasıl kullanılıyor?

Dünya çapında toplanan Büyük Verinin hacmi her geçen gün katlanarak artıyor ve kullanım alanları da sürekli genişliyor. Peki, sağlık hizmetlerinden seyahate, finanstan güvenliğe tüm sektörler için yeni fırsatlar sunan Büyük Veri ile neler yapılabilir?

Birkaç basit örnek Büyük Veriyi daha iyi anlamaya yardımcı olabilir. Büyük Veri denildiğinde ilk akla gelen şirketlerden biri olan Google, her gün yaptığımız aramaları veri tabanına katarak yeni ürünler ve servisler geliştiriyor.  E-ticaret sitelerinin sizin seçimlerinize ve zevkinize göre ürünleri ana sayfalarına taşımaları Büyük Veri ile mümkün oluyor. Sağlık alanında teşhis ve tedavi süreçlerinin iyileştirilmesinde Büyük Veriye başvurmak mümkün hale geldi. 

LinkedIn'e girdiğinizde karşınıza sizinle gerçekten ilgili iş ilanları çıkıyorsa bu da Büyük Verinin eseri... Kısacası Büyük Veri, şimdiden hayatımızın önemli alanlarında söz sahibi ve etkisini artırmaya devam ediyor.