Büyük Veri gerçekten ne işe yarar?

Print Friendly, PDF & Email

Web 2.0 dediğimiz artık normal insanların da içerik ürettiği internet çağında websiteleri her geçen gün daha da gelişiyor ve renkleniyor. Bizim de kendi katkımız, her bir siteye girdiğimizde ya da herhangi bir site için kayıt yaptırdığımızda kişisel bilgilerimizi de onlara bir şekilde “veri” olarak hediye ediyoruz. Birçoğumuz için çok da önemli görünmeyen bu hareketimiz, aslında bizden bu verileri toplayan websitelerine ve şirketlere çok büyük maddi kazanç sağlıyor.

Bugün adına “Büyük Veri (Big Data)” dediğimiz bu veri yığınları artık her yerde ve her geçen gün yepyeni web tabanlı uygulamalarla hayatımıza daha çok giriyor.

Örneğin, Google’da bir arama yaptığımızda kenarda bazı reklamlar görünüyor. Peki hangi reklamın bize hitap ettiğine kim karar veriyor? Aslında arama motoruna herhangi birşey yazdığımızda o aramayla bağlantılı olarak belki onlarca reklam vardır. Ama hangisinin bize hitap ettiğini Google gayet iyi biliyor, çünkü bizi gayet iyi tanıyor. Bunun sebebi daha önce yaptığımız aramalardan ya da Gmailini kullandığımız için ya da kendi tarayıcısını kullandığımız için bizim neleri sevip sevmediğimiz hakkında bilgi sahibi oluyor. İki farklı kişi Google’a “Mısır” yazdığında, birisinde ilk arama sonucu Mısır piramitleri çıkarken, diğerinde Mısır’daki politik durum çıkabiliyor. Bu, aslında kişiselleştirilmiş arama diye bir kavramdan kaynaklanıyor ve aslında aradığımız şeyi hemen bulduğumuz için bizi mutlu ediyor. Öte yandan bu arama kayıtları sadece kişisel aramayı daha etkin hale getirmeye yaramıyor. Bir şehirde, bir bölgede, hatta bir ülkedeki arama istatistiklerinden şu anda orada neler oluyor bilmesine imkan sağlıyor. Örneğin, Google, bazı ülkelerdeki grip salgınlarını salgın çıktığı anda tespit edebiliyor ya da herhangi başka bir hastalığı. Çünkü o bölgedeki insanlar hemen o hastalık hakkında arama/araştırma yapıyorlar ve bu arama sıklığı aynı döneme denk geliyorsa, demekki o bölgede böyle bir sorun var anlamına gelebiliyor.

Şu anda “Data is the new oil” diye bir söz var. İlk kim kullanmış bilmiyorum ama bugünü ve yarını çok iyi tarif ediyor. Sadece Google gibi bir şirket bile aslında bu tür verileri toplayarak kendimiz, çevremiz, şehrimiz ve ülkemiz hakkında bilgi sahibi oluyorsa, internetteki bütün verileri kullansak aslında gelecek için öngörümde bulunamaz mıyız? Cevap, elbette bulunabiliriz!

Son birkaç yıldır çok hızlı bir trend haline gelen “Büyük Veri” ile birlikte, bu büyük veriyi işleyen ve anlamlandırabilen yeni bir meslek ortaya çıktı. “Veri Bilimcisi (Data Scientist)” adı verilen bu mesleği icra edenler, aslında elindeki veriyi çok hızlı bir şekilde işleyerek, verinin mesajını en iyi şekilde aktarabilmek için görsel metodlar da kullanarak veriyi hikaye şekline çevirebiliyor. Yoksa aslında veri zaten her zaman bir yerlerde var ve aynı bir Excel dosyasındaki kolonlar ve sütunlardaki anlamsız sayı ve metinler gibi orada hiç birşey yapmadan yıllarca kalabiliyor. Ancak veriye bilim katarak hayat vermek ve bağlı bulunduğumuz şirketimiz, projemiz ya da toplumumuz için bunu anlamlandırmak özellikle 21. yüzyılda çok önemli bir hal alıyor.

Elbette büyük veri dediğimiz şey, bir Excel dosyasındaki sayılarınızdan çok daha büyüktür. Her ne kadar tanımı çok geniş olmasına rağmen, büyük veri, geleneksel veri işleme ve depolama araçlarıyla başa çıkılamayacak kadar çok ve karmaşık veriye deniyor. Tanımın içine de büyük veriyi büyük yapan önemli üç faktörü de eklememiz gerekiyor: Yani işlenen verinin hacmi, verinin karmaşıklığı, bilgi giriş çıkış hızı ve bunlara ek olarak da verinin çeşitliliği.

Günümüzde her şirket, küçük bir marketten tutun, büyük bir fabrikaya kadar, müşterileri hakkında az da olsa veri toplar ama büyümek isteyen bir şirket ise daha spesifik sorular sorarak veri toplar ve bu verilere uygun bir şekilde şirketini o yönde ilerletebilir. Elbise satan küçük bir mağaza bile, örneğin şu şekilde veri toplasa: müşterilerimin yaş aralığı nasıl, cinsiyetleri ne, hangi saatlerde daha çok alışveriş oluyor, insanlar kredi kartı mı, yoksa peşin mi alışveriş yapıyor, mağazanın caminda fiyat etiketi olsa mı insanlar içeri giriyor, yoksa renkli resimler mi, adres bilgilerinden gelen müşteriler çevrede oturan insanlar mı yoksa bir sebep için size uzaktan da olsa geliyorlar mı vs vs. bunun gibi yüzlerce soru sorulup size en çok hangi müşteri tıpı para kazandırıyorsa mağazanızın yapısını ona göre şekillendirebilirsiniz. Herkes kendi çapında böyle bir analizi yapıyor gibi görünse de ve hatta buna “biz yılların deneyimiyle konuşuyoruz” dese de aslında verileri bilimsel bir metodla işleyerek çok daha kısa sürede belki birkaç haftada belki birkaç ayda size en iyi müşteri profilini ortaya çıkarabilirsiniz ve yıllarca beklemenize gerek kalmaz. Tabii ki daha büyük bir şirketiniz varsa, şirketinizin ayakta kalması için büyük veriyi kullanmak ve böylelikle şirketin geleceğine bu veriyle beraber yön vermek kaçınılmaz bir hal alır.

Netice olarak, büyük veri artık her yerde ve beklenen o ki büyük veriye sahip olan geleceğe de sahip olacakmış gibi görünüyor. Dünyada henüz “veri bilimcisi” sayısı çok çok az olmasına rağmen, bu farkı farkeden şirketler şimdiden kendi verilerini anlamlandıran “veri bilimcilerine” iş vermeye başladı bile ve şirketleri çok hızlı bir şekilde gelişiyor.

Bu yazı IstanbulArtNews dergisi için yazılmıştır, dergi sayfalarını indirmek için pdf’i tıklayınız.

IstanbulArtNews – Eylül 2015