Yeni bir meslek: Veri bilimi uzmanlığı Yeni bir meslek: Veri bilimi uzmanlığı

Yeni bir meslek: Veri bilimi uzmanlığı

Yeni bir meslek: Veri bilimi uzmanlığı

30/11/2022 10:00

Veri bilimciler, karmaşık sorunları çözmek için teknik becerilere ve hangi sorunların çözülmesi gerektiğini keşfetme merakına sahip yeni nesil analitik veri uzmanlarıdır
BU HABERİ
PAYLAŞ

Veri bilimi, iş için anlamlı öngörüler ayıklamak amacıyla veriler üzerinde gerçekleştirilen çalışmaların adıdır. Büyük miktardaki verileri analiz etmek için matematik, istatistik, yapay zekâ ve bilgisayar mühendisliği alanlarının ilke ve uygulamalarını bir araya getiren, disiplinler arası bir yaklaşımdır. Bu analiz, veri bilimcilerin ne oldu, neden oldu, ne olacak ve sonuçlarla neler yapılabilir sorularını sormasına ve cevaplamasına yardımcı olur. Veri bilimi, verilerden anlam çıkartmak amacıyla çeşitli araç, yöntem ve teknolojileri bir araya getirdiği için önemlidir. Modern kuruluşlar adeta bir veri bombardımanı altında.

Bilgileri otomatik olarak toplayabilen ve depolayabilen cihaz sayısı Veri bilimi, iş için anlamlı öngörüler ayıklamak amacıyla veriler üzerinde gerçekleştirilen çalışmaların adıdır. Büyük miktardaki verileri analiz etmek için matematik, istatistik, yapay zekâ ve bilgisayar mühendisliği alanlarının ilke ve uygulamalarını bir araya getiren, disiplinler arası bir yaklaşımdır. Bu analiz, veri bilimcilerin ne oldu, eskisinden çok daha fazla. Çevrimiçi sistemler ve ödeme portalları; e-ticaret, tıp, finans gibi alanlarda ve insan yaşamının diğer her alanında çok daha fazla veri yakalıyor. Devasa miktarda metin, ses, video ve görüntü verilerine erişebiliyoruz. Maalesef eyleme dönüştürülebilir olmadığı sürece ham veriler hiçbir değer sunmuyor. Veri bilimciler, ham verileri anlamlı önerilere dönüştürebilir. İşletmelerin varlığından dahi haberdar olmadığı sorunları ortaya çıkarabilir ve çözebilirler. Kuruluşlar da bu önerileri müşteri memnuniyetini artırmak, tedarik zincirini optimize etmek veya yeni ürünler çıkarmak için kullanabilir.

VERİ BİLİMİ NE ZAMAN ORTAYA ÇIKTI?

Veri bilimi terimi yeni olmamakla birlikte anlamları ve çağrışımları zaman içinde değişmiştir. Bu sözcük ilk olarak 1960’larda istatistik sözcüğü için alternatif bir ad olarak ortaya çıkmıştır. 1990’ların sonlarında, bilgisayar bilimi uzmanları terimi resmileştirdi. Önerilen tanım, veri bilimini verilerin tasarımı, toplanması ve analizi şeklinde üç farklı yönü bulunan ayrı bir alan olarak ifade ediyordu. Terimin akademik çevreler dışında kullanılmaya başlaması ise bundan yaklaşık 10 yıl sonra gerçekleşti. Veri bilimciler de bundan 10 yıl önce çok fazla kişinin radarında değildi ancak aniden popüler olmaları, işletmelerin artık büyük veri hakkında nasıl düşündüklerini yansıtıyor. Bu yapılandırılmamış hantal bilgi yığını artık göz ardı edilemez ve unutulamaz boyutta. Bu veriler, daha önce kimsenin aramayı düşünmediği, işle ilgili iç görüleri araştıran ve ortaya çıkaran biri olduğu sürece geliri arttırmaya yardımcı olan sanal bir altın madenidir.

Bu noktada veri bilimciler devreye girer. Birçok veri bilimci, kariyerine istatistikçi veya veri analisti olarak başladı. Ancak büyük veri ve Hadoop gibi büyük veri depolama ve işleme teknolojileri büyümeye ve gelişmeye başladıkça bu roller de gelişti. Veriler artık BT’nin işlemesi için sonradan akla gelen bir şey değil. Analiz, yaratıcı merak ve yüksek teknoloji fikirlerini kâr elde etmenin yeni yollarına dönüştürmek için ustalık gerektiren temel bilgilerdir. Veri bilimci rolünün akademik kökenleri de vardır. Üniversiteler birkaç yıl önce işverenlerin programcı ve ekip oyuncusu olan kişiler istediğini fark etmeye başladı. Profesörler, buna uyum sağlamak için derslerinde bazı düzenlemelere gittiler ve North Carolina Eyalet Üniversitesi’ndeki İleri Analitik Enstitüsü gibi bazı programlar, yeni nesil veri bilimcilerini ortaya çıkarmak için hazırlandı. Şu an ülke genelindeki üniversitelerde altmıştan fazla benzer program var.

NE İÇİN KULLANILIR?

Veri bilimi, dört temel yol izlenerek, veriler üzerinde çalışmak için kullanılır;

1) Açıklayıcı analiz

Açıklayıcı analiz, gerçekleşen olaylara veya veri ortamında yaşananlara dair öngörü elde etmek için verileri inceler. Karakteristik özelliği; pasta grafikleri, çubuk grafikleri, çizgi grafikleri, tablolar gibi veri görselleştirmeleri veya oluşturulmuş açıklamalar içermesidir. Örneğin, bir uçuş rezervasyonu hizmeti, her gün rezerve edilen bilet sayısı gibi verileri kaydedebilir. Açıklayıcı analiz bu hizmet için ani rezervasyon artışlarını, ani rezervasyon düşüşlerini ve yüksek performanslı ayları ortaya çıkarır.

2) Tanısal analiz

Tanısal analiz, bir şeyin neden gerçekleştiğini anlamak için yapılan derinlemesine irdeleme veya ayrıntılı veri incelemesidir. Karakteristik özelliği; ayrıntılara inme, veri keşfi, veri madenciliği ve bağıntılar gibi tekniklerdir. Bu tekniklerin her birindeki benzersiz düzenleri keşfetmek için belirli bir veri kümesi üzerinde birden fazla veri işlemi veya dönüşümü uygulanabilir. Örneğin, uçuş hizmeti, yüksek performanslı bir ayın ayrıntılarına inebilir ve ani rezervasyon artışını daha iyi anlamaya çalışabilir. Bunun sonucunda, çok sayıda müşterinin ayda bir düzenlenen bir spor etkinliğine katılmak için o şehri ziyaret ettiği keşfedilebilir.

3) Tahmine dayalı analiz

Tahmine dayalı analiz, geçmişteki verileri kullanarak gelecekte gerçekleşebilecek veri düzenleri hakkında isabetli tahminlerde bulunur. Karakteristik özelliği; makine öğrenimi, tahminde bulunma, düzen eşleştirme ve tahmine dayalı modelleme gibi tekniklerdir. Bu tekniklerin her birinde bilgisayarlar verilerdeki nedensellik bağlantıları üzerinde ters mühendislik yapmak için eğitilir. Örneğin, uçuş hizmeti ekibi her yılın başında o yılın uçuş rezervasyonu düzenlerini tahmin etmek için veri biliminden yararlanabilir. Bilgisayar programı veya algoritması geçmişteki verilere bakabilir ve Mayıs ayında belirli destinasyonlarda yaşanacak olan ani rezervasyon artışlarını tahmin edebilir. Müşterilerinin gelecekteki seyahat ihtiyaçlarını öngörebilen şirket, o şehirler için hedeflemeli reklamları Şubat ayından itibaren başlatabilir.

4) Kuralcı analiz

Kuralcı analiz, tahmine dayalı verileri bir üst seviyeye çıkarır. Sadece gerçekleşmesi olası sonucu tahmin etmekle kalmayarak bu sonuç için ideal yanıtı da önerir. Farklı seçimlerin getirebileceği potansiyel sonuçları analiz edebilir ve en iyi eylem tarzını önerebilir. Grafik analizini, simülasyonu, karmaşık olay işleme süreçlerini, sinir ağlarını ve makine öğreniminden öneri altyapılarını kullanır. Uçuş rezervasyonu örneğine dönersek, kuralcı analiz geçmişteki pazarlama kampanyalarına bakarak yaklaşan ani rezervasyon artışından en iyi şekilde yararlanmayı sağlayabilir. Bir veri bilimci, farklı pazarlama kanallarındaki farklı pazarlama harcaması seviyelerinin getireceği rezervasyon sonuçlarını öngörebilir. Bu veri tahminleri, uçuş rezervasyonu şirketinin pazarlama kararlarını daha güvenle vermesine yardımcı olur.

VERİ BİLİMCİ NE YAPAR?

Bir veri bilimci, veri bilimi süreci kapsamında geniş bir yelpazedeki farklı teknik, araç ve teknolojileri kullanabilir. Daha hızlı ve daha isabetli sonuçlar için soruna en uygun kombinasyonları seçer. Bir veri bilimcinin rolü ve gündelik işleri, kuruluşun büyüklüğüne ve gerekliliklerine bağlı olarak değişir. Genellikle hepsi veri bilimi sürecini izler ancak ayrıntılar farklılık gösterebilir. Büyük veri bilimi ekiplerinde bir veri bilimci, veri bilimi süreçlerinin uçtan uca izlendiğinden ve iş hedeflerine ulaşıldığından emin olmak için diğer analistlerle, mühendislerle, makine öğrenimi uzmanlarıyla ve istatistikçilerle birlikte çalışabilir. Ancak küçük ekiplerde bir veri bilimci, birçok farklı görevi üstlenebilir. Deneyimine, becerilerine ve eğitim geçmişine dayalı olarak birden fazla rolü veya çakışan rolleri yerine getirebilir. Bu durumda, günlük sorumlulukları arasında temel veri bilimi metodolojilerinin yanı sıra mühendislik, analiz ve makine öğrenimi de yer alabilir.

NASIL ÇALIŞIR?

Veri bilimi süreci genellikle bir iş sorunu nedeniyle başlatılır. Bir veri bilimci, işletmenin ihtiyaçlarını anlamak için işletme paydaşlarıyla birlikte çalışır. Sorun tanımlandıktan sonra, veri bilimci bu sorunu OSEMN veri bilimi sürecini kullanarak çözebilir:

O-Obtain data (Verileri edinme)

Önceden var olan veriler, yeni elde edilen veriler veya internetten indirilen bir veri deposu kullanılabilir. Veri bilimciler dahili veya harici veritabanlarından, şirket CRM yazılımlarından, web sunucusu günlüklerinden veya sosyal medyadan veri ayıklayabilir ya da üçüncü taraf kaynaklardan veri satın alabilir.

S-Scrub data (Verileri ovma)

Veri ovma veya veri temizleme adıyla karşımıza çıkan bu süreç, verileri önceden belirlenen bir formata göre standart hale getirme sürecidir. Eksik verileri ele alma, veri hatalarını düzeltme ve aykırı verileri kaldırma adımlarını içerir. Bazı veri ovma örnekleri şunlardır: Tüm tarih değerlerini ortak bir standarda dönüştürmek, imla hatalarını veya gereksiz boşlukları düzeltmek, matematik hatalarını düzeltmek veya büyük sayılardaki noktaları kaldırmak.

E-Explore data (Verileri keşfetme)

Veri keşfi, ileride uygulanacak veri modelleme stratejilerini planlarken kullanılan ön veri analizidir. Veri bilimciler, açıklayıcı istatistiklerden ve veri görselleştirme araçlarından yararlanarak verileri genel hatlarıyla anlamaya başlar. Bundan sonra, üzerinde çalışılabilecek veya eyleme dönüştürülebilecek ilgi çekici düzenleri belirlemek için verileri keşfetmeleri mümkün olur.

M-Model data (Verileri modelleme)

Daha derin öngörüler edinmek, sonuçları tahmin etmek ve en iyi eylem tarzını belirlemek için yazılım ve makine öğrenimi algoritmaları kullanılır. Eğitim veri kümesine ilişkilendirme, sınıflandırma ve kümeleme gibi makine öğrenimi teknikleri uygulanır. İsabet oranını değerlendirmek amacıyla, model önceden belirlenen test verileriyle karşılaştırılarak test edilebilir. Sonuçların iyileştirilmesi amacıyla, veri modeli üzerinde üst üste defalarca hassas ayar yapılabilir.

N-Interpret results (Sonuçları yorumlama)

Veri bilimciler, veri öngörülerini eyleme dönüştürmek için analistlerle ve işletmelerle birlikte çalışır. Trendleri ve tahminleri temsil eden diyagramlar, grafikler ve çizelgeler oluşturur. Verilerin özetlenmesi, paydaşların sonuçları etkili bir şekilde anlamasına ve uygulamasına yardımcı olur.

HANGİ TEKNİKLER KULLANILIR?

Veri bilimi uzmanları, veri bilimi sürecini izlemek için bilgi işlem sistemleri oluşturur. Veri bilimciler tarafından kullanılan başlıca teknikler şunlardır;

Sınıflandırma

Sınıflandırma, verilerin belirli grup veya kategorilere tasnif edilmesidir. Bilgisayarlar, verileri belirlemek ve tasnif etmek üzere eğitilir. Bilinen veri kümeleri kullanılarak, bir bilgisayarda verileri hızlı bir şekilde işleyen ve kategorize eden karar algoritmaları oluşturulur. Örneğin:  

• Ürünleri popüler veya popüler değil olarak tasnif etme  

• Sigorta başvurularını yüksek riskli veya düşük riskli olarak tasnif etme  

• Sosyal medya yorumlarını olumlu, olumsuz veya nötr olarak tasnif etme.

• Veri bilimi uzmanları, veri bilimi sürecini izlemek için bilgi işlem sistemleri oluşturur.

Regresyon

Regresyon, alakasız görünen iki veri noktası arasında bir ilişki bulma yöntemidir. Bağlantı genellikle bir matematik formülü etrafında modellenir ve bir grafik ya da eğriler olarak temsil edilir. Veri noktalarından birinin değeri bilindiğinde, diğer veri noktasını tahmin etmek için regresyon kullanılır. Örneğin:  

• Hava yoluyla bulaşan hastalıkların yayılma hızı.

• Müşteri memnuniyeti ile çalışan sayısı arasındaki ilişki.  

• Belirli bir konumda itfaiye istasyonlarının sayısı ile yangından kaynaklanan yaralanma sayısı arasındaki ilişki.

Kümeleme

Kümeleme, düzenleri veya anormallikleri bulmak amacıyla, birbiriyle yakından ilişkili verileri gruplandırma yöntemidir. Kümelemenin tasnif etmeden farkı, verilerin sabit kategorilere isabetli bir şekilde sınıflandırılamamasıdır. Bu nedenle veriler, en olası ilişkileri göz önünde bulundurularak gruplandırılır. Kümeleme sayesinde yeni düzenler ve ilişkiler keşfedilebilir. Örneğin:

• Daha iyi müşteri hizmeti sunmak amacıyla, benzer alışveriş davranışları sergileyen müşterileri gruplandırma.  

• Günlük kullanım düzenlerini belirlemek ve bir ağ saldırısını daha hızlı tespit etmek için ağ trafiğini gruplandırma.  

• Makaleleri farklı haber kategorileri altında kümeleme ve bu bilgileri asılsız haber içeriklerini bulmak üzere kullanma.

Veri bilimi tekniklerinin ardındaki temel ilke

Ayrıntılar değişiklik gösterebilmekle birlikte, bu tekniklerin altında yatan ilkeler şunlardır:

• Bir makineye, bilinen bir veri kümesine dayalı olarak verileri nasıl tasnif edeceğini öğretmek. Örneğin, bilgisayara örnek anahtar sözcükler ve her birinin tasnif değeri verilir. “Mutluluk” olumlu, “Nefret” ise olumsuzdur.

• Makineye bilinmeyen verileri vermek ve cihaza veri kümesini bağımsız bir şekilde tasnif ettirmek.

• Sonuçlardan bazılarının isabetsiz olacağı bilinciyle hareket etmek ve sonucun olasılık faktörünü ele almak.

ideal tepkiyi vermesine yardımcı olabilir. Örneğin, kamyonlarla hizmet veren bir nakliyat şirketi, veri bilimini kullanarak kamyonlar arıza yaptığında yaşanan kesinti sürelerini azaltmak istiyor. Daha hızlı arıza yaşanmasına yol açan rotaları ve vardiya düzenlerini belirliyorlar ve kamyonların zaman çizelgelerini buna göre ayarlıyorlar. Buna ek olarak, kamyonların daha hızlı tamir edilebilmesi için sık sık değişim gerektiren yaygın yedek parçaların envanterini hazırlıyorlar. 

FARKLI VERİ BİLİMİ TEKNOLOJİLERİ NELERDİR?

Veri bilimi uygulayıcıları, şunun gibi karmaşık teknolojilerle çalışır:

Yapay zeka: Tahmine dayalı ve kuralcı analiz için makine öğrenimi modelleri ve ilgili yazılımlar kullanılır. Bulut bilgi işlem: Bulut teknolojileri, veri bilimcilere gelişmiş veri analizleri için ihtiyaç duydukları esnekliği ve işlem gücünü verir. IoT (Nesnelerin İnterneti): IoT, internete otomatik olarak bağlanabilen çeşitli cihazları ifade eder. Bu cihazlar, veri bilimi girişimleri için veri toplar. Bunlar, veri madenciliği ve veri ayıklama için kullanılabilen, devasa boyutta veriler oluşturur. Kuantum bilgi işlem: Kuantum bilgisayarları, karmaşık hesaplamaları yüksek hızla yapabilir. Gerekli becerilere sahip veri bilimciler, karmaşık nicel algoritmalar oluşturmak için bunları kullanabilir.

- Ankara Sanayi Odası’nın yayın organı ASOMEDYA dergisinin Temmuz-Ağustos (2022) sayısı