R ile Veri Kazıma Çevrim İçi Semineri Düzenlendi
İnönü Üniversitesi İstatistik ve Ekonometri Araştırma ve Uygulama Merkezi tarafından hazırlanan
İnönü Üniversitesi İstatistik ve Ekonometri Araştırma ve Uygulama Merkezi tarafından hazırlanan “R ile Veri Kazıma” başlıklı çevrim içi program gerçekleştirildi.
Moderatörlüğünü Aydın Adnan Menderes Üniversitesi Nazilli İktisadi ve İdari Bilimler Fakültesi Uluslararası Ticaret ve Finansman Bölümü Öğretim Üyesi Doç. Dr. Sadullah Çelik’in yaptığı programa konuşmacı olarak Ondokuz Mayıs Üniversitesi İktisadi ve İdari Bilimler Fakültesi İktisat Bölümü Öğretim Üyesi Doç. Dr. Miraç Eren katıldı.
Etkinlik moderatör Doç. Dr Sadullah Çelik’in konuşmacı Doç. Dr. Miraç Eren’in özgeçmişinden bilgi vermesi ile başladı.
Doç. Dr. Miraç Eren, büyük bir bölümü web ortamında oluşturulan verilerin toplulaştırılmasını sağlayarak daha düzgün bir şekilde analize hazır hale getiren R ile Veri Kazıma programından bahsetti.
Dünyada üretilen verilerin büyük bir bölümünün web ortamında oluşturulduğunu vurgulayan Eren, söz konusu verinin toplu hale getirilmesinin sağlanmasının daha düzgün ve doğru bir analiz için önemli olduğunu ifade etti. Bu amaçla kullanılan R ile Veri Kazıma programından bahseden Doç. Dr. Eren şunları söyledi:
“Normalde biz hazır yani ikincil veriler üzerinden bu işlemleri yapıyoruz ama internette dağınık olan veriler üzerinden de bu işlemi yapma şansımız var. İlgili firmanın bir bilgisi bir sitede, başka bir bilgisi başka bir sitede veya onunla ilgili yapılan yorumlar başka bir yerde olabilir. Bunların hepsini derleyip, bir çatı altında toplayıp, bunun üzerinde analizler yapabileceğimiz bir formata çevirmek için ilk yapacağımız işlem veri kazıma dediğimiz olaydır.”
Sosyal bilimcilerin kullanabileceği sosyal medya, haber siteleri, hükümet kaynakları, forumlar gibi internet kaynaklarında çok sayıda dağınık ve kısmen düzenli verinin bulunduğundan bahseden Eren “İnternetten veri toplamanın iki ana yolu var. Birincisi API’lar üzerinden yani veri tabanından, ikincisi ise Web Scraping yani veri kazıma dediğimiz olay.” diyerek veri kazıma programlarını ve kullanım alanlarını açıkladı. Sunumunda veri kazıma kullanımının avantaj ve dezavantajlarına da yer veren Doç. Dr. Eren, konunun etik ve hukuki boyutlarına da değindi.
Uygulama üzerinden farklı örneklerle, programın kullanım alanlarının nasıl çeşitlendirilebileceğini ve programdan nasıl faydalanılabileceğini gösteren Doç. Dr. Miraç Eren, etkinliğin sonunda dinleyicilerden gelen soruları yanıtladı.