Web Scraping (Web Kazıma) Nedir?  - SSTTEK Academy

Web Scraping (Web Kazıma) Nedir? 

Web Scraping, internet sitelerindeki verilerin otomatik yöntemlerle toplanması işlemidir. Bu işlem, bir web sayfasındaki içeriklerin (yazı, görsel, bağlantı vs.) yazılımlar veya botlar aracılığıyla okunup bir veri seti hâline getirilmesini sağlar.  

Nasıl Çalışır? 

  1. Bir bot veya yazılım, hedef web sitesine HTTP isteği gönderir. 
  1. Sayfanın HTML yapısı çözülerek istenen veriler belirlenir. 
  1. Veriler ayıklanarak genellikle bir veritabanına, tabloya veya dosyaya kaydedilir. Bu süreçte, HTML etiketleri, CSS sınıfları veya API yanıtları kullanılarak istenen veriler seçilir. 

Kullanım Alanları: 

  • Fiyat karşılaştırma siteleri 
  • Haber veya blog içeriklerini analiz etme 
  • E-ticaret ürün bilgilerini toplama 
  • Veri bilimi projeleri için veri seti oluşturma 
  • SEO analizleri ve rakip takip araçları 
  • Akademik araştırmalar ve piyasa analizleri 

Dikkat Edilmesi Gerekenler: 

  • Her web sitesi scraping’e izin vermeyebilir. 
  • Web sitelerinin robots.txt dosyası scraping politikalarını belirtebilir. 
  • Aşırı veya izinsiz scraping yasal sorunlara yol açabilir. 
  • API sunan sitelerde, scraping yerine API kullanımı tercih edilmelidir.