Kazımak

TL; DR
Scrape, bir web sitesinden verilerin çıkarılmasını temsil eden bir terimdir. Bu iş “kazıyıcı” adı verilen bir kod ile gerçekleştirilir. Veriler metin, fotoğraflar, videolar, iletişim bilgileri veya ürün öğeleri ile temsil edilebilir.
Kazıma Hakkında
Web kazıma veya web veri çıkarma olarak da adlandırılan kazıma, bir web sitesinden büyük miktarda veri alma tekniğidir. Bu işlemi, verilerin bir bilgisayara veya bir veritabanına tablo formatında kaydedilmesi takip eder.
Kazıma işlemi manuel olarak yapılsa bile, web verilerini kazırken genellikle otomatik araçlar kullanılır çünkü bu daha hızlı ve daha az maliyetli bir işlemdir.
Web kazıma, esasen bir veri çıkarma şeklidir. Hava durumu raporları, piyasa fiyatları veya toplanan diğer herhangi bir veri listesi gibi öğeler, web kazıma çabalarında bulunabilir.
Kazıma ne zaman kullanılır?
Genellikle, web kazıma, arama motoru botları bir siteyi analiz etmek veya sıralamak için taradığında, fiyat karşılaştırması yapan botlar yapıldığında veya pazar araştırması şirketleri forumlardan veri çekmek için kazıyıcılar kullandığında kullanılır.
O nasıl çalışır?
Tüm iş, bir kod parçası olan bir kazıyıcı tarafından gerçekleştirilir.
İlk adımda kazımak istediği web sitesine “get” kodu sorgusu gönderir. Herhangi bir web sitesiyle çalışacak şekilde yapılandırılabilir veya belirli bir web sitesi için oluşturulabilir.
Ardından, web kazıma yazılımı, gereksinime göre web sitelerinin birden çok sayfasından verileri otomatik olarak yükleyecek ve çıkaracaktır.
Bundan sonra, sorgunun sonuçlarına göre bir HTML belgesi tanımlar.
Son adımda, istenilen veriler sıyırıcılar tarafından belge içerisinde aranır ve sonuçlar kullanıcı tarafından daha önce belirtilen bir belgeye dönüştürülür. Bir düğmeye basit bir tıklama ile web sitesinde bulunan veriler kolayca kaydedilebilir.