Skip to main content

Skrabe

TL;DR

Scrape er et udtryk, der repræsenterer udtræk af data fra et websted. Dette job udføres af en kode, der kaldes "skraber". Dataene kan repræsenteres af tekst, fotos, videoer, kontaktoplysninger eller produktartikler.

Om Scrape

Scrape, også kaldet web-skrabning eller webdataekstraktion er teknikken til at hente store mængder data fra en hjemmeside. Denne proces efterfølges af lagring af data på en computer eller i en database i et tabelformat.

Selv skrabningen kan udføres manuelt, normalt bruges automatiserede værktøjer til at skrabe webdata, fordi det er en hurtigere og billigere proces.

Webskrabning er i bund og grund en form for dataudtræk. Elementer som vejrrapporter, markedspriser eller en hvilken som helst anden liste over indsamlede data kan findes i web-skrabning.

Hvornår bruges skrabe?

Normalt bruges web-skrabning, når søgemaskine-bots crawler et websted for at analysere det eller rangordne det, når prissammenligning, der implementerer bots, eller når markedsundersøgelsesvirksomheder bruger skrabere til at trække data fra fora.

Hvordan virker det?

Alt arbejdet udføres af en skraber, som er et stykke kode.

I det første trin sender den en "hent" kodeforespørgsel til den hjemmeside, den ønsker at blive skrabet. Det kan konfigureres til at fungere med ethvert websted, eller det kan bygges til et specifikt websted.

Derefter vil webskrabningssoftware automatisk indlæse og udtrække data fra flere sider på websteder baseret på kravet.

Herefter definerer den et HTML-dokument baseret på resultaterne af forespørgslen.

I det sidste trin søges de anmodede data i dokumentet af skraberne, og resultaterne konverteres i et dokument specificeret af brugeren før. Med et enkelt klik på en knap kan de tilgængelige data på hjemmesiden nemt gemmes.