Skip to main content

לְגַרֵד

TL;DR

גרידה הוא מונח המייצג חילוץ של נתונים מאתר אינטרנט. עבודה זו מתבצעת על ידי קוד אשר נקרא "מגרד". הנתונים יכולים להיות מיוצגים על ידי טקסט, תמונות, סרטונים, מידע ליצירת קשר או פריטי מוצר.

לגבי גרידה

גרידה, הנקראת גם גרידה באינטרנט או מיצוי נתוני אינטרנט היא הטכניקה של שליפת כמויות גדולות של נתונים מאתר אינטרנט. תהליך זה מלווה בשמירת נתונים במחשב או במסד נתונים בפורמט טבלה.

אפילו הגרידה יכולה להתבצע באופן ידני, בדרך כלל משתמשים בכלים אוטומטיים בעת גירוד נתוני אינטרנט מכיוון שזה תהליך מהיר יותר ויקר פחות.

גירוד אינטרנט הוא בעצם סוג של חילוץ נתונים. ניתן למצוא פריטים כמו דוחות מזג אוויר, תמחור בשוק, או כל רשימה אחרת של נתונים שנאספו במאמצי גרידה באינטרנט.

מתי משתמשים בגרד?

בדרך כלל, גרידה באינטרנט משמשת כאשר בוטים של מנועי חיפוש סורקים אתר לצורך ניתוחו או דירוגו, כאשר מתבצעת השוואת מחירים של פריסת בוטים או כאשר חברות מחקרי שוק משתמשות במגרדים כדי למשוך נתונים מפורומים.

איך זה עובד?

כל העבודה מתבצעת על ידי מגרד, שהוא חתיכת קוד.

בשלב הראשון, הוא שולח שאילתת קוד "קבל" לאתר שהוא רוצה שיגרדו אותו. ניתן להגדיר אותו כך שיעבוד עם כל אתר אינטרנט, או שניתן לבנות אותו עבור אתר אינטרנט ספציפי.

לאחר מכן, תוכנת גירוד אינטרנט תטען ותחלץ נתונים ממספר דפים של אתרי אינטרנט על סמך הדרישה.

לאחר מכן, הוא מגדיר מסמך HTML המבוסס על תוצאות השאילתה.

בשלב האחרון, הנתונים המבוקשים מתבצעים בחיפוש על ידי המגרדים והתוצאות מומרות במסמך שצוין על ידי המשתמש קודם לכן. בלחיצת כפתור פשוטה ניתן לשמור את הנתונים הזמינים באתר בקלות.