Skip to content

shlmt/HtmlCrawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🔍 HTML Crawler - כלי לניתוח ופריסת HTML ב־C#

תיאור

כלי לעיבוד HTML בשפת C#, שמטרתו לאפשר בנייה של מנועי Crawler או Scraper -- כלומר, כלים לסריקת אתרים ושליפת מידע. המערכת קוראת קבצי HTML, מפרקת אותם לאובייקטים היררכיים מסוג HtmlElement, ומאפשרת שאילתות מתקדמות באמצעות סלקטורים בסגנון CSS.

עקרונות הנדסיים

  • שימוש בתבנית Singleton עבור HtmlHelper
  • שימוש ב־Regular Expressions לניתוח HTML ו־Attributes
  • שימוש ב־Queue לעיבוד מבני בטוח (ללא רקורסיות מסוכנות)
  • שימוש ב IEnumerable ו־‎yield return‎` ליעילות בזיכרון.

Releases

No releases published

Packages

No packages published

Languages