【C#】推薦2個.Net開源Html解析器,方便我們提取網頁數據
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
如果我們需要抓取網絡上的數據,這時候我們就要寫爬蟲,這里面就涉及到網頁的抓取、以及網頁分析與數據提取。 下面推薦2個.Net開源Html解析器,方便用于網絡爬蟲Html源碼的解析、Html源碼編輯等場景。 一、AngleSharp 這是一個基于.Net開發的,Html代碼解析器,支持通過C#實現類似Jquery的方式來解析Html源碼、節點創建、節點刪除、節點修改、屬性的添加修改等,還支持SVG、XML、MathML等格式,此外還能解析Css。 項目地址: https://github.com/AngleSharp/AngleSharp? 項目特色 1、非常出色的性能; 2、基于.NET Standard 2.0開發,支持跨平臺,包括移動平臺; 3、擴展性強,可以自己自定義; 4、支持LINQ語法; 5、支持類似Jquery查詢功能; 6、表單提交、Http請求等; 7、Api功能符合W3C規范標準。 部分代碼示例 Html代碼解析 Form表單提交,并獲取超鏈接數量 通過Class選擇元素 表格單元格選擇 Html元素創建 添加Class 屬性操作 二、html-agility-pack Html Agility Pack (HAP) 是一個開源的 HTML 解析庫。
示例代碼 獲取指定的網頁,并獲取所有a標簽的文本。
該文章在 2025/3/19 12:54:33 編輯過 |
關鍵字查詢
相關文章
正在查詢... |