欧美成人精品手机在线观看_69视频国产_动漫精品第一页_日韩中文字幕网 - 日本欧美一区二区

LOGO OA教程 ERP教程 模切知識交流 PMS教程 CRM教程 開發文檔 其他文檔  
 
網站管理員

【C#】推薦2個.Net開源Html解析器,方便我們提取網頁數據

admin
2025年3月19日 12:53 本文熱度 454

如果我們需要抓取網絡上的數據,這時候我們就要寫爬蟲,這里面就涉及到網頁的抓取、以及網頁分析與數據提取。

下面推薦2個.Net開源Html解析器,方便用于網絡爬蟲Html源碼的解析、Html源碼編輯等場景。


一、AngleSharp

這是一個基于.Net開發的,Html代碼解析器,支持通過C#實現類似Jquery的方式來解析Html源碼、節點創建、節點刪除、節點修改、屬性的添加修改等,還支持SVG、XML、MathML等格式,此外還能解析Css。

項目地址:

https://github.com/AngleSharp/AngleSharp?

項目特色

1、非常出色的性能;

2、基于.NET Standard 2.0開發,支持跨平臺,包括移動平臺;

3、擴展性強,可以自己自定義;

4、支持LINQ語法;

5、支持類似Jquery查詢功能;

6、表單提交、Http請求等;

7、Api功能符合W3C規范標準。

部分代碼示例

Html代碼解析

Form表單提交,并獲取超鏈接數量

通過Class選擇元素

表格單元格選擇

Html元素創建

添加Class

屬性操作


二、html-agility-pack

Html Agility Pack (HAP) 是一個開源的 HTML 解析庫。

  • 強大的容錯性:HAP 對于“真實世界”中常見的 HTML 錯誤非常寬容,能夠解析格式不規范的 HTML 文件。
  • DOM 操作:它提供了一個類似 System.Xml 的對象模型,但專門用于 HTML 文檔,支持對 HTML 的讀寫操作。
  • XPath 和 XSLT 支持:用戶可以使用 XPath 查詢和 XSLT 轉換來處理 HTML 數據,但即使不熟悉這些技術,也可以輕松上手。

項目地址:
https://github.com/zzzprojects/html-agility-pack

示例代碼

獲取指定的網頁,并獲取所有a標簽的文本。

using HtmlAgilityPack;

using System;


// 加載 HTML 文件

HtmlWeb web = new HtmlWeb();

HtmlDocument doc = web.Load("https://www.xxx.com");


// 使用 XPath 查詢

var nodes = doc.DocumentNode.SelectNodes("http://a");

foreach (var node in nodes)

{

    Console.WriteLine(node.InnerText);

}


- End -


該文章在 2025/3/19 12:54:33 編輯過
關鍵字查詢
相關文章
正在查詢...
點晴ERP是一款針對中小制造業的專業生產管理軟件系統,系統成熟度和易用性得到了國內大量中小企業的青睞。
點晴PMS碼頭管理系統主要針對港口碼頭集裝箱與散貨日常運作、調度、堆場、車隊、財務費用、相關報表等業務管理,結合碼頭的業務特點,圍繞調度、堆場作業而開發的。集技術的先進性、管理的有效性于一體,是物流碼頭及其他港口類企業的高效ERP管理信息系統。
點晴WMS倉儲管理系統提供了貨物產品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質期管理,貨位管理,庫位管理,生產管理,WMS管理系統,標簽打印,條形碼,二維碼管理,批號管理軟件。
點晴免費OA是一款軟件和通用服務都免費,不限功能、不限時間、不限用戶的免費OA協同辦公管理系統。
Copyright 2010-2025 ClickSun All Rights Reserved