happlyfox 博客

博客 / 列表

Oct 27 2025

happlyfox - 手把手教你爬取優酷電影信息 -1

爬蟲的製作主要分為三個方面 1、加載網頁結構 2、解析網頁結構，轉變為符合需求的數據實體 3、保存數據實體（數據庫，文本等）在實際的編碼過程中，找到了一個好的類庫“HtmlAgilityPack”。介紹：官網：http://html-agility-pack.net/... Html Agility Pack源碼中的類大概有28個左右，其實不算一個很複雜的

網頁爬蟲 , xpath , c#

Oct 27 2025

happlyfox - 手把手教你爬取優酷電影信息-2

上一章節中我們實現了對優酷單頁面的爬取，簡單進行回顧一下，使用HtmlAgilityPack庫，對爬蟲的爬取一共分為三步爬蟲步驟加載頁面解析數據保存數據繼第一篇文檔後的爬蟲進階，本文章主要是對上一篇的進階。實現的功能主要為： 1、爬取電影類別列表 2、循環每個類別的電影信息，對每個類別的信息分頁爬取 3、爬取的數據保存到數據

網頁爬蟲 , xpath , c# , 多線程

happlyfox 博客

博客 / 列表

happlyfox - 手把手教你爬取優酷電影信息 -1

happlyfox - 手把手教你爬取優酷電影信息-2

Product

Company

Support

Company