初嘗 Node.js 開發,使用到了一些小工具,在此與大家分享。一篇小白出品的小白文,歡迎大神們慷慨指導! 首先介紹具體需求:使用 .html 模板根據配置內容生成定製的靜態網頁,這些靜態網頁被部署至 n 台服務器上供訪問。 為何要生成大量相似度極高的靜態文件,而非使用數據庫並通過請求渲染模板呢?項目背景如此,不必糾結吐槽,本文重點在於分享幾款實用小工具。 Cheerio 使用 .html 模板
新建一個文件夾,這裏我命名為“爬”。 mkdir pa 初始化一個工程,並安裝相關模塊。 cd pa // 安裝package.json npm init // 安裝cheerio,用來在服務端使用jq語法操作dom npm install cheerio --save 新建文件命名為app.js,按照需求爬取數據,並保存到data.txt。 cons
時間:2021年4月1號,文中各版本號以該時間為背景 問題一、網頁採用gb2312編碼,爬取後中文全部亂碼 環境:node@8.12.0,cheerio@0.22.0 網站使用的gb2312編碼,開始用http直接訪問網頁,cheerio加載後console出來中文全部亂碼: const http = require('http') const cheerio = require('