node-spider-bqg-novel

nodejs 爬虫，爬取网站小说

nodejs + ts + puppeteer

本工具只供平时学习用

爬取指定文章需要先分析网页结构和 html 标签，再适度修改代码

最新版参考 grabRanWen.ts 或 grabQiuYuGe.ts ，没有全局安装ts编译的，可以修改为js再执行是一样的

根目录新建 bin 文件夹，ts编译的js文件会生成到 bin 里面，爬取的文件会生成到 bin/data/novel/ 里面

puppeteer 中文api文档 https://my.oschina.net/reamd7/blog/1634846?spm=a2c6h.12873639.article-detail.23.32892e562nV4LB#pagesetuseragentuseragent

安装

npm install

运行

# 在 package.json 里面配置scripts命令
npm start
# or
npm run get:rw
# or
npm run get:qyg

配置puppeteer

修改 bqgConfig.ts

关注 bqgConfig.ts 中 config 对象的 localChromePath，参考里面的注释说明
mac和windows有区别

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
bin		bin
src		src
.gitignore		.gitignore
README.md		README.md
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json
yarn.lock		yarn.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

node-spider-bqg-novel

安装

运行

配置puppeteer

About

Releases

Packages

Languages

liuzg0505/node-spider-bqg-novel

Folders and files

Latest commit

History

Repository files navigation

node-spider-bqg-novel

安装

运行

配置puppeteer

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages