express-to-html 简介

express-to-html 简介,中文说明

express-to-html #github#

给朋友写的这个小玩意,可以吧express网站页面,批量转存为html。与express本身支持的cache不同,这个可以直接导出可访问的静态站。

文件功能说明

middleware/recorder.js

这个文件帮助记录网站中的请求地址。每次请求网站,这里都会判断当前页面是否被记录。

routes/spider.js

这个文件,帮助爬去自己的网站。当需要导出静态页面的时候,通过访问下面这个地址,可以爬取该网站的页面地址,并记录到“output.txt”文件中。

http://localhost:3000/spider

routes/output.js

这个文件用来导出静态页面。通过访问下面的地址,可以把“output.txt”记录的页面,按目录结构,保存到“release”文件夹中,并把静态文件,也拷贝过去。

http://localhost:3000/output

config.js

这个文件用来配置host和port,默认使用http://localhost:3000

const port = 3000;
const base_url = 'http://localhost:'+port;

module.exports = {port:port,base_url:base_url}

集成到自己的项目中

在app.js文件中,配置如下:

// app.js
...
var urlRecorder = require('./middleware/recorder'); // import it
var spiderRouter = require('./routes/spider'); // import it
var spiderRouter = require('./routes/spider'); // import it
...
var app = express();
...
app.use('/', outputRouter); // add it
app.use(urlRecorder); // add it
app.use('/', spiderRouter); // add it
...

作者

NewImaging
  • Shadust
  • 有你,真好~

评论