本项目旨在将使用Python编写的LightnovelSpider异步网络爬虫项目的最佳实践移植到基于Node.js的TypeScript项目中。本项目已终止开发。
使用Typescript编写异步网络爬虫的框架部分大约可以节约掉Python异步引擎的40行代码,但代价是Axios想要实现HTTP/SOCKS通用代理功能的过程极为繁琐,如果采用切换Agent实例的方式实现必将造成运行时切换节点的较大开销,此外Python官方库自带的文本处理函数在Typescript上要实现同样效果必须重新编写一套工具函数。可见在要求最佳实践的情况下使用Node.js编写网络爬虫相比使用Python并不划算。
- 完成了异步网络爬虫框架部分的移植。