FictionDown:一款强大的网文爬取与转换工具
FictionDown是一款专为网文爱好者设计的爬取工具,它具备全自动校对、多格式转换等功能,能够有效解决章节目录缺失和次序紊乱等难题。同时内嵌简易的广告过滤功能,极大地方便了用户的阅读体验。
软件亮点
以起点为样板:软件亮点以起点为例,实现多网站线程同步爬取和校对。
多格式支持:支持导出为txt格式,兼容大部分阅读软件;支持导出为markdown格式,方便使用pandoc转换成epub。
书籍信息保存:自动保存书籍信息、卷构造、创作者信息。
简易广告过滤:内置简易广告过滤功能,但需手动删除部分广告。
Golang开发:采用Golang语言开发,确保了软件的稳定性和高效性。
安装部署便捷:安装部署简单,外界依赖仅有PhantomJS。
使用方法
获取书籍信息
输入起点等网站链接,获取书籍信息。
开始爬取各章节内容,包括VIP章节。
校对与过滤
遇到VIP章节,将其放入Example中作为校对样板。
手动设定笔趣阁等盗版小说网站的对应链接。
使用tamp字段名再次启动,开始爬取,仅爬取VIP部分,并与Example进行校对。
手动编写相匹配的缓存,删除广告宣传和一些任意标识符(部分为关键词,可能导致pandoc内存溢出或格式错误)。
使用-f md
生成markdown文件。
转换为epub
使用pandoc将markdown文件转换为epub:pandoc -o xxxx.epub xxxx.md
支持直接输出epub格式,无需使用pandoc(刺猬猫网站支持)。
功能完善与更新
爬取起点时携带Cookie:支持爬取已购买章节。
支持刺猬猫网站:支持直接输出epub格式。
小说集站内关键字搜索:支持站内关键字搜索。
md转换到epub时路径问题:已修复。
简化广告过滤:简化应用流程。
提升log输出:优化日志输出。
书籍介绍格式:书籍介绍也应为HTML格式,而非当前的\t
和\n
。
版本更新
小说集站内关键字搜索功能。
cmd梳理改动。
网站搭配结构。
每个输出文件格式稍作梳理。
- 新游戏暂无消息 参与地图设计大赛赢取奖励 10-31
- 2K公布免费第三人称英雄射击游戏《Ethos计划》 10-21
- 考试啦,《葫芦娃2》带来原动画细节小考卷(4) 10-21
- 王国两位君主北欧之地隐士有什么用 10-21
- 我的世界种子怎么种植方法 10-21
- 崩坏学园2怎么注销崩坏怎么注销账号 10-21
- 不止《生化危机》外媒精选30款恐怖佳作 10-21
- 王国两位君主北欧之地雷神之锤解锁顺序 10-21
- 梦幻西游梦玲珑穿什么 10-21
- 功夫熊猫阿宝邀你切磋,《蛋仔派对》联动KouKouLove第二弹开启 10-21