Note
本工具仅能下载你在网页上可见的内容,无法绕过知乎盐选会员的付费限制。
- 自动处理字体反爬,识别并还原乱码文本。
- 批量下载知乎盐选小说,自动识别章节链接。
- 支持还原原文标点(可选“o”→“。”、“I”→“!”)。
知乎盐选内容采用自定义字体混淆反爬。
工具会自动解析网页中的字体文件,利用 OCR 技术识别每个字体字形对应的真实汉字,生成映射关系,从而将乱码文本还原为正常可读内容。
Important
使用前请确保你拥有知乎盐选会员账号,否则无法获取完整付费内容。
pip install -r requirements.txt将浏览器登录知乎后获取的 cookies 字符串完整粘贴到 cookies.txt 文件中。
python yanxuan.py <第一节链接> [--auto] [--punct]<第一节链接>:小说第一节的网页链接(必填)。--auto:自动下载全部章节。--punct:自动恢复标点(将“o”替换为“。”、“I”替换为“!”)。
下载结果会保存在 download/ 文件夹下。
-
python yanxuan.py "https://www.zhihu.com/question/114514/answer/1919810" -
python yanxuan.py "https://www.zhihu.com/xen/market/remix/paid_column/1145141919810" --auto --punct
本项目基于 moran69/yanxuan 仓库的原始实现,感谢原作者的还原思路。
Caution
- 本工具仅供学习与技术交流,请勿用于任何商业或非法用途。
- 使用本工具下载的内容仅限个人保存和阅读,严禁传播、公开或用于其他用途。
- 如因使用本工具造成的任何法律责任,均由使用者自行承担,作者不负任何责任。
如有问题或建议,欢迎 issue 反馈。