Skip to content

mistpink/yanxuan

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 

Repository files navigation

知乎盐选小说批量下载与还原工具

功能

Note

本工具仅能下载你在网页上可见的内容,无法绕过知乎盐选会员的付费限制。

  • 自动处理字体反爬,识别并还原乱码文本。
  • 批量下载知乎盐选小说,自动识别章节链接。
  • 支持还原原文标点(可选“o”→“。”、“I”→“!”)。

实现原理

知乎盐选内容采用自定义字体混淆反爬。
工具会自动解析网页中的字体文件,利用 OCR 技术识别每个字体字形对应的真实汉字,生成映射关系,从而将乱码文本还原为正常可读内容。

使用方法

Important

使用前请确保你拥有知乎盐选会员账号,否则无法获取完整付费内容。

1. 安装依赖

pip install -r requirements.txt

2. 准备 cookies

将浏览器登录知乎后获取的 cookies 字符串完整粘贴到 cookies.txt 文件中。

3. 运行脚本

python yanxuan.py <第一节链接> [--auto] [--punct]
  • <第一节链接>:小说第一节的网页链接(必填)。
  • --auto:自动下载全部章节。
  • --punct:自动恢复标点(将“o”替换为“。”、“I”替换为“!”)。

下载结果会保存在 download/ 文件夹下。

4. 示例

  • python yanxuan.py "https://www.zhihu.com/question/114514/answer/1919810"
  • python yanxuan.py "https://www.zhihu.com/xen/market/remix/paid_column/1145141919810" --auto --punct

致谢

本项目基于 moran69/yanxuan 仓库的原始实现,感谢原作者的还原思路。

Caution

  • 本工具仅供学习与技术交流,请勿用于任何商业或非法用途。
  • 使用本工具下载的内容仅限个人保存和阅读,严禁传播、公开或用于其他用途。
  • 如因使用本工具造成的任何法律责任,均由使用者自行承担,作者不负任何责任。

Star History

Star History Chart

如有问题或建议,欢迎 issue 反馈。

About

知乎盐选小说批量下载与还原工具。自动处理字体反爬、识别章节链接,支持还原原文标点。采用 cookies 登录,命令行参数灵活。

Resources

Stars

Watchers

Forks

Contributors

Languages

  • Python 100.0%