在使用国内文生图模型时,提示prompt提示词超出限额,比如Qwen/Qwen-Image的API仅能发送不超过2000汉字(约1K token)的提示词,现有代码中仅约束性提示词就有超过2000,根本无法在嵌入论文的内容提示词。
问题示意
Prompt 结构:
┌─────────────────────────────────────────────────────┐
│ HEAD (保留) │
│ ┌───────────────────────────────────────────────┐ │
│ │ FORMAT_SLIDE (48) │ │
│ │ SLIDE_STYLE_HINTS (894) │ │
│ │ LAYOUT_RULE (945) │ │
│ │ VISUALIZATION_HINTS (174) │ │
│ │ CONSISTENCY_HINT (73) │ │
│ │ SLIDE_FIGURE_HINT (185) │ │
│ │───────────────────────────────────────────────│ │
│ │ 固定模板总计: 2319 chars (已超限!) │ │
│ └───────────────────────────────────────────────┘ │
├─────────────────────────────────────────────────────┤
│ TAIL (被截断丢失) │
│ ┌───────────────────────────────────────────────┐ │
│ │ slide_info (~20) │ │
│ │ context_md (~3000 chars) ← 论文内容 │ │
│ │ sections_md (~500 chars) ← 当前幻灯片内容 │ │
│ └───────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────┘
截断后: full_prompt[:1900]
→ 只保留 HEAD 部分(样式提示)
→ 丢失 TAIL 部分(论文内容)
→ 图像生成无内容依据
在使用国内文生图模型时,提示prompt提示词超出限额,比如Qwen/Qwen-Image的API仅能发送不超过2000汉字(约1K token)的提示词,现有代码中仅约束性提示词就有超过2000,根本无法在嵌入论文的内容提示词。
问题示意
Prompt 结构:
┌─────────────────────────────────────────────────────┐
│ HEAD (保留) │
│ ┌───────────────────────────────────────────────┐ │
│ │ FORMAT_SLIDE (48) │ │
│ │ SLIDE_STYLE_HINTS (894) │ │
│ │ LAYOUT_RULE (945) │ │
│ │ VISUALIZATION_HINTS (174) │ │
│ │ CONSISTENCY_HINT (73) │ │
│ │ SLIDE_FIGURE_HINT (185) │ │
│ │───────────────────────────────────────────────│ │
│ │ 固定模板总计: 2319 chars (已超限!) │ │
│ └───────────────────────────────────────────────┘ │
├─────────────────────────────────────────────────────┤
│ TAIL (被截断丢失) │
│ ┌───────────────────────────────────────────────┐ │
│ │ slide_info (~20) │ │
│ │ context_md (~3000 chars) ← 论文内容 │ │
│ │ sections_md (~500 chars) ← 当前幻灯片内容 │ │
│ └───────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────┘
截断后: full_prompt[:1900]
→ 只保留 HEAD 部分(样式提示)
→ 丢失 TAIL 部分(论文内容)
→ 图像生成无内容依据