Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Bug]: <title>Failed to process document - doc-4ed46e6033f61a939bf0930ad9c61590: {} (status code: 500) #1069

Open
1 of 2 tasks
wjj97172 opened this issue Mar 12, 2025 · 1 comment
Labels
bug Something isn't working

Comments

@wjj97172
Copy link

wjj97172 commented Mar 12, 2025

Do you need to file an issue?

  • I have searched the existing issues and this bug is not already filed.
  • I believe this is a legitimate bug, not just a question or feature request.

Describe the bug

---the output of program -----
INFO: Process 166934 Shared-Data created for Single Process
INFO:Init {'embedding_dim': 768, 'metric': 'cosine', 'storage_file': './chinese-bingli/vdb_entities.json'} 0 data
INFO:Init {'embedding_dim': 768, 'metric': 'cosine', 'storage_file': './chinese-bingli/vdb_relationships.json'} 0 data
INFO:Init {'embedding_dim': 768, 'metric': 'cosine', 'storage_file': './chinese-bingli/vdb_chunks.json'} 0 data
INFO: Process 166934 initialized updated flags for namespace: [full_docs]
INFO: Process 166934 ready to initialize storage namespace: [full_docs]
INFO: Process 166934 initialized updated flags for namespace: [text_chunks]
INFO: Process 166934 ready to initialize storage namespace: [text_chunks]
INFO: Process 166934 initialized updated flags for namespace: [entities]
INFO: Process 166934 initialized updated flags for namespace: [relationships]
INFO: Process 166934 initialized updated flags for namespace: [chunks]
INFO: Process 166934 initialized updated flags for namespace: [chunk_entity_relation]
INFO: Process 166934 initialized updated flags for namespace: [llm_response_cache]
INFO: Process 166934 ready to initialize storage namespace: [llm_response_cache]
INFO: Process 166934 initialized updated flags for namespace: [doc_status]
INFO: Process 166934 ready to initialize storage namespace: [doc_status]
INFO: Process 166934 storage namespace already initialized: [full_docs]
INFO: Process 166934 storage namespace already initialized: [text_chunks]
INFO: Process 166934 storage namespace already initialized: [llm_response_cache]
INFO: Process 166934 storage namespace already initialized: [doc_status]
INFO: Process 166934 Pipeline namespace initialized
Failed to process document 123 - doc-4ed46e6033f61a939bf0930ad9c61590: {} (status code: 500)

---background---
lightrag:latest main (up to 03.12 14:00:00 )
prompt.py modify from english to chinese,
book.txt modify like this:【病例id:41420241764120241011,患者姓名:赵**,女性,年龄52,2024年09月28日入院,2024年10月11日出院。出院科室推拿科,诊断编码及名称包括:K07.604,颞颌关节炎,G50.000,三叉神经痛,M50.101+G55.1*,颈椎间盘突出伴有神经根病,E78.000,纯高胆固醇血症。手术及操作编码及名称包括:83.9800x001,,软组织治疗性药物局部注射,,17.96100,,针刀治疗,,17.92110,,颈椎病推拿治疗,,17.91100,,毫针治疗,,17.94100,,拔罐治疗,,17.91350,,温针灸治疗。治疗期间费用包括:2024年09月28日 11时0分 子午流注开穴法 医保费用分类丙类 数量 1.0每个穴位 花费10.0元 微波治疗 医保费用分类丙类 数量 1.0每部位/次 花费20.0元 拔罐疗法 医保费用分类丙类 数量 4.03罐 花费60.0元 灸法 医保费用分类丙类 数量 1.0次 花费20.0元 电针 医保费用分类丙类 数量 4.0二个穴位 花费80.0元 耳针(磁珠压耳穴) 医保费用分类丙类 数量 1.0单耳 花费17.0元 。2024年09月28日 12时0分 II级护理(优质护理) 医保费用分类丙类 数量 1.0日 花费35.0元 五床间及以上 医保费用分类丙类 数量 1.0床日 花费12.0元 住院诊查费 医保费用分类丙类 数量 1.0日 花费30.0元 。2024年09月28日 3时23分 真空采血管/抗凝剂/环氧乙烷灭菌 医保费用分类丙类 数量 1.0支 花费0.85元 静脉采血器采血 医保费用分类丙类 数量 1.0次 花费4.0元 。2024年09月28日 3时4分 25羟维生素D测定(免疫学法等) 医保费用分类丙类 数量 1.0项 花费40.0元 人免疫缺陷病毒抗体测定(免疫学法) 医保费用分类丙类 数量 1.0项 花费25.0元 十二通道心电图检查 医保费用分类丙类 数量 1.0次 花费20.0元】

Steps to reproduce

No response

Expected Behavior

No response

LightRAG Config Used

Paste your config here

采用了ollma的llm以及embedding
llm_model_name="deepseek-r1:7b",
ollama_embed:embed_model="shaw/dmeta-embedding-zh:latest"

同时参考,将embedding_batch_num设置为4;

Logs and screenshots

No response

Additional Information

  • LightRAG Version:1.2.5
  • Operating System:ubuntu 20
  • Python Version: 3.12
  • Related Issues:

vdb_entities.json 这个文件没有实体,是空的。

@wjj97172 wjj97172 added the bug Something isn't working label Mar 12, 2025
@seanzhang-zhichen
Copy link

Do you need to file an issue?

  • I have searched the existing issues and this bug is not already filed.[ ] I believe this is a legitimate bug, not just a question or feature request.

Describe the bug

---the output of program ----- INFO: Process 166934 Shared-Data created for Single Process INFO:Init {'embedding_dim': 768, 'metric': 'cosine', 'storage_file': './chinese-bingli/vdb_entities.json'} 0 data INFO:Init {'embedding_dim': 768, 'metric': 'cosine', 'storage_file': './chinese-bingli/vdb_relationships.json'} 0 data INFO:Init {'embedding_dim': 768, 'metric': 'cosine', 'storage_file': './chinese-bingli/vdb_chunks.json'} 0 data INFO: Process 166934 initialized updated flags for namespace: [full_docs] INFO: Process 166934 ready to initialize storage namespace: [full_docs] INFO: Process 166934 initialized updated flags for namespace: [text_chunks] INFO: Process 166934 ready to initialize storage namespace: [text_chunks] INFO: Process 166934 initialized updated flags for namespace: [entities] INFO: Process 166934 initialized updated flags for namespace: [relationships] INFO: Process 166934 initialized updated flags for namespace: [chunks] INFO: Process 166934 initialized updated flags for namespace: [chunk_entity_relation] INFO: Process 166934 initialized updated flags for namespace: [llm_response_cache] INFO: Process 166934 ready to initialize storage namespace: [llm_response_cache] INFO: Process 166934 initialized updated flags for namespace: [doc_status] INFO: Process 166934 ready to initialize storage namespace: [doc_status] INFO: Process 166934 storage namespace already initialized: [full_docs] INFO: Process 166934 storage namespace already initialized: [text_chunks] INFO: Process 166934 storage namespace already initialized: [llm_response_cache] INFO: Process 166934 storage namespace already initialized: [doc_status] INFO: Process 166934 Pipeline namespace initialized Failed to process document 123 - doc-4ed46e6033f61a939bf0930ad9c61590: {} (status code: 500)

---background--- lightrag:latest main (up to 03.12 14:00:00 ) prompt.py modify from english to chinese, book.txt modify like this:【病例id:41420241764120241011,患者姓名:赵**,女性,年龄52,2024年09月28日入院,2024年10月11日出院。出院科室推拿科,诊断编码及名称包括:K07.604,颞颌关节炎,G50.000,三叉神经痛,M50.101+G55.1*,颈椎间盘突出伴有神经根病,E78.000,纯高胆固醇血症。手术及操作编码及名称包括:83.9800x001,,软组织治疗性药物局部注射,,17.96100,,针刀治疗,,17.92110,,颈椎病推拿治疗,,17.91100,,毫针治疗,,17.94100,,拔罐治疗,,17.91350,,温针灸治疗。治疗期间费用包括:2024年09月28日 11时0分 子午流注开穴法 医保费用分类丙类 数量 1.0每个穴位 花费10.0元 微波治疗 医保费用分类丙类 数量 1.0每部位/次 花费20.0元 拔罐疗法 医保费用分类丙类 数量 4.03罐 花费60.0元 灸法 医保费用分类丙类 数量 1.0次 花费20.0元 电针 医保费用分类丙类 数量 4.0二个穴位 花费80.0元 耳针(磁珠压耳穴) 医保费用分类丙类 数量 1.0单耳 花费17.0元 。2024年09月28日 12时0分 II级护理(优质护理) 医保费用分类丙类 数量 1.0日 花费35.0元 五床间及以上 医保费用分类丙类 数量 1.0床日 花费12.0元 住院诊查费 医保费用分类丙类 数量 1.0日 花费30.0元 。2024年09月28日 3时23分 真空采血管/抗凝剂/环氧乙烷灭菌 医保费用分类丙类 数量 1.0支 花费0.85元 静脉采血器采血 医保费用分类丙类 数量 1.0次 花费4.0元 。2024年09月28日 3时4分 25羟维生素D测定(免疫学法等) 医保费用分类丙类 数量 1.0项 花费40.0元 人免疫缺陷病毒抗体测定(免疫学法) 医保费用分类丙类 数量 1.0项 花费25.0元 十二通道心电图检查 医保费用分类丙类 数量 1.0次 花费20.0元】

Steps to reproduce

No response

Expected Behavior

No response

LightRAG Config Used

Paste your config here

采用了ollma的llm以及embedding llm_model_name="deepseek-r1:7b", ollama_embed:embed_model="shaw/dmeta-embedding-zh:latest"

同时参考,将embedding_batch_num设置为4;

Logs and screenshots

No response

Additional Information

  • LightRAG Version:1.2.5
  • Operating System:ubuntu 20
  • Python Version: 3.12
  • Related Issues:

vdb_entities.json 这个文件没有实体,是空的。

我也碰到了 看了下,实际上LLM返回是对的,但最后没有实体和边的信息,不知道什么

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

2 participants