Bug Description
当前提供的镜像及megatron core版本,无法支持GLM5模型hf转torch_dist,GLM5的架构还未支持。但是怎么本项目中能提供训练脚本?
Steps to Reproduce
当前提供的镜像及megatron core版本,无法支持GLM5模型hf转torch_dist,GLM5的架构还未支持。但是怎么本项目中能提供训练脚本?
Expected Behavior
正常转换GLM5
Actual Behavior
转换报错
Environment
- slime version:
- Python version:
- PyTorch version:
- CUDA/ROCm version:
- GPU type and count:
- OS:
- SGLang version (if relevant):
- Megatron-LM version (if relevant):
Logs
Additional Context
No response
Pre-submission Checklist
Bug Description
当前提供的镜像及megatron core版本,无法支持GLM5模型hf转torch_dist,GLM5的架构还未支持。但是怎么本项目中能提供训练脚本?
Steps to Reproduce
当前提供的镜像及megatron core版本,无法支持GLM5模型hf转torch_dist,GLM5的架构还未支持。但是怎么本项目中能提供训练脚本?
Expected Behavior
正常转换GLM5
Actual Behavior
转换报错
Environment
Logs
Additional Context
No response
Pre-submission Checklist