TrajDL提供了轨迹数据挖掘领域中的多个SOTA深度学习模型的实现,为研究人员、工程师提供易用、高效、可靠的开发工具,可以快速开展实验和应用开发。TrajDL有几个关键特性:
-
基于Arrow,Pytorch和Lightning
TrajDL的数据部分构建在Arrow之上,模型部分构建在Pytorch之上,训练与验证流程构建在Lightning之上,充分结合各个框架工具的优势。 -
高效的工具
TrajDL提供了高效的工具,比如高效的Dataset,Tokenizer,GridSystem。出色的零拷贝特性可以显著降低数据的处理时间,节省内存使用。高效的Tokenizer和GridSystem可以随时转换数据,无需预先处理数据。 -
可扩展性
TrajDL高度模块化,不会约束用户的代码,用户可以随时从TrajDL里面取出自己需要使用的工具。TrajDL还打通了与Polars,Pandas,PyArrow等工具的接口,用户使用常用的科学计算工具处理后的数据可以轻松导入到TrajDL的数据体系。另外TrajDL同时支持API与配置文件两种方式开展实验与开发,尽可能提升用户体验。 -
包含SOTA模型的实验复现脚本
TrajDL提供了SOTA模型的复现脚本,用户可以通过脚本重现论文内的实验结果,部分场景下TrajDL具备比论文场景更优的效果。
简体中文文档参阅:简体中文文档
English documentation will be provided in subsequent versions.
scripts/benchmark目录下存储了TrajDL提供的benchmark复现脚本,针对各个论文使用TrajDL进行了实验复现。
本项目使用Apache License 2.0,详见LICENSE。