Skip to content

Conversation

@liguifa
Copy link
Contributor

@liguifa liguifa commented Sep 3, 2025

问题
在以下场景下,任务实际仍在运行,但 Dinky 显示任务状态为失败或未知,且任务名旁的小火苗消失:

  1. 任务由 Flink Operator 管理,Operator对任务进行重新部署后导致jobId 发生变化。

  2. 任务由 Flink Operator 管理,失败的任务被重新拉起并成功运行。

  3. K8s 模式下,Dinky 启动任务超时,但任务实际已在 K8s 中启动成功。

  4. K8s 模式下,任务 pod 被临时缩容为 0,导致 Dinky 误判为失败。

  5. Dinky 获取 Flink 任务数据时,误将任务标记为未知。

变更

  1. 更新任务信息时,先检查 jobId 是否变化,如变化则更新任务实例的 jobId。

  2. 每隔五分钟检查一次失败任务,如发现任务已重新运行成功,则将其重新放回监控队列。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant