-
Notifications
You must be signed in to change notification settings - Fork 29
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Disk Manager] Fix tests on tasks metrics: do not use NotBefore method of mocks #3263
base: main
Are you sure you want to change the base?
Conversation
if totalHangingTasksCount.CompareAndSwap(0, 1) { | ||
gaugeSetWg.Done() |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
а если не получится записать, то мы же никогда не дождемся Wait?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
В корректном испольнении обязательно получится записать.
- Сначала таск зависает, и в атомик запсывается 1 (успешно, т.к. изначально там 0).
- Тест дожидается этого.
- Тест отменяет таск.
- В атомик записывается 0 (успешно, так как там уже записан 1).
- Тест дожидается этого и завершается.
if нужен, чтобы не дёргать Done, когда этого не нужно делать.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
изменение по моему мнению выглядит слишком сложным
- может легче стартовать раннеров после того, как зашедулили hanging tasks?
- может попробовать дождаться первого 0 в метрике totalHangingTasksCount?
- вообще проблема НЕ может воспроизводиться на метрике hangingTasksCount, поэтому менять нужно только код вокруг totalHangingTasksCount
- может быть в testify есть методы, которые позволяют сделать то, что нам нужно? какой-нибудь After или что-то вроде того?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
может легче стартовать раннеров после того, как зашедулили hanging tasks?
может попробовать дождаться первого 0 в метрике totalHangingTasksCount?
Тут дело в том, что 0 в эту метрику будут постоянно записываться в фоне с каким-то периодом -- и так до тех пор, пока не пройдёт HangingTaskTimeout. Поэтому не понятно, как эти меры могли бы помочь.
Вообще проблема НЕ может воспроизводиться на метрике hangingTasksCount, поэтому менять нужно только код вокруг totalHangingTasksCount
Да, но код хочется сделать единнобразным. Иначе получается ещё сложнее.
может быть в testify есть методы, которые позволяют сделать то, что нам нужно? какой-нибудь After или что-то вроде того?
Не вижу подходящего инструмента(
В качестве альтернативы думал вызывать On для перехода в 0 уже после того, как дождались 1. Но есть и другая проблема -- как гарантировать, что wg.Done() не будет вызван лишний раз?
ИМХО, текущий вариант довольно естественный. Нам интересуют два события:
- Переход счётчика из 0 в 1
- Переход счётчика из 1 в 0
И проверки в CompareAndSwap срабатывают ровно на эти события.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Изменил подход согласно предложению @jkuradobery #3263 (review)
@@ -112,6 +112,7 @@ func newDefaultConfig() *tasks_config.TasksConfig { | |||
clearEndedTasksLimit := uint64(10) | |||
maxRetriableErrorCount := uint64(2) | |||
hangingTaskTimeout := "100s" | |||
maxPanicCount := uint64(0) |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Добавил это в конфиг для всех tasks_tests, чтобы не пропускать паники в тасках. Теперь, если в каком-либо тесте таска запаникует, сразу вернётся неретрабельная ошибка, и тест упадёт.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
I propose we send setter for a gauge to a channel. And we wait for 0 -> 1-> 0 history in the channel (there can be contiguous duplicates, but they should be ignored).
This way we can get rid of waitgroups and improve readability.
d9ab64e
to
8e98788
Compare
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Good job, LGTM
In this pr we fix
TestHangingTasksMetrics
andTestListerMetricsCleanup
tests. These tests worked incorrectly, but we didn't know about that because they passed.The problem is the following. In go mocks, if a mock method call violates the requirement
NotBefore
, the method panics. InTestHangingTasksMetrics
andTestListerMetricsCleanup
tests we have mock metrics but 'real' task controller. If a method of mock metrics panics during task execution, the panic is handled in task controller. This leads to the strange situation:Must not be called before
error occurs but the test passes.Moreover, we used
NotBefore
requirement in these tests incorrectly. Namely, we required that 0 is set to totalHangingTaskCount not before then 1 is. But actually, this happens:In this pr we stop using
NotBefore
method in these tests.