You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: README.md
+6-2Lines changed: 6 additions & 2 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -14,7 +14,8 @@
14
14
-**Replay** — учитывает только те логи, где B совпадает с A.
15
15
-**IPS** — взвешивает отклики по отношению вероятностей выбора в B и A.
16
16
-**SNIPS** — нормализует веса IPS для меньшей дисперсии.
17
-
-**Doubly Robust** — комбинирует модель отклика и IPS; достаточно корректности хотя бы одной из них.
17
+
-**Direct Method** — строит модель отклика и прогнозирует исходы под политикой B.
18
+
-**Doubly Robust** — комбинирует Direct Method и IPS; достаточно корректности хотя бы одной из них.
18
19
-**SN-DR** — нормализует поправку Doubly Robust, что снижает дисперсию.
19
20
-**Switch-DR** — применяет IPS-поправку только при малых весах, иначе полагается на модель.
20
21
@@ -23,6 +24,7 @@
23
24
-**Replay** — новая политика должна часто совпадать со старой, иначе большинство логов отбрасывается.
24
25
-**IPS** — требует точного знания вероятностей действий в обеих политиках; большие веса увеличивают дисперсию.
25
26
-**SNIPS** — нормализует веса IPS и снижает дисперсию, но остаётся чувствительным к ошибкам вероятностей и малым объёмам данных.
27
+
-**Direct Method** — зависит от точности модели отклика и может смещаться вне обучающей области.
26
28
-**Doubly Robust** — корректность достигается, если верна хотя бы модель отклика или пропенсити, но метод чувствителен к ошибкам обеих моделей и выбору клиппинга.
27
29
-**SN-DR** — уменьшает дисперсию DR за счёт нормализации весов, но наследует его предположения.
28
30
-**Switch-DR** — отбрасывает экстремальные веса, сочетая DM и DR, но выбор порога влияет на смещение.
@@ -91,6 +93,7 @@ from policyscope.estimators import (
0 commit comments