SOW — Agentic Search Optimization Engine

1. Цель

Разработать Python-сервис с CLI-клиентом, который автоматически:

получает SEO-сигналы целевого сайта;
формирует гипотезы ниши;
собирает и/или принимает конкурентов из SERP;
анализирует контентные и keyword gaps;
возвращает структурированное SEO-ядро и рекомендации.

2. Что было скорректировано в исходной постановке

2.1 Ниша

Полностью автоматически и безошибочно определить нишу нельзя, если у агента нет входных ограничений. Поэтому корректная модель такая:

агент предлагает 2–3 гипотезы ниши;
гипотезы строятся по SEO-сигналам целевого сайта;
пользователь или следующий слой системы может подтвердить гипотезу.

Это соответствует ранее согласованному варианту Option B.

2.2 SERP и конкуренты

Топ сайтов нельзя считать универсальным без параметров:

GEO
язык
search engine
device
query set

Поэтому корректная логика:

по каждой SERP-запросной группе агент собирает результаты;
хранит массив до 10 результатов;
в итоговый shortlist выделяет 5 основных конкурентов;
расширяет shortlist до 10, если результаты сильно различаются по интенту или сегменту.

2.3 LLM

LLM не должен быть первым источником истины. Корректный пайплайн:

собрать crawl / on-page / competitor / SERP данные;
нормализовать сигналы;
затем использовать LLM для оценки, резюмирования и приоритизации.

3. In Scope

Phase 1 — MVP CLI

Python CLI-приложение
анализ одной целевой страницы или локального HTML
извлечение title, meta description, meta keywords, headings, links
heuristic niche discovery
сравнение с переданными конкурентами
построение keyword opportunities / SEO core
вывод в text / json

Phase 2 — Smart data acquisition

подключение SERP API или search provider
сбор top-5 / top-10 конкурентов
page-type classification
начальная site-wide агрегация

Phase 3 — LLM layer

LLM-based scoring
entity normalization
search intent enrichment
content brief generation
page recommendations

Phase 4 — Production system

API + job queue
persistence layer
dashboard
scheduled re-runs
exports and integrations

4. Out of Scope для текущего MVP

full-site distributed crawling
production SERP scraping at scale
bypass anti-bot protections
rank tracking history
external billing
multi-tenant auth

5. Входные данные

Обязательные:

target_domain или target_url или локальный HTML-файл

Опциональные:

competitor_sources[]
serp_file
geo
language
search_engine
max_competitors
max_core_terms

6. Выходной результат

Сервис должен возвращать объект с блоками:

niche_hypotheses
target
competitors
seo_core
insights
warnings

Каждый элемент seo_core должен включать:

term
cluster
intent
priority
source
competitor_count
target_score
competitor_score
supporting_terms
rationale

7. Functional requirements

FR-1. Target analysis

Система должна уметь анализировать локальный HTML, URL и домен.

FR-2. On-page extraction

Система должна извлекать базовые SEO-сигналы страницы.

FR-3. Niche hypotheses

Система должна возвращать до 3 гипотез ниши на базе найденных терминов.

FR-4. Competitor comparison

Система должна сравнивать целевую страницу с конкурентами и выделять overlap / gaps.

FR-5. SEO core generation

Система должна формировать итоговое SEO-ядро с приоритетом и обоснованием.

FR-6. Flexible competitor input

Система должна принимать конкурентов как повторяемые CLI-аргументы и как JSON-массив.

8. Non-functional requirements

простота локального запуска;
отсутствие обязательных внешних зависимостей в MVP;
расширяемость до API-first архитектуры;
детерминированный offline-friendly режим тестирования;
совместимость с Windows shell и локальным запуском Python.

9. Deliverables

Реализовано в текущем инкременте

main.py — совместимый entrypoint
пакет seo_agent_cli
unit tests на фикстурах
README.md
SOW.md
ARCHITECTURE.md
TODO.md

10. Acceptance criteria для MVP

MVP считается принятым, если:

запускается через CLI;
принимает целевой сайт и конкурентов;
извлекает SEO-сигналы из HTML;
возвращает гипотезы ниши;
строит keyword opportunities;
проходит локальные unit tests;
поддерживает JSON output.

11. Риски

SERP без API нестабилен и зависит от anti-bot ограничений;
нишевая классификация по heuristics ограничена;
keyword scoring без search volume является относительным, а не абсолютным;
без LLM и внешних SEO-данных приоритизация пока упрощённая.

12. Recommendation

Для production-версии рекомендован стек:

Python как core backend;
CLI + позже FastAPI;
optional Redis/PostgreSQL;
external SERP / SEO APIs;
LLM layer после стабилизации data pipeline.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

SOW — Agentic Search Optimization Engine

1. Цель

2. Что было скорректировано в исходной постановке

2.1 Ниша

2.2 SERP и конкуренты

2.3 LLM

3. In Scope

Phase 1 — MVP CLI

Phase 2 — Smart data acquisition

Phase 3 — LLM layer

Phase 4 — Production system

4. Out of Scope для текущего MVP

5. Входные данные

6. Выходной результат

7. Functional requirements

FR-1. Target analysis

FR-2. On-page extraction

FR-3. Niche hypotheses

FR-4. Competitor comparison

FR-5. SEO core generation

FR-6. Flexible competitor input

8. Non-functional requirements

9. Deliverables

Реализовано в текущем инкременте

10. Acceptance criteria для MVP

11. Риски

12. Recommendation

FilesExpand file tree

SOW.md

Latest commit

History

SOW.md

File metadata and controls

SOW — Agentic Search Optimization Engine

1. Цель

2. Что было скорректировано в исходной постановке

2.1 Ниша

2.2 SERP и конкуренты

2.3 LLM

3. In Scope

Phase 1 — MVP CLI

Phase 2 — Smart data acquisition

Phase 3 — LLM layer

Phase 4 — Production system

4. Out of Scope для текущего MVP

5. Входные данные

6. Выходной результат

7. Functional requirements

FR-1. Target analysis

FR-2. On-page extraction

FR-3. Niche hypotheses

FR-4. Competitor comparison

FR-5. SEO core generation

FR-6. Flexible competitor input

8. Non-functional requirements

9. Deliverables

Реализовано в текущем инкременте

10. Acceptance criteria для MVP

11. Риски

12. Recommendation