Skip to content

[Price Compare] Step 6: Category breakdown (keyword-based) #77

@frankieboxx

Description

@frankieboxx

Step 6 — Category Breakdown (Keyword-Based)

NO AI — use keyword dictionary to classify Atrium purchases into categories:

CATEGORIES = {
    "Mliječni proizvodi": ["jogurt", "sir", "mlijeko", "mozzarella", "cheddar", "edam", "mascarpone", "vrhnje", "maslac"],
    "Meso i mesni proizvodi": ["pršut", "salama", "hrenovka", "kobasica", "debrecinka", "piletina", "svinjetina", "šunka", "losos", "tuna"],
    "Voće i povrće": ["banana", "paprika", "patlidžan", "rajčica", "tikvice", "luk", "grožđe", "jabuka", "limun"],
    "Pekarski proizvodi": ["brašno", "kruh", "pecivo", "tortilla"],
    "Jaja": ["jaja"],
    "Pića": ["coca", "fanta", "sprite", "juice", "sok", "voda", "pivo", "vino"],
    "Slastice": ["bomboni", "čokolada", "grickalice", "keks"],
    "Začini i umaci": ["ketchup", "majoneza", "senf", "sol", "papar", "origano"],
    "Kemija i potrošni": ["deterdžent", "sapun", "salveta", "folija", "vrećica"],
}

Aggregate: total spend per category, % of total, top item in each.

File: scripts/price_compare.py
Priority: P2 — independent feature

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions