🚀 Tikal CNE DBT Enterprise Template

Enterprise-grade DBT template with advanced CLI tooling, automated workflows, and production-ready data pipelines

An opinionated, battle-tested DBT project template designed for enterprise data teams. Features intelligent CLI automation, comprehensive validation, and seamless integration with modern data orchestration platforms like Dagster.

✨ Key Features

🎯 Smart CLI Interface - Interactive command-line tools for rapid development
🏗️ Enterprise Architecture - Staging → Marts data modeling patterns
🔄 Dagster Integration - Native support for asset-based orchestration
🛡️ Advanced Validation - SQL linting, model validation, and data quality checks
🚀 CI/CD Ready - Production-grade GitHub Actions workflows
📊 Multi-Warehouse Support - BigQuery, Snowflake, and more
🔍 Data Observability - Built-in monitoring with Elementary Data
📝 Auto-Documentation - Self-documenting models and lineage

🎬 Quick Demo

# Set up your environment in seconds
task setup-env

# Launch the interactive CLI
task cli

# Create a new data domain with models
create domain security_tools --sub-domain crowdstrike
create model --domain security_tools --type staging --name endpoint_data

# Run your pipeline
task dbt:build

🏛️ Architecture Overview

📁 models/
├── 🔧 staging/          # Clean, standardized source data
│   ├── integration_tools/
│   │   ├── okta/        # Identity & access management
│   │   ├── crowdstrike/  # Endpoint security
│   │   └── active_directory/
│   └── infra/           # Pipeline metadata & metrics
└── 🏪 marts/            # Business-ready analytics tables
    ├── security/        # Security analytics
    ├── compliance/      # Compliance reporting
    └── operations/      # Operational insights

🚀 Quick Start

Prerequisites

Go-task - Task runner
Python 3.12+
Access to BigQuery or Snowflake

1. Environment Setup

# Automated setup (installs gh, uv, pre-commit)
task setup-env

# Or use dev container for containerized development
# (see .devcontainer configuration)

2. Configuration

# Copy and configure environment
cp .env_example .env
# Edit .env with your warehouse credentials

# Test your setup
task test-setup

3. Launch CLI

# Start interactive CLI with autocomplete
task cli

# Verify warehouse connection
task dbt:debug

🎛️ CLI Commands

Our intelligent CLI provides guided workflows for common tasks:

📊 Data Modeling

create domain <domain_name>              # Create new data domain
create model --domain <name> --type <staging|marts>  # Generate models
create integration-tool <tool_name>      # Add new data source
create macro --name <macro_name>         # Reusable SQL components

🔍 Development & Testing

task dbt:run --select <model>           # Run specific models
task dbt:test                           # Execute data tests
task dbt:build                          # Full build pipeline
task dbt:docs                           # Generate documentation

🛠️ Quality & Validation

validate all                            # Run all validations
task dbt:lint                          # SQL formatting
task dbt:format                        # Auto-fix formatting

📈 Monitoring & Observability

task dbt:edr-report                     # Elementary data report
learn catalog                          # Explore data catalog
select organization                     # Switch contexts

🏗️ Project Structure

📂 Models Organization

models/
├── staging/                    # 🧹 Data cleaning & standardization
│   ├── _sources.yml           # Source definitions
│   └── stg_<source>_<entity>.sql
├── marts/                      # 🎯 Business logic & analytics
│   ├── core/                  # Core business entities
│   ├── finance/               # Financial analytics
│   └── security/              # Security metrics
└── intermediate/              # 🔄 Reusable transformations

🔧 Macros & Utilities

macros/
├── create_database/           # Database management
├── generate_schema_name/      # Dynamic schema naming
├── get_custom_alias/          # Table aliasing
└── normalization/             # Data standardization

🧪 Testing & Validation

Generic Tests: Uniqueness, not-null, referential integrity
Singular Tests: Custom business logic validation
Data Quality: Elementary data monitoring
SQL Linting: SQLFluff integration

🔄 CI/CD Pipeline

Our GitHub Actions workflow provides:

🔍 Slim CI - Only test changed models
🧪 Automated Testing - Data quality validation
📊 Documentation - Auto-generated data catalog
🚀 Deployment - Multi-environment support
📈 Monitoring - Performance tracking

Pipeline Stages

Validation → SQL linting, model validation
Testing → Unit tests, data quality checks
Build → Compile and run models
Deploy → Environment-specific deployment
Monitor → Data freshness and quality alerts

🛡️ Data Quality & Governance

Built-in Validations

Schema Enforcement - Automatic schema validation
Data Freshness - Source data recency checks
Referential Integrity - Cross-table relationship validation
Custom Business Rules - Domain-specific data quality tests

Pre-commit Hooks

🔒 Security scanning (detect private keys)
📝 SQL formatting (SQLFluff)
🐍 Python code quality (black, isort, mypy)
🧪 DBT validations (parsing, testing)

🔧 Configuration

Environment Variables

# Warehouse Configuration
SNOWFLAKE_ACCOUNT=your-account
SNOWFLAKE_USER=your-username
SNOWFLAKE_PASSWORD=your-password
SNOWFLAKE_DATABASE=your-database

# BigQuery Configuration  
GOOGLE_APPLICATION_CREDENTIALS=path/to/credentials.json
BQ_PROJECT=your-project-id
BQ_DATASET=your-dataset

# Pipeline Configuration
ORG_ID=your-organization-id
DBT_TARGET=dev  # dev, staging, prod

Profiles Configuration

The project supports multiple target environments with automatic schema and database naming conventions.

📚 Documentation & Learning

📖 Getting Started Guides

🎓 Recommended Reading

🔌 IDE Extensions

🚨 Troubleshooting

Common Issues

Connection Problems

task dbt:debug  # Validate warehouse connection

Model Compilation Errors

dbt build --debug  # Verbose logging
# Check compiled SQL in target/compiled/

Performance Issues

task dbt:run --select "+state:modified"  # Slim runs

Debug Mode

Enable detailed logging for troubleshooting:

export DBT_LOG_LEVEL=debug
task dbt:run --debug

🤝 Contributing

We welcome contributions! Please see our Contributing Guidelines for details.

Development Workflow

Fork and clone the repository
Create a feature branch
Make your changes with tests
Run validation: task validate
Submit a pull request

📊 Monitoring & Observability

Elementary Data Integration

Data Quality Monitoring - Automated anomaly detection
Lineage Tracking - Visual data flow representation
Performance Metrics - Query performance insights
Alerting - Slack/email notifications for issues

Usage Analytics

Track model usage, performance, and data freshness with built-in monitoring dashboards.

🏢 Enterprise Features

Multi-tenant Architecture - Organization and instance isolation
Role-based Access Control - Fine-grained permissions
Audit Logging - Complete change tracking
Disaster Recovery - Backup and restore procedures
Compliance Ready - SOX, GDPR, HIPAA support

📄 License

This project is licensed under the MIT License - see the LICENSE.md file for details.

🙏 Acknowledgments

Built with ❤️ by the Tikal CNE team using:

DBT - Data transformation framework
Dagster - Data orchestration platform
Elementary - Data observability
Go-task - Task automation
SQLFluff - SQL linting

Ready to transform your data pipeline? 🚀 Get started or explore the docs!

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.devcontainer		.devcontainer
.github		.github
.task		.task
cli		cli
macros		macros
models/users		models/users
tests		tests
.commitlintrc.json		.commitlintrc.json
.dbt-checkpoint.yaml		.dbt-checkpoint.yaml
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.releaserc.json		.releaserc.json
.sqlfluff		.sqlfluff
.sqlfluffignore		.sqlfluffignore
CI_WORKFLOW_README.md		CI_WORKFLOW_README.md
README.md		README.md
Taskfile.yml		Taskfile.yml
ascii_art.txt		ascii_art.txt
bearer.ignore		bearer.ignore
bearer.yml		bearer.yml
cli.ini		cli.ini
dbt_project.yml		dbt_project.yml
package-lock.yml		package-lock.yml
packages.yml		packages.yml
profiles.yml		profiles.yml
pyproject.toml		pyproject.toml
tox.ini		tox.ini
uv.lock		uv.lock

tikalk/abc-dbt

Folders and files

Latest commit

History

Repository files navigation