Skip to content

aakcay5656/dataset-analyzer

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Dataset Analyzer v3.1

Python FastAPI Streamlit Contributions

Dataset Analyzer is a powerful open-source platform for intelligent dataset analysis. It automatically analyzes datasets, generates insights, and creates interactive visualizations. Built with modern Python technologies, it can efficiently process large files with streaming analysis.

Features

Smart Data Analysis

  • Automatic data type detection (numeric, categorical, datetime, text)
  • Object column analysis (emails, phones, URLs, dates, numeric strings)
  • Data quality assessment (missing values, outliers, completeness)
  • Statistical insights and summaries

Advanced Visualizations

  • Interactive charts (histograms, box plots, heatmaps, time series)
  • Smart object charts (pattern detection, convertibility, length distributions)
  • Multi-chart dashboard with tabbed navigation
  • Export-ready high-quality charts

High Performance

  • Streaming analysis for large (GB+) files
  • Supports CSV, JSON, JSON Lines, Excel (.xlsx/.xls)
  • Async processing with FastAPI
  • Smart caching of results

Modern UI/UX

  • Streamlit-based clean, responsive interface
  • Real-time progress tracking

Quick Start

Prerequisites

  • Python 3.8+
  • pip package manager
  • 4GB+ RAM recommended for large files

Installation

git clone https://github.com/aakcay5656/dataset-analyzer.git
cd dataset-analyzer

python -m venv .venv
source .venv/bin/activate   # Windows: .venv\Scripts\activate

pip install -r requirements.txt

Run the App

# Terminal 1 - Backend
cd backend
python main.py

# Terminal 2 - Frontend
streamlit run streamlit_app.py

Open in browser: http://localhost:8501

Tech Stack

Backend: FastAPI · SQLAlchemy · Pandas · NumPy · Plotly Frontend: Streamlit · Plotly.js · Custom CSS Database: SQLite (default), PostgreSQL (production)

Contributing

We welcome contributions!

  • Bug reports → open an issue
  • Feature requests → share ideas
  • Code contributions → submit PRs
  • Docs → improve README & examples
  • Testing → add test cases

Contact

If you like this project, please star the repo!


Dataset Analyzer v3.1 (TR)

Python FastAPI Streamlit Contributions

Dataset Analyzer, akıllı veri analizi için geliştirilmiş güçlü ve açık kaynaklı bir platformdur. Veri setlerini otomatik olarak analiz eder, anlamlı içgörüler üretir ve etkileşimli görselleştirmeler oluşturur. Modern Python teknolojileri ile geliştirilmiştir ve büyük dosyaları streaming analiz sayesinde verimli bir şekilde işler.

Özellikler

Akıllı Veri Analizi

  • Otomatik veri tipi algılama (sayısal, kategorik, tarih, metin)
  • Object kolon analizi (email, telefon, URL, tarih, numerik string)
  • Veri kalitesi ölçümü (eksik değerler, aykırı değerler, tamlık)
  • İstatistiksel özetler ve içgörüler

Gelişmiş Görselleştirmeler

  • Etkileşimli grafikler (histogram, boxplot, ısı haritası, zaman serisi)
  • Object kolon grafikleri (pattern analizi, dönüştürülebilirlik, uzunluk dağılımı)
  • Çoklu grafik dashboard (sekme tabanlı düzen)
  • Sunuma hazır yüksek kaliteli grafikler

Yüksek Performans

  • GB+ boyutlu dosyalar için streaming analizi
  • CSV, JSON, JSON Lines, Excel (.xlsx/.xls) desteği
  • FastAPI ile async işleme
  • Akıllı caching sistemi

Modern UI/UX

  • Streamlit tabanlı modern ve sade arayüz
  • Gerçek zamanlı ilerleme takibi

Hızlı Başlangıç

Gereksinimler

  • Python 3.8+
  • pip paket yöneticisi
  • Büyük dosyalar için 4GB+ RAM önerilir

Kurulum

git clone https://github.com/aakcay5656/dataset-analyzer.git
cd dataset-analyzer

python -m venv .venv
source .venv/bin/activate   # Windows: .venv\Scripts\activate

pip install -r requirements.txt

Çalıştırma

# Terminal 1 - Backend
cd backend
python main.py

# Terminal 2 - Frontend
streamlit run streamlit_app.py

Tarayıcıda aç: http://localhost:8501

Teknoloji Yığını

Backend: FastAPI · SQLAlchemy · Pandas · NumPy · Plotly Frontend: Streamlit · Plotly.js · Custom CSS Database: SQLite (varsayılan), PostgreSQL (production)

Katkı

Katkılarınızı bekliyoruz!

  • Hata bildirimi → issue aç
  • Yeni özellik önerisi → tartışma başlat
  • Kod katkısı → pull request gönder
  • Dokümantasyon → README & örnek ekle
  • Test → yeni testler yaz

İletişim


İstersen sana bunun sadece İngilizce ya da sadece Türkçe versiyonunu da sadeleştirip ayırabilirim (örneğin GitHub’daki README.md İngilizce, README.tr.md Türkçe gibi). İster misin o şekilde ayırayım?

About

No description or website provided.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages