Bu çalışma, Brezilya’nın en büyük e-ticaret platformlarından biri olan Olist veri seti kullanılarak hazırlanmış kapsamlı bir Python veri analizi projesidir.
Amaç; sipariş davranışlarını, fiyat dağılımlarını, teslimat sürelerini, müşteri memnuniyetini ve ödeme yöntemlerinin tamamlanma oranlarını incelemektir.
- Python (Google Colab)
- Pandas • NumPy
- Plotly Express
- Matplotlib • Seaborn
- SciPy (İstatistiksel Testler)
- EDA • Feature Engineering
Kullanılan veri dosyaları:
olist_orders_dataset.csvolist_order_items_dataset.csvolist_products_dataset.csvolist_customers_dataset.csvolist_sellers_dataset.csvolist_order_payments_dataset.csvolist_order_reviews_dataset.csv
Tüm veri setleri pandas DataFrame olarak yüklendi, eksik/gürültülü veriler temizlendi ve tarih alanları dönüştürüldü.
- Ortalama ürün fiyatı
- Sepet bazında toplam tutar
- En yüksek / en düşük fiyatlar
- Kategoriye göre fiyat karşılaştırmaları
- En çok sipariş edilen kategoriler
- En yüksek gelir getiren kategoriler
- Fiyat ortalaması yüksek kategori davranışları
- Satın alma → teslimat tarih farkı
- Ortalama teslim süresi
- Geciken sipariş oranı
- Gecikmenin yorum puanına etkisi
Projenin çıktıları arasında:
- Sepet tutarı dağılımı
- Kategori bazında fiyat grafiği
- Teslimat süresi histogramı
- Kategori popülerliği
- İnceleme puanı dağılımı
- Ödeme yöntemlerinin tamamlanma oranı
Hipotez:
- H0: Ödeme yöntemi siparişin tamamlanma oranını etkilemez
- H1: Ödeme yöntemi siparişin tamamlanma oranını etkiler
Yapılan chi-square testi sonucunda:
- p < 0.05 bulundu
- ➡️ Ödeme yöntemi sipariş iptallerini anlamlı şekilde etkilemektedir.
- Kredi kartı işlemleri en yüksek tamamlanma oranına sahiptir.
- Teslimat süresi uzadıkça yorum puanı düşüyor
- Kredi kartı, en güvenilir ödeme yöntemi
- Gecikme → memnuniyette ciddi düşüş
- Bazı kategoriler (ör. Informática Acessórios) daha yüksek fiyat ortalamasına sahip
- Büyük sipariş hacmine sahip kategoriler en yüksek geliri oluşturuyor
- Lojistik gecikmeleri azaltacak optimizasyonlar yapılmalı
- Yüksek gelir potansiyeli olan kategoriler desteklenmeli
- Ödeme ekranlarında kredi kartı önerisi gösterilebilir
- Gecikme riski yüksek bölgeler için özel SLA tanımlanabilir
- Müşteri memnuniyeti düzenli olarak review-score analizleriyle takip edilmeli
Dirayet Hazal Tuncay – Data Analyst
Python • SQL • Power BI • BigQuery • Looker Studio