Pernah melihat kumpulan titik di grafik tapi bingung apa maknanya? Dalam analisis data, hal seperti ini sering terjadi saat kita mencoba mencari hubungan antara dua variabel — misalnya, apakah peningkatan anggaran iklan benar-benar berdampak pada kenaikan penjualan.
Di sinilah scatter plot berperan penting. Visualisasi sederhana ini membantu Anda melihat pola, korelasi, bahkan anomali yang mungkin tersembunyi dalam tumpukan data angka.
Tanpa berlama-lama, yuk langsung saja ke pembahasannya!
Pengertian Scatter Plot

Scatter plot adalah grafik yang menampilkan titik-titik data pada bidang koordinat untuk memperlihatkan hubungan antara dua variabel numerik — biasanya satu variabel di sumbu X dan satu di sumbu Y.
Visualisasi ini umum digunakan untuk mengevaluasi pola, korelasi, klaster, serta mendeteksi outlier pada data kuantitatif.
Fungsi Scatter Plot dan Kapan Menggunakannya
Scatter plot tidak hanya sekadar kumpulan titik — setiap titik membawa informasi tentang hubungan dua variabel.
Bagian ini membahas fungsi utamanya serta kapan visualisasi ini paling efektif digunakan dalam analisis data.
Fungsi Utama Scatter Plot
- Menilai arah dan kekuatan hubungan antar variabel (misalnya apakah meningkat bersama atau berlawanan arah).
- Mengidentifikasi pola seperti hubungan linear/nonlinear, klaster, atau tren umum.
- Mendeteksi outlier yang menyimpang jauh dari pola mayoritas data.
Kapan Waktu yang Tepat Menggunakan Scatter Plot
Gunakan scatter plot ketika Anda ingin menunjukkan hubungan antara dua set angka, mengevaluasi distribusi, dan melihat pengelompokan atau outlier—terutama jika data bersifat numerik kontinu.
Berbeda dengan grafik garis, scatter plot lebih tepat digunakan saat fokus utama adalah korelasi atau pola antarvariabel, bukan urutan kategori atau seri waktu yang saling terhubung.
Cara Membaca Scatter Plot: Pola, Korelasi, dan Trendline
Untuk mendapatkan insight yang benar, Anda perlu tahu cara membaca arah, kekuatan, dan pola hubungan antarvariabel. Di sini dijelaskan bagaimana mengenali korelasi serta peran trendline dan R² dalam interpretasi data.
Pola Korelasi
- Korelasi positif: titik-titik cenderung naik bersama (X meningkat, Y meningkat).
- Korelasi negatif: titik-titik cenderung turun (X meningkat, Y menurun).
- Tidak ada korelasi: titik-titik menyebar acak tanpa pola arah.
Nilai koefisien korelasi Pearson (r) berada pada rentang -1 hingga +1 dan menggambarkan arah serta kekuatan hubungan linear.
Trendline, R², dan Koefisien Korelasi
Menambahkan trendline (misalnya regresi linear) membantu merangkum arah hubungan dan memprediksi nilai Y berdasarkan X.
Koefisien determinasi (R²) menunjukkan seberapa besar variasi pada Y yang dapat dijelaskan oleh model linear, dengan nilai antara 0 hingga 1.
Sementara koefisien korelasi (r) mengukur kekuatan hubungan linear; pada regresi sederhana, r² sama dengan R².
Peringatan: Korelasi ≠ Kausalitas
Korelasi yang kuat tidak otomatis berarti hubungan sebab-akibat. Hubungan tersebut bisa jadi dipengaruhi variabel lain atau sekadar kebetulan. Karena itu, penentuan kausalitas memerlukan analisis tambahan di luar sekadar korelasi.
Cara Membuat Scatter Plot
Membuat scatter plot kini bisa dilakukan di berbagai platform. Bagian ini memandu Anda langkah demi langkah agar bisa menghasilkan visualisasi yang akurat dan informatif.
Menggunakan Microsoft Excel
- Siapkan dua kolom data numerik (X dan Y).
- Pilih Insert > Scatter (grafik XY).
- Untuk menambahkan trendline dan menampilkan nilai R²: klik chart > Add Trendline > centang “Display R-squared value on chart.”
Menggunakan Google Sheets
- Pilih data > Insert > Chart.
- Ubah Chart type menjadi Scatter chart di Chart editor.
- Google Sheets akan menampilkan hubungan dua variabel numerik dalam format titik sebar.
Menggunakan Python
Contoh sederhana dengan pandas, NumPy, dan Matplotlib:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# Data contoh
np.random.seed(42)
x = np.linspace(0, 10, 50)
y = 2.5 * x + 5 + np.random.normal(scale=5, size=x.size)
# Scatter
plt.scatter(x, y, alpha=0.7)
# Trendline linear
coef = np.polyfit(x, y, 1)
trend_y = np.poly1d(coef)(x)
plt.plot(x, trend_y, color=’red’)
# Korelasi dan R^2
r = np.corrcoef(x, y)[0, 1]
r2 = r**2
plt.title(f”r={r:.2f}, R^2={r2:.2f}”)
plt.xlabel(“X”)
plt.ylabel(“Y”)
plt.show()
Fungsi scatter() digunakan untuk membuat titik sebar, polyfit() untuk membuat garis regresi linear, dan corrcoef() untuk menghitung korelasi Pearson.
Kuasai visualisasi data seperti scatter plot dengan mudah! Belajar langsung di Bootcamp Data Analyst Course-Net!
Kesalahan Umum dan Tips Visualisasi yang Lebih Baik

Meski terlihat sederhana, scatter plot bisa menyesatkan bila divisualisasikan dengan keliru. Pelajari berbagai kesalahan umum seperti overplotting atau skala sumbu yang tidak proporsional, serta tips agar hasil visual Anda lebih mudah dibaca dan bermakna.
1. Overplotting dan Solusinya
Titik yang menumpuk bisa membuat pola sulit dibaca. Solusinya:
- Kurangi opasitas (alpha) agar kepadatan terlihat.
- Tambahkan jitter (gangguan kecil pada posisi) agar titik tidak saling menutupi.
- Gunakan hexbin atau agregasi lain untuk dataset yang sangat padat.
2. Skala Sumbu dan Penipuan Visual
Sumbu yang terpotong atau skala yang tidak konsisten bisa menyesatkan pembacaan data.
Pastikan skala sumbu konsisten, beri label yang jelas, dan jelaskan bila sumbu tidak dimulai dari nol.
3. Outlier: Deteksi dan Tindak Lanjut
Scatter plot memudahkan identifikasi outlier—titik yang menyimpang jauh dari pola utama.
Setelah ditemukan, lakukan pemeriksaan kualitas data, periksa kemungkinan kesalahan input, atau gunakan metode analisis yang robust agar hasil tidak bias oleh outlier.
4. Bubble Chart vs Scatter Plot
Bubble chart adalah pengembangan dari scatter plot yang menambahkan ukuran gelembung untuk mewakili variabel ketiga. Setiap titik memiliki posisi (X, Y) dan ukuran (Z). Gunakan bubble chart bila ingin menampilkan tiga dimensi informasi sekaligus.
Baca juga: Visualisasi Data: Jenis, Fungsi, dan Tools
Jadi Data Science Tersertifikasi dengan Kursus Data Science dari Course-Net!
Scatter plot adalah salah satu visualisasi penting untuk memahami hubungan antar variabel, menemukan pola, serta mendeteksi outlier secara cepat. Dengan menguasainya, Anda bisa membaca data lebih efektif dan mengambil keputusan berbasis bukti.
Ingin belajar analisis dan visualisasi data secara komprehensif? Ikuti Bootcamp Data Science Course-Net dan pelajari penggunaan tools populer seperti Python, Microsoft Power BI, dan Tableau untuk membangun insight dari data. Dapatkan sertifikasi internasional dan belajar langsung dari praktisi profesional, upgrade skill kamu sekarang!