Kursus
Seaborn adalah salah satu pustaka Python andalan untuk visualisasi data statistik. Dibangun di atas Matplotlib, pustaka ini menghasilkan bagan yang rapi dengan lebih sedikit kode, terintegrasi langsung dengan DataFrame pandas, dan menangani plot statistik umum—histogram, box plot, heatmap, regresi—melalui API yang konsisten.
Dalam tutorial ini, saya akan membahas tipe plot inti Seaborn, menunjukkan cara menyesuaikannya, dan membandingkan Seaborn dengan pustaka visualisasi Python lain seperti Matplotlib dan Plotly. Semua contoh kode menggunakan Seaborn 0.13+ dan pandas 2.0+.
Ringkasan
-
Seaborn adalah pustaka visualisasi statistik Python yang dibangun di atas Matplotlib—instal dengan
pip install seaborn -
Bekerja langsung dengan pandas DataFrame: berikan nama kolom sebagai argumen
x,y, danhue -
Tipe plot utama:
scatterplot(),lineplot(),barplot(),histplot(),boxplot(),heatmap(),pairplot() -
Fungsi level figur (
relplot(),displot(),catplot()) membuat grid multi-panel dalam satu pemanggilan -
Sesuaikan tampilan dengan
set_theme()dan palet warna bawaan
Apa itu Seaborn?
Seaborn adalah pustaka visualisasi data Python yang dibangun di atas Matplotlib. Pustaka ini bekerja langsung dengan pandas DataFrame, sehingga Anda memberikan nama kolom sebagai argumen alih-alih array mentah. Pustaka ini mencakup tipe bagan statistik paling umum: scatter plot, line plot, bar plot, histogram, box plot, heatmap, dan lainnya.
Seaborn mengorganisasi API-nya ke dalam tiga level:
-
Fungsi level figur (
relplot(),displot(),catplot()) membuat keseluruhan grid figur dan menangani faceting secara otomatis -
Fungsi level sumbu (
scatterplot(),histplot(),boxplot(), dll.) menggambar pada satu axes Matplotlib -
Fungsi utilitas (
heatmap(),pairplot(),jointplot()) untuk tata letak multi-panel khusus
Anda dapat mempelajari lebih lanjut tentang Seaborn melalui kursus Introduction to Data Visualization with Seaborn kami.
Seaborn dilengkapi tema bawaan dan palet warna yang dapat Anda terapkan dengan satu pemanggilan set_theme(). Pustaka ini juga menyertakan estimasi statistik—interval kepercayaan pada bar plot, regresi, kernel density estimate—sehingga Anda dapat beralih dari data mentah ke figur siap publikasi dengan kode minimal.

Seaborn vs. Matplotlib
Dua pustaka visualisasi data paling banyak digunakan di Python adalah Matplotlib dan Seaborn. Keduanya dirancang untuk membuat grafik dan visualisasi berkualitas tinggi, tetapi memiliki beberapa perbedaan kunci yang membuatnya lebih cocok untuk kasus penggunaan yang berbeda.
Matplotlib memberi Anda kontrol penuh atas setiap elemen figur (sumbu, tick, legenda, anotasi), tetapi kontrol itu berarti lebih banyak kode untuk setiap bagan. Seaborn menukar sebagian granularitas itu untuk kecepatan: satu pemanggilan fungsi dengan DataFrame menghasilkan plot statistik yang sudah bergaya.
| Fitur | Matplotlib | Seaborn |
|---|---|---|
| Tingkat abstraksi | Tingkat rendah (kontrol detail) | Tingkat tinggi (default statistik) |
| Gaya default | Minimal—perlu penataan manual | Tema siap publikasi bawaan |
| Integrasi DataFrame | Menerima array; dukungan DataFrame ditambahkan belakangan | Dibangun mengelilingi pandas DataFrame |
| Fitur statistik | Tidak ada bawaan | Interval kepercayaan, regresi, KDE |
| Tata letak multi-panel | Manual dengan subplots() |
Otomatis dengan FacetGrid, relplot() |
| Terbaik untuk | Figur kustom, tidak standar | Analisis data eksploratori, bagan statistik standar |
Dalam praktiknya, Anda menggunakan keduanya bersama. Seaborn membuat plotnya, lalu Anda memanggil fungsi Matplotlib untuk menyempurnakan label, batas, atau anotasi—seperti yang akan Anda lihat pada contoh di bawah.
Anda dapat mengeksplorasi Matplotlib lebih lanjut melalui tutorial Introduction to Plotting with Matplotlib in Python kami.
Instalasi Seaborn
Seaborn memerlukan Python 3.9+ (per versi 0.13) dan bergantung pada Matplotlib, pandas, dan NumPy. Instal dengan pip atau conda:
# install seaborn with pip
pip install seaborn
Saat Anda menggunakan pip, Seaborn dan dependensi yang diperlukan akan diinstal. Jika ingin mengakses fitur tambahan dan opsional, Anda juga dapat menyertakan dependensi opsional dalam instalasi pip. Contohnya:
pip install seaborn[stats]
Atau dengan conda:
# install seaborn with conda
conda install seaborn
Dataset Contoh
Seaborn menyediakan beberapa dataset bawaan yang dapat kita gunakan untuk visualisasi data dan analisis statistik. Dataset ini disimpan dalam pandas DataFrame, sehingga mudah digunakan dengan fungsi plotting Seaborn.
Salah satu dataset paling umum yang juga digunakan di semua contoh resmi Seaborn disebut `tips dataset`; dataset ini berisi informasi tentang tip yang diberikan di restoran. Berikut contoh memuat dan memvisualisasikan dataset Tips di Seaborn:
import seaborn as sns
tips = sns.load_dataset("tips")
sns.histplot(data=tips, x="total_bill")
Output:

Jika Anda belum memahami plot ini—tidak masalah. Ini disebut histogram. Kami akan menjelaskan lebih detail tentang histogram nanti dalam tutorial ini. Untuk saat ini, intinya adalah Seaborn hadir dengan banyak dataset contoh sebagai pandas DataFrame yang mudah digunakan dan melatih keterampilan visualisasi Anda. Berikut contoh lain memuat dataset `exercise`.
import seaborn as sns
# Load the exercise dataset
exercise = sns.load_dataset("exercise")
# check the head
exercise.head()
Output:
Tipe Plot Seaborn
Seaborn menyediakan beragam tipe plot untuk kebutuhan analitis yang berbeda. Secara umum, visualisasi masuk ke dalam salah satu dari tiga kategori:
- Univariat – hanya x (hanya memuat satu sumbu informasi)
- Bivariat – x dan y (memuat dua sumbu informasi)
- Trivariat – x, y, z (memuat tiga sumbu informasi)

Berikut beberapa tipe plot yang paling umum digunakan di Seaborn:
- Scatter Plot. Scatter plot digunakan untuk memvisualisasikan hubungan antara dua variabel. Fungsi scatterplot() milik Seaborn menyediakan cara sederhana untuk membuat scatter plot.
- Line Plot. Line plot digunakan untuk memvisualisasikan tren suatu variabel terhadap waktu. Fungsi lineplot() milik Seaborn menyediakan cara sederhana untuk membuat line plot.
- Histogram. Histogram digunakan untuk memvisualisasikan distribusi suatu variabel. Fungsi histplot() milik Seaborn menyediakan cara sederhana untuk membuat histogram.
- Box Plot. Box plot digunakan untuk memvisualisasikan distribusi suatu variabel. Fungsi boxplot() milik Seaborn menyediakan cara sederhana untuk membuat box plot.
- Violin Plot. Violin plot mirip dengan box plot, tetapi memberikan tampilan yang lebih detail atas distribusi data. Fungsi violinplot() milik Seaborn menyediakan cara sederhana untuk membuat violin plot.
- Heatmap. Heatmap digunakan untuk memvisualisasikan korelasi antar variabel. Fungsi heatmap() milik Seaborn menyediakan cara sederhana untuk membuat heatmap.
- Pairplot. Pairplot digunakan untuk memvisualisasikan hubungan antara banyak variabel. Fungsi pairplot() milik Seaborn menyediakan cara sederhana untuk membuat pairplot.
Kita sekarang akan melihat contoh dan penjelasan detail untuk masing-masing pada bagian berikutnya dari tutorial ini.
Fungsi Level Figur vs. Level Sumbu
Salah satu konsep terpenting di Seaborn adalah pembedaan antara fungsi level figur dan level sumbu. Memahaminya akan menghemat waktu debugging Anda.
Fungsi level sumbu (seperti scatterplot(), histplot(), boxplot()) menggambar pada satu axes Matplotlib. Anda dapat memberikan argumen ax untuk mengontrol lokasi plot:
import seaborn as sns
import matplotlib.pyplot as plt
fig, axes = plt.subplots(1, 2, figsize=(12, 5))
tips = sns.load_dataset("tips")
sns.histplot(data=tips, x="total_bill", ax=axes[0])
sns.boxplot(data=tips, x="day", y="total_bill", ax=axes[1])
plt.tight_layout()
plt.show()
Fungsi level figur (relplot(), displot(), catplot()) membuat figurnya sendiri dan dapat secara otomatis membagi data menjadi beberapa panel menggunakan parameter col dan row:
import seaborn as sns
tips = sns.load_dataset("tips")
sns.displot(data=tips, x="total_bill", col="time", kde=True)
Fungsi level figur mengembalikan objek FacetGrid alih-alih axes, sehingga Anda menetapkan judul dan label dengan cara berbeda: gunakan g.set_axis_labels() dan g.set_titles() alih-alih plt.xlabel().
Cara Membuat Plot di Seaborn
Mari lihat Seaborn secara langsung dengan beberapa contoh berbagai tipe plot.
Membuat scatter plot Seaborn
Scatter plot digunakan untuk memvisualisasikan hubungan antara dua variabel kontinu. Setiap titik pada plot mewakili satu data poin, dan posisinya pada sumbu x dan y merepresentasikan nilai kedua variabel.
Plot dapat disesuaikan dengan warna dan marker berbeda untuk membantu membedakan kelompok data. Di Seaborn, scatter plot dapat dibuat menggunakan fungsi scatterplot().
import seaborn as sns
tips = sns.load_dataset("tips")
sns.scatterplot(x="total_bill", y="tip", data=tips)
Output:

Plot sederhana ini dapat ditingkatkan dengan menyesuaikan parameter `hue` dan `size`. Berikut caranya:
import seaborn as sns
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips")
# customize the scatter plot
sns.scatterplot(x="total_bill", y="tip", hue="sex", size="size", sizes=(50, 200), data=tips)
# add labels and title
plt.xlabel("Total Bill")
plt.ylabel("Tip")
plt.title("Relationship between Total Bill and Tip")
# display the plot
plt.show()
Output:

Membuat line plot Seaborn
Line plot digunakan untuk memvisualisasikan tren dalam data dari waktu ke waktu atau variabel kontinu lainnya. Pada line plot, setiap titik data dihubungkan oleh garis, membentuk kurva yang mulus. Di Seaborn, line plot dapat dibuat menggunakan fungsi lineplot(). Anda dapat mendalaminya di tutorial line plot Seaborn kami.
import seaborn as sns
fmri = sns.load_dataset("fmri")
sns.lineplot(x="timepoint", y="signal", data=fmri)
Output:

Kita dapat dengan sangat mudah menyesuaikannya menggunakan kolom `event` dan `region` dari dataset.
import seaborn as sns
import matplotlib.pyplot as plt
fmri = sns.load_dataset("fmri")
# customize the line plot
sns.lineplot(x="timepoint", y="signal", hue="event", style="region", markers=True, dashes=False, data=fmri)
# add labels and title
plt.xlabel("Timepoint")
plt.ylabel("Signal Intensity")
plt.title("Changes in Signal Intensity over Time")
# display the plot
plt.show()
Output:

Sekali lagi, saya menggunakan Seaborn untuk line plot dasar dan Matplotlib untuk label sumbu serta judul.
Membuat bar plot Seaborn
Bar plot digunakan untuk memvisualisasikan hubungan antara variabel kategorikal dan variabel kontinu. Pada bar plot, setiap batang merepresentasikan mean atau median (atau agregasi apa pun) dari variabel kontinu untuk tiap kategori. Di Seaborn, bar plot dapat dibuat menggunakan fungsi barplot(). Untuk detail lebih lanjut, lihat panduan barplot Seaborn.
import seaborn as sns
titanic = sns.load_dataset("titanic")
sns.barplot(x="class", y="fare", data=titanic)
Output:

Mari sesuaikan plot ini dengan menyertakan kolom `sex` dari dataset.
import seaborn as sns
import matplotlib.pyplot as plt
titanic = sns.load_dataset("titanic")
# customize the bar plot
sns.barplot(x="class", y="fare", hue="sex", errorbar=None, palette="muted", data=titanic)
# add labels and title
plt.xlabel("Class")
plt.ylabel("Fare")
plt.title("Average Fare by Class and Gender on the Titanic")
# display the plot
plt.show()
Output:

Membuat histogram Seaborn
Histogram memvisualisasikan distribusi variabel kontinu. Pada histogram, data dibagi menjadi bin dan tinggi setiap bin merepresentasikan frekuensi atau jumlah titik data di dalam bin tersebut. Di Seaborn, histogram dapat dibuat menggunakan fungsi histplot(). Panduan histogram Seaborn kami membahas ini lebih dalam.
import seaborn as sns
iris = sns.load_dataset("iris")
sns.histplot(x="petal_length", data=iris)
Output:

Menyesuaikan histogram
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
# customize the histogram
sns.histplot(data=iris, x="petal_length", bins=20, kde=True, color="green")
# add labels and title
plt.xlabel("Petal Length (cm)")
plt.ylabel("Frequency")
plt.title("Distribution of Petal Lengths in Iris Flowers")
# display the plot
plt.show()
Output:

Membuat density plot Seaborn
Density plot (juga disebut kernel density estimate atau KDE plot) menampilkan distribusi variabel kontinu sebagai kurva halus alih-alih bin diskret. Plot ini berguna saat Anda ingin membandingkan distribusi tanpa sensitivitas ukuran bin pada histogram. Di Seaborn, buat dengan kdeplot().
import seaborn as sns
tips = sns.load_dataset("tips")
sns.kdeplot(data=tips, x="total_bill")
Output:

Mari perbaiki plot dengan menyesuaikannya.
import seaborn as sns
import matplotlib.pyplot as plt
# Load the "tips" dataset from Seaborn
tips = sns.load_dataset("tips")
# Create a density plot of the "total_bill" column from the "tips" dataset
# We use the "hue" parameter to differentiate between "lunch" and "dinner" meal times
# We use the "fill" parameter to fill the area under the curve
# We adjust the "alpha" and "linewidth" parameters to make the plot more visually appealing
sns.kdeplot(data=tips, x="total_bill", hue="time", fill=True, alpha=0.6, linewidth=1.5)
# Add a title and labels to the plot using Matplotlib
plt.title("Density Plot of Total Bill by Meal Time")
plt.xlabel("Total Bill ($)")
plt.ylabel("Density")
# Show the plot
plt.show()
Output:

Membuat box plot Seaborn
Box plot adalah jenis visualisasi yang menunjukkan distribusi suatu dataset. Plot ini umum digunakan untuk membandingkan distribusi satu atau lebih variabel di berbagai kategori.
import seaborn as sns
tips = sns.load_dataset("tips")
sns.boxplot(x="day", y="total_bill", data=tips)
Output:

Sesuaikan box plot dengan menyertakan kolom `time` dari dataset.
import seaborn as sns
import matplotlib.pyplot as plt
# load the tips dataset from Seaborn
tips = sns.load_dataset("tips")
# create a box plot of total bill by day and meal time, using the "hue" parameter to differentiate between lunch and dinner
# customize the color scheme using the "palette" parameter
# adjust the linewidth and fliersize parameters to make the plot more visually appealing
sns.boxplot(x="day", y="total_bill", hue="time", data=tips, palette="Set3", linewidth=1.5, fliersize=4)
# add a title, xlabel, and ylabel to the plot using Matplotlib functions
plt.title("Box Plot of Total Bill by Day and Meal Time")
plt.xlabel("Day of the Week")
plt.ylabel("Total Bill ($)")
# display the plot
plt.show()
Membuat violin plot Seaborn
Violin plot adalah jenis visualisasi data yang menggabungkan aspek box plot dan density plot. Plot ini menampilkan estimasi densitas data, biasanya dihaluskan oleh kernel density estimator, bersama dengan rentang interkuartil (IQR) dan median dalam bentuk mirip box plot.
Lebar violin merepresentasikan estimasi densitas, dengan bagian yang lebih lebar menunjukkan densitas lebih tinggi, dan IQR serta median ditampilkan sebagai titik dan garis putih di dalam violin.
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")
sns.violinplot(x="species", y="petal_length", data=iris)
plt.show()
Output:

Membuat heatmap Seaborn
Heatmap menggunakan warna untuk merepresentasikan nilai dalam sebuah matriks. Dalam analisis data, heatmap umum digunakan untuk memvisualisasikan matriks korelasi. Panduan heatmap Seaborn kami membahas opsi kustomisasi lanjutan.
import seaborn as sns
import matplotlib.pyplot as plt
# Load the dataset
tips = sns.load_dataset('tips')
# Create a heatmap of the correlation between variables
corr = tips.select_dtypes(include="number").corr()
sns.heatmap(corr, annot=True, cmap="coolwarm")
# Show the plot
plt.show()
Output:

Contoh lain heatmap menggunakan dataset `flights`.
import seaborn as sns
import matplotlib.pyplot as plt
# Load the dataset
flights = sns.load_dataset('flights')
# Pivot the data
flights = flights.pivot(index="month", columns="year", values="passengers")
# Create a heatmap
sns.heatmap(flights, cmap='Blues', annot=True, fmt='d')
# Set the title and axis labels
plt.title('Passengers per month')
plt.xlabel('Year')
plt.ylabel('Month')
# Show the plot
plt.show()
Output:

Pada contoh ini, kita menggunakan dataset `flights` dari pustaka `seaborn`. Kita melakukan pivot data agar cocok direpresentasikan sebagai heatmap menggunakan metode .pivot(). Lalu, kita membuat heatmap menggunakan fungsi sns.heatmap() dan meneruskan variabel flights yang telah di-pivot sebagai argumen.
Membuat pair plot Seaborn
Pair plot adalah jenis visualisasi di mana beberapa scatter plot berpasangan ditampilkan dalam format matriks. Setiap scatter plot menunjukkan hubungan antara dua variabel, sementara plot diagonal menunjukkan distribusi variabel individual.
import seaborn as sns
# Load iris dataset
iris = sns.load_dataset("iris")
# Create pair plot
sns.pairplot(data=iris)
# Show plot
plt.show()
Output:

Kita dapat menyesuaikan plot ini dengan menggunakan parameter `hue` dan `diag_kind`.
import seaborn as sns
import matplotlib.pyplot as plt
# Load iris dataset
iris = sns.load_dataset("iris")
# Create pair plot with custom settings
sns.pairplot(data=iris, hue="species", diag_kind="kde", palette="husl")
# Set title
plt.title("Iris Dataset Pair Plot")
# Show plot
plt.show()
Output:

Membuat joint plot Seaborn
Joint plot menggabungkan scatter plot (tengah) dengan histogram marginal (tepi atas dan kanan) dalam satu figur. Tata letak ini menampilkan sekaligus hubungan antara dua variabel dan distribusi individualnya secara sekilas.
Berikut contoh sederhana membangun joint plot seaborn menggunakan dataset iris:
import seaborn as sns
import matplotlib.pyplot as plt
# load iris dataset
iris = sns.load_dataset("iris")
# plot a joint plot of sepal length and sepal width
sns.jointplot(x="sepal_length", y="sepal_width", data=iris)
# display the plot
plt.show()
Output:

Membuat facet grid Seaborn
FacetGrid membuat grid subplot—satu per nilai unik dalam variabel kategorikal. Ini memungkinkan Anda membandingkan plot yang sama di berbagai grup (misalnya, distribusi total bill untuk setiap hari dalam seminggu).
import seaborn as sns
# load the tips dataset
tips = sns.load_dataset('tips')
# create a FacetGrid for day vs total_bill
g = sns.FacetGrid(tips, col="day")
# plot histogram for total_bill in each day
g.map(sns.histplot, "total_bill")
Output:

|
Python Seaborn Cheat Sheet |
Tema dan Gaya Seaborn
Seaborn menyediakan lima tema bawaan yang mengontrol tampilan umum plot Anda. Panggil sns.set_theme() di bagian atas skrip untuk menerapkannya secara global:
import seaborn as sns
sns.set_theme(style="whitegrid") # options: darkgrid, whitegrid, dark, white, ticks
Anda juga dapat mengontrol skala elemen plot dengan parameter context. Ini menyesuaikan ukuran font, lebar garis, dan elemen lainnya untuk format keluaran yang berbeda:
sns.set_theme(style="whitegrid", context="talk") # options: paper, notebook, talk, poster
Konteks "notebook" (default) cocok untuk Jupyter notebook, sementara "talk" dan "poster" memperbesar semuanya untuk presentasi.
Menyesuaikan Plot Seaborn
Di luar gaya default, Seaborn memberi Anda kontrol atas palet warna, ukuran figur, tema, dan anotasi. Berikut kustomisasi yang paling umum:
Mengubah palet warna
Berikut contoh bagaimana Anda dapat mengubah palet warna plot seaborn Anda:
import seaborn as sns
import matplotlib.pyplot as plt
# Load sample dataset
tips = sns.load_dataset("tips")
# Create a scatter plot with color palette
sns.scatterplot(x="total_bill", y="tip", hue="day", data=tips, palette="Set2")
# Customize plot
plt.title("Total Bill vs Tip")
plt.xlabel("Total Bill ($)")
plt.ylabel("Tip ($)")
plt.show()
Output:

Menyesuaikan ukuran figur
Untuk menyesuaikan ukuran figur pada plot seaborn Anda, Anda dapat menggunakan contoh di bawah ini sebagai panduan:
import seaborn as sns
import matplotlib.pyplot as plt
# Load sample dataset
iris = sns.load_dataset("iris")
# Create a violin plot with adjusted figure size
plt.figure(figsize=(8,6))
sns.violinplot(x="species", y="petal_length", data=iris)
# Customize plot
plt.title("Petal Length Distribution by Species")
plt.xlabel("Species")
plt.ylabel("Petal Length (cm)")
plt.show()
Output:

Menambahkan anotasi
Anotasi dapat membantu membuat visualisasi Anda lebih mudah dibaca. Kami menampilkan contoh cara menambahkannya di bawah ini:
import seaborn as sns
import matplotlib.pyplot as plt
# Load sample dataset
diamonds = sns.load_dataset("diamonds")
# Create a scatter plot with annotations
sns.scatterplot(x="carat", y="price", data=diamonds)
# Add annotations
plt.text(1, 18000, "Large, Expensive Diamonds", fontsize=12, color="red")
plt.text(2.5, 5000, "Small, Affordable Diamonds", fontsize=12, color="blue")
# Customize plot
plt.title("Diamond Prices by Carat")
plt.xlabel("Carat (ct)")
plt.ylabel("Price ($)")
plt.show()
Output:

Praktik terbaik untuk visualisasi Seaborn
Berikut beberapa praktik terbaik yang perlu diingat agar mendapatkan hasil maksimal dari Seaborn.
Pilih tipe plot yang tepat untuk data Anda
Seaborn menyediakan beragam tipe plot, masing-masing dirancang untuk tipe data dan analisis yang berbeda. Penting untuk memilih tipe plot yang tepat untuk data Anda agar temuan tersampaikan secara efektif. Misalnya, scatter plot mungkin lebih tepat untuk memvisualisasikan hubungan antara dua variabel kontinu, sementara bar plot mungkin lebih tepat untuk memvisualisasikan data kategorikal.
Gunakan warna secara efektif
Warna bisa menjadi alat yang kuat untuk visualisasi data, namun penting untuk menggunakannya secara efektif. Hindari menggunakan terlalu banyak warna atau warna yang terlalu mencolok, karena dapat membuat visualisasi sulit dibaca. Sebaliknya, gunakan warna untuk menyorot informasi penting atau mengelompokkan titik data yang serupa.
Beri label sumbu dan gunakan judul yang jelas
Label dan judul sangat penting untuk visualisasi data yang efektif. Pastikan memberi label sumbu dengan jelas dan menyediakan judul yang deskriptif untuk visualisasi Anda. Ini akan membantu audiens memahami pesan yang ingin Anda sampaikan.
Pertimbangkan audiens
Saat membuat visualisasi, penting untuk mempertimbangkan audiens dan pesan yang ingin Anda komunikasikan. Jika audiens Anda non-teknis, gunakan bahasa yang jelas dan ringkas, hindari jargon teknis, dan berikan penjelasan yang jelas tentang konsep statistik apa pun.
Gunakan analisis statistik yang sesuai
Seaborn menyediakan beragam fungsi statistik yang dapat Anda gunakan untuk menganalisis data. Saat memilih fungsi statistik, pastikan memilih yang paling sesuai untuk data dan pertanyaan riset Anda.
Sesuaikan visualisasi Anda
Anda akan menemukan beragam opsi kustomisasi di Seaborn yang dapat digunakan untuk meningkatkan visualisasi. Bereksperimenlah dengan berbagai font, gaya, dan warna untuk menemukan yang paling baik menyampaikan pesan Anda.
Memilih Pustaka Visualisasi Python yang Tepat
Meneruskan apa yang telah kita bahas, mari lihat bagaimana Seaborn dibandingkan dengan Matplotlib dan dua alternatif lain yang akan Anda temui, serta pustaka mana yang cocok untuk kasus penggunaan tertentu:
| Pustaka | Kekuatan | Keterbatasan | Terbaik untuk |
|---|---|---|---|
| Matplotlib | Kontrol penuh atas setiap elemen figur | Verbosa; tidak ada statistik bawaan | Figur kustom, siap publikasi |
pandas .plot() |
Plot cepat dari DataFrame tanpa impor tambahan | Tipe bagan terbatas; penataan minimal | Pemeriksaan eksploratori cepat |
| Plotly | Interaktif; bisa disematkan di web; dukungan 3D | Dependensi lebih berat; kurva belajar untuk kustomisasi | Dasbor, aplikasi web, laporan interaktif |
| Seaborn | Default statistik; API bersih; integrasi pandas | Hanya statis; kurang fleksibel dibanding Matplotlib mentah | Analisis data eksploratori, plot statistik |
Untuk sebagian besar pekerjaan analisis data, saya menggunakan Seaborn untuk eksplorasi awal, Matplotlib untuk penyempurnaan, dan Plotly saat output perlu interaktif. Mereka tidak saling eksklusif.
Kesimpulan
Seaborn adalah pustaka visualisasi data yang kuat di Python yang menyediakan antarmuka intuitif dan mudah digunakan untuk membuat grafik statistik yang informatif. Dengan beragam alat visualisasi, Seaborn memungkinkan Anda dengan cepat dan efisien mengeksplorasi serta mengomunikasikan wawasan dari set data yang kompleks.
Dari scatter plot dan line plot hingga heatmap dan facet grid, Seaborn menawarkan beragam visualisasi untuk berbagai kebutuhan. Selain itu, kemampuan Seaborn untuk berintegrasi dengan Pandas dan Numpy menjadikannya alat yang tak tergantikan bagi analis dan ilmuwan data.
Dengan panduan pemula Python Seaborn ini, Anda dapat mulai menjelajahi dunia visualisasi data dan mengomunikasikan wawasan Anda secara efektif kepada audiens yang lebih luas.
Jika Anda ingin memperluas pengetahuan lebih jauh dalam topik ini, lihat kursus Introduction to Data Visualization with Seaborn atau Intermediate Data Visualization with Seaborn kami.
Sepanjang kursus ini, Anda akan belajar memanfaatkan alat visualisasi lanjutan Seaborn untuk menganalisis berbagai dataset dunia nyata, seperti American Housing Survey, data biaya kuliah, dan tamu The Daily Show.
Anda juga dapat melihat lembar contekan Seaborn gratis kami.
FAQ Python Seaborn
Apa perbedaan antara Seaborn dan Matplotlib, dan kapan saya harus menggunakan masing-masing?
Seaborn adalah pustaka tingkat tinggi yang dibangun di atas Matplotlib dan menyederhanakan pembuatan grafik statistik, sedangkan Matplotlib adalah pustaka tingkat rendah yang memberikan kontrol sangat detail atas setiap elemen plot. Gunakan Seaborn saat Anda ingin visualisasi statistik yang menarik dengan kode minimal, dan gunakan Matplotlib saat Anda membutuhkan plot yang sangat kustom atau tidak standar. Keduanya juga dapat dikombinasikan, karena plot Seaborn dapat disesuaikan lebih lanjut dengan perintah Matplotlib.
Bisakah saya menggunakan Seaborn dengan sumber data selain Pandas DataFrame?
Seaborn dirancang agar paling alami bekerja dengan Pandas DataFrame, tetapi banyak fungsinya juga menerima array NumPy, daftar Python, atau dictionary. Meski begitu, sebaiknya data Anda dikonversi dahulu menjadi DataFrame karena ini memungkinkan Anda menggunakan seluruh fitur Seaborn, termasuk parameter hue, style, dan size yang merujuk nama kolom.
Bagaimana cara menangani nilai hilang saat membuat plot dengan Seaborn?
Seaborn umumnya menangani nilai hilang dengan baik dengan membuangnya sebelum plotting, sehingga entri NaN tidak akan membuat kode Anda gagal. Namun, data yang hilang dapat secara diam-diam mendistorsi distribusi atau estimasi statistik pada plot Anda. Praktik terbaiknya adalah memeriksa dan menangani nilai hilang secara eksplisit dalam DataFrame (melalui imputasi atau penghapusan) sebelum memvisualisasikan.
Apa saja tema bawaan Seaborn dan bagaimana cara mengubahnya?
Seaborn dilengkapi lima tema preset (darkgrid, whitegrid, dark, white, dan ticks) yang dapat Anda terapkan dengan sns.set_style(). Anda juga dapat mengontrol skala elemen plot (ukuran font, ketebalan garis) menggunakan sns.set_context() dengan opsi seperti paper, notebook, talk, dan poster, sehingga mudah menyesuaikan visual untuk berbagai format presentasi.
Apakah Seaborn cocok untuk visualisasi interaktif atau berbasis web?
Seaborn terutama dirancang untuk membuat plot statis dan paling cocok untuk analisis eksploratori, laporan, dan publikasi. Jika Anda membutuhkan fitur interaktif seperti tooltip, zoom, atau elemen yang dapat diklik untuk aplikasi web, pustaka seperti Plotly atau Bokeh lebih tepat. Namun, Anda dapat menggunakan Seaborn di dalam Jupyter notebook untuk alur kerja eksplorasi yang semi-interaktif.



