Data Science
Ujian CPMK03
Soal 1
Feature Engineering adalah proses menciptakan atau memodifikasi fitur-fitur dalam dataset untuk meningkatkan performa model.
Pernyataan tersebut Benar atau Salah ?
a. Benar
b. Salah
Jawab: A
Soal 2
Pada tahap modelling, kita mencoba untuk memahami data dengan melihat tren dan pola dalam dataset.
Pernyataan tersebut Benar atau Salah ?
a. Benar
b. Salah
Jawab: B
Soal 3
Data analytics adalah proses analisis data untuk mendapatkan wawasan yang dapat digunakan untuk membuat keputusan bisnis yang lebih baik.
Pernyataan tersebut bernilai Benar atau Salah ?
a. Benar
b. Salah
Jawab: A
Soal 4
Analisis deskriptif berfokus pada menjelaskan atau merangkum data agar lebih mudah dipahami.
Pernyataan terbut bernilai Benar atau Salah ?
a. Benar
b. Salah
Jawab: A
Soal 5
Analisis prediktif menggunakan data historis untuk membuat perkiraan tentang kejadian di masa depan.
Pernyataan tersebut bernilai Benar atau Salah ?
a. Benar
b. Salah
Jawab: A
Soal 6
Model yang kompleks selalu lebih baik daripada model yang sederhana dalam memprediksi data baru.
Pernyataan tersebut bernilai Benar atau Salah ?
a. Benar
b. Salah
Jawab: B
Soal 7
Data analytics hanya diperlukan dalam bisnis besar dan tidak diperlukan dalam skala yang lebih kecil.
Pernyataan tersebut bernilai Benar atau Salah ?
a. Benar
b. Salah
Soal 8
Analisis prediktif tidak berguna dalam konteks bisnis karena hanya berfokus pada data historis.
Pernyataan tersebut bernilai Benar atau Salah ?
a. Benar
b. Salah
Jawab: B
Soal 9
Data analytics melibatkan identifikasi, pengumpulan, dan pengorganisasian data.
Pernyataan tersebut bernilai Benar atau Salah ?
a. Benar
b. Salah
Jawab: A
Soal 10
Menghapus fitur yang tidak penting atau kurang relevan dapat meningkatkan kinerja model.
Pernyataan tersebut bernilai Benar atau Salah ?
a. Benar
b. Salah
Jawab: A
Soal 11
Dataset: Pengeluaran Belanja Rumah Tangga
Bulan Kategori Pengeluaran (USD)
Januari Makanan 800
Januari Transportasi 200
Januari Hiburan 150
Februari Makanan 850
Februari Transportasi 180
Februari Hiburan 200
Maret Makanan 900
Maret Transportasi 220
Maret Hiburan 180
[Analisis Deskriptif]
Dari dataset tersebut, apakah ada bulan di mana pengeluaran hiburan lebih tinggi daripada pengeluaran makanan? Berikan penjelasan Anda.
Jawab:
Kita bandingkan pengeluaran Hiburan dengan Makanan untuk tiap bulan:
Januari:
Hiburan = 150
Makanan = 800
👉 Hiburan < Makanan
Februari:
Hiburan = 200
Makanan = 850
👉 Hiburan < Makanan
Maret:
Hiburan = 180
Makanan = 900
👉 Hiburan < Makanan
Kesimpulan:
Tidak ada bulan di mana pengeluaran untuk Hiburan lebih tinggi daripada Makanan.
Di semua bulan, pengeluaran untuk Makanan selalu lebih besar dibanding Hiburan.
UAS - DATA SCIENCE
Soal 1
Apa itu visualisasi data dan mengapa visualisasi data penting dalam proses pengambilan keputusan?
Jawab:
Visualisasi data adalah proses menyajikan data dalam bentuk grafik, diagram, peta, atau chart agar lebih mudah dipahami dan dianalisis. Contohnya termasuk:
- Diagram batang (bar chart)
- Diagram garis (line chart)
- Diagram lingkaran (pie chart)
- Heatmap, dashboard interaktif, dan lain-lain
Mengapa Visualisasi Data Penting dalam Pengambilan Keputusan?
- Menyederhanakan Informasi yang Kompleks
Data mentah seringkali sulit ditafsirkan. Visualisasi mengubah angka menjadi gambar yang mudah dicerna dan dipahami dengan cepat. - Membantu Menemukan Pola dan Tren
Dengan grafik, kita bisa melihat tren naik-turun, anomali, korelasi, dan pola-pola yang tidak terlihat hanya dari tabel angka. - Mempercepat Pengambilan Keputusan
Keputusan bisa dibuat lebih cepat dan akurat karena informasi ditampilkan secara ringkas dan visual. - Meningkatkan Komunikasi Data
Visualisasi membantu menjelaskan data kepada tim, manajemen, atau stakeholder non-teknis dengan cara yang lebih intuitif. - Mendukung Bukti dalam Pengambilan Keputusan
Visualisasi dapat digunakan sebagai alat pendukung keputusan berbasis data, bukan asumsi.
Contoh:
Jika sebuah perusahaan ingin mengetahui bulan dengan penjualan tertinggi, melihat grafik garis penjualan per bulan akan jauh lebih cepat dan informatif dibanding membaca daftar angka panjang.
Kesimpulan:
Visualisasi data adalah alat penting dalam data analytics karena membantu memahami, mengkomunikasikan, dan mengambil keputusan berdasarkan data secara lebih efektif.
Soal 2
Bagaimana jenis data, jumlah data, dan jumlah variabel dalam kumpulan data mempengaruhi pemilihan alat dan jenis visualisasi?
Jawab:
Jenis data, jumlah data, dan jumlah variabel memang sangat memengaruhi pemilihan alat dan jenis visualisasi yang paling tepat. Berikut penjelasannya:
1. Jenis Data
Jenis data menentukan bentuk visualisasi yang sesuai.
Jenis Data | Contoh | Visualisasi yang Cocok |
---|---|---|
Data Kategorikal | Jenis produk, gender | Bar chart, pie chart, stacked chart |
Data Numerik | Penjualan, usia | Histogram, line chart, scatter plot |
Data Waktu (Time Series) | Data bulanan/tahunan | Line chart, area chart |
Data Geospasial | Lokasi, koordinat | Map chart, heatmap geografis |
2. Jumlah Data (Banyak Sedikitnya Baris/Observasi)
Sedikit data:
Grafik sederhana seperti bar chart atau pie chart sudah cukup.
Data besar (big data):
Perlu visualisasi yang efisien dan interaktif, misalnya:
Heatmap untuk matriks besar
Dashboard interaktif (menggunakan alat seperti Tableau, Power BI)
Sampling atau agregasi sebelum divisualisasikan
3. Jumlah Variabel (Fitur/Kolom)
1 variabel (univariat):
Histogram, pie chart, bar chart
2 variabel (bivariat):
Scatter plot, line chart, grouped bar chart
>2 variabel (multivariat):
Gunakan:
Bubble chart (3 variabel: x, y, ukuran)
Treemap
Parallel coordinates
Multidimensional scaling (MDS) atau PCA plot
4. Pengaruh terhadap Pemilihan Alat
Alat visualisasi juga dipilih berdasarkan kompleksitas dan skala data:
Skala Data | Alat yang Cocok |
---|---|
Kecil – Menengah | Excel, Google Sheets, Matplotlib, Seaborn |
Sedang – Besar | Tableau, Power BI, Plotly, R Shiny |
Big Data | Apache Superset, D3.js, Grafana, Kibana |
Kesimpulan:
Pemilihan jenis visualisasi yang tepat bergantung pada kombinasi dari:
Jenis data: numerik, kategorikal, waktu, geografis
Jumlah data: banyak/sedikit baris
Jumlah variabel: kompleksitas hubungan antar fitur
Tujuannya selalu sama: menyampaikan informasi secara jelas, akurat, dan mudah dipahami.
Soal 3
Jelaskan bagaimana elemen-elemen desain visual dapat mempengaruhi interpretasi dan pemahaman data
Jawab:
Elemen-elemen desain visual memiliki peran penting dalam menentukan bagaimana seseorang menafsirkan dan memahami data yang disajikan dalam bentuk visual. Desain yang baik dapat memperjelas informasi, sementara desain yang buruk dapat menyesatkan atau membuat data sulit dipahami.
Berikut penjelasan elemen-elemen desain visual yang mempengaruhi interpretasi:
1. Warna
✅ Fungsi: Menyoroti perbedaan antar kategori, menunjukkan tren atau intensitas (misal: heatmap).
⚠️ Potensi masalah: Penggunaan warna terlalu banyak atau terlalu mirip bisa membingungkan.
🎯 Tips: Gunakan skema warna yang konsisten dan ramah bagi orang dengan buta warna (colorblind-friendly).
2. Ukuran
✅ Fungsi: Menunjukkan besar-kecilnya nilai (misalnya dalam bubble chart atau pie chart).
⚠️ Potensi masalah: Perbedaan ukuran bisa menyesatkan jika tidak proporsional terhadap nilai aslinya.
🎯 Tips: Gunakan skala yang logis dan hindari efek dramatis yang tidak diperlukan.
3. Tata Letak (Layout)
✅ Fungsi: Mengarahkan perhatian audiens ke informasi penting terlebih dahulu.
⚠️ Potensi masalah: Tata letak yang berantakan membuat pembaca kehilangan fokus.
🎯 Tips: Susun elemen secara hierarkis; letakkan informasi kunci di posisi strategis.
4. Label dan Judul
✅ Fungsi: Memberikan konteks agar pembaca memahami arti grafik.
⚠️ Potensi masalah: Label yang kurang jelas bisa menimbulkan kebingungan.
🎯 Tips: Gunakan judul yang deskriptif dan label sumbu yang informatif.
5. Skala dan Sumbu
✅ Fungsi: Menunjukkan rentang nilai dan perubahan secara akurat.
⚠️ Potensi masalah: Sumbu yang dimulai bukan dari nol bisa mengubah persepsi tren (misalnya grafik terlihat dramatis padahal tidak).
🎯 Tips: Tampilkan skala yang jujur dan relevan untuk data.
6. Bentuk dan Gaya Visualisasi
✅ Fungsi: Menyesuaikan jenis grafik dengan jenis data (contoh: line chart untuk data waktu).
⚠️ Potensi masalah: Pemilihan grafik yang tidak sesuai membuat interpretasi keliru.
🎯 Tips: Pilih jenis grafik berdasarkan tujuan komunikasi dan tipe data.
Contoh Kesalahan Umum
Menggunakan 3D chart tanpa alasan → bisa menyesatkan proporsi data.
Tidak memberi legenda pada grafik → membuat pembaca menebak-nebak.
Warna kontras rendah → menyulitkan keterbacaan.
Kesimpulan
Elemen desain visual seperti warna, ukuran, tata letak, label, skala, dan jenis grafik sangat mempengaruhi bagaimana data dipahami.
Desain yang baik membantu menyampaikan pesan data dengan jelas, sedangkan desain buruk dapat menyebabkan kesalahpahaman atau interpretasi yang salah.
📌 Tujuan utama desain visual data adalah komunikasi yang efektif — bukan sekadar estetika.
Soal 4
Anda memiliki data penjualan produk bulanan dalam bentuk berikut :
Gunakan Python untuk membuat visualisasi yang menunjukkan tren penjualan bulanan.
Langkah-langkah:
1. Masuk ke https://colab.research.google.com/ dan buat notebook baru dan jalankan kode pemrograman di bawah
2. Import pustaka pandas, matplotlib, dan seaborn.
3. Buat DataFrame menggunakan data di atas.
4. Buat grafik garis untuk menunjukkan tren penjualan bulanan.
5. Tambahkan judul, label sumbu, dan grid ke grafik Anda.
Kode Pemrograman:
#import library yang dibutuhkan
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# Data penjualan
data = {
'Bulan': ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'],
'Penjualan': [150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700]
}
df = pd.DataFrame(data)
# Buat grafik garis
plt.figure(figsize=(10, 6))
sns.lineplot(x='Bulan', y='Penjualan', data=df, marker='o')
plt.title('Tren Penjualan Bulanan')
plt.xlabel('Bulan')
plt.ylabel('Penjualan')
plt.grid(True)
plt.show()
Berikan hasil visualisasi dan interpretasi dari tren penjualan yang ditunjukkan oleh grafik tersebut
Jawab:
Hasil menjalankan kode bisa cek di link ini:
https://colab.research.google.com/drive/1pGEBf7OqgoNuv_r6KnNFPHIPOMeW0LSL?usp=sharing
Berikut adalah grafik visual dari tren penjualan bulanan. Grafik ini menunjukkan peningkatan penjualan yang stabil dari bulan Januari hingga Desember, mencerminkan pertumbuhan bisnis yang konsisten sepanjang tahun.
Komentar
Posting Komentar
Semoga bermanfaat dunia dan akhirat