Praktikum Modul 3 Pengenalan Python Dan Google Colab

Daftar Isi

 

Praktikum ini membahas dasar penggunaan Python di Google Colab untuk eksplorasi data dan visualisasi sederhana — umumnya digunakan dalam bidang Machine Learning dan Artificial Intelligence (AI).
Tujuannya agar mahasiswa mampu:

  • Menggunakan Google Colab untuk menjalankan kode Python.

  • Mengelola dataset (membaca, menampilkan, dan membersihkan data).

  • Membuat visualisasi sederhana menggunakan Matplotlib dan Seaborn.

Pengantar Python: Variabel, Tipe Data, dan Struktur Data

a. Variabel & Tipe Data

Contoh:

nama = "Adi Muhamad" # string umur = 21 # integer ipk = 3.75 # float is_mahasiswa = True # boolean

Tipe data dapat dicek dengan:

print(type(nama), type(umur), type(ipk), type(is_mahasiswa))

Penjelasan:

  • string: teks atau kalimat

  • integer: bilangan bulat

  • float: bilangan desimal

  • boolean: logika (True/False)

b. Struktur Data: List & Dictionary

List (data urutan yang bisa diubah)

nilai = [80, 85, 90, 88] nilai.append(92) print("Rata-rata:", sum(nilai) / len(nilai))

Dictionary (data pasangan kunci-nilai)

biodata = { "nama": "Adi Muhamad", "prodi": "Bisnis Digital", "minat": ["AI", "Big Data"] } print(biodata["nama"], "minat:", ", ".join(biodata["minat"]))

Penjelasan:

  • List cocok untuk menyimpan banyak nilai sejenis (misal nilai ujian).

  • Dictionary cocok untuk data dengan pasangan kunci → nilai (seperti nama, prodi, minat).

Numpy: Operasi Matriks dan Agregasi Data

a. Membuat Array

import numpy as np b = np.arange(1, 13).reshape(3, 4) print("b =\n", b)

b. Indexing & Slicing

print("Elemen baris-1 kolom-2:", b[0, 1]) print("Baris ke-2:", b[1]) print("Kolom ke-3:", b[:, 2])

c. Broadcasting dan Agregasi

c = b + 10 print("Broadcasting b + 10:\n", c) print("Sum keseluruhan:", b.sum()) print("Mean per kolom:", b.mean(axis=0)) print("Max per baris:", b.max(axis=1))

d. Transformasi Bentuk

print("Reshape (2,6):\n", b.reshape(2,6)) print("Transpose:\n", b.T)

Penjelasan:

  • Numpy memudahkan perhitungan numerik (seperti menjumlahkan seluruh elemen atau rata-rata per kolom).

  • Broadcasting artinya menambahkan angka ke seluruh elemen array tanpa perulangan manual.

Pandas: Eksplorasi DataFrame

a. Membuat DataFrame

import pandas as pd df_demo = pd.DataFrame({ "produk": ["A", "B", "C", "D"], "harga": [100, 120, 90, 150], "penjualan": [120, 90, 150, 110] }) df_demo

b. Membaca Dataset CSV

from google.colab import drive drive.mount('/content/drive') path = '/content/drive/MyDrive/ColabNotebooks/Modul3/dataset_prediksi_harga_rumah.csv' df = pd.read_csv(path) df.head()

c. Info & Ringkasan Data

print("\nInfo:") print(df.info()) print("\nDescriptive stats:") display(df.describe())

Penjelasan:

  • info() menunjukkan jumlah data, tipe kolom, dan missing values.

  • describe() menampilkan statistik deskriptif seperti mean, min, max, dan quartile.

d. Seleksi Kolom, Baris, dan Filter

kolom_numerik = df.select_dtypes(include=np.number).columns.tolist() display(df.head(3)) display(df.tail(3)) print("Baris ke-5:\n", df.iloc[4]) if 'kamar_tidur' in df.columns: display(df[df['kamar_tidur'] >= 3].head()) if set(['harga', 'luas_bangunan']).issubset(df.columns): df['harga_per_m2'] = df['harga'] / df['luas_bangunan']

Penjelasan:

  • iloc digunakan untuk mengakses baris berdasarkan indeks.

  • loc digunakan berdasarkan label atau nama kolom.

  • Dapat membuat kolom baru (misal harga per m²).

e. Menangani Missing Values

print(df.isna().sum()) df_clean = df.fillna(df.median(numeric_only=True))

Penjelasan:

  • isna().sum() → menghitung jumlah data kosong.

  • fillna() → mengganti nilai kosong dengan median atau nilai lain.

Visualisasi Data — Matplotlib & Seaborn

a. Histogram

import matplotlib.pyplot as plt kolom = 'luas_bangunan' if 'luas_bangunan' in df.columns else df.select_dtypes(include=np.number).columns[0] plt.hist(df[kolom], bins=12) plt.title(f"Histogram: {kolom}") plt.xlabel(kolom) plt.ylabel("Frekuensi") plt.show()

Penjelasan:
Histogram digunakan untuk melihat distribusi data numerik, misalnya penyebaran luas bangunan.

b. Scatter Plot

if set(['luas_bangunan', 'harga']).issubset(df.columns): plt.scatter(df['luas_bangunan'], df['harga']) plt.title("Scatter: Luas Bangunan vs Harga") plt.xlabel("Luas Bangunan (m2)") plt.ylabel("Harga (Rp)") plt.show()

Penjelasan:
Scatter plot menampilkan hubungan antara dua variabel numerik (misalnya apakah luas bangunan berbanding lurus dengan harga rumah).

c. Seaborn: Heatmap Korelasi & Pairplot

import seaborn as sns corr = df.select_dtypes(include=np.number).corr(numeric_only=True) sns.heatmap(corr, annot=True, fmt=".2f") plt.title("Matriks Korelasi") plt.show() kolom_pair = [c for c in ['luas_bangunan', 'luas_tanah', 'kamar_tidur', 'kamar_mandi', 'harga'] if c in df.columns] if len(kolom_pair) >= 3: sns.pairplot(df[kolom_pair])

Penjelasan:

  • Heatmap menampilkan kekuatan hubungan antar variabel numerik dalam bentuk warna.

  • Pairplot menampilkan hubungan antar variabel dalam grafik sebaran (scatter) dan distribusi diagonal.

🧠 Kesimpulan Umum

Materi praktikum ini memperkenalkan alur dasar analisis data menggunakan Python:

  1. Membaca dan memahami data (dengan Pandas).

  2. Membersihkan dan menyiapkan data (handling missing values).

  3. Melakukan analisis statistik sederhana.

  4. Membuat visualisasi dasar untuk memahami pola dan hubungan antar variabel.

Tahapan ini merupakan fondasi utama dalam data science dan machine learning sebelum melangkah ke tahap modeling dan prediksi.

Link Google Collab Praktikum 1 dan 2 Modul 3

Praktikum 1 Klik Disini 
Praktikum 2 Klik Disini

Referensi

Sumber utama:

Modul Praktikum Machine Learning & AI, disusun oleh Adi Muhamad Muhsidi (2025).
Program Studi Bisnis Digital, Fakultas Ekonomi dan Bisnis, Universitas Kuningan.

Link flipbook: https://heyzine.com/flip-book/cbbbf75431.html

Atau dapat diakses langsung dari blog pribadi penulis di:
https://adi-muhamad.my.id

Posting Komentar