Laporan Praktikum Modul 3 Sumber dan Klasifikasi Data

Daftar Isi

Menganalisi Data Mentah Dari Website Pemerintah

Data tersebut adalah data terstruktur (tabular):

  • Baris (row) → mewakili satu record/data (misalnya data suatu daerah pada tahun tertentu)
  • Kolom (column) → mewakili atribut/variabel

Identifikasi Tipe Data Tiap Kolom

KolomTipe DataPenjelasan
idAngka (integer)Nilai unik untuk tiap baris
kode_provinsiAngka / TeksBiasanya angka, tapi bisa teks jika ada nol di depan
nama_provinsiTeksNama wilayah
kode_kabupaten_kotaAngka / TeksSama seperti kode provinsi
nama_kabupaten_kotaTeksNama daerah
status_kawinTeksKategori (misal: Kawin, Belum Kawin)
jumlah_pendudukAngka (integer)Nilai kuantitatif (jumlah orang)
satuanTeksMisalnya "jiwa"
tahunAngka (integer)Tahun data

Klasifikasi Sederhana

  • Angka (numerik): id, kode_provinsi, kode_kabupaten_kota, jumlah_penduduk, tahun
  • Teks (string/kategori): nama_provinsi, nama_kabupaten_kota, status_kawin, satuan

Catatan Penting

  • Kode wilayah kadang dianggap teks, bukan angka, karena:
    • Tidak untuk perhitungan
    • Bisa punya format khusus (misalnya ada nol di depan)

Kesimpulan

Data ini:

  • Disusun dalam baris dan kolom (tabular)
  • Mengandung dua tipe utama:
    • Angka (numerik)
    • Teks (kategorikal)
  • Setiap kolom berisi satu nilai tunggal (atomic) → jadi termasuk data terstruktur yang rapi (tidak multivalue)

Dari daftar kolom, itu terlihat seperti struktur data tabel (dataset tabular)—biasanya dipakai di Excel, CSV, database SQL, atau DataFrame (misalnya di Python/Pandas).

Kalau ditanya tipe data masing-masing kolom, kira-kira seperti ini:

  • id → integer (angka unik / primary key)
  • kode_provinsi → integer atau string (kode wilayah, kadang pakai string kalau ada nol di depan)
  • nama_provinsi → string (teks)
  • kode_kabupaten_kota → integer atau string
  • nama_kabupaten_kota → string
  • status_kawin → string (misalnya: Kawin, Belum Kawin, Cerai, dll)
  • jumlah_penduduk → integer (jumlah orang)
  • satuan → string (misalnya: “jiwa”)
  • tahun → integer (misalnya: 2020, 2021)

Kesimpulan:

  • Ini adalah data terstruktur (structured data) dalam bentuk tabel
  • Kombinasi tipe datanya: integer + string (teks)

Observasi 2


Jenis Struktur Data

Data yang kamu tampilkan adalah JSON (JavaScript Object Notation)

Ciri utamanya:

  • Menggunakan kurung kurawal {}
  • Berisi pasangan kunci–nilai (key-value pairs)
  • Data disusun dalam array [] berisi objek

➡️ Jadi ini bukan tabel relasional, tapi data semi-terstruktur

Struktur Hirarki

Struktur data ini bertingkat (nested / hierarki):

  • Level 1 → Array (list data)
  • Level 2 → Object (user)
  • Level 3 → Nested object (address, company)
  • Level 4 → Nested lagi (geo)

Contoh:

  • address → object
    • di dalamnya ada geo → object lagi

Identifikasi Tipe Data

1. Tipe Data Utama dalam JSON

JSON hanya punya beberapa tipe dasar:

  • Number (angka)id
  • String (teks)"name", "email", dll
  • Object{ ... }
  • Array[ ... ]
  • (opsional: boolean, null — tapi tidak ada di contoh ini)

2. Tipe Data per Field

KeyTipe DataKeterangan
idAngka (number)ID unik
nameTeks (string)Nama
usernameTeksUsername
emailTeksEmail
phoneTeksNomor (bukan angka murni)
websiteTeksURL
addressObjectData bersarang
companyObjectData bersarang

Nested Object

address

  • street → teks
  • suite → teks
  • city → teks
  • zipcode → teks (bukan angka murni)
  • geo → object

geo

  • lat → teks (meskipun angka, disimpan sebagai string)
  • lng → teks

company

  • name → teks
  • catchPhrase → teks
  • bs → teks

Karakteristik Penting

1. Semi-Terstruktur

  • Tidak kaku seperti tabel
  • Tidak perlu skema tetap
  • Bisa berubah-ubah struktur

2. Key-Value

Contoh:

"name": "Leanne Graham"
  • "name" = key
  • "Leanne Graham" = value

3. Nested (Bersarang)

  • Object di dalam object
  • Ini yang tidak ada di tabel biasa tanpa relasi

Perbandingan dengan Tabel

JSONTabel Relasional
FleksibelKaku
Bisa nestedHarus dipisah tabel
Key-valueKolom tetap
HierarkiFlat

Kesimpulan

  • Ini adalah data JSON (semi-terstruktur)
  • Menggunakan:
    • Array → kumpulan data
    • Object → representasi entitas
    • Key-value pairs
  • Mengandung tipe:
    • Angka (number)
    • Teks (string)
    • Object (nested)
  • Memiliki struktur hierarki (nested), bukan datar seperti tabel

Posting Komentar