Praktikum Modul 4 Regresi Linear dan Prediksi Bisnis
Pada praktikum ini, mahasiswa Universitas Kuningan akan mempelajari secara langsung bagaimana cara membangun model regresi linear sederhana dan regresi linear berganda menggunakan bahasa pemrograman Python, khususnya melalui platform Google Colab. Praktikum ini bertujuan untuk memberikan pengalaman langsung dalam membuat dataset, melatih model, melakukan evaluasi kinerja model, serta menafsirkan hasil prediksi secara kuantitatif dan visual.
Praktikum ini menggunakan dataset dummy berisi data penjualan selama 12 bulan, yang menggambarkan situasi sederhana dari dunia bisnis. Dengan data ini, mahasiswa akan melihat bagaimana faktor-faktor seperti anggaran iklan dan harga produk dapat memengaruhi jumlah penjualan, dan bagaimana hubungan tersebut dapat dimodelkan menggunakan regresi linear.
2. Tujuan Praktikum
Tujuan utama dari praktikum ini adalah agar mahasiswa mampu memahami dan menerapkan konsep dasar regresi linear dalam konteks analisis data bisnis. Secara lebih rinci, tujuan yang ingin dicapai antara lain:
- Menerapkan konsep regresi linear sederhana dan regresi linear berganda menggunakan pustaka Scikit-Learn di Python.
- Mampu melakukan pemrosesan data sederhana menggunakan pandas dan NumPy.
- Menghitung dan menafsirkan hasil evaluasi model menggunakan metrik R² (koefisien determinasi), MAE (Mean Absolute Error), MSE (Mean Squared Error), dan RMSE (Root Mean Squared Error).
- Menyajikan hasil prediksi dalam bentuk visualisasi yang mudah dipahami menggunakan Matplotlib.
- Menyimpan hasil analisis dan prediksi model ke dalam file CSV agar dapat digunakan untuk praktikum lanjutan.
Dengan memahami seluruh langkah tersebut, mahasiswa diharapkan mampu menerapkan metode regresi linear dalam situasi nyata, seperti memprediksi penjualan, permintaan konsumen, atau tren pertumbuhan bisnis berdasarkan data historis.
3. Studi Kasus
Kasus yang digunakan dalam praktikum ini adalah Prediksi Penjualan Produk Berdasarkan Faktor Pemasaran. Dataset yang digunakan merupakan data dummy yang berisi informasi penjualan selama 12 bulan. Data ini terdiri atas empat kolom utama:
| Kolom | Keterangan |
|---|---|
| Bulan | Menunjukkan urutan bulan ke-1 sampai ke-12. |
| Iklan | Menunjukkan total anggaran iklan (dalam juta rupiah) yang digunakan pada bulan tersebut. |
| Harga | Menunjukkan harga jual produk (dalam ribu rupiah). |
| Penjualan | Menunjukkan jumlah unit produk yang terjual selama bulan tersebut. |
Data dummy ini dirancang agar mencerminkan kondisi realistis di mana peningkatan biaya iklan dapat meningkatkan penjualan, sedangkan kenaikan harga produk mungkin memiliki efek sebaliknya. Dengan dataset sederhana ini, mahasiswa dapat lebih mudah memahami konsep hubungan antarvariabel.
4. Langkah-Langkah Praktikum
a. Persiapan Lingkungan Kerja
Mahasiswa diminta untuk membuka Google Colab, kemudian membuat notebook baru dengan nama:
PraktikumML-Bab4_NIM_NamaLengkap.ipynb
Google Colab dipilih karena menyediakan lingkungan Python berbasis cloud yang mudah digunakan, tidak memerlukan instalasi, dan mendukung pustaka populer untuk analisis data seperti NumPy, Pandas, Matplotlib, dan Scikit-Learn.
b. Membuat Dataset Dummy
Dataset dummy disusun menggunakan dictionary Python dan diubah menjadi DataFrame dengan bantuan pustaka Pandas. Dataset ini berisi 12 baris data yang mewakili penjualan selama satu tahun. Masing-masing baris berisi data iklan, harga, dan jumlah penjualan. Dataset ini menjadi dasar bagi dua jenis analisis: regresi linear sederhana dan regresi linear berganda.
c. Regresi Linear Sederhana
Model regresi linear sederhana digunakan untuk melihat hubungan antara satu variabel independen dan satu variabel dependen. Dalam kasus ini, variabel independennya adalah biaya iklan, sedangkan variabel dependennya adalah penjualan produk. Tujuan utamanya adalah untuk melihat seberapa besar pengaruh biaya iklan terhadap peningkatan penjualan.
Setelah model dilatih, dilakukan evaluasi menggunakan metrik R² untuk melihat seberapa baik model menjelaskan variasi data, serta metrik kesalahan seperti MAE, MSE, dan RMSE untuk menilai tingkat kesalahan prediksi. Semakin kecil nilai kesalahan, semakin baik model tersebut.
Selain itu, hasil prediksi divisualisasikan dalam bentuk grafik menggunakan Matplotlib, di mana titik-titik data aktual dibandingkan dengan garis regresi. Garis tersebut menunjukkan arah tren hubungan antara biaya iklan dan penjualan.
d. Regresi Linear Berganda
Langkah selanjutnya adalah membangun model regresi linear berganda. Berbeda dengan regresi sederhana, model ini melibatkan lebih dari satu variabel independen, yaitu biaya iklan dan harga produk. Dengan dua variabel ini, mahasiswa dapat menganalisis bagaimana kombinasi keduanya memengaruhi jumlah penjualan.
Model dilatih dengan cara yang sama menggunakan fungsi LinearRegression() dari pustaka Scikit-Learn. Hasilnya berupa persamaan linear dalam bentuk:
Penjualan = a + b₁(Iklan) + b₂(Harga)
Di mana:
- a adalah intercept (konstanta)
- b₁ adalah koefisien regresi untuk variabel iklan
- b₂ adalah koefisien regresi untuk variabel harga
Koefisien regresi menunjukkan besarnya pengaruh masing-masing variabel terhadap penjualan. Misalnya, jika b₁ bernilai positif dan signifikan, berarti setiap kenaikan biaya iklan sebesar 1 juta rupiah dapat meningkatkan penjualan sebesar nilai koefisien tersebut, dengan asumsi variabel lain tetap.
e. Evaluasi Model
Evaluasi dilakukan dengan menghitung empat metrik utama:
- R² (Koefisien Determinasi): menunjukkan proporsi variasi dalam data penjualan yang dapat dijelaskan oleh model. Nilai R² mendekati 1 menunjukkan model yang baik.
- MAE (Mean Absolute Error): menunjukkan rata-rata selisih absolut antara nilai aktual dan nilai prediksi.
- MSE (Mean Squared Error): menghitung rata-rata kuadrat dari kesalahan prediksi.
- RMSE (Root Mean Squared Error): akar kuadrat dari MSE, menggambarkan seberapa jauh prediksi menyimpang dari data aktual dalam satuan yang sama dengan target.
Dari hasil perhitungan, mahasiswa dapat menilai apakah model regresi yang dibangun sudah cukup baik atau masih perlu perbaikan, misalnya dengan menambah data, memilih fitur yang lebih relevan, atau melakukan normalisasi.
f. Menyimpan dan Membagikan Hasil
Setelah mendapatkan hasil prediksi, langkah selanjutnya adalah menyimpannya dalam format CSV agar dapat digunakan untuk analisis lanjutan. File hasil biasanya disimpan di folder Google Drive menggunakan kode drive.mount(). Dengan demikian, file dapat diakses kembali kapan pun tanpa khawatir hilang saat runtime Colab berakhir.
File yang disimpan mencakup dua hasil:
- hasil_regresi_sederhana.csv – berisi data aktual dan prediksi dari model sederhana.
- hasil_regresi_berganda.csv – berisi data aktual dan prediksi dari model berganda.
Mahasiswa dapat menautkan file ini ke dalam laporan blog dengan menyertakan tautan ke Google Drive tempat file disimpan.
5. Analisis dan Interpretasi
Setelah seluruh langkah dilakukan, mahasiswa dapat melakukan analisis terhadap hasil yang diperoleh. Misalnya, dari model regresi sederhana dapat dilihat bahwa peningkatan biaya iklan secara signifikan meningkatkan penjualan. Ini menunjukkan hubungan positif antara iklan dan hasil penjualan. Sementara itu, pada model regresi berganda, nilai koefisien pada variabel harga mungkin negatif, yang berarti semakin tinggi harga, semakin menurun tingkat penjualan.
Selain melihat nilai koefisien, evaluasi model juga penting untuk menentukan seberapa baik model tersebut dalam memprediksi data baru. Nilai R² yang tinggi (misalnya di atas 0,9) menandakan bahwa model sudah sangat baik dalam menjelaskan variasi data penjualan berdasarkan faktor-faktor yang digunakan. Namun, jika nilai R² rendah, hal itu menunjukkan bahwa masih ada variabel lain yang memengaruhi penjualan tetapi belum dimasukkan ke dalam model.
Interpretasi hasil ini sangat penting dalam dunia bisnis. Misalnya, perusahaan dapat menggunakan model ini untuk memperkirakan penjualan jika mereka meningkatkan anggaran iklan sebesar jumlah tertentu, atau menganalisis dampak perubahan harga terhadap jumlah produk yang terjual. Dengan demikian, model regresi linear dapat menjadi alat bantu pengambilan keputusan yang efektif.
6. Kesimpulan
Melalui praktikum ini, mahasiswa belajar bahwa regresi linear merupakan salah satu teknik analisis data paling fundamental namun sangat bermanfaat dalam dunia bisnis. Dengan menggunakan Python dan pustaka Scikit-Learn, proses pembangunan model prediksi menjadi lebih mudah dan sistematis. Mahasiswa dapat memahami bagaimana data historis dapat digunakan untuk memprediksi kinerja bisnis di masa depan.
Regresi linear sederhana membantu memahami hubungan langsung antara satu faktor (seperti biaya iklan) dengan hasil (penjualan). Sementara itu, regresi linear berganda memberikan wawasan yang lebih luas dengan mempertimbangkan lebih dari satu faktor sekaligus (misalnya iklan dan harga). Dengan hasil evaluasi menggunakan R², MAE, MSE, dan RMSE, mahasiswa juga dapat menilai seberapa baik model bekerja.
Selain itu, dengan kemampuan untuk menyimpan dan memvisualisasikan hasil, mahasiswa dapat mengkomunikasikan hasil analisis secara lebih profesional. Semua langkah ini menjadi bekal penting dalam membangun model analitik bisnis yang lebih kompleks di masa depan, seperti regresi logistik, pohon keputusan, atau bahkan pembelajaran mesin berbasis neural network.
7. Lampiran
Untuk kode lengkap dari praktikum ini (termasuk pembuatan dataset, model regresi sederhana, model regresi berganda, evaluasi, dan penyimpanan file CSV), dapat diakses melalui tautan berikut:
➡️ Klik di sini untuk membuka file Google Drive (kode praktikum lengkap)
Disusun oleh: [Muhammad Rifaldi] - [20232010011]
Program Studi: [Bisnis Digital], Universitas Kuningan
Referensi
Sumber utama:
Modul Praktikum Machine Learning & AI, disusun oleh Adi Muhamad Muhsidi (2025).
Program Studi Bisnis Digital, Fakultas Ekonomi dan Bisnis, Universitas Kuningan.
Link flipbook: https://heyzine.com/flip-book/cbbbf75431.html
Atau dapat diakses langsung dari blog pribadi penulis di:
https://adi-muhamad.my.id

Posting Komentar