Dari Regresi Linear ke Machine Learning: Bagaimana Algoritma Belajar dari Data

October 23, 2025
Dari Regresi Linear ke Machine Learning: Bagaimana Algoritma Belajar dari Data

Pendahuluan

Machine Learning (pembelajaran mesin) adalah cabang dari kecerdasan buatan yang berfokus pada kemampuan sistem komputer untuk belajar dari data dan membuat prediksi atau keputusan tanpa perlu diprogram secara eksplisit. Dalam machine learning, algoritma digunakan untuk mengenali pola dari data dan kemudian menerapkan pola tersebut pada data baru. Salah satu algoritma paling dasar sekaligus paling penting dalam pembelajaran mesin adalah regresi linear.

Regresi linear merupakan metode statistik yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen (input) dengan satu variabel dependen (output). Istilah “linear” mengacu pada bentuk hubungan antara variabel-variabel tersebut yang diasumsikan berbentuk garis lurus artinya, perubahan pada variabel input akan menghasilkan perubahan proporsional pada variabel output. Sedangkan kata “regresi” berasal dari konsep statistik yang diperkenalkan oleh Francis Galton pada abad ke-19, yang menggambarkan kecenderungan suatu variabel untuk “kembali” atau regress ke nilai rata-rata. Oleh karena itu, regresi linear berarti suatu metode untuk memprediksi atau memperkirakan nilai suatu variabel berdasarkan hubungan liniernya dengan variabel lain.

Regresi linear adalah salah satu metode statistik paling klasik dan fundamental dalam analisis data serta machine learning. Tujuannya sederhana: memprediksi atau menjelaskan hubungan antara satu atau lebih variabel input (independen) dengan satu variabel output (dependen) melalui suatu garis lurus (linear relationship).

Secara matematis, model regresi linear sederhana dapat ditulis sebagai:

Y=β0+β1X+ϵ

Di mana:

  • YY adalah variabel target atau hasil yang ingin diprediksi,

  • XX adalah variabel input atau faktor yang memengaruhi,

  • adalah intercept (nilai YY ketika X=0X = 0),

  • adalah slope atau kemiringan garis (berapa besar perubahan YY ketika XX naik satu satuan),

  • adalah error atau selisih antara hasil prediksi dan data sebenarnya.

Disebut “linear” karena model ini mengasumsikan bahwa perubahan pada XX menghasilkan perubahan proporsional pada YY; hubungan antara keduanya digambarkan dengan garis lurus.
Disebut “regresi” karena konsep ini awalnya diperkenalkan oleh Francis Galton pada abad ke-19 ketika meneliti tinggi badan anak-anak dan orang tuanya. Ia menemukan bahwa tinggi anak-anak “cenderung kembali” atau regress ke rata-rata populasi, bukan ke ekstrem. Dari sanalah istilah regression lahir  yang secara harfiah berarti “kembali ke rata-rata”.

Dalam konteks machine learning, regresi linear termasuk dalam kategori supervised learning, yaitu pembelajaran dengan data yang memiliki label atau target yang jelas. Model ini belajar dengan “menyesuaikan” garis terbaik agar meminimalkan kesalahan prediksi, umumnya menggunakan metode Ordinary Least Squares (OLS).