[0:00]Assalamualaikum warahmatullahi wabarakatuh. Jumpa lagi dengan channel Kang Opas.
[0:09]Jangan lupa subscribe untuk mendukung channel ini. Terima kasih. Kali ini saya akan berbagi pengetahuan membahas soal korelasi dan regresi sederhana menggunakan Microsoft Excel. Namun sebelum ke pembahasan soal, saya akan sedikit mengobrol mengenai korelasi dan regresi. Kalau kita berbicara korelasi, berarti kita sedang berbicara hubungan. Hubungan itu harus antara dua peubah atau variabel, misalnya X dengan Y, biaya iklan dengan penjualan, harga jual dengan penjualan, pendapatan dan pengeluaran, kolesterol dan tekanan darah, omset dengan laba dan sebagainya. Apa itu korelasi? Korelasi itu adalah hubungan keeratan secara linier antara dua peubah, X dengan Y. Hubungan antara X dan Y ini dapat divisualisasikan dengan scatter plot atau diagram pancar atau diagram sebar. Titik-titik ini adalah kombinasi X dan Y. Kumpulan dari kombinasi ini akan membentuk pola. Untuk hubungan linier ada tiga, korelasi positif (searah) X semakin besar, maka Y semakin besar. Korelasi negatif (berlawanan arah), X makin besar tapi Y semakin kecil. Korelasi nol, terlihat tidak ada hubungan (tidak ada pola linear atau acak). X-nya makin besar, Y-nya ada yang besar ada yang kecil. Jadi Y-nya tidak dipengaruhi oleh X secara linier. Bukan berarti pasti mereka tidak memiliki hubungan, namun bisa saja hubungannya tidak linier, mungkin hubungannya kuadratik atau mungkin eksponensial. Hal yang penting dalam korelasi adalah: 1. Arah hubungan. Nilainya berkisar antara -1 dan 1. Tanda (+) / (-) → arah hubungan. (+) Searah. (-) Berlawanan arah.
[1:50]Bila digambarkan dalam garis bilangan, koefisien korelasi itu seperti ini. Dari -1 sampai +1. Pada titik 0, menunjukkan atau menandakan tidak ada hubungan. Tentunya yang kita bicarakan adalah hubungan linier. Sedangkan semakin ke -1 artinya menunjukkan adanya hubungan yang negatif kuat. Sedangkan semakin ke +1, maka semakin adanya hubungan positif yang kuat. 2. Kekuatan hubungan. Untuk melihat seberapa kuat hubungan antara variabel X dan Y, dengan menggunakan koefisien korelasi. Rumus korelasi ini juga dikenal sebagai korelasi product moment (korelasi Pearson) → r. Koefisien korelasi Pearson biasanya disimbolkan atau dinotasikan dengan r. Kalau korelasi antara X dengan Y, kita simpulkan menjadi rxy. Untuk mempermudah menginterpretasikan besaran koefisien korelasi, banyak ahli yang telah membuat pengkategorian kekuatan hubungan. Berikut adalah kategori korelasinya. Jadi, korelasi itu tidak menggambarkan hubungan sebab akibat. Misalkan X dan Y saling berhubungan bukan berarti bahwa X mengakibatkan Y atau Y disebabkan oleh X. Melalui korelasi hanya dapat dideteksi: kedua variabel tersebut berhubungan atau tidak. Sedangkan besaran atau angka koefisien korelasi menunjukkan kekuatan hubungan, nilainya berkisar antara -1 dan 1. Sekarang bagaimana kalau kita, bukan hanya sekedar ingin melihat hubungan tapi ingin melihat juga hubungan sebab akibat? Oleh karena itu, kita tidak hanya cukup dengan korelasi. Kita harus melakukan analisis regresi! Analisis regresi yang akan kita lakukan adalah: ANALISIS REGRESI LINIER SEDERHANA. Sederhana karena hanya satu peubah penjelas, yaitu hanya ada satu X. Apabila lebih dari satu peubah penjelas, maka istilahnya Berganda. Jadi regresi linier merupakan analisis yang akan kita lakukan untuk mendapatkan pola hubungan antara dua variabel, di mana variabel tersebut sifatnya numerik. Dalam bahasa sederhana regresi linier ini mencari garis lurus yang bentuknya Y = β0 + β1X. Garis lurus yang kita cari ini adalah yang paling menggambarkan data yang kita miliki. Di mana selisih atau residualnya antara data yang sebenarnya dengan garis regresi atau nilai dugaan sekecil mungkin. Ini adalah contoh scatter plot yang menunjukkan korelasi antara biaya iklan dan penjualan. Di mana terdiri dari banyak variasi titik kombinasi X dan Y. Regresi adalah garis ini. Garis lurus yang kita cari ini adalah yang paling menggambarkan data yang kita miliki. Di mana selisih atau residualnya antara data yang sebenarnya dengan garis regresi atau nilai dugaan sekecil mungkin. Garis lurus yang didapatkan bisa yang biru atau mungkin yang merah. Kita akan lihat apa yang dimaksud dengan selisih. Apabila ini adalah garisnya, perhatikan ada titik yang diberi warna biru. Yang jarak antara sumbu horizontal dengan titik itu disebut Y aktual atau nilai Y sebenarnya. Sedangkan dari sumbu horizontal ke garis itu dinamakan nilai Y berdasarkan garis regresi. Jarak antara titik dengan garis inilah yang disebut selisih antara nilai yang sebenarnya titik tersebut dengan garis regresi. Selisih ini disebut juga residual atau epsilon atau ada juga yang menyebutnya galat, notasinya adalah e atau ε. Nilai residual bisa positif, bisa negatif. Oleh karena itu kita bisa ukur dengan cara menggabungkan ke dalam bentuk jumlah kuadrat residual. Jumlah kuadrat residual artinya nilai residual dari setiap titik dikuadratkan, kemudian dijumlahkan dan kita ingin yang sekecil-kecilnya. Metode untuk mendapatkan garis dengan jumlah kuadrat residual yang paling kecil atau minimum, dikenal dengan metode kuadrat terkecil atau LEAST SQUARES METHOD. Garis inilah yang kita sebut garis regresi. X sebagai prediktor. Ada juga yang menyebutkan X adalah variabel bebas, atau variabel penjelas, atau variabel yang mempengaruhi, atau (independent variabel). Y sebagai Response. Ada juga yang menyebutkan Y adalah variabel tak bebas, atau variabel respon, atau variabel yang dipengaruhi, atau (dependent variabel). β0 dikenal sebagai intercept atau titik potong garis. Jadi kalau diteruskan akan memotong di titik di mana X = 0. Kemudian ada β1 dikenal sebagai gradien atau kemiringan garis. β1 adalah perubahan Y ketika X berubah satu satuan, atau satu unit. Sehingga garis ini didekati dengan β0 + β1X. Makna β0 dan β1. β0 → Pada saat X=0 maka nilai Y adalah sebesar β0. + β1 → Bila X bertambah 1 satuan X, maka Y akan bertambah sebesar β1 satuan Y. Dan bila X berkurang 1 satuan maka Y pun akan berkurang sebesar β1 satuan Y. -β1 → Bila X bertambah 1 satuan X, maka Y akan berkurang sebesar β1 satuan Y, dan bila X berkurang 1 satuan maka Y akan bertambah sebesar β1 satuan Y. Berapa besar model bisa dipercaya? Seberapa baik persamaan regresi yang terbentuk dalam memodelkan pengaruh X terhadap Y? Pertanyaan ini dapat dijawab oleh suatu besaran yang dinamakan Koefisien Determinasi (R-Squared) R². R² menggambarkan besarnya keragaman Y yang dapat dijelaskan oleh keragaman X, atau merupakan persentase keragaman yang mampu dijelaskan oleh X atau oleh model, atau besarnya model dapat mewakili model yang sebenarnya. Sifat-sifat Koefisien Determinasi. Merupakan ukuran kebaikan model regresi. Bernilai antara 0 s.d 1 atau 0% s.d 100%. Semakin tinggi nilainya maka model semakin baik. R² merupakan persentase keragaman yang mampu dijelaskan oleh X atau oleh model regresi. Kita langsung ke contoh soal dan melakukan pemecahan soal dengan bantuan Excel. Berikut ini adalah data hasil pengamatan terhadap sampel acak yang terdiri dari 12 mall di Kota Bandung mengenai omzet penjualan dan laba (dalam juta rupiah). A. Buatkan Scatter Plot korelasi antara omzet penjualan dan laba! B. Tentukan Koefisien korelasi dan Koefisien Determinasi, beri penjelasan! C. Tentukan persamaan regresi dan interpretasinya! D. Jika omzet penjualan 50 jt, berapakah laba yang diperoleh? Pembahasan. Kita identifikasi terlebih dahulu apa saja yang diketahui di soal. Ada data omzet dan laba. Laba dipengaruhi oleh omzet berarti omzet adalah variabel X dan laba adalah variabel Y. A. Membuat Scatter Plot. Untuk membuat Scatter Plot dapat kita lakukan dengan cara seleksi data yang kita miliki. Kemudian kita pilih pada menu Insert, pilih Chart Insert Scatter pada menu Chart. Maka akan muncul diagram scatter sesuai dengan data yang kita entrikan. Kemudian lengkapi informasi yang diperlukan seperti judul grafik serta nama variabel X dan Y. Setelah diagram kita jadi, kita bisa mengubah desain dan format diagram sesuai selera kita. Untuk mencari koefisien korelasi atau r, bisa menggunakan rumus fungsi Pearson. Sintaksnya adalah =PEARSON(Array1;Array2). Pada Array1 diisikan data variabel independen atau X dan pada data Array2 kita isikan data dependen atau Y. Maka diperoleh r = 0.823032424. Kemudian untuk mengetahui koefisien determinasi kita tinggal pangkatkan saja nilai r-nya. Maka diperoleh nilai 0.677382371. Atau bisa juga sekaligus mengetahui fungsi liniernya. Caranya adalah kita pilih pada Quick Layout. Di situ terdapat beberapa pilihan. Pilih Layout 9. Maka akan diperoleh langsung persamaan liniernya Y = 0.8079x + 3.8979 dan R² nya juga sudah langsung keluar yaitu 0.6774. Ada sedikit perbedaan pada cara penulisan fungsi di mana pada Excel beta 0-nya ditulis di belakang. Kita tinggal pindahkan saja. Tidak masalah. Jadi sekarang sudah diketahui nilai r, R², beta 0, dan beta 1. Kita sudah dapat menganalisa korelasi dan regresinya. Tapi sebelum kita menginterpretasikan nilai yang ada, ada cara lain untuk menganalisa regresi menggunakan Excel yaitu dengan menggunakan fasilitas Data Analyze. Caranya adalah klik Data Analyze, lalu pilih Regression, kemudian klik OK. Inputkan data. Input Y range berarti kita isikan data Y kita. Klik di sini kemudian seleksi data. Seleksi dari mulai judul sampai akhir. Lakukan hal yang sama untuk data X. Dikarenakan tadi kita ngeblok dari mulai judul, maka label ini kita centang. Untuk confidence level-nya ini otomatis untuk 95%. Jadi tidak perlu dicentang. Tapi apabila confidence level-nya misalkan 99%, maka ini harus dicentang dan isikan angka 99. Selanjutnya pada output option yaitu di mana kita akan meletakkan hasil perhitungan, saya pilih yang output range. Artinya hasilnya akan ditampilkan di sheet ini. Lalu kita isikan di sini. Kemudian klik OK. Lalu hasilnya akan seperti ini. Ada Summary Output dan tabel ANOVA. Cara ini dan cara yang pertama tadi hasilnya sama. Hanya di cara pertama kita memperoleh visualisasi dari diagram pencarnya. Selanjutnya kita langsung analisa saja dari data yang sudah kita miliki. Interpretasi Korelasi. Dilihat dari besarnya r yang mendekati 1 yaitu r = 0.823032424, maka hubungan antara omzet penjualan dan laba termasuk ke dalam kategori sangat kuat. Berpola linier positif. Maka semakin tinggi omzet penjualan akan semakin tinggi laba. Nilai koefisien determinasi bisa diinterpretasikan dari R Square. Nilai koefisien determinasi 0.677 atau 67.7%. Jadi, variabel Omzet Penjualan mampu menjelaskan variabel Laba sebesar 67.7% sementara sisanya yaitu sebesar 32.3% dijelaskan oleh faktor lainnya di luar model. Maksud faktor lain di luar model adalah bisa saja bahwa laba itu tidak hanya dipengaruhi omzet, walaupun pengaruh omzet besar tapi ada faktor lain yang berpengaruh, misalkan biaya, harga jual, sdm dll. Selanjutnya interpretasi dari Standar Eror of Estimate. Jadi rata-rata penyimpangan variabel dependen prediksi terhadap variabel dependen sebenarnya sebesar 2.65. Artinya apa yang kita hitung ini biasanya sebuah prediksi. Jadi simpangan eror antara prediksi dan kenyataan adalah sebesar 2.65. Lalu selanjutnya hasil output ANOVA, yang menunjukkan bahwa F_hitung 20.996 dengan nilai signifikansi 0.005. Nilai F_hitung ini bisa dibandingkan dengan F_tabel. Tapi bisa juga membandingkan signifikansi F ini dengan alfa. Alfa menggunakan 0.05 (5%) dan ini nilai signifikansinya 0.005 berarti F_signifikansi lebih kecil dari alfa. Sehingga dapat disimpulkan bahwa adanya pengaruh yang signifikan antara variabel X atau omzet penjualan dengan Y atau laba. Selanjutnya interpretasi persamaan regresinya. Persamaan regresi dapat dilihat pada tabel koefisien. Intercept-nya 3.8979 dan nilai X-nya 0.8079. Jadi persamaan regresinya adalah y = 3.8979 + 0.8079x. Artinya: Ketika variabel independen (X) naik sebesar 1 juta rupiah maka akan meningkatkan variabel dependen (Y) sebesar 0.8079 juta rupiah atau Ketika omzet penjualan meningkat 1 juta rupiah maka laba akan meningkat sebesar 0.8079 juta rupiah. Sekitar Rp800.000. Pertanyaan D. Jika omzet penjualan atau x-nya Rp50 juta, berapakah laba yang diperoleh? Ini tinggal dimasukkan nilai X 50 ke persamaan model y = 3.8979 + 0.8079x diperoleh y = 44.2929. Artinya: jika omzet penjualan sebesar 50 juta, maka laba yang didapat diprediksi sebesar Rp44.292.900.
[14:35]Demikian pembahasan kasus soal korelasi dan regresi dengan menggunakan bantuan Excel. Mudah-mudahan bisa dipahami. Terima kasih sudah berkenan untuk menonton. Semoga bermanfaat. Mohon maaf apabila ada kesalahan dalam penggunaan istilah, simbol dan rumus. Share video ini untuk berbagi pengetahuan. Link dari file Excel dalam video ini saya sertakan di deskripsi. Terima kasih untuk like dan subscribe-nya. Wassalamualaikum warahmatullahi wabarakatuh.



