[0:01]Hello everyone. So ngayon ituturo ko sa inyo paano mag-compute manually ng correlation, specifically ng Pearson-R. Tara, simulan na natin. So para saan ba ang correlation? Ang correlation ay ginagamit upang malaman kung may relationship sa dalawa o higit pang bilang ng variables. Madalas, ang Pearson-r ang statistical treatment na ginagamit para malaman ang strength at direction ng correlation. Ano ba ang halimbawa ng mga bagay na correlated? Minsan mapapatanong ka, may relationship kaya ang self-confidence at ang score sa exam? Kasi pwede nating i-hypothesize o i-assume na kapag mas confident ka sa sarili mo, pwedeng mas mataas din ang score mo sa exam. Okay, so 'yan 'yung mga klase ng tanong na sinasagot natin gamit ang Pearson-R, pero hindi natin sinasabi na meron silang cause and effect. Kasi posibleng related ang dalawang bagay pero wala naman silang logical relationship. Halimbawa, paano kung sabihin mo na ang pagkain ng candy ay nagdudulot ng isang sakit dahil sila ay related. Yun ang shortcoming. Yun ang hindi kayang gawin ng correlation. Kaya lang niyang sabihin na ang dalawang bagay ay related, pero hindi niya kayang sabihin kung may cause and effect ang dalawang bagay na ito. Ang tanging makakagawa lang no'n ay 'yung tinatawag na experiment. Kaya nga kapag merong bagong medicine o vaccine na inilabas, dumadaan muna ito sa tinatawag na clinical trial, kasi hindi naman maganda na correlation lang 'yung gagamitin nila. At bukod dito, Pearson-R 'yung ituturo ko ngayon. Minsan ginagamit din 'yung tinatawag na Spearman-Rho, pero ginagamit ito, 'yung Spearman-Rho kapag nagko-correlate tayo ng mga rank. For example, kapag po mas mataas 'yung ranggo ko sa school, mas mataas 'yung ranggo ko sa trabaho o sa magta-top sa board exam o sa score ko sa board exam, doon ginagamit ang Spearman-Rho. When we are dealing with ranks. Ang Pearson-R ginagamit kapag ang data natin, um, pwedeng continuous. Ibig sabihin, interval o ratio. Kaya ngayon, alamin natin ano ba 'yung ibig sabihin ng strength at direction. Una, maraming direksyon ang relationship sa correlation. Una, pwede ang positive correlation. Ibig sabihin, 'pag tumataas ang isang variable o ang X, tumataas din ang Y. Halimbawa, kapag mas mahaba ang lecture, mas mahaba ang discussion, mas maraming beses ka maghihikab. So, positively correlated sila. Habang mas matagal ka nag-aaral, mas mataas ang iyong grade, positively correlated. 'Pag tumataas ang isa, tumataas din ang isa. 'Pag dumadami ang tao sa lansangan, pwedeng tumaas din ang tsansa ng pagkalat ng isang sakit. Sa kabilang dako, meron din namang negative correlation. Na ang ibig sabihin, 'pag tumataas ang isa, bumababa naman 'yung Y o 'yung isang variable. Halimbawa, the longer the lecture, the lower your attentiveness. 'Pag mas matagal ang discussion, mas mababa o mas, um, mas bawasan ang attention o ang attentiveness. Isa pang example, kapag mas marami kang party na pinupuntahan, posibleng mas mababa 'yung grade mo kasi hindi ka na nakakapag-aral. 'Yan naman 'yung negative correlation. Halimbawa 'yung supply and demand. Kapag mataas ang supply, mababa ang demand at vice versa. Okay? Or pwede rin naman na no relationship. Walang kinalaman ang variable X sa variable Y. Halimbawa ang dami ng ice cream na binebenta sa dami ng krimen na nagaganap sa isang bayan. Walang relationship ang dalawa na ito. Okay. Ngayon, tingnan naman natin, okay na tayo sa direction. Ano naman ang strength ng relationship? Ang R ay nagre-range mula sa -1 hanggang sa +1. Sa gitna nito, zero. Kapag ang iyong R ay mas malapit sa 1 o -1, 'wag niyo pansinin 'yung sign. Okay? Basta mas malapit sa 1, mas strong ang relationship. Ang sinasabi lang naman ng sign kung positive o negative 'yung kanilang correlation. Okay? So kung negative ang correlation o may negative sign, ibig sabihin, negative relationship. 'Pag taas ng isa, bababa 'yung isa. Pero kapag walang negative sign, meaning positive ang sign ng ating R, ibig sabihin positive relationship. 'Pag tumaas ang isa, tataas din ang isa. Pero kung ang R ay malapit sa zero, mas mahina ang relationship ng mga variables. Okay? So ngayon, pwede na tayong mag-compute. Bago natin gawin 'yan, i-state muna ang hypothesis. Null hypothesis: There is no correlation between self-confidence and exam scores. Alternative hypothesis: There is a correlation between self-confidence and exam scores. Kung gusto mong gawing one-tailed dahil two-tailed dito, pwede mong sabihin na there is a positive correlation. Or kung sinasabi ng research date na negative correlation, pwede mo rin naman i-hypothesize na there is a negative correlation. So depende pa rin sa ating pagse-search sa literature, ano ba ang sinasabi ng published research. I-guide ka niyan sa pagsusulat mo ng sarili mong hypothesis. Anyway, balik tayo dito sa two-tailed nating hypothesis. Sinasabi lang natin na may correlation, pero hindi natin nililinaw kung positive o negative, kasi nag-e-explore lamang tayo. Kaya ngayon, tingnan natin ang data. Ito ang score nila sa self-confidence, from 1 to 60, gaano 'yan kataas? At ito 'yung score nila sa exam, from 1 to 100, gaano ito kataas? So, mukha namang may correlation 'pag titingnan natin, pero dapat kasing compute, i-compute natin para makasiguro tayo. Kaya, ang una niyong gagawin, i-compute niyo ang total ng X at ng Y. So, i-sum niyo lahat ng number sa X at lahat ng number sa Y at ilagay sa baba, ang magkahiwalay. Pagkatapos, i-compute ang deviation from the mean. Ibig sabihin, okay. So kanina, kin-compute po natin 'yung sum ng X at 'yung sum ng Y. Tapos kunin niyo 'yung mean ng X at 'yung mean ng Y. Okay?
[6:27]Pagkatapos, ready na tayong i-compute ang deviation. Unahin ko muna 'yung sa X. Okay? So, wala sa slide ko, pero ang mean ng ating X ay 54. Paano nakuha? 432 divided by kung ilan sila, 8 participants. Okay? So, 'yan po ay 54. Ibig sabihin, bawat isang number na nandito sa X, i-minus or isu-subtract natin doon sa 54. 49 - 54, -5. 60 - 54, +6. Hanggang sa dulo. Kaya po, ito 'yung kanilang mga deviations from 54. Ganun din 'yung gagawin niyo dito sa variable Y. Iko-compute niyo rin 'yung kanyang deviation. Ang total ng ating Y ay 720, divided by 8 participants. Ang kanyang average ay 90. 81, ganun din 'yung gagawin. Ulitin niyo lang 'yung sa X. 81, pero this time, minus the mean of Y, which is 90. 81 - 90, -9. 88 - 90, -2. Hanggang sa marating niyo 'yung dulo. 90 - 90, 0. So 'yan, nakuha niyo na ngayon 'yung deviation. Anong next niyong gagawin? Eto na 'yung medyo matrabaho. I-multiply niyo 'yung deviation ng X at 'yung deviation ng Y sa mga means nila. So -5 * -9, 45. -4 * -2 = 8. Hanggang sa marating niyo 'yung huli, tapos i-total niyo lahat ng nandito sa ating panibagong column. At 'yan ay nilabel natin as SP na nangangahulugang sum products or sum of products. Kasi ito 'yung product nu'ng mga ito, minultiply natin, kaya ito 'yung product at tinotal natin. Kaya sum products or sum of products. No'ng in-add natin lahat 'yan, ang ating total ay 100. So, iwan niyo lang muna 'yan diyan. Eto 'yung ating next na gagawin. Ang mga deviations na nakuha natin kanina, doon sa X at sa Y, kailangan niyo 'yang i-square. Una, i-square natin 'yung deviations nu'ng X. Okay? Kaya -5 * -5, 25. -4 * -4, 16. Hanggang sa dulo. -4 * -4, 16. I-total niyo lahat. Okay? 'Yan 'yung tinatawag na sum of squares ng X. Ang ating total ay 132. Ulitin niyo lang 'yan doon sa deviations ng Y. I-square niyo isa-isa 'yung mga deviations. -9 * -9, 81. Hanggang sa dulo. 0 * 0, 0. So, add niyo lahat 'yung mga deviations na ito, ang sum of squares ng Y ay 202. So, na-compute na natin 'yung summation of X, summation of Y, sum products, sum of squares ng X, sum of squares ng Y. Ngayon, ready na tayong gamitin ang formula ng R. So, mapapansin niyo medyo matrabaho 'yung computation natin, pero shortcut naman 'yung formula na ituturo ko sa inyo. Instead na ito 'yung typically na ginagamit, pwede nating gamitin 'yung isa kong nakuha sa aking reference na sum products divided by the square root of the sum of squares of X multiplied by the sum of squares of Y. Substitute, sum product is 100, sum of squares ng X ay 132. Sa Y naman ay 202. Substitute natin. I-multiply. 26.664. Square root natin 'yan. Pagka-square root, ang kalalabasan ay 163.3. 'Yan 'yung square root ng 26.664. Tapos ready na tayong i-divide. 100 divided by 163.3, ang ating R ay 0.61. So, dahil walang negative sign, ang ating relationship ay positive, positive correlation. 'Pag mataas ang self-confidence, mataas din ang score sa exam. Yun nga lang, hindi pa tayo pwedeng mag-conclude kasi hindi pa natin nakuha 'yung ating, um, hindi pa natin nakumpara 'yung ating R doon sa R na nasa table. Okay? So, para gawin 'yan, alamin 'yung critical value. Ang formula ay degrees of freedom is equal to, um, N - 2. Okay? N, number of participants. 8 sila, -2 = 6. Ang alpha natin, for example, ay 0.05. Tingnan niyo sa table sa likod ng libro, hanapin 'yung table na para doon sa R. At dahil ang alpha natin ay 0.05, dito tayo tumingin, ang DF natin ay 6, nagtagpo sa 0.767. This time, napansin natin na mas malaki 'yung tabular R compared doon sa R na na-compute natin. Kaya, hindi tayo pwedeng mag-conclude na merong significant correlation sa pagitan ng self-confidence at exam scores. So, ito 'yung ating natutunan dito sa lesson na ito. Posibleng may positive correlation ang mga bagay, pero baka ito ay hindi statistically significant. At kapag hindi statistically significant ang ating correlation, hindi natin pwedeng sabihing totoo ito sa population na pinanggalingan ng ating sample. Yun 'yung essence no'ng tinatawag na significance sa correlation. Posibleng totoo 'yan sa iyong sample, pero hindi 'yan totoo sa general population. Okay? So, ano kaya 'yung mga factors kaya hindi natin ma-reject 'yung null hypothesis? Posible kasing dahil maliit 'yung sample size natin, walo lang sila. Pero kung gawin mo siguro ito sa 100 na respondents, posibleng ma-reject mo 'yung null hypothesis. Kaya ang ating conclusion, dahil mas malaki 'yung tabular R compared sa R natin, we cannot reject, hindi pwedeng i-reject ang null hypothesis. Conclusion: Walang significant correlation sa pagitan ng self-confidence at exam scores. Okay? Paano naman kung mas malaki 'yung R kumpara sa tabular R, doon niyo lang pwedeng sabihin na may significant correlation. Yun ay, 'yun na ang ating lesson para sa correlation. Sana maraming natutunan at good luck sa inyong lahat. Salamat.



