Ukandamizaji Inachambua Uhusiano kati ya Vigezo
Ukandamizaji ni mbinu ya madini ya data inayotumiwa kutabiri maadili ya nambari mbalimbali (pia huitwa maadili ya kuendelea ), kutokana na dataset fulani. Kwa mfano, regression inaweza kutumika kutabiri gharama ya bidhaa au huduma, kupewa vigezo vingine.
Ukandamizaji hutumiwa katika viwanda mbalimbali kwa ajili ya mipango ya biashara na masoko, utabiri wa kifedha, mfano wa mazingira na uchambuzi wa mwenendo.
Ukandamizaji Vs. Uainishaji
Ukandamizaji na uainishaji ni mbinu za uchimbaji wa data zinazotumiwa kutatua matatizo kama hayo, lakini mara nyingi huchanganyikiwa. Wote hutumiwa katika uchambuzi wa utabiri, lakini kurekebisha hutumiwa kutabiri thamani ya namba au ya kuendelea wakati ugawaji huwapa data katika makundi yaliyomo.
Kwa mfano, regression itatumika kutabiri thamani ya nyumba kulingana na eneo lake, miguu ya mraba, bei wakati wa mwisho kuuzwa, bei ya nyumba zinazofanana, na mambo mengine. Uainishaji utakuwa utaratibu ikiwa unataka badala ya kupanga nyumba katika makundi, kama vile kutembea, kiwango kikubwa au viwango vya uhalifu.
Aina za Mbinu za Regression
Aina rahisi na ya zamani ya regression ni regression ya kawaida hutumiwa kulinganisha uhusiano kati ya vigezo mbili. Mbinu hii inatumia fomu ya hisabati ya mstari wa moja kwa moja (y = mx + b). Kwa maneno ya wazi, hii ina maana tu kwamba, kutokana na grafu yenye Y na mhimili wa X, uhusiano kati ya X na Y ni mstari wa moja kwa moja na vitu vichache. Kwa mfano, tunaweza kudhani kwamba, kutokana na ongezeko la idadi ya watu, uzalishaji wa chakula utaongezeka kwa kiwango sawa - hii inahitaji uhusiano mkali, kati ya kati ya takwimu hizi mbili. Ili kutazama jambo hili, fikiria grafu ambayo mhimili wa Y hufuata ongezeko la idadi ya watu, na mhimili wa X hufuata uzalishaji wa chakula. Kwa thamani ya Y inapoongezeka, thamani ya X itaongezeka kwa kiwango hicho, na kufanya uhusiano kati yao mstari wa moja kwa moja.
Mbinu za juu, kama vile regression nyingi, kutabiri uhusiano kati ya vigezo mbalimbali - kwa mfano, kuna uwiano kati ya kipato, elimu na ambapo mtu anachagua kuishi? Kuongezea kwa vigezo zaidi huongeza sana utata wa utabiri. Kuna aina kadhaa za mbinu nyingi za kurejesha ikiwa ni pamoja na kiwango, hierarchical, setwise na stepwise, kila mmoja na matumizi yake mwenyewe.
Kwa hatua hii, ni muhimu kuelewa kile tunachojaribu kutabiri (variable inayotategemea au kutabiriwa ) na data tunayotumia kufanya utabiri (vigezo vya kujitegemea au vya predictor ). Katika mfano wetu, tunataka kutabiri mahali ambapo mtu anachagua kuishi (kipato kilichotabiriwa) kilichopewa mapato na elimu (vigezo vyote vya utabiri ).
- Udhibiti wa kawaida wa kawaida unazingatia vigezo vyote vya predictor kwa wakati mmoja. Kwa mfano 1) ni uhusiano gani kati ya mapato na elimu (predictors) na uchaguzi wa jirani (alitabiri); na 2) kwa kiwango gani kila mmoja wa maandalizi ya mtu binafsi anachangia kwenye uhusiano huo?
- Hatua ya kukabiliana na ukandamizaji mara nyingi hujibu swali lolote tofauti. Hatua ya kurekebisha hatua kwa hatua itachambua ambayo predictors ni bora kutumika kutabiri uchaguzi wa jirani - maana kwamba mfano stepwise kutathmini utaratibu wa umuhimu wa vigezo predictor na kisha kuchagua subset husika. Aina hii ya tatizo la kurekebisha hutumia "hatua" ili kuendeleza usawa wa usajili. Kutokana na aina hii ya ukandamizaji, wasimamizi wote hawawezi hata kuonekana katika usawa wa mwisho wa regression.
- Udhibiti wa hierarchical , kama hatua kwa hatua, ni mchakato mfululizo, lakini vigezo vya predictor vimeingia katika mfano katika utaratibu uliotanguliwa uliofafanuliwa mapema, yaani, algorithm haina mjengo uliojengwa wa equations kwa kuamua amri ambayo ingiza predictors. Hii hutumiwa mara nyingi wakati mtu anayeunda equation ya regression ana ujuzi wa wataalam wa shamba.
- Udhibiti wa kinyume pia unafanana na hatua ya hatua lakini inachambua seti ya vigezo badala ya vigezo vya kibinafsi.