Kufafanua Mfano wa Takwimu za Ukandamizaji

Ukandamizaji Inachambua Uhusiano kati ya Vigezo

Ukandamizaji ni mbinu ya madini ya data inayotumiwa kutabiri maadili ya nambari mbalimbali (pia huitwa maadili ya kuendelea ), kutokana na dataset fulani. Kwa mfano, regression inaweza kutumika kutabiri gharama ya bidhaa au huduma, kupewa vigezo vingine.

Ukandamizaji hutumiwa katika viwanda mbalimbali kwa ajili ya mipango ya biashara na masoko, utabiri wa kifedha, mfano wa mazingira na uchambuzi wa mwenendo.

Ukandamizaji Vs. Uainishaji

Ukandamizaji na uainishaji ni mbinu za uchimbaji wa data zinazotumiwa kutatua matatizo kama hayo, lakini mara nyingi huchanganyikiwa. Wote hutumiwa katika uchambuzi wa utabiri, lakini kurekebisha hutumiwa kutabiri thamani ya namba au ya kuendelea wakati ugawaji huwapa data katika makundi yaliyomo.

Kwa mfano, regression itatumika kutabiri thamani ya nyumba kulingana na eneo lake, miguu ya mraba, bei wakati wa mwisho kuuzwa, bei ya nyumba zinazofanana, na mambo mengine. Uainishaji utakuwa utaratibu ikiwa unataka badala ya kupanga nyumba katika makundi, kama vile kutembea, kiwango kikubwa au viwango vya uhalifu.

Aina za Mbinu za Regression

Aina rahisi na ya zamani ya regression ni regression ya kawaida hutumiwa kulinganisha uhusiano kati ya vigezo mbili. Mbinu hii inatumia fomu ya hisabati ya mstari wa moja kwa moja (y = mx + b). Kwa maneno ya wazi, hii ina maana tu kwamba, kutokana na grafu yenye Y na mhimili wa X, uhusiano kati ya X na Y ni mstari wa moja kwa moja na vitu vichache. Kwa mfano, tunaweza kudhani kwamba, kutokana na ongezeko la idadi ya watu, uzalishaji wa chakula utaongezeka kwa kiwango sawa - hii inahitaji uhusiano mkali, kati ya kati ya takwimu hizi mbili. Ili kutazama jambo hili, fikiria grafu ambayo mhimili wa Y hufuata ongezeko la idadi ya watu, na mhimili wa X hufuata uzalishaji wa chakula. Kwa thamani ya Y inapoongezeka, thamani ya X itaongezeka kwa kiwango hicho, na kufanya uhusiano kati yao mstari wa moja kwa moja.

Mbinu za juu, kama vile regression nyingi, kutabiri uhusiano kati ya vigezo mbalimbali - kwa mfano, kuna uwiano kati ya kipato, elimu na ambapo mtu anachagua kuishi? Kuongezea kwa vigezo zaidi huongeza sana utata wa utabiri. Kuna aina kadhaa za mbinu nyingi za kurejesha ikiwa ni pamoja na kiwango, hierarchical, setwise na stepwise, kila mmoja na matumizi yake mwenyewe.

Kwa hatua hii, ni muhimu kuelewa kile tunachojaribu kutabiri (variable inayotategemea au kutabiriwa ) na data tunayotumia kufanya utabiri (vigezo vya kujitegemea au vya predictor ). Katika mfano wetu, tunataka kutabiri mahali ambapo mtu anachagua kuishi (kipato kilichotabiriwa) kilichopewa mapato na elimu (vigezo vyote vya utabiri ).