Nini maana ya kuunganisha?

Uchimbaji wa data na k-maana algorithm

Njia ya kukusanya algorithm ni dondoo ya data na chombo cha kujifunza mashine kinachotumiwa kwa uchunguzi wa makundi katika makundi ya uchunguzi unaohusiana bila ujuzi wowote wa kabla ya mahusiano hayo. Kwa sampuli, algorithm inajaribu kuonyesha katika aina gani, au nguzo, data ni ya, na idadi ya nguzo inayoelezwa na thamani k.

K- algorithm k- maana ni moja ya mbinu rahisi kukusanya na ni kawaida kutumika katika imaging matibabu, biometrics, na mashamba kuhusiana. Faida ya k- njia ya kuunganisha ni kwamba inasema juu ya data yako (kwa kutumia fomu yake isiyohifadhiwa) badala ya kufundisha algorithm kuhusu data mwanzoni (kwa kutumia fomu iliyosimamiwa ya algorithm).

Wakati mwingine hujulikana kama Algorithm ya Lloyd, hasa katika duru za sayansi za kompyuta kwa sababu kiwango cha algorithm kawaida kilipendekezwa kwanza na Stuart Lloyd mwaka wa 1957. Neno "k-maana" lilianzishwa mwaka wa 1967 na James McQueen.

Jinsi k-maana ya kazi ya algorithm

Algorithm k- maana ni algorithm ya mabadiliko ambayo inapata jina lake kutoka kwa njia yake ya uendeshaji. Mkusanyiko wa makundi ya algorithm katika makundi ya k , ambapo k hutolewa kama parameter ya pembejeo. Halafu huwapa kila uchunguzi kwa makundi kulingana na ukaribu wa uchunguzi na maana ya nguzo. Maana ya nguzo ni kisha kulipwa na mchakato huanza tena. Hapa ndio jinsi algorithm inavyofanya kazi:

  1. Hifadhi ya algorithm inachagua kwa kifupi pointi k kama vituo vya awali vya nguzo (njia).
  2. Kila hatua katika dataset inapewa kwenye nguzo iliyofungwa, kulingana na umbali wa Euclidean kati ya kila hatua na kituo cha kila kikundi.
  3. Kituo kikuu cha kikundi kinafupishwa kama wastani wa pointi katika nguzo hiyo.
  4. Hatua ya 2 na 3 kurudia mpaka makundi yamejiunga. Kubadilisha uongo kunaweza kufafanuliwa tofauti kulingana na utekelezaji, lakini kwa kawaida ina maana kuwa ama hakuna uchunguzi hubadilishana nguzo wakati hatua za 2 na 3 zinarudiwa, au kwamba mabadiliko hayafanyi tofauti tofauti katika ufafanuzi wa makundi.

Kuchagua Idadi ya Makundi

Moja ya hasara kubwa kwa k- maana ya kuunganisha ni ukweli kwamba lazima ueleze idadi ya makundi kama pembejeo kwenye algorithm. Kama imeundwa, algorithm haiwezi kuamua idadi inayofaa ya makundi na inategemea mtumiaji kutambua hili mapema.

Kwa mfano, kama ungekuwa na kikundi cha watu ambacho kinapaswa kuzingatiwa kulingana na utambulisho wa kijinsia wa kijinsia kama kiume au kike, wito wa k- maana algorithm kwa kutumia pembejeo k = 3 ingewatia nguvu watu katika nguzo tatu wakati tu mbili, au pembejeo ya k = 2, ingeweza kutosha zaidi ya asili.

Vile vile, kama kikundi cha watu binafsi kilikuwa kikiunganishwa kwa urahisi kulingana na hali ya nyumbani na ukaita k- maana ya algorithm na pembejeo k = 20, matokeo yanaweza pia kuwa yanajitokeza kuwa yenye ufanisi.

Kwa sababu hii, mara nyingi ni wazo nzuri ya kujaribu majaribio tofauti ya k kutambua thamani inayofaa zaidi data yako. Unaweza pia kupenda matumizi ya algorithms nyingine ya madini ya data katika jitihada yako ya ujuzi wa kujifunza mashine.