Jinsi ya kutumia Tool 'Ngram Viewer' katika Vitabu vya Google

Ngram, pia inayoitwa N-gram ni uchambuzi wa takwimu za maudhui ya maandishi au mazungumzo ili kupata n (nambari) ya aina fulani ya bidhaa katika maandiko. Inaweza kuwa kila aina ya vitu, kama phonemes, prefixes, misemo, au barua. Ijapokuwa N-gram haijulikani nje ya mtafiti, kwa kweli hutumiwa katika nyanja mbalimbali, na ina maana nyingi kwa watu wanaofanya mipango ya kompyuta inayoelewa na kujibu kwa lugha ya asili. Hiyo, kwa kifupi, itakuwa nia ya Google katika wazo hilo.

Katika kesi ya Google Books Ngram Viewer, maandiko ya kuchambuliwa hutoka kwa kiasi kikubwa cha vitabu Google imechungulia kutoka kwenye maktaba ya umma ili kuzalisha injini yao ya utafutaji ya Vitabu vya Google . Kwa Vitabu vya Google Ngram Viewer, wao hutaja maandiko unayotafuta kama "corpus." Mshirika katika Ngram Viewer umegawanyika na lugha, ingawa unaweza kujifunza kwa Kiingereza kwa Kiingereza na Marekani au kuwapiga pamoja. Inakaribia kuwa super kuvutia ya kugeuza kutoka Uingereza hadi Marekani matumizi ya suala na kuona chati kubadilika.

Jinsi Ngram Inafanya Kazi

  1. Nenda kwenye Vitabu vya Google Ngram Viewer kwenye vitabu.google.com/ngrams.
  2. Vipengele vyenye kesi, tofauti na utafutaji wa Mtandao wa Google, na hakikisha uwezekano wa kutafsiri majina sahihi.
  3. Andika katika maneno yoyote au maneno unayotaka kuchambua. Hakikisha kutenganisha kila neno kwa comma. Google inashauri, "Albert Einstein, Sherlock Holmes, Frankenstein" ili uanze.
  4. Ifuatayo, funga katika kipindi cha tarehe. Kichapishaji ni 1800 hadi 2000, lakini kuna vitabu vya hivi karibuni (2011 ilikuwa hivi karibuni iliyoorodheshwa kwenye nyaraka za Google, lakini hiyo inaweza kubadilishwa.)
  5. Chagua corpus. Unaweza kutafuta maandiko ya lugha za kigeni au Kiingereza, na kwa kuongeza uchaguzi wa kawaida, unaweza kuona mambo kama "Kiingereza (2009) au American English (2009)" chini. Hizi ndizo za zamani zaidi ambazo Google imesasishwa, lakini unaweza kuwa na sababu fulani ya kufanya kulinganisha kwako na seti za zamani za data. Watumiaji wengi wanaweza kuwapuuza na kuzingatia corpora ya hivi karibuni.
  6. Weka ngazi yako ya kupendeza. Kuvuta huelezea jinsi grafu ya laini iko mwisho. Uwakilishi sahihi zaidi utakuwa kiwango cha smoothing ya 0, lakini hiyo inaweza kuwa vigumu kusoma. Kichapishaji ni kuweka kwa 3. Katika hali nyingi, huna haja ya kurekebisha hili.
  1. Bonyeza kifungo cha kura cha vitabu . (Unaweza pia kugonga kuingia kwenye mwitikio wa utafutaji.)

Ngram inaonyesha nini?

Vitabu vya Google Ngram Viewer vitazalisha grafu inayowakilisha matumizi ya maneno fulani katika vitabu kwa wakati. Ikiwa umeingiza neno zaidi au neno moja, utaona mistari iliyosajiliwa na rangi ili kuondokana na maneno tofauti ya utafutaji. Hii ni sawa na Mwelekeo wa Google , tafuta tu hufunika kipindi cha muda mrefu.

Hapa ni mfano wa maisha halisi. Tulikuwa na hamu ya kujua kuhusu vigaji hivi karibuni. Wanasemwa katika Nyumba ndogo ya Laura Ingalls Wilder kwenye mfululizo wa Prairie , lakini hatujawahi kusikia kitu hicho. Tulianza kutumia utafutaji wa wavuti wa Google ili ujifunze zaidi kuhusu pikipiki. Inaonekana, wao huchukuliwa kuwa sehemu ya vyakula vya Amerika Kusini na kwa kweli hufanywa kutoka siki. Wanasikiliza nyakati ambazo si kila mtu aliyepata mazao mapya wakati wote wa mwaka. Je! Hiyo ni hadithi nzima?

Tulitafuta Google Ngram Viewer, na kuna baadhi ya mazungumzo ya pie katika mapema na mwishoni mwa miaka ya 1800, mengi ya majadiliano katika miaka ya 1940, na idadi kubwa ya mazungumzo ya hivi karibuni (labda nostalgia pie.) Naam, kuna baadhi ya tatizo na data katika ngazi ya kupendeza ya 3. Kuna sahani juu ya mazungumzo katika miaka ya 1800. Hakika kulikuwa na idadi sawa ya mazungumzo ya pie moja kila mwaka kwa miaka mitano? Kinachoendelea ni kwamba kwa sababu hakuna vitabu vingi vilivyochapishwa wakati huo, na kwa sababu data yetu imewekwa kwa laini, inapotosha picha. Pengine kulikuwa na kitabu kimoja ambacho kilichosema pie ya siki, na ilikuwa imepata wastani ili kuepuka kiboko. Kwa kuweka smoothing kwa 0, tunaweza kuona kwamba hii ndiyo kesi. Wachawi vituo vya mwaka wa 1869, na kuna mwitu mwingine mwaka wa 1897 na 1900.

Je, hakuna mtu anayezungumza juu ya siki kwa muda wote? Labda walizungumza kuhusu pie hizo. Kuna uwezekano wa maelekezo yaliyozunguka mahali pote. Hawakuandika tu juu yao katika vitabu, na hiyo ni upeo wa utafutaji huu wa Ngram.

Utafutaji wa Juu wa Ngram

Kumbuka jinsi tulivyosema kuwa Ngrams inaweza kuwa na aina zote za utafutaji wa maandishi tofauti? Google inakuwezesha kufuta chini kidogo na Ngram Viewer pia. Ikiwa ungependa kutafuta samaki kitenzi badala ya samaki jina, unaweza kufanya hivyo kwa kutumia vitambulisho. Katika kesi hii, ungependa kutafuta "samaki_VERB"

Google hutoa orodha kamili ya amri ambazo unaweza kutumia na nyaraka zingine za juu kwenye tovuti yao.