Како користити "Нграм Виевер" алат у Гоогле књигама

Нграм, који се обично назива Н-грам, представља статистичку анализу текста или говора за проналажење н (броја) некакве ставке у тексту. То може бити све врсте ствари, као што су фонеми, префикси, фразе или слова. Иако је Н-грам нешто нејасан изван истраживача, он се заправо користи у различитим областима и има много импликација за људе који раде рачунарске програме који разумеју и реагују са природним говорним језиком. То је, у најмању руку, Гоогле интересовање за ту идеју.

У случају Гоогле Боокс Нграм Виевер, текст који треба анализирати долази из огромне количине књига које је Гоогле скенирао из јавних библиотека да попуњавају свој претраживач Гоогле књига . За Гоогле Боокс Нграм Виевер, они се односе на текст који ћете претраживати као "корпус". Корпус у Нграм Виеверу подељен је језиком, иако можете засебно анализирати британски и амерички енглески или их заједно сјединити. Завршава се супер занимљив прелазак са британске на америчку употребу термина и промена графикона.

Како Нграм ради

  1. Идите на Гоогле Боокс Нграм Виевер на боокс.гоогле.цом/нграмс.
  2. Ставке су осетљиве на величину слова, за разлику од Гоогле Веб претраживања, зато обавезно користите одговарајуће именице.
  3. Укуцајте било коју фразу или фразе које желите анализирати. Обавезно одвојите сваку фразу са зарезом. Гоогле сугерише, "Алберт Ајнштајн, Шерлок Холмс, Франкенштајн" да бисте започели.
  4. Затим упишите временски период. Подразумевана вредност је од 1800 до 2000, али постоје још скорашње књиге (2011. је најновија наведена у документацији Гоогле-а, али се то можда променило.)
  5. Изабери корпус. Можете претраживати текстове страних језика или енглески, а поред стандардних избора, на дну можете приметити ствари попут "Енглески (2009) или Амерички енглески (2009)". Ово су старији корпуси од којих је Гоогле још више ажурирао, али можда имате неки разлог да направите упоређивање са старим скуповима података. Већина корисника их може игнорисати и фокусирати се на најновије корпоре.
  6. Подесите ниво поравнања. Глатко се односи на то колико је глатко графикон на крају. Најтачнија репрезентација би била ниво поравнања од 0, али то може бити тешко читати. Подразумевано је подешено на 3. У већини случајева, не морате да га подесите.
  1. Притисните тастер за претрагу пуно књига . (Такође можете кликнути на унос у тражилу за претрагу.)

Шта је Нграм показао?

Гоогле Боокс Нграм Виевер ће изаћи графикон који представља употребу одређене фразе у књигама кроз време. Ако сте унели више од једне речи или фразе, видећете линије у боји за контраст различитих термина за претраживање. Ово је прилично слично Гоогле трендовима , само претраживање обухвата дужи временски период.

Ево примера стварног живота. Били смо радознали због пита за сирће недавно. Споменуте су у Лаури Ингаллс Вилдер'с Литтле Хоусе у серији Праирие , али никада нисмо чули за такву ствар. Прво смо користили Гооглеову претрагу Веба како бисмо сазнали више о питећим сирћетом. Очигледно, они се сматрају делом америчке Јужне кухиње и заиста су направљени од сирћета. Они се чувају уназад када нико није имао приступ свежем производу током читаве године. Да ли је то цела прича?

Тражили смо Гоогле Нграм Виевер, а постоје и помињања колача у раним и касним 1800-им, пуно помена у 1940-им и све већи број помињања у последње време (можда и неке пите носталгије.) Па, ту су и неке проблем са подацима на нивоу помицања од 3. Постоји висока висина над менторима у 1800-им. Сигурно није било једнак број помињања једне пите сваке године пет година? Оно што се догађа је то зато што у то доба није пуштено пуно књига, а због тога што су наши подаци постављени на глатке, то искривљује слику. Вероватно је постојала једна књига која је помињала питу пшенице, и управо се уверио да би се избегао класик. Постављањем померања на 0, видимо да је управо то случај. Спике се креће 1869. године, а 1897. и 1900. године постоји још један скок.

Да ли је нико говорио о сирћету питу остатак времена? Вероватно су причали о тим питу. Било је вероватно да рецепти плутају по целом месту. Они једноставно нису писали о њима у књигама, а то је ограничење ових Нграм претраживања.

Напредна претрага Нграма

Сећате ли се како смо рекли да се Нграм може састојати од различитих текстуалних претрага? Гоогле вам дозвољава да се мало смањите и са Нграм Виевер-ом. Ако желите претраживати рибу глагол уместо рибе именице, можете то учинити користећи ознаке. У овом случају, тражили бисте "фисх_ВЕРБ"

Гоогле пружа комплетну листу команди које можете користити и друге напредне документе на њиховој веб локацији.