Skip to main content

Kuinka käyttää Ngram Viewer -työkalua Google-kirjoissa

Nonviolence and Peace Movements: Crash Course World History 228 (Kesäkuu 2025)

Nonviolence and Peace Movements: Crash Course World History 228 (Kesäkuu 2025)
Anonim

Ngram, jota kutsutaan yleisesti nimellä N-grammaa, on tilastollinen analyysi tekstin tai puhesisältöä varten n (numero) jonkinlaisesta kohtaa tekstistä.

Hakusana voi olla kaikenlaisia ​​asioita, kuten foneemeja, etuliitteitä, lauseita tai kirjaimia. Vaikka N-gramma on jonkin verran epäselvä tutkimusyhteisön ulkopuolella, sitä käytetään monilla eri aloilla, ja sillä on paljon vaikutuksia kehittäjiin, jotka koodaavat tietokoneohjelmia, jotka ymmärtävät ja vastaavat luonnollista puhetta.

Google Books Ngram Viewerin tapauksessa analysoitava teksti tulee suuresta määrästä kirjoja, jotka Google on skannannut yleisistä kirjastoista Google-kirjojen hakukoneensa täyttämiseksi. Google-kirjojen Ngram Viewer -ohjelmassa he viittaavat tekstiin, jonka aiot etsiä nimellä corpus . Ngram Viewer kerää kieliä, vaikka voit erikseen analysoida britti- ja amerikkalaista englantia tai kerätä ne yhteen.

Kuinka Ngram toimii

  1. Siirry Google-kirjoihin Ngram Viewer osoitteessa books.google.com/ngrams.

  2. Kirjoita kaikki lauseet tai lauseet, joita haluat analysoida. Erota jokainen lause pilkulla. Google ehdottaa, "Albert Einstein, Sherlock Holmes, Frankenstein", jotta pääset alkuun. Erät ovat erottavia, toisin kuin Google-haut.

  3. Kirjoita päivämääräalue. Oletusasetus on 1800-2000.

  4. Valitse korpus. Voit etsiä vieraita kieliä tai englantia, ja tavallisten valintojen lisäksi saatat nähdä alhaalta "Englanti (2009) tai American English (2009)". Nämä ovat vanhempia korpuja, joita Google on päivittänyt, mutta saatat joutua tekemään vertailut vanhoja tietojoukkoja vastaan. Useimmat käyttäjät voivat jättää ne huomiotta ja keskittyä viimeisimpiin korpuksiin.

  5. Aseta tasoitustaso. Tasoitus viittaa siihen, kuinka sujuva kuvaaja on lopussa. Tarkka esitys olisi tasoitustaso 0, mutta asetusta voi olla vaikea lukea. Oletusasetuksena on 3. Useimmissa tapauksissa sinun ei tarvitse säätää sitä.

  6. paina Etsi paljon kirjoja painiketta.

Googlen avulla voit porata melko vähän Ngram Viewerin avulla. Jos haluat etsiä kalaa verbin sijaan kalaa substantiivi, voit tehdä sen käyttämällä tunnisteita. Tässä tapauksessa etsit "fish_VERB"

Google tarjoaa täydellisen luettelon käyttämistäsi komennoista ja muista kehittyneistä asiakirjoista verkkosivuillaan.

Mitä Ngram näyttää?

Google-kirjat Ngram Viewer tuottaa kaavion, joka edustaa tietyn ilmaisun käyttöä kirjoissa ajan kuluessa. Jos olet antanut useamman kuin yhden sanan tai lauseen, näet värikoodatut rivit vastaamaan eri hakutermejä. Tämä on melko samanlainen kuin Google Trends, vain haku kattaa pidemmän ajan.

Tapaustutkimus

Harkitse etikkapatinkojen tapaustutkimusta. Ne mainitaan Laura Ingalls Wilder'ssa Pikku talo Prairie sarja. Tutustumalla Googlen verkkohakuun saadaksesi lisää tietoa etikkapatikoista paljastaa, että niitä pidetään osana amerikkalaista etelää ruokaa ja todella valmistettu etikkaa. He kuuntelevat aikoja, jolloin kaikilla ei ollut pääsyä tuoreisiin tuotteisiin kaikkina vuodenaikoina. Mutta onko koko tarina?

Etsi Google Ngram Viewer etikka piirakka ja kohtaat joitain mainintoja kakusta sekä 1800-luvun alkupuolella että 1800-luvun lopulla, paljon mainoksia 1940-luvulla ja yhä useampia mainintoja viime aikoina. Kuitenkin tasoitustasolla 3 näet tasangon yli maininnat 1800-luvulla. Koska tuolloin ei ole julkaistu paljon kirjoja, ja koska tiedot ovat sileitä, se vääristää kuvaa. Todennäköisesti oli yksi kirja, joka mainitsi etikkapiirin, ja se sai vain keskiarvon välttää piikki. Asettamalla tasoitus 0: ksi, voimme nähdä, että näin on juuri. Piikki keskittyy 1869, ja toinen piikki 1897 ja 1900.

On epätodennäköistä, että kukaan ei puhu etikkaa pihveistä muualla ajallaan. Paikan päällä oli kelluvia reseptejä, mutta ihmiset vain eivät kirjoittaa niistä kirjojen kohdalla, ja tämä on tärkeä rajoittaminen näistä Ngram-hauista.