Bemutatkozik: British National Corpus

Nyelvoktatás - 2009. július 11.

Írta: Prievara Tibor

Mi ez?

Most a BNC-t, illetve az internetet, mint nyelvi adatbankot igyekszünk röviden bemutatni. Tipikus probléma a nyelvtani segédletek, nyelvtankönyvek kapcsán, hogy (bár sok érdekes, hasznos dolgot tartalmaznak) pont az nincs benne, amire nekünk szükségünk lenne.

Hogyan használhatjuk?

Mit tegyünk, ha például felmerül, hogy az afraid szónak valóban az of-e a leggyakrabban használt vonzata, vagy talán az afraid to még gyakoribb...

Nos, ez egy olyan kérdés, amelyre hiába keressük a nyelvtankönyvekben, szótárakban a választ, mégis fontos lehet tudnunk. A megoldást az online nyelvi adatbázisok jelentik, ezek közül a legnagyobb a British National Corpus, amely több, mint 500 millió szót tartalmaz, ráadásul meg is van szűrve, úgyhogy teljesen megbízható. Ha a BNC Searcholdalán begépeljük az afraid of és az afraid to kifejezéseket, azt kapjuk, hogy az of vonzat gyakoribb (1160 eset), ám a to is használatos, de ritkábban (860 eset). Külön ajándék, hogy a BNC minden eredményhez 50 példamondatot is ad ingyen, azaz a szövegkörnyezetet is láthatjuk.

Ha a BNC nem elég, esetleg megpróbálhatjuk a Google-t is, mint adatbázist. Érdekességképpen nézzük meg, hogy mit mond erről a Google. Az eredmény: afraid to .. 4 600 000 esetben fordul elő, míg az az afraid of-ra 5 130 000 példát találhatunk. Elmondhatjuk tehát, hogy ebben az esetben a Google kereső, ahol aztán tényleg minden van nagyjából ugyanazt az eredményt adja, mint a gondosan szűrt BNC.