Wyszukiwarka PELCRA dla danych NKJP
32
10
0
Abstract:
Evaluations

Nobody evaluated this document yet.

Login to evaluate.


ii
i
i
i
i
i
i
14
Wyszukiwarka PELCRA dla danych
NKJP
Piotr Pęzik
14.1. O wyszukiwarce
Wyszukiwarka PELCRA1 to jedna z dwóch wyszukiwarek internetowych dostępnych dla danych NKJP. Narzędzie to pozwala na szybkie i wygodne przeszukiwanie zasobów zgromadzonych na potrzeby Narodowego Korpusu Języka
Polskiego. Wyszukiwarka jest oparta na składni zapytań korpusowych, która
z jednej strony oferuje funkcjonalność porównywalną z opcjami wyszukiwania
dostępnymi w standardowych narzędziach korpusowych, a z drugiej umożliwia szczególnie skuteczne wyszukiwanie pojedynczych wyrazów, wariantów
morfologicznych i semantycznych oraz elastycznych wielowyrazowych kolokacji
w obszernych zbiorach danych NKJP. W czasie powstawania niniejszej publikacji wyszukiwarka pozwalała na bardzo szybkie przeszukiwanie ponad 1500
milionów słów tekstowych znajdujących się w ogólnej puli danych NKJP. Dla
przykładu, niezapisane w pamięci podręcznej serwera zapytanie o wszystkie wystąpienia różnych form rzeczownika brama, występującego w ponad 54 tysiącach
kontekstów korpusowych zajmuje niecałe 0,2 sekundy. Co ważne, wyszukiwarka PELCRA zawsze podaje całkowitą liczbę kontekstów wystąpień wyrazów,
lub fraz pasujących do danego zapytania, nawet dla bardzo częstych wyrazów
lub fraz.
1 PELCRA to akronim nazwy zespołu badawczego działającego od 1997 roku w Instytucie
Anglistyki Uniwersytetu Łódzkiego – zob. http://pelcra.ia.uni.lodz.pl. Opisana w tym rozdziale wyszukiwarka dla danych NKJP, zwana po prostu wyszukiwarką PELCRA, dostępna jest pod
adresem http://nkjp.uni.lodz.pl/.
ii
i
i
i
i
i
i
254 Piotr Pęzik
Inną wyszukiwarką dostępną od wczesnych etapów projektu jest internetowa wersja silnika Poliqarp (Janus i Przepiórkowski 2007)2, która została przystosowana do przeszukiwania danych NKJP. Do niewątpliwych zalet tej wyszukiwarki należy jej bogata składnia, pozwalająca formułować między innymi zaawansowane zapytania uwzględniające kryteria morfosyntaktyc...
Cookie:
The our website use cookies to provide you with top-quality services, which are personalised to individual needs. Using the website without changing the setting of cookies is that they will be stored on your end device. You can at any time make changes to the settings for cookies. Close