Podrozdziały


2 Zestaw znaczników morfosyntaktycznych

Każdy znacznik morfosyntaktyczny jest ciągiem wartości rozdzielonych dwukropkami, np.: subst:sg:nom:m1 dla segmentu chłopiec. Pierwsza wartość, np. subst, określa klasę gramatyczą (por. p.2.2), następne zaś, np. sg, nomm1 wartości odpowiednich dla tej klasy kategorii gramatycznych (por. p.2.1).


2.1 Kategorie gramatyczne

Poniższa tabela przedstawia repertuar kategorii gramatycznych używanych w Korpusie IPI PAN.


Liczba: (2 wartości)

pojedyncza
sg oko
mnoga pl oczy

Przypadek: (7 wartości)

mianownik
nom woda
dopełniacz gen wody
celownik dat wodzie
biernik acc wodę
narzędnik inst wodą
miejscownik loc wodzie
wołacz voc wodo

Rodzaj: (5 wartości)

męski osobowy
m1 papież, kto, wujostwo
męski zwierzęcy m2 baranek, walc, babsztyl
męski rzeczowy m3 stół
żeński f stuła
nijaki n dziecko, okno, co, skrzypce, spodnie

Osoba: (3 wartości)

pierwsza
pri bredzę
druga sec bredzisz
trzecia ter bredzi

Stopień: (3 wartości)

równy
pos cudny
wyższy comp cudniejszy
najwyższy sup najcudniejszy

Aspekt: (2 wartości)

niedokonany
imperf iść
dokonany perf zajść

Zanegowanie: (2 wartości)

niezanegowana
aff pisanie, czytanego
zanegowana neg niepisanie, nieczytanego

Akcentowość: (2 wartości)

akcentowana
akc jego, niego, tobie
nieakcentowana nakc go, -ń, ci

Poprzyimkowość: (2 wartości)

poprzyimkowa
praep niego, -ń
niepoprzyimkowa npraep jego, go

Akomodacyjność: (2 wartości)

uzgadniająca
congr dwaj, pięcioma
rządząca rec dwóch, dwu, pięciorgiem

Aglutynacyjność: (2 wartości)

nieaglutynacyjna
nagl niósł
aglutynacyjna agl niosł-

Wokaliczność: (2 wartości)

wokaliczna
wok -em
niewokaliczna nwok -m


2.2 Klasy gramatyczne

Zasięg tradycyjnych części mowy, takich jak czasownik, rzeczownik, liczebnik czy zaimek, jest nieostry i przez to kontrowersyjny: czy tzw. odsłowniki, tj. formy typu piciepalenie, to czasowniki (posiadają kategorię aspektu, są regularnie powiązane z formami czasownikowymi typu pićpalić), czy też rzeczowniki (odmieniają się przez przypadek, posiadają słownikową kategorię rodzaju)?, czy piąty to liczebnik (na to wskazuje semantyka), czy też przymiotnik (na to wskazuje odmiana)?, czy taki to zaimek (semantyka), czy przymiotnik (odmiana)?

W Korpusie IPI PAN klasy gramatyczne rozumiane są morfosyntaktycznie są one oparte na pojęciu fleksemu, będącym pojęciem węższym od terminu leksem.


liczba przypadek rodzaj osoba stopień aspekt zaneg. akcent. poprzyim. akomod. aglutyn. wokal.
rzeczownik \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\odot}                  
rzeczownik deprecjatywny \ensuremath{\odot} \ensuremath{\oplus} \ensuremath{\odot}                  
liczebnik główny \ensuremath{\odot} \ensuremath{\oplus} \ensuremath{\oplus}             \ensuremath{\oplus}    
liczebnik zbiorowy \ensuremath{\odot} \ensuremath{\oplus} \ensuremath{\odot}             \ensuremath{\oplus}    
przymiotnik \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\oplus}   \ensuremath{\oplus}              
przymiotnik przyprzym.                        
przymiotnik poprzyim.                        
przysłówek         \ensuremath{\oplus}              
zaimek nietrzecioosobowy \ensuremath{\odot} \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\odot}       \ensuremath{\oplus}        
zaimek trzecioosobowy \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\odot}       \ensuremath{\oplus} \ensuremath{\oplus}      
zaimek SIEBIE   \ensuremath{\oplus}                    
forma nieprzeszła \ensuremath{\oplus}     \ensuremath{\oplus}   \ensuremath{\odot}            
forma przyszła BYĆ \ensuremath{\oplus}     \ensuremath{\oplus}   \ensuremath{\odot}            
aglutynant BYĆ \ensuremath{\oplus}     \ensuremath{\oplus}   \ensuremath{\odot}           \ensuremath{\oplus}
pseudoimiesłów \ensuremath{\oplus}   \ensuremath{\oplus}     \ensuremath{\odot}         \ensuremath{\oplus}  
rozkaźnik \ensuremath{\oplus}     \ensuremath{\oplus}   \ensuremath{\odot}            
bezosobnik           \ensuremath{\odot}            
bezokolicznik           \ensuremath{\odot}            
im. przys. współczesny           \ensuremath{\odot}            
im. przys. uprzedni           \ensuremath{\odot}            
odsłownik \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\odot}     \ensuremath{\odot} \ensuremath{\oplus}          
im. przym. czynny \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\oplus}     \ensuremath{\odot} \ensuremath{\oplus}          
im. przym. bierny \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\oplus}     \ensuremath{\odot} \ensuremath{\oplus}          
winien \ensuremath{\oplus}   \ensuremath{\oplus}     \ensuremath{\odot}            
predykatyw                        
przyimek   \ensuremath{\odot}                    
spójnik                        
kublik                        
ciało obce nominalne \ensuremath{\oplus} \ensuremath{\oplus} \ensuremath{\odot}                  
ciało obce luźne                        
forma nierozpoznana                        
interpunkcja                        

Powyższa tabela zawiera przybliżoną charakterystykę morfoskładniową wszystkich klas fleksyjnych przyjmowanych w niniejszym tagsecie. Symbol \ensuremath{\oplus} oznacza, że dla danej klasy fleksyjnej dana kategoria gramatyczna jest morfologiczna (fleksemy należące to tej klasy zwykle ,,odmieniają się'' przez tę kategorię), zaś symbol \ensuremath{\odot} oznacza, że dana kategoria jest słownikowa (wszystkie formy dowolnego fleksemu należącego do tej klasy mają tę samą wartość tej kategorii, choć mogą to być różne wartości dla różnych fleksemów, jak w wypadku rodzaju rzeczowników).

Poniższa tabela zawiera informacje o formach podstawowych dla poszczególnych klas fleksyjnych, a także skróty nazw klas fleksyjnych używane w korpusie.

fleksem skrót forma podstawowa przykład
rzeczownik subst mianownik liczby pojedynczej profesor
rzeczownik
deprecjatywny
depr mianownik liczby pojedynczej
rzeczownika
profesor
liczebnik główny num mianownik rodzaju męskiego
rzeczowego
pięć, dwa
liczebnik zbiorowy numcol mianownik rodzaju męskiego
rzeczowego liczebnika głównego
pięć, dwa
przymiotnik adj mianownik liczby pojedynczej
rodzaju męskiego
stopnia równego
polski
przymiotnik
przyprzym.
adja mianownik liczby pojedynczej
rodzaju męskiego przymiotnika
w stopniu równym
polski
przymiotnik
poprzyimkowy
adjp mianownik liczby pojedynczej
rodzaju męskiego przymiotnika
w stopniu równym
polski
przysłówek adv forma stopnia równego dobrze, bardzo
zaimek
nietrzecioosobowy
ppron12 mianownik liczby pojedynczej ja
zaimek
trzecioosobowy
ppron3 mianownik liczby pojedynczej on
zaimek SIEBIE siebie biernik siebie
forma nieprzeszła fin bezokolicznik czytać
forma przyszła
BYĆ
bedzie bezokolicznik być
aglutynant BYĆ aglt bezokolicznik być
pseudoimiesłów praet bezokolicznik czytać
rozkaźnik impt bezokolicznik czytać
bezosobnik imps bezokolicznik czytać
bezokolicznik inf bezokolicznik czytać
im. przys.
współczesny
pcon bezokolicznik czytać
im. przys.
uprzedni
pant bezokolicznik czytać
odsłownik ger bezokolicznik czytać
im. przym. czynny pact bezokolicznik czytać
im. przym. bierny ppas bezokolicznik czytać
winien winien forma męska liczby
pojedynczej
powinien, rad
predykatyw pred jedyna forma tego fleksemu warto
przyimek prep niewokaliczna forma tego fleksemu na, przez, w
spójnik conj jedyna forma tego fleksemu oraz
kublik qub jedyna forma tego fleksemu nie, -że, się
ciało obce
nominalne
xxs mianownik liczby pojedynczej de, l'Hospital
ciało obce luźne xxx jedyna forma tego fleksemu bene
forma
nierozpoznana
ign jedyna forma tego fleksemu  
interpunkcja interp jedyna forma tego fleksemu ;, ., (, ]