Każdy znacznik morfosyntaktyczny jest ciągiem wartości rozdzielonych dwukropkami, np.: subst:sg:nom:m1 dla segmentu chłopiec. Pierwsza wartość, np. subst, określa klasę gramatyczą (por. p.2.2), następne zaś, np. sg, nom i m1 wartości odpowiednich dla tej klasy kategorii gramatycznych (por. p.2.1).
Poniższa tabela przedstawia repertuar kategorii gramatycznych używanych w Korpusie IPI PAN.
|
Liczba: (2 wartości) |
||
|
pojedyncza |
sg | oko |
| mnoga | pl | oczy |
|
Przypadek: (7 wartości) |
||
|
mianownik |
nom | woda |
| dopełniacz | gen | wody |
| celownik | dat | wodzie |
| biernik | acc | wodę |
| narzędnik | inst | wodą |
| miejscownik | loc | wodzie |
| wołacz | voc | wodo |
|
Rodzaj: (5 wartości) |
||
|
męski osobowy |
m1 | papież, kto, wujostwo |
| męski zwierzęcy | m2 | baranek, walc, babsztyl |
| męski rzeczowy | m3 | stół |
| żeński | f | stuła |
| nijaki | n | dziecko, okno, co, skrzypce, spodnie |
|
Osoba: (3 wartości) |
||
|
pierwsza |
pri | bredzę |
| druga | sec | bredzisz |
| trzecia | ter | bredzi |
|
Stopień: (3 wartości) |
||
|
równy |
pos | cudny |
| wyższy | comp | cudniejszy |
| najwyższy | sup | najcudniejszy |
|
Aspekt: (2 wartości) |
||
|
niedokonany |
imperf | iść |
| dokonany | perf | zajść |
|
Zanegowanie: (2 wartości) |
||
|
niezanegowana |
aff | pisanie, czytanego |
| zanegowana | neg | niepisanie, nieczytanego |
|
Akcentowość: (2 wartości) |
||
|
akcentowana |
akc | jego, niego, tobie |
| nieakcentowana | nakc | go, -ń, ci |
|
Poprzyimkowość: (2 wartości) |
||
|
poprzyimkowa |
praep | niego, -ń |
| niepoprzyimkowa | npraep | jego, go |
|
Akomodacyjność: (2 wartości) |
||
|
uzgadniająca |
congr | dwaj, pięcioma |
| rządząca | rec | dwóch, dwu, pięciorgiem |
|
Aglutynacyjność: (2 wartości) |
||
|
nieaglutynacyjna |
nagl | niósł |
| aglutynacyjna | agl | niosł- |
|
Wokaliczność: (2 wartości) |
||
|
wokaliczna |
wok | -em |
| niewokaliczna | nwok | -m |
Zasięg tradycyjnych części mowy, takich jak czasownik, rzeczownik, liczebnik czy zaimek, jest nieostry i przez to kontrowersyjny: czy tzw. odsłowniki, tj. formy typu picie i palenie, to czasowniki (posiadają kategorię aspektu, są regularnie powiązane z formami czasownikowymi typu pić i palić), czy też rzeczowniki (odmieniają się przez przypadek, posiadają słownikową kategorię rodzaju)?, czy piąty to liczebnik (na to wskazuje semantyka), czy też przymiotnik (na to wskazuje odmiana)?, czy taki to zaimek (semantyka), czy przymiotnik (odmiana)?
W Korpusie IPI PAN klasy gramatyczne rozumiane są morfosyntaktycznie są one oparte na pojęciu fleksemu, będącym pojęciem węższym od terminu leksem.
Powyższa tabela
zawiera przybliżoną charakterystykę
morfoskładniową wszystkich klas fleksyjnych przyjmowanych w niniejszym
tagsecie. Symbol
oznacza, że dla danej klasy fleksyjnej dana
kategoria gramatyczna jest morfologiczna (fleksemy należące to tej
klasy zwykle ,,odmieniają się'' przez tę kategorię), zaś symbol
oznacza, że dana kategoria jest słownikowa (wszystkie formy dowolnego
fleksemu należącego do tej klasy mają tę samą wartość tej
kategorii, choć mogą to być różne wartości dla różnych
fleksemów, jak w wypadku rodzaju rzeczowników).
Poniższa tabela zawiera informacje o formach podstawowych dla poszczególnych klas fleksyjnych, a także skróty nazw klas fleksyjnych używane w korpusie.