EnglishPolski

Zaawansowane wyszukiwanie | Składnia zapytań

Podziękowania

Korpus IPI PAN i towarzyszące mu narzędzia zostały opracowane przede wszystkim w ramach dwóch projektów realizowanych w IPI PAN pod kierownictwem Adama Przepiórkowskiego: Anotowany korpus pisanego języka polskiego z dostępem przez Internet (z uwzględnieniem zastosowań w inżynierii lingwistycznej) (grant KBN 7T11C04320; kwiecień 2001 -- marzec 2004) oraz Automatyczna ekstrakcja wiedzy lingwistycznej z dużego korpusu języka polskiego (grant MNiI 3T11C00328; marzec 2005 -- wrzesień 2007). Czynny udział w tworzeniu Korpusu IPI PAN wzięli przede wszystkim następujący pracownicy IPI PAN (w większości członkowie Zespołu Inżynierii Lingwistycznej): Łukasz Dębowski, Elżbieta Hajnicz, Adam Przepiórkowski, Marcin Woliński. Korpus i narzędzia do jego obsługi mogły powstać dzięki zaangażowaniu wielu osób spoza IPI PAN. Zespół kierowany przez Rafała L. Górskiego (Instytut Języka Polskiego PAN) zajmował się akwizycją tekstów do Korpusu. Piotr Bański, Artur Gniadzik, Jakub Jurkiewicz, Radosław Moszczyński, Paweł Savov, Jakub Sikora i Katarzyna Sokołowska pomagali w konwersji tekstów do postaci XML-owej; za ofiarną pracę szczególne podziękowania należą się tutaj Radosławowi Moszczyńskiemu. Michał Michalski zaimplementował program do automatycznej okresowej akwizycji i konwersji tekstów z Internetu. Monika Czerepowicka, Dorota Lewandowska, Hanna Maliszewska, Marta Nazarczuk-Błońska, Marta Piasecka, Beata Wójtowicz i Ewa Wolska uczestniczyły w ręcznym ujednoznacznieniu korpusu treningowego, zaś konsultacjami w trakcie tego procesu służył Zygmunt Saloni. Tomasz Szymko stworzył program automatycznie dzielący teksty na wypowiedzenia. Pierwsze wydanie Korpusu IPI PAN (czerwiec 2004) zostało morfosyntaktycznie oznaczone za pomocą tagera statystycznego stworzonego przez Łukasza Dębowskiego, zaś drugie (marzec 2006) -- za pomocą tagera opartego na drzewach decyzyjnych i regułach, stworzonego przez Macieja Piaseckiego i Grzegorza Godlewskiego; w obu wypadkach wykorzystany został analizator morfologiczny Morfeusz. Zygmunt Krynicki stworzył pierwsze wersje programu Poliqarp do przeszukiwania korpusów, obecnie rozwijanego przede wszystkim przez Daniela Janusa; wśród osób pomagających testować i debugować Poliqarpa wymienić należy przede wszystkim Janusza S. Bienia, Aleksandra Buczyńskiego, Magdalenę Derwojedową, Rafała L. Górskiego, Tomasza Obrębskiego i Beatę Trawiński. Jak każdy korpus, Korpus IPI PAN nie jest wolny od błędów; w ich usuwaniu uczestniczyli przede wszystkim Piotr Andrzejczak (metadane) i Anna Stepowany (błędy w konwersji). W przygotowaniu 2. wydania Korpusu IPI PAN aktywnie uczestniczył Aleksander Buczyński.

Tworzenie Korpusu IPI PAN byłoby trudniejsze, gdybyśmy nie dysponowali różnorakimi zasobami językowymi. Zygmunt Saloni i Marcin Woliński udostępnili analizator morfologiczny Morfeusz. Od Janusza S. Bienia otrzymaliśmy wczesne wersje wzbogaconego korpusu "Słownika frekwencyjnego polszczyzny współczesnej". Włodzimierz Gruszczyński udostępnił wzorce odmiany leksemów polskich, dzięki czemu możliwa była szybsza rozbudowa analizatora morfologicznego. Dzięki Janowi Hajičowi mogliśmy korzystać z programu DAUJC do ręcznego ujednoznaczniania interpretacji morfosyntaktycznych.

Za udostępnienie tekstów i pomoc w dotarciu do właścicieli praw autorskich dziękujemy następującym osobom i wydawnictwom: Jarosław Abramow-Newerly, Marek Adamiec, Józef Augustyn SJ, Piotr Augustyniak, Bogdan Bartnikowski, Grażyna Berke, Agnieszka Biedrzycka, Andrzej Bień, Piotr Biliński, Wojciech Blajer, Eugeniusz Bobula, Aleksander Bohm, Bogusław Bożek, Kazimierz Brakoniecki, Katarzyna Brückman de Renstrom, Józef Brynkus, Stefan Chłopicki, Władysław Chłopicki, Wacław Chrząszcz, Anna Chudzik, Helena Ciborowska, Stanisław Cieniawa, Aleksandra Cieślikowa, Krzysztof Czarnota, Maria Dąbrowska, Stanisław Dubiel, Helena Duć-Fajfer, Małgorzata Duda, Henryk Dziadosz SJ, Elżbieta Dziwisz, Teresa Eminowicz-Jaśkowska, Marzanna Fijałkowska-Pyzowska, Jacek Filek, Jerzy Franczak, Jacek Głębski, Janusz Głowacki, Henryk Górecki, Włodzimierz Gruszczyński, Jacek Grzybowski, Elżbieta Hajnicz, Alicja Helman, Mariusz Holzer, Agnieszka Indyka-Piasecka, Zbigniew Jakubiec, Michał Jałowiecki, Daniel Janus, Tomasz Jaroszewski, Wit Jaworski, Stanisław Jonas, Sylwester Józefiak, Tomasz Jurasz, Janusz Jutrzenka Trzebiatowski, Jacek Kardaszewski, Andrzej Kastory, Ewa Kawalec, Zdzisław J. Kijas OFMConv , Radosław Klimek, Piotr Kłodkowski, Piotr Köhler, Krystyna Kofta, Felicja Konarska, Paweł Kosiński SJ, Barbara Kosmowska, Hanna Kowalewska, Waldemar Kozaczyński, Katarzyna Kozanecka, Jan Kozłowski, Bohdan Kozarzewski, Małgorzata Krakowiak, Antoni Kroh, Anna Krupska-Śliwiak, Krzysztof Książyński, Marian Kucała, Andrzej Kucharczyk, Marta Kudelska, Miłowit Kuniński, Anna Kupść, Witold Kupść, Kazimierz Kutz, Krzysztof Lenartowicz, Andrzej Lenda, Antoni Libera, Tadeusz Loska, Bronisław Łagowski, Teresa Łozowicka-Stupnicka, Tadeusz Dionizy Łukaszuk OSPPE, Piotr Majewicz, ks. Mieczysław Maliński, Witold Mańczak, Wojciech Markert, Roman Mazurkiewicz, Roland Meyer, Halina Mieczkowska, Stanisław Miklaszewski, Adam Mikrut, Włodzimierz Mizerski, Zofia Mossakowska, Radosław Moszczyński, Monika Motas-Piotrowska, Dorota Mycielska, Krzysztof Nazar, Helena Noskowicz-Bieroniowa, Krzysztof Obłój, Joanna Okoniowa, Joanna Olczak-Ronkier, Teresa Zofia Orłoś, Wiktor Osiatyński, Małgorzata Pamuła, Wacław Passowicz, Anna Pawlak, Marek Pawlicki, Krzysztof Pawłowski, Adam Peszko, Maciej Piasecki, Zdzisława Piątek, Jerzy Piech, Marian Pilot, Andrzej Piotrowski, Krystyna Pisarkowa, Andrzej Pisowicz, Bartłomiej Pokrzywka, Maciej Przepiera, Danuta Przepiórkowska, Teresa Przybyłowska-Lichwa, Piotr Pysiak, Jan Rajman, Alicja Rakowska, Zygmunt Rola, Andrzej Romanowski, Maria Rostworowska, Kazimierz Rup, Krzysztof Rutkowski, Mirosław Rzyczniak, Cezary Sękalski, Olga Sicińska, Aleksander Sieroń, Dariusz Skórczewski, Bożena Snella-Mrozik, Wiktoria Sobczyk, Stanisław A. Sroka, Leszek Starkel, Andrzej Stokłosa, Andrzej Szczeklik, Danuta Szcześniewska, Stanisław Szczur, Andrzej Szeptycki, Józef Szocki, Marek Szołtysek, Jerzy S. Szumski, Irena Szymańska, Wiesław Paweł Szymański, Bogdan Świecimski, Agata Świerzowska, Jan Jakub (Kuba) Tatarkiewicz, Krzysztof Tatarkiewicz, Tomasz Tołłoczko, Zdzisława Tołłoczko, Krzysztof Urbański, Jadwiga Waniakowa, Monika Warneńska, Bogna Wernichowska, Krystyna Weyssenhoff-Brożkowa, Zdzisław Wietrzak SJ, Witt Wilczyński, Krzysztof Wilkosz, Jerzy Wołkow, Iwona Anna Wójcik, s. Małgorzata Maria Wójcik, Jerzy Wrona, Witold Zalewski, Tadeusz Zimecki, Aleksandra Żabicka, Wojciech Żmudziński, wydawnictwo Abrys, Ajaks, Alfa-medica press, Czytelnik, Emilia, Instytut Ochrony Przyrody PAN, Księgarnia Akademicka, Ludowa Spółdzielnia Wydawnicza, Media Rodzina, Rebis, Rosner i Wspólnicy, słowo/obraz terytoria, Societas Vistulana, Instytut Filologii Polskiej Uniwersytetu Gdańskiego, Uczelniane Wydawnictwa Naukowo-Dydaktyczne AGH, Universitas, Wspólnota kulturowa Borussia, Wydawnictwo Akademii Pedagogicznej w Krakowie, Wydawnictwo IJP PAN, Wydawnictwo Jagiellonia SA, Wydawnictwo Oddziału PAN w Krakowie, Wydawnictwo Papieskiej Akademii Teologicznej w Krakowie, Wydawnictwo W.A.B., Wydawnictwo WAM, Znak, Zysk i Sp.

Chcielibyśmy także serdecznie podziękować Instytutowi Języka Polskiego PAN za udostępnienie serwera lustrzanego stron http://korpus.pl/.