Wielopoziomowa anotacja lingwistyczna korpusu PJM

„Wielopoziomowa anotacja lingwistyczna korpusu polskiego języka migowego (PJM)” – projekt finansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego w ramach Narodowego Programu Rozwoju Humanistyki.

Celem projektu jest stworzenie szczegółowej i wielopoziomowej anotacji danych migowych zebranych w korpusie PJM. Korpus języka migowego jest swego rodzaju skarbnicą wiedzy nie tylko na temat gramatyki i leksyki PJM, ale także na temat kultury i życia polskich głuchych. Aby w pełni wykorzystać potencjał tego korpusu, niezbędna jest jego szczegółowa anotacja.

W ramach realizacji projektu planowane są następujące działania:

1. kontynuacja gromadzenia nagrań video;
2. przeprowadzenie segmentacji, glosowania i lematyzacji nowego materiału;
3. przeprowadzenie wielopoziomowej anotacji (obejmującej transkrypcję za pomocą notacji HamNoSys, segmentację zdaniową, tłumaczenie na polszczyznę oraz podstawową interpretację gramatyczną).

Zadanie wielopoziomowego zaanotowania korpusu migowego jest na polskim gruncie przedsięwzięciem bez precedensu, a zatem bardzo przydatne jest wsparcie ekspertów zagranicznych. Rolę konsultanta i doradcy zewnętrznego w projekcie PLM pełni prof. Trevor Johnston z Australii, jeden z najwybitniejszych specjalistów w zakresie badań nad językami migowymi na świecie, profesor Wydziału Lingwistyki Uniwersytetu Macquariego w Sydney.

Realizacja projektu doprowadzi do zebrania bardzo obszernego korpusu nagrań video, zawierającego wypowiedzi rodzimych użytkowników PJM. Będzie to z pewnością jeden z największych zaanotowanych zbiorów tego typu na świecie. Efektem końcowym będzie baza danych z możliwością przeszukiwania i dowolnego przetwarzania zgromadzonych informacji za pośrednictwem programu iLex, który pozwala na przypisywanie poszczególnym sekwencjom materiału video nieograniczonej liczby tagów (znaczników).

Skip to content