Arkadiusz Grzegorzek - Automatyzacja tworzenia korpusu polskiego języka biznesu

Imię i nazwisko autora: Arkadiusz Grzegorzek
Promotor:  prof. dr hab. Jerzy Gołuchowski
Tytuł pracy: Automatyzacja tworzenia korpusu polskiego języka biznesu
Streszczenie:

W poszukiwaniu sposobów szybkiego i taniego pozyskiwania dużych zbiorów tekstów opracowuje się metody przeszukiwania i filtrowania  zasobów internet. Efektywność tych metod zależy od wielu czynników, między innymi: języka w jakim zapisany jest tekst, tematyki, szczegółowości kryteriów wyszukiwania. Kontrola jakości pozyskanych materiałów jest niezbędna ponieważ efekt działania tych metod obarczony jest sporą ilością błędów i zakłóceń.

Przedmiotem niniejszej pracy jest proces automatyzacji tworzenia korpusu języka polskiego biznesu, przy użyciu zasobów sieci Internet.

Celem pracy jest przedstawienie wybranych narzędzi do budowy korpusów internetowych i zbadanie możliwości ich wykorzystania w tworzeniu korpusu języka polskiego biznesu. Zakłada się, że utworzony korpus ma posłużyć do pozyskiwania terminów biznesowych.