Imię i nazwisko autora: | Arkadiusz Grzegorzek |
Promotor: | prof. dr hab. Jerzy Gołuchowski |
Tytuł pracy: | Automatyzacja tworzenia korpusu polskiego języka biznesu |
Streszczenie: |
W poszukiwaniu sposobów szybkiego i taniego pozyskiwania dużych zbiorów tekstów opracowuje się metody przeszukiwania i filtrowania zasobów internet. Efektywność tych metod zależy od wielu czynników, między innymi: języka w jakim zapisany jest tekst, tematyki, szczegółowości kryteriów wyszukiwania. Kontrola jakości pozyskanych materiałów jest niezbędna ponieważ efekt działania tych metod obarczony jest sporą ilością błędów i zakłóceń. Przedmiotem niniejszej pracy jest proces automatyzacji tworzenia korpusu języka polskiego biznesu, przy użyciu zasobów sieci Internet. Celem pracy jest przedstawienie wybranych narzędzi do budowy korpusów internetowych i zbadanie możliwości ich wykorzystania w tworzeniu korpusu języka polskiego biznesu. Zakłada się, że utworzony korpus ma posłużyć do pozyskiwania terminów biznesowych. |