Szövegtípusok számítógépes nyelvészeti megközelítésben


vincze-veronikaVincze Veronika


A természetes nyelvek rétegzettsége jól ismert jelenség az elméleti nyelvészet körében: a különböző szaknyelvi rétegek mellett például az internetről, főként a közösségi médiából származó szövegek nyelvezete is több kutatás tárgyát képezi. A nyelvi rétegzettség azonban a számítógépes nyelvészetben viszonylag kevéssé kutatott terület, noha a nyelvfeldolgozó eszközök számára az eltérő nyelvi rétegek automatikus elemzése kihívást jelent. Előadásomban bemutatom, hogy különböző nyelvi rétegekből (elsődlegesen újsághírekből, jogi szövegekből és internetről) származó angol és magyar nyelvű szövegek mennyiben mutatnak (statisztikailag szignifikáns) eltéréseket egymástól, és ezek az eltérések hogyan befolyásolják az automatikus számítógépes nyelvészeti elemzések hatékonyságát.

Friss Hírek

Friss Hírek RSS

Boritokep_71

Ismét nylít napot tartunk a kar képzései iránt érdeklődő felvételizők számára 2025. február 8-án, szombaton, 11:15-től kezdődően a kar főépületében.


A teljes programról és a további tudnivalókról ide kattintva olvashatsz!


Ebben a cikkben a miniórák listáját és a regisztrációs linket találod meg. A többi programra nem, de a miniórákra regisztrálnod szükséges! A jelentkezés február 4-én 20:00-kor zárul!