korpuszalapú nyelv megértés

Kapcsolódó fogalmak: 
információkinyerés
Kapcsolódó fogalmak: 
információkeresés
Kapcsolódó fogalmak: 
gépi fordítás
Rövid szöveges bemutatás: 
A korpuszalapú nyelv megértés két dologból tevődik össze. Az első a korpusz. A korpusz nem más mint egy szöveggyűjtemény. Ezt az elnevezést általában óriási mennyiségű szöveges leírásokra használják. Ezek a leírások nem feltétlenül összefüggőek olyan értelemben, hogy a bennük található információk nem minden esetben azonos tárgyterületről származnak. A szövegeket emberek írják más embereknek. A nyelv megértése pedig gépi feladat. A gépi megértés két féle módon lehetséges. Statisztikák alapján történhet nyelvfeldolgozás, információkinyerés, ezeket a végrehajtás előtt kell definiálni. A másik a gépi tanulás, amikor a rendelkezésre álló szövegből a rendszer modelleket hozhat létre a megfelelő információkinyerés érekébe. A korpuszalapú megértést fel lehet használni gépi fordításra, információ kinyerésre és keresésre.