LAS: Language Agnostic System for Question Answering

Dominika Basaj , Barbara Rychalska , Anna Wróblewska

Abstract

In this article we present a deep learning question answering (QA) setting that can work for any natural language. We recognize the problem of low-resource languages, i.e. most languages other than English, which lack appropriately sized datasets or cutting-edge NLP tools. To address this problem, we have designed and implemented a QA dataset and system that are independent from language use, specifically, we test our solution on the Polish language which is both low-resource and grammatically complex. Both these features make the task of QA significantly harder. To the best of our knowledge, this is the first attempt to train a deep learning QA system in a language-agnostic setting.
Publication typeOriginal work published as abstract
Author Dominika Basaj (FMIS)
Dominika Basaj,,
- Faculty of Mathematics and Information Science
, Barbara Rychalska (FMIS) - Loglab Sp. z o.o.
Barbara Rychalska,,
- Faculty of Mathematics and Information Science
, Anna Wróblewska (FMIS / DCSDCAM)
Anna Wróblewska,,
- Department of CAD/CAM Systems Design and Computer-Aided Medicine
Pages260-263
Publication size in sheets0.5
Book 2018 Fifth International Conference on Social Networks Analysis, Management and Security (SNAMS), 2018, ISBN 978-1-5386-9588-3
Keywords in Polishprzetwarzanie języka naturalnego
Keywords in EnglishSocial network services,Security,Natural language processing,Indexes,Knowledge discovery
Abstract in PolishW tym artykule przedstawiamy ustawienie odpowiadania na pytania z głębokim uczeniem się (QA), które może działać dla dowolnego języka naturalnego. Rozumiemy problem języków o niskim poziomie zasobów, tj. Większości języków innych niż angielski, które nie mają odpowiednich rozmiarów zestawów danych lub nowatorskich narzędzi NLP. Aby rozwiązać ten problem, zaprojektowaliśmy i wdrożyliśmy zestaw danych i system QA, które są niezależne od języka, w szczególności testujemy nasze rozwiązanie na języku polskim, który jest zarówno mało zasobowy, jak i złożony gramatycznie. Obie te funkcje znacznie utrudniają zadanie kontroli jakości. Zgodnie z naszą najlepszą wiedzą jest to pierwsza próba szkolenia systemu QA w głębokim uczeniu się w warunkach agnostyki językowej.
DOIDOI:10.1109/SNAMS.2018.8554469
URL http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8554469&isnumber=8554420
Languageen angielski
Score (nominal)0
Publication indicators Scopus Citations = 0; WoS Citations = 0
Citation count*
Cite
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back