Humanities and big data : exploiting digital archives in the age of abundance

Piotr Gawrysiak

Abstract

Widespread digitization efforts undertaken in recent years resulted in creation of online repositories of humanities source materials of unprecedented scale. While the information stored in these digital archives is immediately useful in a same sense as the original publications that were digitized, it is also much more amenable to automated processing in the digital form. Meanwhile, the current state of the art in machine learning and distributed processing technology created a situation, in which advanced, large scale (so called “big data”) analysis tools are widely available even to small research institutions with modest budgets. ese two trends should, as this paper postulates, be exploited in order to gain new insight not available previously in humanities.
Author Piotr Gawrysiak II
Piotr Gawrysiak,,
- The Institute of Computer Science
Pages17-26
Publication size in sheets0.5
Book Sosińska-Kalata Barbara, Przastek-Samokowa Maria, Wiorogórska Zuzanna (eds.): Nauka o informacji w okresie zmian: Informatologia i humanistyka cyfrowa, NAUKA - DYDAKTYKA - PRAKTYKA, vol. VIII, 2016, SBP, ISBN 978-83-64203-67-1, 275 p.
Keywords in Englishbig data, data mining, digital archives, data visualization
Abstract in PolishPowszechne wysiłki digitalizacyjne, podjęte w ostatnich latach, doprowadziły do stworzenia internetowych repozytoriów humanistycznych materiałów źródłowych na niespotykaną skalę. Chociaż informacje przechowywane w tych cyfrowych archiwach są bezpośrednio przydatne, w tym samym sensie jak publikacje oryginalne, które zostały zdigitalizowane, to są też o wiele bardziej podatne na automatyczne przetwarzanie w postaci cyfrowej. Równocześnie obecny stan wiedzy w dziedzinie uczenia maszynowego i technologii przetwarzania rozproszonego stworzył sytuację, w której zaawansowane narzędzia analityczne, stosowane do wielkich zasobów danych (tzw. big data) są powszechnie dostępne nawet dla małych instytucji badawczych o skromnych budżetach. Te dwie tendencje powinny, jak postuluje się w niniejszym artykule, być wykorzystane w celu uzyskania nowych informacji, wcześniej niedostępnych w naukach humanistycznych.
projectDevelopment of new algorithms in the areas of software and computer architecture, artificial intelligence and information systems and computer graphics . Project leader: Rybiński Henryk, , Phone: +48 22 234 7731, start date 18-05-2015, end date 30-11-2016, II/2015/DS/1, Completed
WEiTI Działalność statutowa
Languageen angielski
File
miscelannea-gawrysiak.pdf (file archived - login or check accessibility on faculty) miscelannea-gawrysiak.pdf 1.91 MB
Score (nominal)5
ScoreMinisterial score = 5.0, 27-03-2017, BookChapterNotSeriesMainLanguages
Citation count*0
Cite
Share Share



* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back