Knowledge base: Warsaw University of Technology

Settings and your account

Back

Digitization of a paper book to the form of an e-book in the ePub format

Karolina Agata Pospieszyńska

Abstract

Firstly, the theoretical part of the thesis consists of descriptions of issues related to the digitization of the resources of libraries and archival printing files as well as e-books and e-readers. General characteristic of e-books is presented in the further part putting emphasis on the description of the most popularised book formats available, their advantages and disadvantages, along with the types of protection measures of electronic publications. Construction of e-readers available on the market was analysed and their specification compared. Simultaneously the knowledge about the technology of e-paper on which the vast majority of the devices used to read e-books is based on was deepened. Tools and software facilitating premise of the topic used in the practical part were briefly described. Secondly this chapter provides the analysis of the e-book market based on statistic reports and surveys available on the Internet. The practical purpose of the thesis was the creation of the ePub format of the book based on its original physical copy. The physics handbook by Hans Backe “Z fizyką za pan brat” published in 1965 was chosen for this purpose due to its content of extensive number of difficult text formatting elements, equations, tables and illustrations. The thesis provides a basic information useful during e-book creating process. It allows to understand the structure of a file in the ePub format. Office Multi-Function Product's scanner was used in digitization process of the selected publication. In order to create a file in the ePub format the Sigil software was used, which is free and popular e-book editing applica-tion. Moreover, retouch of the files was made with use of Adobe Photoshop. To verify the ePub file were used applications such as Adobe Digital Editions or Moon Reader. EPubCheck validator was used to check compatibility of the file with the applicable standards. The process of conversion and projecting was analysed. The outline of creation process of the ePub was described which fulfils the role of a support in creation of this format without the necessity of participation in expensive courses. The HTML code was inserted and edited with use of the Sigil software after digitization of the publication into a file. Through the addition of text formatting styles and illustrations to the file, the knowledge about the structure of CSS file and the imported media was gained. The CSS file define visual aspect of the e-book. In order to hyphenate words Calibre software was used, which throughout plugin automat-ically adds hidden hyphens in the selected language. The Thesis was written with use of the knowledge of the HTML language which was deepened during the research of appearing problems. The practical part of the thesis con-tains a description of mistakes made during the working process on the file, methods used to solve such problems which were developed for individual cases. Importantly through deduction, trial and error, changes were implemented into the code of the created file based on the examples indicated in the sources. In conclusion the finished file in ePub format was approved in verification process executed according to applicable standards.
Diploma type
Engineer's / Bachelor of Science
Diploma type
Engineer's thesis
Author
Karolina Agata Pospieszyńska (FPE) Karolina Agata Pospieszyńska,, Faculty of Production Engineering (FPE)
Title in Polish
Digitalizacja książki do formy e-booka w formacie EPUB
Supervisor
Leszek Markowski (FPE/IMP) Leszek Markowski,, The Institute of Mechanics and Printing (FPE/IMP)Faculty of Production Engineering (FPE)
Certifying unit
Faculty of Production Engineering (FPE)
Affiliation unit
The Institute of Mechanics and Printing (FPE/IMP)
Study subject / specialization
, Papiernictwo i Poligrafia
Language
(pl) Polish
Status
Finished
Defense Date
04-07-2019
Issue date (year)
2019
Reviewers
Leszek Markowski (FPE/IMP) Leszek Markowski,, The Institute of Mechanics and Printing (FPE/IMP)Faculty of Production Engineering (FPE) Zuzanna Żołek-Tryznowska (FPE/IMP) Zuzanna Żołek-Tryznowska,, The Institute of Mechanics and Printing (FPE/IMP)Faculty of Production Engineering (FPE)
Keywords in Polish
Calibre, CSS, digitalizacja, DRM, e-book, e-czytnik, e-papier, ePub, EPUBCheck, E Ink, HTML, książka elektroniczna, MOBI, rynek e-booków, Sigil, technologia rozpoznawania znaków
Keywords in English
Calibre, CSS, digitization, DRM, EPD, ePub, EPUBCheck, e-book, e-book market, e-paper, e-reader, E Ink, HTML, MOBI, OCR, Sigil
Abstract in Polish
W części teoretycznej pracy opisano zagadnienia związane z digitalizacją zasobów bibliotecznych i archiwalnych dokumentów drukowanych oraz z książkami elektronicznymi i e-czytnikami. W dalszej części przedstawiono ogólną charakterystykę książek elektronicznych, kładąc nacisk na opis najpopularniejszych dostępnych formatów książek, ich zalety i wady, a także rodzaje zabezpieczeń publikacji elektronicznych. Przeanalizowano budowę dostępnych na rynku e-czytników oraz porównano ich specyfikację. Jednocześnie zgłębiono technologię e-papieru, na której opiera się większość urządzeń do czytania e-booków. W skrócie opisano użyte w części praktycznej narzędzia i programy ułatwiające zrealizowanie założeń tematu. W tym rozdziale dokonano także analizy rynku książek elektronicznych na podstawie dostępnych w Internecie raportów statystycznych i ankiet. Celem praktycznym pracy było opracowanie książki elektronicznej w formacie ePub na bazie jej oryginalnej formy drukowanej. Do pracy wybrano podręcznik do fizyki autorstwa Hansa Backe, pt. „Z fizyką za pan brat”, wydany w 1965 r., który zawierał wiele trudnych elementów składu tekstowego, wzorów, tabel oraz ilustracji graficznych. W pracy przedstawiono podstawowe informacje, które są przydatne podczas procesu tworzenia książek elektronicznych oraz umożliwiające zrozumienie działania zapisu w formacie ePub. Do digitalizacji wybranej publikacji posłużył skaner biurowy, a pliki graficzne zmieniono w tekst edytowalny z pomocą programu Abbyy Fine Reader. W celu utworzenia pliku w for-macie ePub, posłużono się programem Sigil, który jest darmowym i popularnym edytorem e-booków. Do retuszu zeskanowanych ilustracji użyto programu Adobe Photoshop. Weryfikacja pliku ePub następowała z pomocą aplikacji do wyświetlania plików, takich jak Adobe Digital Editions czy Moon Reader Plus oraz walidatora EPubCheck, dzięki któremu sprawdzono zgodność pliku z obowiązującymi standardami. Cały proces konwersji i projektowania został poddany analizie. Opisano schemat działania przy tworzeniu ePuba, który może być wskazówką, jak utworzyć go bez podejmowania drogich kursów i szkoleń. Po digitalizacji publikacji do pliku, wykorzystano funkcje programu Sigil poprzez wprowadzanie i wyedytowanie kodu HTML. Nadano surowej treści style oraz dodano ilustracje, poznając w ten sposób budowę pliku określającego wygląd e-książki i możliwości importowania mediów. W celu wprowadzenia dzielenia wyrazów użyto programu Calibre, który poprzez wtyczkę automatycznie dodaje ukryte łączniki w wybranym języku. Do pracy wykorzystano wiedzę na temat języka HTML, którą poszerzono, wyszukując konkretne rozwiązania dla napotkanych problemów. Część praktyczna zawiera opis błędów popełnionych podczas generowania pliku i zastosowane metody ich rozwiązania, które opracowano dla poszczególnych przypadków. Drogą dedukcji oraz metodą prób i błędów wprowadzono zmiany w kodzie tworzonego pliku na podstawie wskazanych w źródłach przykładów. Wygenerowany w finalnej wersji plik ePub pozytywnie przeszedł weryfikację poprawności wykonaną według obowiązujących standardów.
File
  • File: 1
    Karolina_Pospieszyńska__Digitalizacja_książki_do_formy_e-booka_w_formacie_ePub.pdf
Request a WCAG compliant version
Local fields
Identyfikator pracy APD: 30905

Uniform Resource Identifier
https://repo.pw.edu.pl/info/bachelor/WUTc67794bdbc204d22bcd338d5866289a5/
URN
urn:pw-repo:WUTc67794bdbc204d22bcd338d5866289a5

Confirmation
Are you sure?
Report incorrect data on this page