Чем отличаются форматы электронных книг и какой формат предпочесть. Выбираем лучший формат для электронной книги

Здравствуйте, друзья! Вы ведь читаете книги, верно? А многие из вас, я уверен, уже давно освоили электронные книги. Это «детище» технического прогресса медленно вытесняет бумажную литературу. К добру это или нет - судить в этой статье не буду. Тема данного поста более проста - в каком формате комфортнее всего читать книги на смартфоне.

Предвижу возражения на тему того, что на смартфонах читать книги неудобно. Экран маловат, согласен. Но благодаря тому, что размеры смартфонов увеличиваются, этот недостаток постепенно сходит на нет. Чтение книг на смартфонах стало таким же привычным делом, как чтение на ридерах с электронными чернилами. Живым доказательством того, что на смартфонах читают и будут читать, является YotaPhone, который имеет отдельный E-ink экран. Совсем скоро ожидается появление YotaPhone 2.

Многообразие форматов

Итак, какой же формат электронных книг лучше всего выбрать для загрузки в свой смартфон? Ответить на этот вопрос с ходу не так-то просто. Вы только взгляните на то разнообразие форматов, которые имеются сейчас в нашем мире: PDF, FB2, TXT, DJVU, EPUB и т.д. Эти аббревиатуры выглядят пугающе. Но ломать голову тут вовсе не нужно - достаточно взять и разобраться с ними раз и навсегда. Приступим.

В первом десятилетии XXI века, когда мобильные телефоны не отличались такой мощностью, как сейчас, широкое распространение получили книги на языке программирования JAVA. Конечно, можно было открыть текст в формате TXT, но только относительно малых размеров - не более двух мегабайт.

Хотя в то время были смартфоны на таких легендарных ОС, как Symbian и Windows Mobile, они стоили намного больше, чем обычные мобильники без операционных систем. Зато эти смартфоны позволяли открывать текстовые файлы с расширениями TXT, DOC и некоторые другие.

Для современных смартфонов нет никаких проблем открыть файл любого формата. Разработаны многочисленные приложения для чтения электронных книжек в таких форматах, как EPUB, DOC, DOCX, PDF, DJVU, RTF, FB2. Список можно продолжать еще долго, но давайте среди этого «винегрета» выберем наиболее оптимальный вариант для смартфона.

Если брать во внимание размер книги, то лучшим вариантом будет обычный формат TXT (его еще называют «блокнотовским»). Такие книги будут весить совсем немного.

Для чтения электронных книг не рекомендуются следующие форматы книг: DOC, DOCX, RTF. Подобные файлы много весят. Кроме того, они требовательны к ресурсам смартфона и не всегда могут корректно отображать текст, выдавая на экран иероглифы. Форматы типа DOC созданы, прежде всего, для персональных компьютеров и открываются специальными офисными программами.

Формат DJVU применяется обычно для хранения книг технической направленности: справочников, учебников, инструкций. Книги такого формата часто бывают просто-напросто отсканированными и выглядят как набор картинок без возможности форматирования текста. То же относится и к PDF.

Наиболее оптимальный формат электронных книг – это FB2. Он обладает многими преимуществами по сравнению с прочими:

  1. Книги весят чуть больше , чем обыкновенные TXT.
  2. Можно просматривать изображения , так как есть поддержка иллюстраций.
  3. Есть возможность осуществлять форматирование текста и просматривать подробную информацию о книге : год издания, наименование файла, имя автора и прочее.
  4. Навигация по страницам осуществляется легко .
  5. Имеются встроенные стили оформления .

Таким образом, если при закачивании электронной книги на смартфон у вас есть выбор из нескольких форматов, смело выбирайте FB2.

Читать книги в электронном варианте на компьютере не очень удобно. Чтобы сделать этот процесс комфортным, создаются специальные программы (читалки) с разными возможностями и фишками, которые минимизируют дискомфорт и нагрузку на глаза. Это важно для тех пользователей, у которых нет планшета или электронных книг (специальных небольших устройств для чтения по типу планшета). Сегодня рассмотрим известные и наиболее часто загружаемые программы для Windows 10.

Инструменты для чтения книг на Windows 10: выбираем лучшие

Выбор программ для чтения литературы на ПК с Windows 10 довольно широкий, несмотря на то, что многие утилиты взяли курс на мобильные операционные системы Android и iOS. Сегодня выберем лучшие варианты, которые предлагают максимум возможностей, бесплатное использование и понятный интерфейс.

ICE Book Reader Professional: мощная современная читалка с библиотекой

У сервиса ICE Book Reader Professional не очень много конкурентов по количеству функций. Эта бесплатная русскоязычная читалка с множеством тонких настроек, которые выделяют её на общем фоне подобных программ, позволяет:

Окно программы можно легко настроить под себя: выбрать цвет фона, самого текста, общую тему оформления, поставить автоматическую расстановку пробелов и многое другое. Софт может также сам читать вам книги и запускать файлы с самыми разнообразными расширениями, включая lit, chm, epub и другие.


Сервис ICE Book Reader Professional предлагает удобный механизм поиска книг в своей библиотеке

Загружать инсталлятор утилиты лучше из .

Видео: что представляет собой софт ICE Book Reader Professional

Calibre: функциональная читалка почти для всех форматов книг

Утилита Calibre представляет собой очень удобный инструмент для чтения художественной литературы, учебников, документов, журналов и другого. Читалка не только запускает на вашем экране файлы c самыми разнообразными расширениями (например, epub, fb2, doc, pdf и другие), но и конвертирует их, то есть преобразовывает один формат в другой. Управление книгами такое же удобное, как и в ICE Book Reader Professional. В ней также можно настраивать интерфейс под себя.

Какие ещё плюсы у этого софта:


Недостатков у программы два: отсутствие возможности автоматически расставлять мягкие переносы после конвертации, а сама конвертация довольно медленная.

Видео: Calibre - конвертирование и синхронизация книг между компьютером и электронной книгой

AlReader: простая читалка, которую не нужно устанавливать на ПК

Русскоязычный инструмент под названием AlReader не может, к сожалению, похвастаться широким функционалом. Тем не менее в нём есть всё самое необходимое для чтения: поддержка форматов fb2, rtf, epub, odt и других, а также настройка интерфейса (цвет фона, графические темы, стиль и яркость текста, переносы, отступы и т. д.). В книгах, открытых с помощью этой программы, пользователь может делать сколько угодно закладок. Утилита также запоминает ту страницу, на которой вы закончили чтение в прошлый раз.

В окне софта также можно:


Огромный плюс этой читалки заключается в том, что её не нужно устанавливать на компьютер. Вы просто скачиваете файл с официального сайта , а затем его запускаете - программа будет сразу готова к использованию.

EPUBReader: комфортное чтение файлов epub

Название программы говорит само за себя: она предназначена только для чтения файлов в формате epub. Преимущество этого формата в том, что он занимает мало места на носителе, но способен отображать таблицы, необычные шрифты и векторную графику. Инструмент EPUBReader также меняет формат книг (конвертирует) epub на pdf, html или txt. Разработчик утилиты - компания FreeSmart. Программу можно устанавливать не только на Windows 10, но и на смартфоны на базе Android и на устройства Apple.


В окне EPUBReader удобно перемещаться по разделам книги

В EPUBReader можно быстро переходить от раздела к разделу благодаря удобной навигации в левой колонке окна, а также настраивать шрифт и масштаб текста. Функционал программы не такой широкий, как у ICE Book Reader Professional или Calibre, однако это компенсируется удобным и понятным интерфейсом. Если вам нужно открывать только файлы epub, эта читалка - отличный вариант для вас.

Инструмент для чтения нужно загружать из .

FBReader: удобный инструмент с доступом в сетевые библиотеки

Если вам нужен универсальный, но простой инструмент для чтения книг различных форматов, присмотритесь к FBReader. Это средство открывает файлы epub, mobi, fb2, html, rtf, plucker, chm и другие.

Утилита имеет доступ к сетевым библиотекам. В некоторых из них можно загружать книги различных тематик и жанров бесплатно. Есть и платные библиотеки - инструмент FBReader позволяет покупать там книги, то есть вам не нужно будет заходить отдельно на сайт продавца.

Все добавленные книги распределяются по полкам автоматически в соответствии с жанром и именем автора. У FBReader понятный и удобный интерфейс, в котором разберётся даже ничего не знающий новичок. В окне можно настроить цвет фона, шрифт, способ переворачивания страниц и т. д.

Есть у этого инструмента и недостаток: в нём не предусмотрен двухстраничный режим.


Книги в программу FBReader можно добавлять из сетевых библиотек

Загрузить эту удобную читалку можно с официального сайта .

Видео: как пользоваться программой FBReader

LightLib: читаем книги из «Либрусек»

Утилита LightLib - одновременно библиотекарь и читалка, как утверждают на официальном ресурсе этой программы, с которого можно скачать инсталлятор.

Основные возможности у этого средства:

  1. Открывает литературу в таких форматах, как fb2, epub, rtf и txt. Может также запускать zip-архивы.
  2. Конвертирует файлы fb2.
  3. Показывает содержимое папок на дисках.
  4. Имеет доступ к коллекциям «Либрусек» и «Флибуста».
  5. Позволяет просматривать все изображения книги с возможностью перехода к той странице книги, на которой располагается рисунок.

Кроме этого, как и в любой другой читалке, в LightLib можно настроить внешний вид окна, а также просматривать предварительно книгу и добавлять файлы в папку «Избранные».


LightLib является одновременно и библиотекой и читалкой

Cool Reader: функциональное средство с опцией распаковки файлов из архива

Cool Reader - одна из самых удобных читалок. Она заботится о ваших глазах с помощью следующих опций:

  • сглаживание и смена шрифтов;
  • настройка текстурированного фона;
  • плавный скроллинг.

Кроме чтения большинства форматов книг (txt, doc, fb2, rtf, epub и другие) утилита также может:


Загрузить программу на Windows 10 можно с .

Видео: как установить Cool Reader

Adobe Reader: классическая программа для чтения pdf

Трудно найти пользователя, который не слышал утилите Adobe Reader, так как это самый популярный инструмент для чтения и просмотра файлов pdf. Он подходит не только для документов, но и для чтения художественной литературы, учебников и журналов.

В программе доступны следующие опции:


Загружайте инсталлятор утилиты с официального сайта .

DjVuViewer: простой инструмент для чтения djvu

Утилита DjVuViewer - одно из стандартных средств открытия файлов djvu. Этот формат лучше, чем pdf тем, что экономит место в памяти ПК за счёт более качественного сжатия файла. У программы следующие плюсы:


Инструмент для файлов можно загрузить с его официальной страницы .

Foxit Reader: альтернатива Adobe Reader

Как и Adobe Reader, инструмент Foxit предназначен для просмотра и чтения документов и книг в формате pdf. Его преимущество в том, что для установки нужно гораздо меньше места на жёстком диске. Кроме чтения, здесь также можно:


Программа доступна для скачивания на официальном сайте .

Видео: где скачать Foxit Reader и как его установить

Одними из самых функциональных читалок на сегодня считаются ICE Book Reader Professional, Calibre и Cool Reader. Они не только позволяют читать текст в комфортных условиях и минимизируют риск испортить зрение, но и конвертируют файлы в необходимые вам форматы, предоставляют доступ к обширным базам данных. Более простыми, но не менее хорошими являются LightLib, FBReader и AlReader. Кроме этого, существуют читалки для одного формата, например, EPUBReader или Adobe Reader. Выбирайте инструмент в зависимости от форматов файлов, которые вы скачиваете для чтения.

Можно считать, что электронные книги прочно вошли в нашу жизнь. Еще бы, ведь эти устройства обладают огромным количеством преимуществ, благодаря которым они удобны в использовании и являются хорошими помощниками любителей читать. В небольшого размера компактную технику можно скачать сотни книг. При чтении не устают глаза, так как электронные чернила не светятся и создается эффект печатного листа. Если вы много читаете книг именно на компьютере, то есть специальные , чтобы они не так уставали.

Кроме того некоторые модели электронных книг оснащены дополнительными функциями. Однако, те, кто только приобрел или уже давно имеет такое устройство, знают, что скачать в Интернете книгу можно в разном формате, которых огромное множество. В чем же различия между ними, и какой из них лучше выбрать, мы и попробуем разобраться. Кроме того в электронном виде можно читать книги и на компьютере, для этого нужно всего лишь установить .

FB2 – формат для электронных книг

Встречаются гаджеты, которые поддерживают различные виды форматов. Но есть модели, для которых желательно выбрать определенный из них. К примеру, если вас интересует, какие форматы поддерживает электронная книга Pocketbook, то для этих устройств обычно рекомендуют FB2. Полное название звучит как FictionBook, придумана он был группой российских разработчиков.

В FB2 поддерживаются выделения текста различными шрифтами. Этот формат используется для создания структурированных документов. Кстати, книги, созданные в FictionBook, при необходимости отлично переформатируются, архивируются и имеют небольшой объем. Среди недостатков формата является то, что в западных странах он недостаточно распространен. В связи с этим не факт, что его будут поддерживать устройства от некоторых популярных брендов, например, Sony, Amazon и др. Но если вы ищете ответ на вопрос: “Какие форматы поддерживает электронная книга Texet, Onyx или Wexler?”, то FB2 вам подойдет.

EPUB

EPUB является форматом с плавающей версткой. Это одна из самых популярных программ для ридеров, используемая во всем мире. По структуре такой тип файла похож на заархивированную веб-страницу. При этом здесь содержатся шрифты, текст, иллюстрации и графика.

Среди недостатков EPUB можно отметить лишь то, что он не так сильно распространен в России. Поэтому многие файлы приходиться конвертировать из других форматов в этот. Но на работу с EPUB ориентированы многие устройства от популярных европейских производителей. Кроме того программа для чтения iBooks, установленная на iPhone и iPad, также поддерживает данный формат. Кроме этой программы какие еще отличие есть у смартфона и у айфона узнаете .

TXT

Говоря о том, какие форматы поддерживает электронная книга Wexler, Onyx или устройство от других производителей, следует отметить TXT. Подобные файлы поддерживаются практически всеми устройствами и занимают совсем немного объема. Однако, большинство пользователей отмечают, что чтение документов в данном формате не очень удобно.

Среди недостатков TXT – отсутствие форматирования. Кроме того здесь нет выравнивания, переносов, разметки. Этот формат подходит для небольших заметок. Для полноценной книги в электронном варианте он является не лучшим вариантом.

Какой формат выбрать

Конечно, мы остановились лишь на самых популярных форматах, которые наиболее часто встречаются. Помимо них можно отметить DJVU, PDF, DOC, MOBI и другие. Все они имеют свои плюсы и минусы. Остановить свой выбор на определенном формате следует исходя из того, какой формат ваша электронная книга поддерживает лучше всего. Если вы скачали произведение в определенном формате, который вам не подходит, то переделать его в другой можно с помощью специальных программ-конвертеров.

Оптимальный вариант – это читать книги в том формате, который является “родным” для устройства. В противном случае можно столкнуться с более медленной работой ридера или другими неудобствами. Если же вам приглянулся определенный формат или вы не можете найти произведение в другой версии, то вы вполне можете установить на электронную книгу программу, позволяющую его просматривать или конвертировать документ.

Устройства для чтения электронных книг (так называемые ридеры ) уже давно превратились из чего-то очень экзотического в такое же привычное бытовое устройство, как и смартфон. Пользователи очень быстро поняли, в чем прелесть ридеров: в них можно закачать сотни (если не тысячи) книг в электронном виде, глаза при чтении не портятся (электронные чернила не светятся), можно настраивать любые параметры текста, включая гарнитуру шрифта и его размер, книга сама запоминает страницу, на которой вы остановились, ну и так далее - перечислять всякие удобства по сравнению с использованием бумажных книг можно очень долго. Однако у пользователей (особенно начинающих) есть при этом одна проблема: по Сети книги гуляют в различных форматах, коих немало: FB2, EPUB, MOBI, PDF, RTF, TXT и так далее.Хорошо еще, когда на сайте предлагают на выбор разные форматы - например, на сайте Litres.ru , где этот выбор очень широк.


Виды форматов

Однако для начинающих пользователей все эти EPUB, FB2 и прочие DjVu - темный лес,поэтому давайте разберемся, что они собой представляют, чем отличаются и в каких устройствах используются. Итак, форматы электронных книг (документов).1. FB2 (FictionBook) - формат (стандарт), разработанный Дмитрием Грибовым и группой энтузиастов. Отлично подходит для создания структурированных книг, занимает небольшой объем, отлично архивируется, хорошо конвертируется в другие форматы. Представляет собой XML-файл, структурно похожий на письмо электронной почты. Главный недостаток - так как это фактически российская разработка, в мире этот формат совершенно неизвестен и почти не поддерживается ни одним из брендовых ридеров - Sony , Amazon , Barnes&Noble , Kobo .На "Литресе" написано, что FB2 "поддерживается всеми российскими ридерами", но это не совсем точно. FB2 поддерживается почти всеми китайскими ридерами с украинским или российским программным обеспечением. Также FB2 может поддерживаться и известными западными ридерами (например, Sony), в которые установлена специальная российская прошивка. (Ну и недавно для последнего ридера Sony PRS-T1 вышла официальная прошивка, поддерживающая FB2.) 2. EPUB (Electronic PUBlishing) - наиболее распространенный в мире (и уже очень распространенный в России) формат электронных книг. По структуре он похож на веб-сайт, упакованный в архив, и если FB2 может распространяться как в раскрытом виде, так и в архиве ZIP (многие ридеры умеют читать FB2 в ZIP), то EPUB - это по определению книга, упакованная архиватором. EPUB поддерживается практически любыми ридерами - как западными, так и китайскими (российско-украинскими). Поэтому это наиболее предпочтительный формат. (За редкими исключениями.) 3. MOBI - специализированный формат, созданный специально для ридера Amazon Kindle и, соответственно, поддерживаемый только этим ридером. Причем Kindle никакие другие форматы электронных книг (кроме PDF и TXT, но это разговор особый) не поддерживает. 4. TXT - обычный формат текстового документа. Поддерживается всеми ридерами, но читать книги в TXT - это для законченных мазохистов. Ни разметки, ни нормальных переносов, ни выравнивания по формату, но зато есть обрывы строк и прочие прелести. В топку! 5. PDF (Adobe Portable Document Format) - один из наиболее распространенных форматов электронных документов (как правило, не книг). PDF не особенно удобно читать на ридерах, кроме того, он очень громоздкий, поэтому в PDF для ридеров, как правило, записывают только документы со всякими формулами, иллюстрациями и прочим. 6. LRF - специальный формат для электронных книг от Sony. Однако уже практически вытеснен форматом EPUB, который Sony поддерживает. 7. DjVu (произносится «дежавю́») - формат для хранения плотно сжатых отсканированных документов - например, старых книг. В ридерах используется очень редко, потому что читать отсканированные книги на ридере почти невозможно из-за плохого качество отображения и маленького размера экрана. 8. RTF (Rich Text Format) - универсальный формат для хранения текстовых документов. В ридерах используется очень редко - так, для совместимости. 9. DOC - формат документов Microsoft Office. Некоторые ридеры его поддерживают, но читать документы на ридере обычно мало кому нужно. Вот как-то не для того они сделаны. Правда, в DOC по Сети до сих пор гуляют некоторые книги, но уж проще их переконвертировать в тот же EPUB. Существуют и всякие другие форматы, однако этим можно не забивать себе голову - вряд ли они вообще когда-нибудь пригодятся. Большинству пользователей, за редкими исключениями, обычно вполне достаточно формата EPUB. Его поддерживают почти все ридеры (кроме Kindle), книги в этом формате имеют небольшой размер, хорошую структуру, позволяют включать оглавление, иллюстрации и так далее. Многие онлайновые библиотеки хранят книги в этом формате, также в торрентах можно найти огромные коллекции книг формата EPUB. Какие выводы? EPUB - ваш выбор, будь то у вас западный ридер (Sony, Barnes&Noble, Kobo) или китайско-российско-украинский. А вот для Kindle нужно будет искать книги в формате MOBI или, что намного проще, просто переконвертировать тот же EPUB или FB2 в этот формат. Подобная процедура производится легко и быстро с помощью специальной программы. Как это делается - рассмотрим в отдельной статье.

Коротко о главном
Если вы хотите составить себе адекватное представление о epub, представьте, что вы сохранили на диск какую-нибудь (например, эту) веб-страницу вместе с используемой на ней графикой и стилями. Для всех современных браузеров это стандартная функция, например в FireFox это делается через меню «Файл → Сохранить как → Веб-страница полностью». Можно сохранить рядом не одну, а несколько страниц. Затем вы кладете рядом с вашими страницами два служебных XML-файла. Один просто метка «это epub» (container.xml), второй содержит перечень всех файлов - .html, .css, .jpg, etc (обычно это файл content.opf).
Осталось поместить всё это в zip-архив и сменить ему расширение с.zip на.epub.
Всё.
Книга готова, а вы уже знаете, что такое epub. Это не шутка и не преувеличение - epub это просто архивированный в zip html. Ни больше, ни меньше.

Про формат подробно
Размещение содержимого в epub-архиве

Как мы уже выяснили, epub - это zip-архив с несколькими файлами. Когда вы архивируете файлы ZIP-архиватором и вкладываете в архив XML-файл container.xml, вы говорите прозой создаете файл в формате «Open Container». Несмотря на убийственно-пафосное название этого мероприятия (IDPF стоило знать, что есть ISO-стандарт OPC и не изобретать велосипед), за «Open Container Format» (OCF) вполне можно поставить IDPF «зачот» (почему - выясним ниже).
Помимо файл container.xml (должен лежать в META-INF) epub обязательно содержит еще один служебный файл, где перечислены все прочие файлы, размещенные в архиве, и указан их тип, как правило называется content.opf.
Вся конструкция для знающего человека сильно напоминает java-пакеты вообще и OpenDocument в частности. И в самом, деле IDPF ищет пути объединения с OpenDocument. Не очень понятно, что мешало стартовать с клоном OD, ведь OpenDocument на два года старше OCF, но, видимо, велосипеды - неизбежный удел дилетантов, вовремя доки почитать не удосужились. Вот и xpointer IDPF так же, по всем судя, твердо намерены реизобрести в рамках EPUB3 . Версии к 5-й догадаются использовать стандартизованный w3c формат для ссылок и тоже будут искать пути объединения.

Какие данные хранятся в epub
epub обычно содержит следующую информацию:

  • Мета-данные: название, язык, авторы, etc.
  • Средства навигации: порядок листания для xhtml-файлов и « карта сайта содержание»
  • Собственно текст в виде нескольких xhtml-файлов, которые могут использовать стили css, картинки в jpg, gif и png а так же векторную графику svg и шрифты. Последняя версия epub декларирует поддержку MathML.
  • Помимо этого epub может включать ряд дополнительных узкоспециализированных файлов разметки, PDF-версию книги для печати и т. п. экзотику, реально не используемую, не поддерживаемую читалками и среднему читателю неинтересную.
Мета-информация в epub
Минимальная мета-информация epub включает название, ID документа и язык. Помимо этого можно указать авторов, переводчиков и других участников создания книги, дату публикации/написания, тему книги (в свободной форме), plain-text описание и данные об издательстве.
Ключевая мета-информация хранится в стандартной схеме Doublin Core , немного расширенной. Описание авторов, тематики и всех других полей (за исключением дат и языка) дается в свободной текстовой форме, что, фактически, исключает эффективную автоматическую каталогизацию epub из разных источников.

Средства навигации
epub, как мы помним, может включать множество html-файлов. И файлов будет множество. Не потому, что этого требует IDPF, а потому, что от больших файлов epub-читалки падают и все делают много маленьких. И вот для того, чтобы привычное читателю «пролистывание» работало, создатель epub указывает порядок, в котором файлы следует предъявлять. «При открытии показываем 3.html, когда читатель пролистает его до конца открываем 1.html, затем 8.html. А файл footnotes.html при прямом пролистывании недостижим, туда читатель будет попадать по сноскам», что-то в таком роде. Содержится обычно в файле content.opf.
Еще одно средство навигации внутри книги - содержание. Если присутствует, то, как правило хранится в toc.ncx. Технически это более аналог функции «карта сайта», чем привычного «содержания». Cодержание в бумажной книге (или электронном документе) повторяет структуру текста, а.ncx не связан с общим порядком следования текстовых фрагментов и может прямо им противоречить. Впрочем, в реальности файл как правило используется именно в качестве содержания и оформляется «штатно», повторяя порядок, заданный для листания.
Вообще, повторное хранение и переписывание на разные лады одних и тех же данных - фирменный знак epub. Мета-данные храняться в четырех местах: в описании OPF контейнера container.xml, в описании epub-пакета content.opf, в файле содержания toc.ncx и в html-файлах (в тегах meta). Содержание описывается трижды - «карта книги» из toc.ncx спорит с перечислением фрагментов в content.opf кто из них главнее, а заголовки h1-h6 в html смотрят на все это, и думают о реванше.

Текст книги
Разумеется, в epub присутствуют и собственно html-файлы с текстом книги. Так же в архиве хранятся используемые в тексте элементы - графика, стили, скрипты, шрифты.
Никаких существенных «надстроек» или «ограничений» в отношении html, css и т.п. epub не задает. Берем современный Web-контент, ставший уже даже не «динамическим», а «текучим» (epub декларирует поддержку html5, больше смахивающего на ОС , чем на язык разметки, его и браузеры-то пока поддерживают ограниченно), сохраняем на диск, архивируем - и вуаля, электронная книга готова.
«Дорогой, я сохранила интернет на диск, что дальше?»

История вопроса
Чтобы лучше понять основную силу и основную слабость epub, вернемся на 12 лет назад. В 2000-м году, когда ваш покорный слуга только-только приобщился к электронному чтению (если быть точным, был коварно подсажен на оное небезызвестным the-ebook), в сети уже существовали «Библиотека Мошкова », «Альдебаран », «Литпортал » и бог знает сколько еще мелких библиотек. Довольно много текстов было, в принципе, доступно. В основном именно в виде HTML.
HTML уже тогда давал широчайшие возможности для оформления. Благодаря этому люди, готовившие тексты, создавали иногда подлинные шедевры верстки. Достаточно вспомнить, что абзацы в библиотеке Мошкова были (и сейчас Мошков жжет в таком же роде, по-моему) оформлены миксом из тегов

и
Однако, реально существовавшие читалки (iSilo , Microsoft Reader , Mobipocket , устройства типа REB и т.п.) понимали только ограниченный диалект HTML и еще более ограниченное подмножество CSS. Конечно же, каждая читалка строила «расширения» над форматом, но никто не верстал под конкретную читалку.
В финале, после соединения творческих прорывов создателей текстов, вдохновленных мощью HTML+CSS и ничем не ограниченных в полете своей фантазии, с реальными читалками, на экране пользователя получалась, как правило, ерунда. В лучшем случае книга была неказиста, но читаема. В худшем - текст вообще превращался в месиво.
Моим первым ответом на это стала программа ClearTXT , убирающая из текста «творчество». Однако, достаточно быстро стало ясно, что никакой эвристический анализ не угонится за фантазией создателей html-книг. В итоге все равно приходилось работать руками, больше или меньше.

Проблемы с диалектом были не единственными. Программы-читалки имели не только индивидуальные «выразительные средства» и «языковые предпочтения». Ни одна не читала HTML напрямую (в этом плане мало, что изменилось, кстати, предлагаю поразмышлять - почему). Каждая программа использовала свой, обычно закрытый, метод подготовки и упаковки данных. lit, rb, lrf, chm - каждый создатель читалки и разработчик устройства считал своим долгом «изобрести» новый закрытый «формат» и своё, личное, DRM-решение. Средства для конвертации в этот закрытый формат часто были либо недоступны, либо выпускались в виде приложений и/или библиотек под конкретную платформу, с ограниченной документацией или вовсе без нее.

Две проблемы в 2000-м, одна проблема в 2012
Итак, в 2000-м году взять произвольный html и скормить его читалке нам мешали две вещи:

  1. Необходимость использовать громоздкие сторонние средства для упаковки HTML в понятный читалке формат
  2. Несовместимость читалки с используемой разметкой и стилями
epub предлагает решения для обеих проблем:
  1. Средства упаковки стандартизированы и технологичны - можно даже вручную, минут за 20, собрать весьма сложную книгу используя OCF, notepad и zip-архиватор.
  2. Как мы уже видели, epub совместим со всеми и всяческими диалектами, стилями и методами разметки. Сохраняй из web, архивируй и читай.
Казалось бы, все хорошо.
И по поводу упаковки к epub претензий, помимо эстетических, нет. Используется, пусть нестандартное и не самое удачное, но адекватное задаче решение, к тому же простое, как палка.
А вот относительно отображения текста в читалках нас ждут плохие новости. Сам «формат» совместим со всем и всяческим HTML, это да. Куда как просто было написать в стандарте «см. спецификацию html». Соблазн был велик и IDPF не устоял. Но вот мы открываем наш «какой угодно» HTML в «какой угодно читалке» и...
И обнаруживаем, что мы ни на йоту не сдвинулись относительно 2000-го года. Как и в конце прошлого века, каждая конкретная читалка понимает только свой, ограниченный, диалект html+css. Как и в прошлом веке, диалект обычно недокументирован. По-прежнему в каждой читалке для решения даже таких стандартных проблем, как сноски, вводятся свои, ни с чем не совместимые, расширения (поищите epub footnotes в google , методики создания, помимо превращения сносок в ссылки, варьируют от совершенно кислотного CSS до javascript). Простейшие вещи сделать практически невозможно, сложные вещи либо не работают, либо роняют читалки.

Вот вам домашнее задание: не подглядывая в epub от ЛитРес, сделайте epub с пустой строкой между двумя абзацами (текст, пустая строка, снова текст, как перед этим абзацем), одинаково отображаемый в iBooks , ADE , Sony и Nook . Китайские чудо-читалки и прочую экзотику оставим в стороне, чтобы задача оставалась выполнимой. И даже выравнивания по ширине и переносов со сносками не попросим. Просто пустая строка, тег в fb2. Время пошло.

Вердикт по делу epub
Явные плюсы формата - простота и технологичность zip-пакета, открытость.
Так же как плюс можно рассматривать единое DRM-решение. IDPF стыдливо делает вид, что DRM в epub типа открыт и типа любой может сделать свой. Все типа верят. И ясно понимают, что epub существует на 99% благодаря тому, что Adobe поддерживает для него DRM-инфраструктуру. DRM-зло, но один DRM на всех это меньшее зло, чем по DRM на магазин.
Да, глупо, когда архивированный HTML с взламываемым за одну минуту DRM выдается за невесть какую инновацию. Но zip и прочая стандартизация это какой ни на есть, а прогресс.
Касаемо плюсов это все.

А вот в области создания сложной разметки epub совсем никуда не годится и дальше будут только минусы. Формат не дает создателю книги ни гарантий относительно того, что увидит конечный читатель на экране, ни надежных средств контроля, которые позволят отсечь хотя бы заведомо «нерабочие» варианты, ни готовых решений для стандартных задач. Мой первый epub, только что прошедший валидацию, уронил две читалки из трех, на которых я его тестировал (слишком большой html - 2Мб, и слишком много ссылок, как я потом установил). Создатели документов вынуждены либо игнорировать «фичи» отдельных epub-читалок, либо предлагать несколько epub, чтобы читатель мог взять файл, совместимый именно с его устройством. Ради такого финала и огород городить не стоило - что толку верстать html5 зная, что читать его будут в IE3?

Чего нам ждать от epub в будущем
Наиболее благоприятный для epub сценарий - вытеснение из ниши программ-читалок мелких разработчиков несколькими крупным игроками. Сделать полнофункциональный html5-парсер с постраничной разбивкой как минимум не проще, чем сделать современный браузер, а отдача несопоставимо меньше, и случайных людей тут не будет. Однако ни google, ни Мicrosoft, ни Opera пока что не бегут делать новые движки epub-читалок чтобы Adobe мог как следует поднять бабла на своем чудо-DRM. И сама Adobe вполне ясно свой потенциал по развитию ридеров показала - ADE до сих пор не имеет ни поддержки сносок, ни нормально типографики, ни переносов.
Так что гораздо вероятнее, что лет за пять вокруг epub сформируется некий «неписанный IDPF» неформальный свод правил верстки, рабочих решений по оформлению, опробованных на ведущих читалках «хаков» и «фокусов». Сетевое сообщество уже формирует «истинный» epub-стандарт поверх всепрощающего «html5+css3+все_чего_хочется_еще». Описываются реальные решения для реальных проблем в реальных ридерах. Потом эти «фокусы», будучи стандартом де-факто, станут обязательными и для разработчиков новых читалок. Те, кто в IT достаточно давно, чтобы успеть наглотаться дыма браузерных войн и поработать с IE4, NN4 и Opera 3, отлично представляют себе, что именно нас ждет - по этим граблям сетевое сообщество уже ходило и икается эта прогулка до сих пор. Поэтому когда я вижу «этот epub оптимизирован под iBooks» я испытываю не просто де-жа-вю, а острый рвотный рефлекс.

И вот за то, что нас пытаются выпихнуть «назад в 90-е» я ставлю epub незачет. Нам не нужны хаки, становящиеся неработоспособными в новой версии софта. Нам не нужны неписанные правила, по крупицам отлавливаемые методом тыка. Не нужны узаконенные баги. Не нужна «валидация тестированием» по всем читалкам - «покажет или не покажет». Всё это мы проходили.
Нам нужна надежная и удобная технология, четкий стандарт и рабочие средства контроля качества. И epub этого нам дать не смог, к сожалению.

Чего от epub ждать бесполезно
Среди недостатков epub есть и еще один, который мы пока не затрагивали - принципиальная несовместимость с другими форматами. epub рожден быть монополистом. Извлечение данных из epub и конвертация в другой формат даже для нехитрого html является непростой задачей. Когда же epub заматереет, обрастет хаками под устройства и замысловатыми решениями, типа подстраничных сносок на CSS, извлечь из него что-либо будет задачей практически неразрешимой. Какой бы формат Adobe не разрабатывала, получается PDF - вход рубль, а выход пять.
А ведь нам все еще нужна поддержка разных (в т.ч. старых) читалок и устройств. Нужна полноценная поддержка альтернативных форматов, которые уже приобрели вес (mobipocket на Kindle) и будут еще появляться на рынке.

В добавок нам нужны средства каталогизации, обмена цитатами и заметками и прочая и прочая, чего epub даже на декларативном уровне пока что не обещает. Иными словами, нам нужен fb3, которому и будет посвящена следующая статья.