Kiwix

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Kiwix
Логотип программы Kiwix
Скриншот программы Kiwix
Тип пакет прикладных программ
Авторы Эммануэль Энгельхарт[вд] и Рено Годен[вд]
Написана на C++[1], JavaScript, Python, Kotlin и Swift
Интерфейс Qt
Операционная система кроссплатформенность[2]
Языки интерфейса Более 120
Первый выпуск 2006
Аппаратные платформы IA-32, x86-64 и ARM
Последняя версия
Репозиторий github.com/kiwix/
Лицензия LGPL-3.0[вд][4] и GPL 3.0+[5]
Сайт kiwix.org/en/ (англ.)
Логотип Викисклада Медиафайлы на Викискладе

Kiwix — пакет свободного программного обеспечения для создания и просмотра ZIM-файлов[англ.], разработанный Эммануэлем Энгельхартом и Рено Годеном в 2006 году. В ZIM-файле в сжатом виде находятся логически связанные между собой html-страницы (а иногда и образы сайтов целиком) с работающими гиперссылками, изображениями, звуком и видео.

Kiwix работает как автономный веб-браузер со страницами внутри ZIM-файла. Если в этих страницах встречается ссылка на сайт в Интернете (а не на другие страницы внутри этого же ZIM-файла), то Kiwix предлагает открыть эту внешнюю ссылку в обычном браузере. Проект создавался с целью сделать возможным доступ к содержимому Википедии на компьютере, планшете или смартфоне без необходимости подключения к Интернету. Файл ZIM находится во внутренней памяти устройства (флешке, жёстком диске, карте памяти). Файлы ZIM, чтобы обойти ограничение на размер файлов в файловой системе FAT32 (максимум 4 Гб), могут быть разбиты на более мелкие части. Название формата ZIM или проекта OpenZIM происходит от Zeno IMproved (улучшенный Zeno, формата, который ранее использовался для этой же цели). В ZIM-файлах возможен поиск по названию страниц и полнотекстовый поиск, для осуществления возможности поиска страницы индексируются и индексы помещаются внутрь файла ZIM (в форматах до середины 2018 года индексы нужно было создавать и хранить отдельно во внешних файлах). Логотип программы — птица Киви, в названии которой присутствуют те же буквы, что и в слове Вики — технологии, на которой основано создание и наполнение Википедии.

Программа нацелена на аудиторию с ограниченным доступом к Интернету (например, там, где доступ заблокирован администратором локальной или глобальной сети или государством, где Интернет дорог (например, роуминг), а также на пользователей из мест, где сайт Википедии или весь Интернет недоступен (например, открытое море, при обучении в тюрьмах, далёкие путешествия) или доступ в Интернет очень медленный. Это программное обеспечение изначально разрабатывалось для издания немецкой Википедии на DVD-диске. Как и многое другое свободное обеспечение, работа Kiwix возможна без установки (инсталляции), например, как программу, так и файл ZIM можно носить с собой на флешке и запускать с неё.

Википедия на флешке в формате Kiwix

Файл в формате ZIM может быть создан из любых локально расположенных в каталоге веб-страничках с помощью утилиты zimwriterfs, которая собирает эти статичные html, изображения, стили и другой контент, затем индексирует, сжимает алгоритмом LZMA2 и складывает внутрь ZIM[6].

Также ZIM-файлы можно создать с помощью плагина для сайтов из нескольких веб-страниц, работающих на вики-движке Медиавики (ранее такая возможность была и в Википедии с помощью инструмента слева от основной статьи «Создать книгу». Статичные html можно получать с любого сайта, используя утилиты для выкачивания сайтов из Интернета (менеджеры закачек, например, wget, curl.). Сайт с Википедией плохо поддаётся выкачиванию с помощью менеджеров закачек, так как на нём очень много гиперсылок на страницы на других языках, которые не нужны при работе с локальной Википедией на одном языке, также объём некоторых Википедий достигает десятков гигабайт и создание html-файлов занимает долгое время. Для выкачивания Википедии и родственных проектов (Викигид, Викитека, Викицитатник, Викисловарь, Викиновости, Викиверситет, Викиучебник и др.) с изображениями или без в рамках проекта Kiwix создана утилита mwoffliner, которая некоторое время (от нескольких минут до нескольких суток) выкачивает Википедию на заданном языке и сохраняет эти данные в виде статичных файлов html в каталоге, а изображения со страниц оптимизирует по размеру, затем уже запускается утилита zimwriterfs, которая собирает все эти статичные файлы в один сжатый ZIM-файл. Если в Википедии не оптимизировать изображения, то размер zim-файла может быть до нескольких терабайт. Zim-файл с английской версией Википедии без изображений 2020 года (но со стилями, формулами, гиперссылками) занимает 37 Гб, с оптимизированными (уменьшенными) изображениями — 79 Гб, на русском языке, соответственно, 11 и 28 Гб.

Чтение Википедии при помощи Kiwix на яхте в Тихом океане
Медицинская Википедия на смартфоне

Имеются сборки программы для Linux, Windows, OS X, Android (версия доступна бесплатно через магазин Google Play, а также в репозитории F-Droid[7], поддерживается операционная система Android версии 3 и выше), для iOS (программа доступна в App Store), для Windows Mobile. Для работы с zim-файлами есть расширения для браузеров: Firefox[8], Chrome[9] (и всех браузеров на его основе) и Edge[10].

Вместе с Kiwix поставляется служба Kiwix (kiwix-serve), функционирующая как веб-сервер и позволяющая организовать доступ к Zim-файлам всем компьютерам внутри локальной или глобальной сети.

В рамках проекта Kiwix есть сайт http://library.kiwix.org/, на котором выложены все zim-файлы, созданные в рамках этого проекта.

В рамках проекта Kiwix ежемесячно создаются дампы Википедии на множестве языков в формате ZIM[11][12]. Кроме Википедиидругих проектов Викимедиа, таких как Мета-Вики, Викивиды), в формате ZIM на сайте Kiwix доступно и много другого контента (книги из проекта Гутенберг, видеоконференции проекта TED с Ютуба и другое). Иногда из очень больших Википедий (миллион статей или больше) делают выжимки по определённой тематике (например, есть zim-файлы по математике, физике, химии, компьютерам, медицине из английской Википедии). На базе английской Википедии есть вариант свободной интернет-энциклопедии для школьников с размером 2,3 гб.

Примечания

[править | править код]
  1. The kiwix Open Source Project on Open Hub: Languages Page — 2006.
  2. https://kiwix.org/en/applications/
  3. https://github.com/kiwix/kiwix-desktop/releases
  4. https://github.com/kiwix/kiwix-apple/blob/main/LICENSE
  5. A Bibliographic Scan of Digital Scholarly Communication Infrastructure (англ.)Educopia Institute, 2020.
  6. ZIM file format. Дата обращения: 31 марта 2022. Архивировано 1 апреля 2022 года.
  7. "Kiwix - Offline Wikipedia reader" (англ.). f-droid.org. Архивировано 7 июля 2020. Дата обращения: 30 мая 2021.
  8. "Kiwix: offline wikipedia reader" (англ.). addons.mozilla.org. Архивировано 29 марта 2019. Дата обращения: 24 января 2021.
  9. "Extensions - Kiwix" (англ.). chrome.google.com. Архивировано 29 марта 2019. Дата обращения: 24 января 2021.
  10. "Kiwix" (англ.). microsoftedge.microsoft.com. Архивировано 11 ноября 2020. Дата обращения: 24 января 2021.
  11. Nathan Willis (2014-06-11). "Accessing Wikipedia offline" (англ.). LWN. Архивировано 14 марта 2016. Дата обращения: 15 октября 2016.
  12. Дампы kiwix для англоязычных проектов Викимедия Архивная копия от 23 октября 2016 на Wayback Machine, русскоязычных проектов Викимедия Архивная копия от 23 октября 2016 на Wayback Machine, все дампы Архивная копия от 10 сентября 2017 на Wayback Machine