1. Уважаемый гость! Если во время регистрации на сайте возникли проблемы, сообщите о них, пожалуйста, сюда: mihail@vilejski-uezd.by Вам обязательно помогут!

Пакетная закачка с familysearch.org

Опубликовал Andzej в Блог Andzej. Просмотров: 14122

Внезапное появление в свободном доступе очень интересных материалов на familysearch.org по нашему, и не только нашему уезду, застало всех врасплох. Тут тебе и частично фонд 333 из НИАБ, фонд 604 и фонд 634 из ЛГИА, причём метрики греко-униатских церквей доступны за период с 1799 по 1839. Аттракцион невиданной щедрости какой-то o_O. А только что кажись нашёл оригиналы метрик Вязынской церкви за 1778 - 1792 годы. :D И, видимо, этот 634 фонд хранит в себе ещё много тайн.

Наш человек, увидев такое количество того, за чем долго бегал, аки Плюшкин, хочет затянуть к себе в дом побольше этого "добра". Вот и я поддался такому желанию. Да ещё эти шушуканья по форумам, что дескать, не надолго это, лавочку и прикрыть могут, только усиливали моё желание скачать это всё.

Официальных способов выкачивать материалы целыми плёнками как бы и нет. Хорошо хоть есть возможность скачать каждое фото по отдельности есть. Но это дурной путь. Тыкать мышкой в экран, быть привязанным к сайту и интернету - это не наш путь.

Есть сторонние плагины для браузеров, которые специально созданы для пакетной загрузки изображений с подобных сайтов. Но есть пару "но". Часть из них содержит зашитые трояны, другая часть имеет кучу настроек, в которых разбираться как бы не хочется.

Поэтому я решил, что сделаю утилиту под конкретную задачу - скачать материал с familysearch. Тем более что чутка знаю Java, в таком объёме, чтобы справиться с поставленной задачей. И таки написал.

Вот ссылка на эту утилиту: MoorMoon.jar

Что она может и чего она не может:
  • может по номеру плёнки скачать её содержимое, при условии что оно доступно, т.е. можно указать номер плёнки и утилита сама знает откуда её качать и сколько в плёнке кадров;
  • может скачивать содержимое плёнки с указанной позиции до следующей указанной позиции, т.е. не всю целиком, а какую-то часть;
  • может загружать только в одном потоке, возможно запилю несколько, некое подобие многопоточности можно организовать запустив утилиту в двух экземплярах, но это как бы нагружает систему и не гуд;
  • не может корректно работать на Linux, потому что пути для сохранения файлов захардкожены под Windows;
  • не может всё остальное о чём подумали вы, но не подумал я :).
Чтобы воспользоваться утилитой необходимо:
  1. Иметь компьютер под управлением Windows.
  2. Проверить установлена ли Java в системе. Для этого запустить командную строку (для win7 "Пуск" -> ввести "cmd" в строке "Найти программы и файлы" -> нажать Enter) и набрать: java -version Должна появиться информация о версии Java, если информация о версии не появилась, то переходим по этой ссылке и устанавливаем Java себе на компьютер.
  3. Когда вы убедились, что java установлена на вашем компьютере, не выходим из консоли и в ней переходим в папку, где лежит moormoon.jar. Для смены диска нужно набрать [Буква диска]: например D: Для смены директории набираем cd [путь] например cd D:\java\example
  4. Затем, находясь в папке с утилитой, набираем java -jar moormoon.jar и читаем короткую инструкцию о использовании утилиты с параметрами.
ВАЖНО! Так как утилита сыровата путь до целевой папки захардкожен, т.е. задан в коде программы. В дальнейшем я это исправлю. Но пока необходимо, чтобы на вашем компьютере был диск D. Думаю такой есть у большинства. Утилита создаёт на диске D папку familySearch. Результаты работы сохраняет в ней, создавая папки с номерами плёнок, которые вы качаете. Названия файлов вида 00001.jpg

Будут вопросы - задавайте!
trumpo, Михаил, malco и 2 другим нравится это.
  • Elena
  • malco
  • Михаил
  • pole
  • Andzej
  • pole
  • Andzej
  • pole
  • кристина
  • Andzej
  • кристина
  • kordeni
  • Олег
  • axez
  • Andzej
  • Олег
  • miliam
  • Олег
You need to be logged in to comment