Я регулярно проверяю онлайн-сервер с кучей файлов, доступных через «список каталогов» (классический Apache «Индекс /»).
Время от времени системный администратор сервера добавляет новые файлы и каталоги, но нет журнала о том, какие файлы были добавлены / обновлены.
Можно ли использовать wget для получения только структуры и имен файлов всего каталога / подкаталога (а не «реального» содержимого) и сохранить их внутри файла? Таким образом, мне нужно просто запустить такую команду и, используя diff, сравнить ее с предыдущей проверкой, есть ли какие-то обновления.
Мне действительно все равно, имеет ли файл html-структуру страниц, путь или URL-адрес. Важно то, что он должен быть согласован между каждой итерацией для облегчения сравнения.
В моем сценарии я не могу использовать метку времени wget (параметр -N) для сравнения ранее загруженных файлов, потому что после получения я перемещаю или удаляю их.