Ищу скрипт


wasistdas
737

Нужен скрипт, который копирует страницу сайта, меняет в текстовом контенте заданные по шаблону тексты (например, одно слово на другое, или одну группу слов на другую) и выдает на моем домене один в один по дизайну, но с указанной заменой текста. Наверняка что-то такое есть. Я бы сам написал, но програмлю на другом языке, а там проблемы с парсингом https


ivan-lev

Как там говорится, разделяй и властвуй..

Разбить на задачи

— «качалка» (скачать страницу.. вплоть до file_get_contents)

— «поиск текстового контента» (это если нужно.. так-то можно во всей странице целиком заменять;

— «синонимайзер»

— выдача браузеру (echo|print)

* возможно, есть смысл дополнить кэшированием..

По каждой есть более-менее готовые решения — искать подходящее, пробовать и «собирать».

p.s. Чем-то таким не очень хорошим отдаёт..

p.p.s. Кхм.. а в каком языке сложности с «парсингом» https?


livetv

http://huifikator.ru/


SocFishing

Скажу из опыта, нет готового свежего решения. Все нужно допинывать, переделывать и тд. под себя. Куски можно взять по запросу https://github.com/search?q=php+proxy и https://github.com/search?q=php+anonymizer

Если эта одна страница, то такая задача очень простая, реализуется в несколько строчек, но не думаю, что вам это нужно. Так же данную задачу можно выполнить совсем другим образом.


Shraibikus

wasistdas:
Нужен скрипт, который копирует страницу сайта, меняет в текстовом контенте заданные по шаблону тексты (например, одно слово на другое, или одну группу слов на другую) и выдает на моем домене один в один по дизайну, но с указанной заменой текста. Наверняка что-то такое есть. Я бы сам написал, но програмлю на другом языке, а там проблемы с парсингом https

Гуглите dolly sites и Site copy там это все из коробки


oxg

можно через Тотал Коммандер делать сразу замену по ftp, слов на слово во всех страницах папки


SocFishing

Если вам нужно скачать сайт и внести правки, bash можно создать, что-то типа

mkdir /tmp/searchengines/

wget —mirror https://searchengines.guru/ -P /tmp/searchengines/

sed -i ‘s/что_менять/на_что_менять/’ /tmp/searchengines/*

sed -i ‘s/что_менять/на_что_менять/’ /tmp/searchengines/*


Mik Foxi

Готовых скриптов врятли будет, заказывайте под себя по конкретно вашему ТЗ. Долларов до 50 уложитесь, там не сложно.


Lastwarrior

Я бы разбил эту задачу на несколько простых, а потом поэтапно их решил. Сначала — получение нужных для парсинга страниц сайта-донора, потом парсинг контента страниц, потом синомайзинг и уже потом только выгрузка контента на свои страницы.


totamon

SocFishing:
Скажу из опыта, нет готового свежего решения.
foxi:
Готовых скриптов врятли будет,

ну как же?) доллли сайт может и умер, но пара живых вполне есть, например

MassSiteProxy 1.x Скрипт массового клонирования(проксирования) сайтов на автомате


wasistdas

Я програмлю на экзотике — на CFML, а там лажа с https. При http все было пучком, а сейчас бубны с сертификатами. ПРосто хочу брать несоклько новостных сайтов, вставлять в каждоое предложение в начало «Из-за коронавируса» и выдавать на отдельный домен

ivan-lev:
Как там говорится, разделяй и властвуй..

Разбить на задачи

— «качалка» (скачать страницу.. вплоть до file_get_contents)

— «поиск текстового контента» (это если нужно.. так-то можно во всей странице целиком заменять;

— «синонимайзер»

— выдача браузеру (echo|print)

* возможно, есть смысл дополнить кэшированием..

По каждой есть более-менее готовые решения — искать подходящее, пробовать и «собирать».

p.s. Чем-то таким не очень хорошим отдаёт..

p.p.s. Кхм.. а в каком языке сложности с «парсингом» https?

———- Добавлено 21.03.2020 в 12:08 ———-

livetv:
http://huifikator.ru/

Вот собственно мне такое и надо. Только с возможностями настроки синонимайзера — мне не доа кажое слово хуювтарять

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *