Нужен скрипт, который копирует страницу сайта, меняет в текстовом контенте заданные по шаблону тексты (например, одно слово на другое, или одну группу слов на другую) и выдает на моем домене один в один по дизайну, но с указанной заменой текста. Наверняка что-то такое есть. Я бы сам написал, но програмлю на другом языке, а там проблемы с парсингом https
ivan-lev
Как там говорится, разделяй и властвуй..
Разбить на задачи
— «качалка» (скачать страницу.. вплоть до file_get_contents)
— «поиск текстового контента» (это если нужно.. так-то можно во всей странице целиком заменять;
— «синонимайзер»
— выдача браузеру (echo|print)
* возможно, есть смысл дополнить кэшированием..
По каждой есть более-менее готовые решения — искать подходящее, пробовать и «собирать».
p.s. Чем-то таким не очень хорошим отдаёт..
p.p.s. Кхм.. а в каком языке сложности с «парсингом» https?
livetv
http://huifikator.ru/
SocFishing
Скажу из опыта, нет готового свежего решения. Все нужно допинывать, переделывать и тд. под себя. Куски можно взять по запросу https://github.com/search?q=php+proxy и https://github.com/search?q=php+anonymizer
Если эта одна страница, то такая задача очень простая, реализуется в несколько строчек, но не думаю, что вам это нужно. Так же данную задачу можно выполнить совсем другим образом.
Shraibikus
wasistdas: Нужен скрипт, который копирует страницу сайта, меняет в текстовом контенте заданные по шаблону тексты (например, одно слово на другое, или одну группу слов на другую) и выдает на моем домене один в один по дизайну, но с указанной заменой текста. Наверняка что-то такое есть. Я бы сам написал, но програмлю на другом языке, а там проблемы с парсингом https
Гуглите dolly sites и Site copy там это все из коробки
oxg
можно через Тотал Коммандер делать сразу замену по ftp, слов на слово во всех страницах папки
SocFishing
Если вам нужно скачать сайт и внести правки, bash можно создать, что-то типа
sed -i ‘s/что_менять/на_что_менять/’ /tmp/searchengines/*
sed -i ‘s/что_менять/на_что_менять/’ /tmp/searchengines/*
Mik Foxi
Готовых скриптов врятли будет, заказывайте под себя по конкретно вашему ТЗ. Долларов до 50 уложитесь, там не сложно.
Lastwarrior
Я бы разбил эту задачу на несколько простых, а потом поэтапно их решил. Сначала — получение нужных для парсинга страниц сайта-донора, потом парсинг контента страниц, потом синомайзинг и уже потом только выгрузка контента на свои страницы.
totamon
SocFishing: Скажу из опыта, нет готового свежего решения.
foxi: Готовых скриптов врятли будет,
ну как же?) доллли сайт может и умер, но пара живых вполне есть, например
MassSiteProxy 1.x Скрипт массового клонирования(проксирования) сайтов на автомате
wasistdas
Я програмлю на экзотике — на CFML, а там лажа с https. При http все было пучком, а сейчас бубны с сертификатами. ПРосто хочу брать несоклько новостных сайтов, вставлять в каждоое предложение в начало «Из-за коронавируса» и выдавать на отдельный домен
ivan-lev: Как там говорится, разделяй и властвуй..
Разбить на задачи
— «качалка» (скачать страницу.. вплоть до file_get_contents)
— «поиск текстового контента» (это если нужно.. так-то можно во всей странице целиком заменять;
— «синонимайзер»
— выдача браузеру (echo|print)
* возможно, есть смысл дополнить кэшированием..
По каждой есть более-менее готовые решения — искать подходящее, пробовать и «собирать».
p.s. Чем-то таким не очень хорошим отдаёт..
p.p.s. Кхм.. а в каком языке сложности с «парсингом» https?
———- Добавлено 21.03.2020 в 12:08 ———-
livetv: http://huifikator.ru/
Вот собственно мне такое и надо. Только с возможностями настроки синонимайзера — мне не доа кажое слово хуювтарять
wasistdas
Нужен скрипт, который копирует страницу сайта, меняет в текстовом контенте заданные по шаблону тексты (например, одно слово на другое, или одну группу слов на другую) и выдает на моем домене один в один по дизайну, но с указанной заменой текста. Наверняка что-то такое есть. Я бы сам написал, но програмлю на другом языке, а там проблемы с парсингом https
ivan-lev
Как там говорится, разделяй и властвуй..
Разбить на задачи
— «качалка» (скачать страницу.. вплоть до file_get_contents)
— «поиск текстового контента» (это если нужно.. так-то можно во всей странице целиком заменять;
— «синонимайзер»
— выдача браузеру (echo|print)
* возможно, есть смысл дополнить кэшированием..
По каждой есть более-менее готовые решения — искать подходящее, пробовать и «собирать».
p.s. Чем-то таким не очень хорошим отдаёт..
p.p.s. Кхм.. а в каком языке сложности с «парсингом» https?
livetv
http://huifikator.ru/
SocFishing
Скажу из опыта, нет готового свежего решения. Все нужно допинывать, переделывать и тд. под себя. Куски можно взять по запросу https://github.com/search?q=php+proxy и https://github.com/search?q=php+anonymizer
Если эта одна страница, то такая задача очень простая, реализуется в несколько строчек, но не думаю, что вам это нужно. Так же данную задачу можно выполнить совсем другим образом.
Shraibikus
Нужен скрипт, который копирует страницу сайта, меняет в текстовом контенте заданные по шаблону тексты (например, одно слово на другое, или одну группу слов на другую) и выдает на моем домене один в один по дизайну, но с указанной заменой текста. Наверняка что-то такое есть. Я бы сам написал, но програмлю на другом языке, а там проблемы с парсингом https
Гуглите dolly sites и Site copy там это все из коробки
oxg
можно через Тотал Коммандер делать сразу замену по ftp, слов на слово во всех страницах папки
SocFishing
Если вам нужно скачать сайт и внести правки, bash можно создать, что-то типа
mkdir /tmp/searchengines/
wget —mirror https://searchengines.guru/ -P /tmp/searchengines/
sed -i ‘s/что_менять/на_что_менять/’ /tmp/searchengines/*
sed -i ‘s/что_менять/на_что_менять/’ /tmp/searchengines/*
Mik Foxi
Готовых скриптов врятли будет, заказывайте под себя по конкретно вашему ТЗ. Долларов до 50 уложитесь, там не сложно.
Lastwarrior
Я бы разбил эту задачу на несколько простых, а потом поэтапно их решил. Сначала — получение нужных для парсинга страниц сайта-донора, потом парсинг контента страниц, потом синомайзинг и уже потом только выгрузка контента на свои страницы.
totamon
Скажу из опыта, нет готового свежего решения.
Готовых скриптов врятли будет,
ну как же?) доллли сайт может и умер, но пара живых вполне есть, например
MassSiteProxy 1.x Скрипт массового клонирования(проксирования) сайтов на автомате
wasistdas
Я програмлю на экзотике — на CFML, а там лажа с https. При http все было пучком, а сейчас бубны с сертификатами. ПРосто хочу брать несоклько новостных сайтов, вставлять в каждоое предложение в начало «Из-за коронавируса» и выдавать на отдельный домен
Как там говорится, разделяй и властвуй..
Разбить на задачи
— «качалка» (скачать страницу.. вплоть до file_get_contents)
— «поиск текстового контента» (это если нужно.. так-то можно во всей странице целиком заменять;
— «синонимайзер»
— выдача браузеру (echo|print)
* возможно, есть смысл дополнить кэшированием..
По каждой есть более-менее готовые решения — искать подходящее, пробовать и «собирать».
p.s. Чем-то таким не очень хорошим отдаёт..
p.p.s. Кхм.. а в каком языке сложности с «парсингом» https?
———- Добавлено 21.03.2020 в 12:08 ———-
http://huifikator.ru/
Вот собственно мне такое и надо. Только с возможностями настроки синонимайзера — мне не доа кажое слово хуювтарять