Примеры парсеров (сборщиков, грабберов)
Примеры парсеров (сборщиков, грабберов)
Хочу сделать скрипт, который будет собирать определённую информацию с сайта. Где лучше смотреть примеры парсеров с применением human emulator?
Re: Примеры парсеров (сборщиков, грабберов)
Сборщик слов с Google.KeywordPlanner http://x-datas.bigfozzy.com/?p=340
Сборщик слов с Яндекс.Вордстат http://x-datas.bigfozzy.com/?p=334
СБОРЩИКИ, ПАРСЕРЫ, ГРАББЕРЫ http://www.x-scripts.com/scripts.php#parse
Как написать простой скрипт парсер на Human Emulator http://www.x-scripts.com/articles/how_parse.php
В этом уроке есть про парсер http://www.x-scripts.com/video/video10.php.
Только пролистать надо до 83 минуты, там в начале про постер рассказывают.
Видео пример как работает сборщик в human emulator https://www.youtube.com/watch?v=CfGoV93iAF4
Полезный объект $harvestor. Безбраузерный сбор интернет страниц. Про этот объект можно прочитать в нашем блоге
Сборщик слов с Яндекс.Вордстат http://x-datas.bigfozzy.com/?p=334
СБОРЩИКИ, ПАРСЕРЫ, ГРАББЕРЫ http://www.x-scripts.com/scripts.php#parse
Как написать простой скрипт парсер на Human Emulator http://www.x-scripts.com/articles/how_parse.php
В этом уроке есть про парсер http://www.x-scripts.com/video/video10.php.
Только пролистать надо до 83 минуты, там в начале про постер рассказывают.
Видео пример как работает сборщик в human emulator https://www.youtube.com/watch?v=CfGoV93iAF4
Полезный объект $harvestor. Безбраузерный сбор интернет страниц. Про этот объект можно прочитать в нашем блоге
Re: Примеры парсеров (сборщиков, грабберов)
Спасибо. А можно ли делать парсинг с помощью GET и POST запросов? И есть ли примеры?
Re: Примеры парсеров (сборщиков, грабберов)
Да можно. Отправляем запрос в GET или POST виде с помощью функций $browser->send_get_query или $browser->send_post_query и разбираем полученный результат. Также можно для разбора использовать PHP функцию file_get_contents или $webpage->load_web_page. Эти функции грузят страницы без отображения в браузере, но такой вариант подходит если нужная для разбора информация не подгружается JS скриптами после загрузки страницы в браузере.