Поделитесь парсером
Поделитесь парсером
Необходимо написать несколько парсеров интернет-магазинов. Может кому не жалко сбросить готовые парсеры для ознакомления с принципами работы. Заранее спасибо.
Великие вещи для великих,
Пропасти для глубоких,
Нежности и дрожь, ужасы для чутких,
А, в общем, всё редкое для редких.
Пропасти для глубоких,
Нежности и дрожь, ужасы для чутких,
А, в общем, всё редкое для редких.
Re: Поделитесь парсером
Почитайте про эту функцию http://www.humanemulator.net/objects/WE ... prefix.php и напишите в аську суппорта, если готового парсера не найдётся. Сделать свой совершенно не сложно.
Re: Поделитесь парсером
Что-то нихрена не получается.
Кто сможет помочь. К примеру, нужно слить страницу http://www.mobitrade.ua/pckomp/hdd/HP.html
Необходимо снять: Название, цену, короткое описание и полное описание.
Заранее благодарен
Кто сможет помочь. К примеру, нужно слить страницу http://www.mobitrade.ua/pckomp/hdd/HP.html
Необходимо снять: Название, цену, короткое описание и полное описание.
Заранее благодарен
Великие вещи для великих,
Пропасти для глубоких,
Нежности и дрожь, ужасы для чутких,
А, в общем, всё редкое для редких.
Пропасти для глубоких,
Нежности и дрожь, ужасы для чутких,
А, в общем, всё редкое для редких.
Re: Поделитесь парсером
тут хуман нипричем, нужен обычный парсер, который можно сделать и на чистом пхп и на чем угодно. задача собственно сграбить страницу (т.е. получить ее хтмл код) и спарсить из кода нужные значения (т.е. найти в этом хтмл коде нужные места) .. имхо, посмотри в сторону content downloader, делает именно то что требуется, парсит определенные куски сайта без того чтоб понимать что либо в коде. если все же с пхп интересно, почитай про регулярные выражения, 1-2 дня на чтение, сможешь легко парсить нужные куски страниц
Re: Поделитесь парсером
В качестве примера могу предложить вот такой код:
Цену решил не собирать, оставив вам простор для творчества )
Если останутся непонятные моменты, пишите.
Код: Выделить всё
<?php
$xhe_host ="127.0.0.1:7010";
// The following code is required to properly run XWeb Human Emulator
require("../Templates/xweb_human_emulator.php");
$browser->navigate("http://www.mobitrade.ua/pckomp/hdd/HP.html");
$browser->wait_for(30,1);
$urls = $anchor->get_all_urls_by_inner_text("Купить",$separator="<br>");
$urls = explode ("<br>",$urls);
for($i=0;$i<count($urls);$i++)
{
$browser->navigate($urls[$i],$use_cache=true);
$browser->wait_for(30,1);
sleep(1);
$title = $webpage->get_body_inter_prefix('<A class=zoomer title="','href="javascript',$as_html=true);
$title = substr($title, 0, strlen($title)-1);
$path = "C:\\".$title.".jpg";
$image->save_to_file_by_name('sale_image', $path);
echo $title."<br>";
echo $webpage->get_body_inter_prefix('<DIV class=title','</DIV></DIV></DIV>',$as_html=true);
echo "<br><br>";
}
// Quit
$app->quit();
?>
Если останутся непонятные моменты, пишите.