Как организовать парсинг
Добавлено: 02 апр 2009, 14:57
Нуждаюсь в совете как организовать кусок кода - нужно взять с вебстраницы УРЛы сайтов, начало куска кода:
// navigate to victim
$browser->navigate($uri);
// wait on browser
$browser->wait_for(90,1);
$findtext= $webpage->get_body();
а дальше надо осуществить поиск урлов на старнице, которые начинаются на "www."
тоесть ищем "www.", и все что после него до первого пробела записываем новой строкой в файл, причем на первом найденном УРЛе скрипт не должен останавливаться, а записывать в файл все найденные.
// navigate to victim
$browser->navigate($uri);
// wait on browser
$browser->wait_for(90,1);
$findtext= $webpage->get_body();
а дальше надо осуществить поиск урлов на старнице, которые начинаются на "www."
тоесть ищем "www.", и все что после него до первого пробела записываем новой строкой в файл, причем на первом найденном УРЛе скрипт не должен останавливаться, а записывать в файл все найденные.