Нуждаюсь в совете как организовать кусок кода - нужно взять с вебстраницы УРЛы сайтов, начало куска кода:
// navigate to victim
$browser->navigate($uri);
// wait on browser
$browser->wait_for(90,1);
$findtext= $webpage->get_body();
а дальше надо осуществить поиск урлов на старнице, которые начинаются на "www."
тоесть ищем "www.", и все что после него до первого пробела записываем новой строкой в файл, причем на первом найденном УРЛе скрипт не должен останавливаться, а записывать в файл все найденные.
Как организовать парсинг
-
- Сообщения: 1
- Зарегистрирован: 02 апр 2009, 14:51
ищем в тексте нужные нам индексы по префиксам
это мы нашли один url в тексте, если надо все то, организуем цикл примерно так :
где то примерно так))
Код: Выделить всё
$ind1 = strpos($findtext,"www.");
$ind3= strpos($findtext," ",$ind1);
$url = substr($findtext,$ind1,$ind3-$ind1);
Код: Выделить всё
$ind1=0;
$ind3=0;
$url ="";
while($ind1!==FALSE)
{
$ind1 = strpos($findtext,"www.",$ind3);
$ind3= strpos($findtext," ",$ind1);
// получаем всё в одну строку
$url = $url.substr($findtext,$ind1,$ind3-$ind1)."\n";
}