Сборщик прямого эфира яндекса

Сбор и анализ всего что можно собрать из сети.
Ответить
Аватара пользователя
bigfozzy
Site Admin
Сообщения: 3057
Зарегистрирован: 28 июл 2008, 17:24
Контактная информация:

Сборщик прямого эфира яндекса

Сообщение bigfozzy » 22 фев 2012, 03:12

Код: Выделить всё

<?php

// настройки расположение
$xweb_path="D:\\XWeb MT\\";
$script_path="K:\\Скрипты\\";
$in_path="D:\\XWeb MT\\In\\";
$out_path="D:\\XWeb MT\\Out\\";
$log_path="";

// порт
$xhe_host ="127.0.0.1:7010";

// подключение библиотек хумана
require($xweb_path."Human Emulator 0\\Templates\\xweb_human_emulator.php");

// инструменты
require($script_path."Tools\\file_tools.php");
require($script_path."Tools\\string_tools.php");
require($script_path."Tools\\folder_tools.php");
require($script_path."Tools\\harvest_tools.php");

$script_name="ya onair";
$app->set_tray_icon("yandex.ico");

// зона
date_default_timezone_set('Europe/Kiev');

// navigate to google
$browser->navigate("http://dzen.yandex.ru/");
// wait on browser
$browser->wait_for();
sleep(3);

$anchor->click_by_inner_text('Прямой эфир',true);
$browser->wait_for();

$prefix1="target=\"_blank\">";
$prefix2="<br><br>";

$numenter=0;
$num=0;
while (true)
{  
  $index1=1; $index2=1;
  $wb=$webpage->get_body();

  if (strpos($wb,"<H1>Несуществующая страница</H1>")!=false || strpos($wb,"<H1>Секретный уровень</H1>")!=false)
  { 
    sleep(10);
    // navigate to google
    $browser->navigate("http://dzen.yandex.ru/");
    // wait on browser
    $browser->wait_for();
    sleep(3);

    $anchor->click_by_inner_text('Прямой эфир',true);
    $browser->wait_for();
    if (strpos($wb,"<H1>Несуществующая страница</H1>")!=false)
      $app->quit();
  }
  while (true)
  {
       // получим индексы следующего слова и его данных
       $index1=strpos($wb,$prefix1,$index2+1); 
       if ($index1==false)
         break;
       
       $index2=strpos($wb,$prefix2,$index1+1);    
       if ($index2==false)
         break;       

       // получим данные подсказки
       $res=substr($wb, $index1+strlen($prefix1), $index2-$index1-strlen($prefix1));      
       $pos=strpos($res,"</a>");
       $kwd=substr($res,0,$pos);

       $res=substr($res,$pos+1,strlen($res));
       $pos=strpos($res,")");
       $data=substr($res,5,$pos-5);

       file_add($out_path."yandex_l20_kwd.txt",$kwd."\r\n");
       file_add($out_path."yandex_l20_datas.txt",$kwd."|".$data."\r\n");
       $num++;
  }
  log_event("kw=$num");  

  if ($input->is_exist_with_name('response'))
  {
        sleep(300);
	$connection->hang_up_ras();            
	$rasname="Высокоскоростное подключение";
	$connection->dial_ras($rasname,"xxx","yyy") ;

        $app->restart(__FILE__);
        $app->quit();           

/*    //$browser->clear_cookies("",false);

// navigate to google
//$browser->navigate("http://dzen.yandex.ru/");
// wait on browser
//$browser->wait_for();

//$anchor->click_by_inner_text('Прямой эфир',true);
//$browser->wait_for();

    $captcha=$app->dlg_captcha_from_image_number(1);

  $input->set_value_by_name('response',$captcha);
$button->click_by_number(0);
$numenter++;
echo "capthcas=$numenter<br>";  */
  }
  if (!$anchor->click_by_inner_text('Следующие 20 запросов >',true))
  {
        sleep(1200);
	$connection->hang_up_ras();            
	$rasname="Высокоскоростное подключение";
	$connection->dial_ras($rasname,"xxx","xxx") ;

        $app->restart(__FILE__);
        $app->quit();           
  }
  // wait on browser
  $browser->wait_for();
  sleep(15);
}

// Quit
$app->quit();
?>

Вложения
tools.zip
(3.11 КБ) 211 скачиваний

Ответить