需要抓取的部分已经用红线标出来,
只需要抓取第一页的就可以,
抓取页面:http://www.mafengwo.cn/yj/10206/2-0-1.html
一以前都是用这个类simple_html_dom.php,但是这个我用这个类抓取不出来了
------解决方案--------------------
可以用正則提取。
------解决方案--------------------
不至于吧?
include 'simple_html_dom.php';
$opts = array(
'http'=>array(
'user_agent' => $_SERVER['HTTP_USER_AGENT']
)
);
$context = stream_context_create($opts);
$url = 'http://www.mafengwo.cn/yj/10206/2-0-1.html';
$html = file_get_html($url, false, $context);
$p = $html->find('p.post-list ul');
foreach($p[0]->find('li') as $i=>$item) {
echo $item->find('img')[0]->src, PHP_EOL;
echo trim($item->find('h2')[0]->text()), PHP_EOL;
echo trim($item->find('p')[3]->text()), PHP_EOL;
//echo '**', $item->innertext(), PHP_EOL;
}
友情提示:垃圾评论一律封号 加我微信:826096331拉你进VIP群学习群