介绍
QueryList不依赖任何框架和架构,它可以单独使用也可以引入到任意的PHP开发框架中去使用,如:Laravel、ThinkPHP;你可以使用它来构建简单的采集系统,也可以用它才构建高可用的分布式采集系统。它提供了丰富的基于CSS选择器的页面抽取API,完全模块化的设计,拥有强大的可扩展性。
安装
通过Composer安装
composer require jaeger/querylist
采集
use QL\QueryList;
$data = QueryList::get('https://www.zydk8.com/page/1')->find('.list_left');
// 采集ul的每行内容
$tableRows = $data->find('li:gt(0)')->map(function ($row) {
return [
'title' => $row->find('.lists_right_title')->texts()->all()[0],
'time' => $row->find('span')->texts()->all()[0],
'author' => $row->find('span')->texts()->all()[1],
'href' => $row->find('a')->attr('href'),
'cover' => $row->find('img')->attr('src'),
];
});
$new_article = $tableRows->all();
print_r($new_article);