介绍

QueryList不依赖任何框架和架构,它可以单独使用也可以引入到任意的PHP开发框架中去使用,如:Laravel、ThinkPHP;你可以使用它来构建简单的采集系统,也可以用它才构建高可用的分布式采集系统。它提供了丰富的基于CSS选择器的页面抽取API,完全模块化的设计,拥有强大的可扩展性。

安装

通过Composer安装

composer require jaeger/querylist

采集

use QL\QueryList;
$data = QueryList::get('https://www.zydk8.com/page/1')->find('.list_left');
// 采集ul的每行内容
$tableRows = $data->find('li:gt(0)')->map(function ($row) {
    return [
        'title' => $row->find('.lists_right_title')->texts()->all()[0],
        'time' => $row->find('span')->texts()->all()[0],
        'author' => $row->find('span')->texts()->all()[1],
        'href' => $row->find('a')->attr('href'),
        'cover' => $row->find('img')->attr('src'),
    ];
});
$new_article = $tableRows->all();
print_r($new_article);

结果

QueryList采集框架

最后修改:2020 年 11 月 26 日
如果觉得我的文章对你有用,请随意赞赏