Curl_setopt_array

Все методы, которые есть в jQuery, должны присутствовать и в этой библиотеке. Это удобно, поскольку вы можете легко перемещаться по DOM-дереву html-документа и с легкостью находить нужные вам элементы. Первое, что нам нужно сделать, это получить html-содержимое нужной страницы сайта для парсинга. Существует несколько способов сделать это. Можно также получить содержимое сайта с помощью сокета pfsockopen, но проще использовать библиотеку php CURL, если она установлена на вашем сервере.

Сейчас я покажу вам, как получить содержимое страницы сайта с помощью библиотеки CURL. Поэкспериментируйте с этими вариантами, если без них у вас ничего не получится. Итак, что делать, если http-страница получена через CURL или каким-то другим способом? Пришло время использовать phpQuery для разбора результата. Скачать библиотеку можно здесь. Чтобы увидеть полный набор функций phpQuery, вам нужно обратиться к документации по jQuery.

Главной фишкой phpQuery, как и jQuery, является использование css-селекторов, это во много раз упрощает процедуру парсинга необходимых элементов страницы. Ознакомиться с методами и селекторами jQuery можно здесь. Конечно, существуют и другие способы парсинга страницы, полученной с помощью php curl, но парсинг с помощью phpQuery для меня является наиболее удобным и эффективным.


Навигация

Comments