Очистите результаты встроенного видео DuckDuckGo с помощью Python

Содержание: вступление, импорт, что будет очищено, процесс, код, ссылки.

вступление

Это сообщение в блоге является продолжением серии веб-скрапинга DuckDuckGo. Здесь вы увидите, как очистить результаты встроенного видео с помощью Python с библиотекой selenium. Будет показано альтернативное решение API.

Примечание. Предполагается, что вы знакомы с selenium библиотекой.

Импорт

from selenium import webdriver import re, urllib.parse

Что будет очищено

Процесс

Если вы читали мой предыдущий пост о парсинге результатов органических новостей DuckDuckGo, то этот процесс вам будет очень знаком.

Выбор CSS селекторов для контейнера, заголовка, ссылки, источника, даты публикации, количества просмотров, продолжительности видео.

Код

Использование API встроенных видео DuckDuckGo

SerpApi - это платный API с бесплатным тарифным планом.

Главное, что нужно сделать, - это перебрать структурированную строку JSON и применить ее к своим потребностям, а не кодировать все с нуля и выяснять, как решать проблемы в процессе.

Ссылки

Github GistAPI встроенных видео DuckDuckGo

Outro

Если вы обнаружили, что что-то не работает, или если вы хотите узнать, как очистить то, о чем я еще не писал, напишите мне сообщение.

Ваш,

- D

Первоначально опубликовано на https://serpapi.com 18 августа 2021 г.

Больше контента на plainenglish.io