Очистите результаты встроенного видео DuckDuckGo с помощью Python
Содержание: вступление, импорт, что будет очищено, процесс, код, ссылки.
вступление
Это сообщение в блоге является продолжением серии веб-скрапинга DuckDuckGo. Здесь вы увидите, как очистить результаты встроенного видео с помощью Python с библиотекой selenium
. Будет показано альтернативное решение API.
Примечание. Предполагается, что вы знакомы с selenium
библиотекой.
Импорт
from selenium import webdriver import re, urllib.parse
Что будет очищено
Процесс
Если вы читали мой предыдущий пост о парсинге результатов органических новостей DuckDuckGo, то этот процесс вам будет очень знаком.
Выбор CSS
селекторов для контейнера, заголовка, ссылки, источника, даты публикации, количества просмотров, продолжительности видео.
Код
Использование API встроенных видео DuckDuckGo
SerpApi - это платный API с бесплатным тарифным планом.
Главное, что нужно сделать, - это перебрать структурированную строку JSON
и применить ее к своим потребностям, а не кодировать все с нуля и выяснять, как решать проблемы в процессе.
Ссылки
Github Gist • API встроенных видео DuckDuckGo
Outro
Если вы обнаружили, что что-то не работает, или если вы хотите узнать, как очистить то, о чем я еще не писал, напишите мне сообщение.
Ваш,
- D
Первоначально опубликовано на https://serpapi.com 18 августа 2021 г.
Больше контента на plainenglish.io