Я новичок в питоне. Я начал делать скрипт для обработки файлов HTML с помощью Beautiful Soup
. Все обрабатывается правильно, но теперь я хотел бы сохранить статью в новую папку с именем nowe
, а не печатать ее. Мне нужно поместить все статьи в одну папку после обработки или сделать один файл CSV.
from bs4 import BeautifulSoup
import glob
import os, os.path
path = '/home/darek/Dokumenty/pliki/'
path_out = '/home/darek/Dokumenty/pliki/nowe'
for filename in glob.glob(os.path.join(path, '*.html',)):
f = filename
tresc = open(f)
soup = BeautifulSoup(tresc, 'html.parser')
article = soup.find('div',class_='post')
tagi = soup.find('div', class_='ph_social_share_box ph_social_share_box_bottom')
fout = open( +filename, "w")
fout.close()
print(article)
Мой журнал ошибок:
File "/home/darek/Dokumenty/parser.py", line 21, in <module>
fout = open( +filename, "w")
TypeError: bad operand type for unary +: 'str'
Это работает для печати
из bs4 import BeautifulSoup import glob import os, os.path
path = '/home/darek/Dokumenty/pliki/'
path_out = '/home/darek/Dokumenty/pliki/nowe'
for filename in glob.glob(os.path.join(path, '*.html',)):
f = filename
content = open(f)
soup = BeautifulSoup(content, 'html.parser')
article = soup.find('div',class_='post')
tags = soup.find('div', class_='ph_social_share_box ph_social_share_box_bottom')
print(article)
Это работает, я не могу записать в файл идею?