Очистить от Craigslist

Я новичок в Python и только начал узнавать о парсинге и библиотеке pandas. Вот небольшой скребок, который я написал. Я хотел бы знать, как будет выглядеть профессиональный код для этого. Я чувствую, что в моем коде много избыточности, но я не знаю, что можно улучшить.

import pandas as pd
from bs4 import BeautifulSoup as bs

import requests


url="https://vancouver.craigslist.org/d/baby-kid-stuff/search/baa"
html_file = requests.get(url)
soup = bs(html_file.text, 'lxml')
#print(soup.prettify())
postings = soup.find_all('li', class_ = 'result-row')

locations = list()
prices = list()
names = list()

for posting in postings:
    location = posting.find('span', class_ = 'result-hood').text
    price = posting.find('span', class_ = 'result-price').text
    name = posting.find('h3', class_= 'result-heading').text.strip()
    locations.append(location)
    prices.append(price)
    names.append(name)

list_of_tuples = list(zip(locations,prices,names))
df = pd.DataFrame(list_of_tuples, columns= ['locations', 'prices', 'names'])
print(df)

0

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *