01、解析和提取 HTML
此将帮助你从网页 URL 中提取 HTML,然后还为你提供可用于解析 HTML 以获取数据的功能。这个很棒的脚本对于网络爬虫和那些想要解析 HTML 以获取重要数据的人来说是一种很好的享受。
# Parse and Extract HTML
# pip install gazpacho
import gazpacho
# Extract HTML from URL
url = ''
html = gazpacho.get(url)
print(html)
# Extract HTML with Headers
headers = {'User-Agent': 'Mozilla/5.0'}
html = gazpacho.get(url, headers=headers)
print(html)
# Parse HTML
parse = gazpacho.Soup(html)
# Find single tags
tag1 = parse.find('h1')
tag2 = parse.find('span')
# Find multiple tags
tags1 = parse.find_all('p')
tags2 = parse.find_all('a')
# Find tags by class
tag = parse.find('.class')
# Find tags by Attribute
tag = parse.find("div", attrs={"class": "test"})
# Extract text from tags
text = parse.find('h1').text
text = parse.find_all('p')[0].text
02、扫描仪
拥有大量图像或只想扫描图像,那么此将帮助你。该脚本使用 Qrtools 模块,使你能够以编程方式扫描 QR 图像。
# Qrcode Scanner
# pip install qrtools
from qrtools import Qr
def Scan_Qr(qr_img):
qr = Qr()
qr.decode(qr_img)
print(qr.data)
return qr.data
print("Your Qr Code is: ", Scan_Qr("qr.png"))
服务器租用托管,机房租用托管,主机租用托管,https://www.e1idc.com