python代理访问网页

admin python 2021年11月30日

2.99W 0 34

使用随机代理访问需要访问的网页 暂时还没解决http协议和https协议问题
import requests
import time
time1 = time.time()
proxypool_url = 'http://129.151.235.55:5555/random'
target_url = 'https://byy3.com'
def get_random_proxy(): """ get random proxy from proxypool :return: proxy """ return requests.get(proxypool_url).text.strip()
def crawl(url, proxy, headers): """ use proxy to crawl page :param url: page url :param proxy: proxy, such as 8.8.8.8:8888 :return: html """ proxies = {'https': 'https://' + proxy} headers = headers return requests.get(url, proxies=proxies).text
def main(): """ main method, entry point :return: none """ headers = { 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8', 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36', } crawl.request_timeout = 15 proxy = get_random_proxy() print('get random proxy', proxy) html = crawl(target_url, proxy,headers) print(html)
if __name__ == '__main__':
     main()

打赏

python代理(2)python代理访问web(1)python代理访问网页(1)python代理采集(1)

本文由泓源视野作者：admin 发表，其版权均为泓源视野所有，文章内容系作者个人观点，不代表泓源视野对观点赞同或支持。如需转载，请注明文章来源。