Proxy

A tiny tool for crawling, assessing, storing some useful proxies.中文版

Construct your ip pool

First make sure mysql has been installed in your machine, and modify db connection information in config.py.

# crawl, assess and store proxies
python ip_pool.py

# assess proxies quality in db periodically.
python assess_quality.py

Demo on how to use these proxies.

Please first construct your ip pool.

Crawl github homepage data:

# visit database to get all proxies
ip_list = []
try:
    cursor.execute('SELECT content FROM %s' % cfg.TABLE_NAME)
    result = cursor.fetchall()
    for i in result:
        ip_list.append(i[0])
except Exception as e:
    print e
finally:
    cursor.close()
    conn.close()

# use this proxies to crawl website
for i in ip_list:
    proxy = {'http': 'http://'+i}
    url = "https://www.github.com/"
    r = requests.get(url, proxies=proxy, timeout=4)
    print r.text

More detail in crawl_demo.py。

Contact

myfancoo@qq.com

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
images		images
README.MD		README.MD
README.zh-cn.md		README.zh-cn.md
assess_logger.log		assess_logger.log
assess_quality.py		assess_quality.py
config.py		config.py
crawl_demo.py		crawl_demo.py
ip_pool.py		ip_pool.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Proxy

Construct your ip pool

Demo on how to use these proxies.

Contact

About

Releases

Packages

Languages

recursively/Proxy

Folders and files

Latest commit

History

Repository files navigation

Proxy

Construct your ip pool

Demo on how to use these proxies.

Contact

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages