4.pycharm添加第三方库

4.pycharm添加第三方库

网络爬虫的第一步就是根据URL,获取网页的HTML信息。在Python3中,可以使用urllib.request和requests进行网页爬取。

(1)准备所需库

我们需要准备一款名为BeautifulSoup(网页解析)的开源库,用于对下载的网页进行解析,我们是用的是PyCharm编译环境所以可以直接下载该开源库。

urllib库是python内置的,无需我们额外安装,只要安装了Python就可以使用这个库。requests库是第三方库,需要我们自己安装。

第三方库安装步骤如下:

选择File->Settings

打开Project:PythonProject下的Project interpreter

点击加号添加新的库

输入bs4选择bs4点击Install Packge进行下载

小知识:requests库的github地址:https://github.com/requests/requests

步骤如下:

在cmd中,使用如下指令安装requests:

pip install requests

或者:

easy_install requests

requests常用方法

官方中文教程地址:

http://docs.python-requests.org/zh_CN/latest/user/quickstart.html

相关推荐

新版微博收藏在哪里(微博中收藏在哪里)
365bet提现多久到账

新版微博收藏在哪里(微博中收藏在哪里)

📅 07-03 👁️ 7582
芝麻分最低是多少?揭开信用评分背后的秘密
365体育投注怎么玩

芝麻分最低是多少?揭开信用评分背后的秘密

📅 07-09 👁️ 1161
老烟民才知道!香烟这些冷门别称,原来这么有意思
365体育投注怎么玩

老烟民才知道!香烟这些冷门别称,原来这么有意思

📅 07-20 👁️ 2810