在第一节演示过如何使用正则表达式截取网页内容。不过html是比正则表达式更高一级的语言,仅仅使用正则表达式来获取内容还是有些困难的。 这次会使用一个新的工具:python的BeautifulSoup库,BeautifulSoup是用来从HT
[阅读更多...]-
Python网络爬虫3 – 使用BeautifulSoup解析网页
-
Python网络爬虫2 – 请求中遇到的几个问题
这次尝试下怎样搜索电影并解析出磁力链接信息。 搜索的网址是:https://www.torrentkitty.tv/search/。 开始了! 使用FireFox打开上面的网址,输入要搜索的电影。在点击搜索按钮前记得打开FireBug,并激
[阅读更多...]