查看原文
其他

Python大法好:贴吧爬虫大法

2016-10-31 大邓 大邓带你玩python

第一次写封装的脚本,里面不规范的地方很多,class、self还只是学到皮毛,所以写的很渣。本代码只适合初入python世界,想抓点数据的人。脚本链接:

http://pan.baidu.com/s/1i4CLClJ

这个脚本可以实现功能如下:

1、输入贴吧名,即可获得该贴吧的关注数,帖子数,群组数,吧务管理团队等

2、输入用户昵称名,即可获得该用户的吧龄、性别、关注的吧、谁关注了ta、ta关注了谁

具体有哪些功能,先进行如下操作:

将 tieba_spider.py 放到python安装目录中Lib文件夹下的site-packages中 。

新建一个py文件,在第一行输入(查看帮助文档):

调用了tieba_spider中所有的类。不过我建议大家,不要这样写,还是用什么类,写什么

比如,我要用tieba类,想获取王宝强吧的吧主就写如下(含运行结果):


如果想获取用户关系,谁关注了ta


如果想获取用户的具体信息,如性别


还要很多功能,大家自己去尝试吧。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存