查看原文
其他

戳穿围城面具:安利&劝退一个专业

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:崔赵雯,中南财经政法大学金融学院

本文编辑:赵一帆

技术总编:王子一

Stata&Python云端课程来啦!

为了感谢大家长久以来的支持和信任,爬虫俱乐部为大家送福利啦!!!Stata&Python特惠课程双双上线腾讯课堂~原价2400元的Python编程培训课程,现在仅需100元,详情请查看推文《Python云端课程福利大放送!0基础也能学~》。关于Stata,爬虫俱乐部推出了系列课程,内容包括字符串函数、正则表达式、爬虫专题和文本分析,可以随心搭配,价格美丽,物超所值,更多信息可查看Stata系列推文《与春天有个约会,爬虫俱乐部重磅推出正则表达式网络课程!》《与春天有个约会,爬虫俱乐部重磅推出基本字符串函数网络课程》等。变的是价格,不变的是课程质量和答疑服务。对报名有任何疑问欢迎在公众号后台和腾讯课堂留言哦

SUMMER/导读

    盼望着,盼望着,来自心怡大学的第一份“礼物”,伴随着夏日清风,翩然而至。当拿到心仪大学录取通知书时,相信每一位考生的心情都是难以用语言描述的激动。关于自己所选专业的讨论也在如火如荼地展开,今天,我们一起来康康微博话题讨论里有哪些专业是大家想实名安利&劝退的,一起往下看吧~



01
首先,我们在微博话题里找到#想实名安利的专业##想实名劝退的专业#这两个话题。



02
接着,我们打开开发者工具,找到真实的URL。



03
由于新浪微博中的数据是采用Ajax加载进行显示的,所以我们需要在Headers中加 x-requested-with: XMLHttpRequest信息。


04
通过查看Preview参数,可以发现其最关键的信息是:cards,而其中在mblog的字段中,包含着我们所需的微博话题原文text_raw,在mblog字段中的user字段中,包含着我们所需的用户名称screen_name。



05
最后,就是我们大显身手的时候了。通过对数据的爬取以及对数据的清理,我们把经过处理后的微博话题原文保存到一个文本文件中,形式如下:

我们运用得到的两个文本文件,绘制出词云图,看看有哪些专业被大家广泛赞誉,又有哪些专业被大家疯狂吐槽!

这幅词云图显示的是被大家伙儿安利的专业的词云图,从图中可以看出,“数学”、“法学”、“计算机”、“会计”等是深受大多数网友喜爱的专业。

这幅词云图显示的是大家伙儿想劝退的专业的词云图,从图中可以看出,“数学”、“计算机”、“会计”等是槽点满满的专业。
这就说明哇,深受部分网友喜爱的专业也会受到部分网友的吐槽。这让小编想到了阿甘正传里的一句话人生就是巧克力盒,永远不知道打开会是什么。面对这个话题,作为已经是老腊肉的我,只能说,最重要的就是“认识你自己”!明确自己的目标和追求,找到属于自己的使命。因为,活在这个世界上,你是对自己负责,你的生活应该由你做主,最根本的决定权还是在你手上,而不管你选择什么,都应该是因为你的内心更向往那种生活。

最后,愿所有考生都能找到“心灵的归处”,坚定地奔赴热爱!


以上就是今天的全部内容了,转发本文并回复关键词“安利专业”即可获得相关程序呦~还在等什么,赶快行动吧!
最后,我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。




欢迎大家点赞、转发、评论哦!

对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!

往期推文推荐

        走进图文并茂的攻略世界 

         玩转word文档“大变身”——wordconvert

        数据读入|一文读懂用Stata读入不同类型的数据

        简述递归

         OpenCV库——轻松更换证件照背景色

         800万年薪!还有谁?!

        千古伤心词人,词伤几何?

去哪儿网攻略爬取——跟我一起去大理吧

"有你才有团"——Stata爬取王者荣耀英雄海报

  爬虫实战|嚣张的徽州宴老板娘错在哪?

如何获取衡量股民情绪的指标?|东方财富股吧标题爬虫

利用Python构建马科维茨有效边界

rangestat,让统计量灵活滚动起来!

听说这样做立项成功率更高哦

如何处理缺失值?这一篇搞定!

  善用dataex命令,高效沟通你我他

  用Markdown制作简历,强力助力你的求职季

大数据下的大学分数线排行榜,快来围观!

《觉醒年代》—带你回到百年前

用Stata画的三维图很奇怪怎么办?

如何随机生成满足特定数据特征的新变量?

爬取无法翻页网页——自然科学基金项目及可视化

爬取京东评论数据进行情感分类

Stata与音乐之间的酷炫连接

这些年,爬虫俱乐部走出的博士们!
         看这里,近五年各校高被引论文上榜名单!

高校经管类核心期刊发文排行榜

疯狂的科研创新加速器——Stata!

  可盐可甜,“粽”有所爱,快来pick你最爱的粽子吧!

  好玩有趣的手绘图形库——cutecharts

  爬虫实战|摩尔庄园微博话题讨论


关于我们 


微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存