查看原文
其他

BvD数据库介绍之Osiris

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:张馨月

文字编辑:朱巧利

技术总编:李朋冲


爬虫俱乐部将于2020年1月5日至11日湖北武汉举行为期一周的Stata编程技术定制培训,此次采取初级班和高级班分批次培训。课程通过案例教学模式,旨在帮助大家在短期内掌握Stata软件编程、金融计量知识和实证分析方法,使大家熟悉Stata核心的爬虫技术,以及Stata与其他软件交互的高端技术。目前正在火热招生中~详细培训大纲及报名方式,请点击《爬虫俱乐部2020第一期Stata编程训练营开始报名啦!》或点击文末阅读原文呦~



在之前关于BvD数据库的介绍中,我们分享了用BankFocus 获取银行数据的方法,详见推文《10分钟带你走进宝藏数据库BvD》。如果大家需要全球上市公司的数据,一定不要错过今天的介绍——Osiris 。这个数据库涵盖了超过80,000家上市公司的数据,下面我们就来具体看看它有哪些功能吧~

Osiris的使用方法以及提供的信息种类与Bank Focus 基本一致,今天我们仍将从以下四个方面介绍:
1.设立筛选条件
2.批量显示符合条件的上市公司
3.查看单个公司的报告
4.统计分析

 

1.设立筛选条件

由于Osiris数据库所包含的公司数目非常多,在初始界面中,我们可以看到非常丰富的筛选条件,以帮助我们挑选出需要的公司样本。
这里我们以筛选“2000年之后在上海设立,良好经营且总收入排名在top25的信息技术类公司”为例进行介绍。
首先,在“公司状态”中选择“运营”:



接下来,在“注册日期”中设定范围:



在“所属区域”“所属城市”中输入“SHANGHAI”(须是英文)。页面上端的“Address of information”表示注册地,“Trading address”表示经营地,在设置时要注意区分。

 


在“所属行业”“GICS分类”中选择“INFORMATION TECHNOLOGY”。

我们可以看到Osiris中提供了四类行业选择方式:除了“GICS分类”,在“文本检索”中可以通过输入关键字筛选;在“行业大类”中分为“银行业、保险业、工业”;在“行业分类代码”中也提供了欧洲、北美、美国的三种行业分类代码。



最后,点击“财务数据”“Key financials&Employees”进入如下界面,选择变量、单位、时间并将搜索范围定在“top 25”:



经过上面的五层筛选,就可以得到我们的目标公司啦。前五行显示的数字是指在所有公司中满足该条件的总数目;“最终结果”显示的是经布尔运算满足所有条件的公司。



另外,点击“保存”,就可以把上述筛选条件保存下来。下次使用时,在界面上方“保存的检索条件”即可找到。

 

2.批量显示符合条件的上市公司

点击“查看检索结果”,可以得到所有符合条件公司的列表:



在界面右上方,Osiris 也为我们提供了“保存”、“导出”等常用功能。

若想要增减某项指标,点击“列变量”,进入如下界面:



你可以在“备选项目”中选择要增加的指标,并把不需要的从“已选项目”删掉。使用方法同Bank Focus相同,这里不做赘述。

 

3.查看单个公司的报告

我们点击公司名称的超链接,可以进入该公司的报告页面。

主界面显示的是标准报告,包括公司的各项基本信息。通过右边的索引栏,可以选择其他报告格式或进入其他章节。



这里我们以点击“财务数据”为例。
在“财务数据”中,Osiris为我们提出了多种模板,用户可以根据自己的需要来进行选择。比如与“全球通用模板”相比,“全球详细财务模板”对会计科目的划分更为精确。
同时,若使用过程中不清楚某个指标的含义,单击该指标,就可以得到它的计算方法。


若数据库中没有我们想要的指标,可以点击索引栏中的“用户自定义指标”,进入如下界面,通过对各项指标并进行加减乘除运算,得到最终需要的指标:



除了数据化的结果,在索引栏的最后一行,我们还可以选择以图表格式展现,大家可以动手了解一下~



4.统计分析
通常我们在批量检索完成后,会将数据导入到工作簿中做一系列分析工作。但其实在数据库本身中,已经设计了一些非常人性化的快速分析工具。
返回检索列表,能在右侧看到六个“分析选项”。我们可以点击“新的分析”来自定义所选字段,也可以使用“预定义”中的默认字段,这里,我们都以默认字段为例。



1)数据透视

数据透视可以从两个维度对数据进行分析,类似于Excel中的数据透视表。比如我们选择“按(行业/收入规模)透视”,就可以得到该组样本在不同收入范围的数目。



2)同业分析

同业分析可以对样本公司按各项指标进行横向比较。

我们以关键财务指标为例,得到如下结果。在表格的前三行显示了所有公司各指标的中值、标准差和均值。同时,可以看到第一家公司的总资产、股东权益、总收入都位列第一,但净利润排在第二位。



3)合并分析

合并分析把所有公司看作一个整体,计算该整体各年度的指标和,并以表格和图表的格式呈现。



4)统计分布

统计分布会根据某个指标对样本进行排序并计算分位数。比如我们按照总收入分类,就能得到各家公司总收入从高到低的排序结果以及总收入的四分位数、十分位数。



(5)集中度分析
集中度分析可以展示单一企业在市场的整体份额,以比较不同企业的相对规模,测量整个市场结构。


(6)线性回归
线性回归可以从每家公司中选择两项指标来分析其内在联系,为我们提供回归图表、方程及相关系数等信息。



今天的介绍就到这里,下一篇BvD推文里我们将介绍另一个涵盖公司数据的子库——Oriana,敬请期待吧~

对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!
往期推文推荐

        来!左边跟我一起画个龙在你右边画一道彩虹~

Selenium登录豆瓣
妙用正则表达式--Python中的re模块(二)
cngcode和cnaddress新鲜出炉!
数据可视化之地理图   
“气功”研究哪家强
数据长、宽整型之另辟蹊径

10分钟带你走进宝藏数据库BvD

实战演练——爱婴医院中莆田系医院数据分析(二)

实战演练——爱婴医院中莆田系医院数据分析(一)

给你一个贴心的reshape应用

asrol命令——让你的描述性统计信息滚动起来

Python带你看文献—xpath抓取知网文献

您有一份天气预报待签收 

听说会Stata的人,数学不会太差?

批量修改路径

妙用正则表达式--Python中的re模块


关于我们

微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存