查看原文
其他

数据集(更新) | 2001-2022年A股上市公司年报&管理层讨论与分析

大邓 大邓和他的Python
2024-09-10

一、数据集介绍

2001-2022年A股年报数据集,含 4 个文件,约 11G。

- 管理层讨论与分析txt.zip
- 年报txt.zip
- A01-22.csv.gz
- mda01-22.csv.gz


注意

  • zip文件夹是原始数据, 解压后内部为 txt 文件。
  • gz文件为汇总数据, 解压后是csv文件。



二、年报数据

2001-2022年, 年报数据

import pandas as pd

anual_report_df = pd.read_csv('A01-22.csv.gz', compression='gzip')
anual_report_df


年报记录数

len(anual_report_df)

Run

55856

上市公司总数

anual_report_df.code.nunique()

Run

5357


三、MD&A数据

2001-2022年MD&A数据

mda_df = pd.read_csv('mda01-22.csv.gz', compression='gzip')
mda_df.head()


len(mda_df)

Run

55439

上市公司总数

mda_df.code.nunique()

Run

5355



四、获取数据

数据集 100 元,加微信 372335839, 备注「姓名-学校-专业」。


五、相关内容




精选内容

LIST | 社科(经管)可用数据集列表
LIST | 文本分析代码列表
LIST | 社科(经管)文本挖掘文献列表
管理科学学报 | 使用「软余弦相似度」测量业绩说明会「答非所问程度」
文献&代码 | 使用Python计算语义品牌评分(Semantic Brand Score)
数据集 | 众筹金融投资平台kiva借贷数据
数据集(更新) | 372w政府采购合同公告明细数据(2024.03)
数据集  | 人民网政府留言板原始文本(2011-2023.12)
数据集  |  人民日报/经济日报/光明日报 等 7 家新闻数据集
可视化 | 人民日报语料反映七十年文化演变
数据集 | 3571万条专利申请数据集(1985-2022年)
数据集 |  专利转让数据集(1985-2021)
数据集 |  3394w条豆瓣书评数据集
数据集 | 豆瓣电影影评数据集
数据集 |  使用1000w条豆瓣影评训练Word2Vec
代码 | 使用 3571w 专利申请数据集构造面板数据
代码 | 使用「新闻数据集」计算 「经济政策不确定性」指数
数据集 | 国省市三级gov工作报告文本
代码 | 使用「新闻数据」生成概念词频「面板数据」
代码 | 使用 3571w 专利申请数据集构造面板数据
代码 | 使用gov工作报告生成数字化词频「面板数据」
cpca库 | 中国省、市区划匹配库
opencc | 中文简体、繁体转换库
可视化 | 使用 DataMapPlot 绘制数据地图
继续滑动看下一个
大邓和他的Python
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存