Wow~70G上市公司定期报告数据集

栏目: IT技术 · 发布时间: 4年前

70G年报pdf数据集

Wow~70G上市公司定期报告数据集

数据下载说明

所有pdf均来自上海证券交易所官网,使用shreport库进行的下载。

Wow~70G上市公司定期报告数据集

报告信息汇总文件

Wow~70G上市公司定期报告数据集

summary.xlsx内字段

  • company 上市公司企业名

  • code 股票代码

  • type 报告类型

  • year 报告年份

  • date 报告发布日期

  • pdf 报告pdf文件下载链接

import pandas as pd
from pathlib import Path


#报告汇总文件summary.xlsx
df = pd.read_excel('summary.xlsx')
df.head()

Wow~70G上市公司定期报告数据集

一共有报告71126份

len(df)

一共有上市公司1486家

len(df['company'].unique())

summary文件夹

summary文件夹内是每家公司的报告披露情况

Wow~70G上市公司定期报告数据集

df1 = pd.read_excel('summary/600000.xlsx')
df1.head()

Wow~70G上市公司定期报告数据集

浦发银行一共有75份定期报告

len(df1)

reports文件夹

reports文件夹存放着以各各公司股票代码命名的文件夹

文件夹内是该公司所有定期报告

Wow~70G上市公司定期报告数据集

读取pdf报告

可使用pdfdocx库读取pdf,

pdfdocx文档链接 https://github.com/thunderhit/pdfdocx

from pdfdocx import read_pdf

p_text = read_pdf('reports/600000/600000_2012_1.pdf')
p_text

Run

上海浦东发展银行股份有限公司 \n\n2012 年第一季度报告 \n\n \n\n \n\n§1 重要提示 \n\n1.1 公司董事会、监事会及其董事、监事、高级管理人员保证本报告所载资料不存在任何虚假记载、\n\n误导性陈述或者重大遗漏,并对其内容的真实性、准确性和完整性承担个别及连带责任。\n\n1.2 公司于 2012 年 4 月 26 日以通讯表决的方式召开第四届董事会第二十六次会议审议通过本报告,\n\n1.4 公司董事长、行长吉晓辉、财务总监刘信义及财务机构负责人傅能声明:保证本季度报告中财务\n\n公司全体董事出席董事会会议并行使表决权。\n\n1.3 公司第一季度财务报告未经审计。\n\n报告的真实、完整。\n\n \n§2 公司基本情况 \n\n2.1 主要会计数据及财务指标 \n\n本报告期末 \n\n上年度期末 \n\n币种:人民币 \n\n本报告期末比上年\n度期末增减(%) \n\n总资产(千元) \n\n归属于上市公司股东的所有者权益(千元) \n\n2,804,646,567\n\n157,055,724\n\n2,684,693,689 \n148,891,235 \n\n归属于上市公司股东的每股净资产(元) \n\n8.420\n\n7.982 \n\n4.47 \n5.48 \n5.49 \n\n经营活动产生的现金流量净额(千元) \n\n每股经营活动产生的现金流\n\n \n\n \n \n母公司现金流量表 \n \n2012 年 1—3 月 \n \n编制单位: 上海浦东发展银行股份有限公司....

公众号后台回复关键词  70g , 可 获得该数据集

精彩回顾

中文文本分析相关资源汇总

cnsenti中文情绪情感分析库

两行代码读取pdf、docx文件

三行代码计算文本相似性

5个小问题带你理解列表推导式

文本数据清洗之正则表达式

Python网络爬虫与文本数据分析

综述:文本分析在市场营销研究中的应用

LabelStudio多媒体数据标注工具[5星推荐]

如何批量下载上海证券交易所上市公司年报

Loughran&McDonald金融文本情感分析库

如何使用 Python 快速构建领域内情感词典

Python数据分析相关学习资源汇总帖

漂亮~pandas可以无缝衔接Bokeh

YelpDaset: 酒店管理类数据集10+G

看在这么多数据面子上,给我点好看可好❤


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

C陷阱与缺陷

C陷阱与缺陷

凯尼格 / 高巍 / 人民邮电出版社 / 2008-2-1 / 30.00元

作者以自己1985年在Bell实验室时发表的一篇论文为基础,结合自己的工作经验扩展成为这本对C程序员具有珍贵价值的经典著作。写作本书的出发点不是要批判C语言,而是要帮助C程序员绕过编程过程中的陷阱和障碍。.. 全书分为8章,分别从词法分析、语法语义、连接、库函数、预处理器、可移植性缺陷等几个方面分析了C编程中可能遇到的问题。最后,作者用一章的篇幅给出了若干具有实用价值的建议。.. 本书......一起来看看 《C陷阱与缺陷》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

html转js在线工具
html转js在线工具

html转js在线工具