CnOpenDataA股上市公司股吧文本数据库,源于东方财富网股吧这一中国最具影响力的股票投资交流社区,系统收录了自1992以来至最新的投资者讨论内容。该数据库涵盖发帖、回帖、用户信息及社交关系等多维度数据,完整记录了中国个人投资者的情绪波动、信息传播与互动行为,是观察A股市场散户情绪、开展文本分析与行为金融研究的权威基础数据资源。
数据独特性:多重版本策略,适配全场景研究需求
- 历史快照版(2022版、2023版)——保存珍贵的早期数据遗产:在早期网站结构下采集并永久保存1992至采集时期的股吧全量数据。例如,2022版在2009年、2015年等年份的发帖量(如1530万条、4977万条)远超后续版本所能回溯获取的数量,这部分数据已成为研究市场早期生态不可复制的珍贵资源。
- 年度滚动更新版——提供最新、字段最全的当前数据:该版本虽对早年历史数据回溯有限,但每年度进行滚动更新,提供自起始年至今连续、完整的数据流,是进行近期事件分析、高频研究进行深度挖掘的首选。
- 历史全量合并版——最完整、跨度最大的终极数据解决方案:通过主键去重技术,纵向融合各历史快照版与滚动更新版,形成 “时间跨度最大、数据总量最全” 的单一数据集。合并后发帖总量达7.78亿条,回帖总量达15.20亿条,实现从1992年至当前的全时段无缝覆盖。
- API实时更新版——直达市场脉搏,支持瞬时决策与研究:提供每日增量的实时数据流,确保研究人员能够捕捉市场对突发新闻、财报、政策的分钟级、小时级讨论与情绪反应,适用于高频交易策略检验、实时舆情监控等对时效性要求极高的前沿领域。
数据完整性:超长时序与海量规模,构建研究坚实基础
- 时间跨度极长:所有版本的数据记录始于1992年,持续覆盖中国股市发展的几乎所有关键周期与重大事件,直至当前最新日期,为跨越数十年的趋势比较、周期分析和政策效应评估提供了可能。
- 数据规模庞大:累计整合发帖近7.8亿条、回帖超15.2亿条,涉及用户超2600万,构成全球范围内规模最大的中文金融社交媒体文本数据库之一,足以支撑复杂的机器学习模型训练与大样本统计分析。
- 年度序列连续:自2006年起,每年均保有至少数十万至上亿条的发帖与回帖记录,无年份数据缺失,保证了时间序列分析的连续性。
潜在应用场景:
- 投资者情绪与市场波动研究:股吧发帖与回帖内容直接反映散户情绪变化,可用于构建投资者情绪指数,分析其与股价、交易量之间的动态关系,为行为金融学提供实证依据。
- 信息传播与市场效率分析:股吧往往是市场传闻、政策解读的“发酵池”,通过文本传播路径与网络结构分析,可研究信息扩散效率、舆情影响力及其对定价过程的影响。
- 公司治理与事件研究:针对上市公司财报发布、并购重组、高管变动等重大事件,可分析股吧讨论热度、情感倾向与市场反应之间的关联,为公司信息披露与投资者关系管理提供参考。
- 用户行为与社会网络研究:结合用户画像、关注关系与互动数据,可深入挖掘投资者社群结构、意见领袖影响力、群体决策行为等,拓展社会学与传播学在金融场景中的应用。
CnOpenData A股股吧文本数据库以其史诗级的时间跨度、海量的数据规模、以及精心设计的多版本体系,重新定义了金融文本数据资源的深度与广度。无论是回溯历史、洞察当下,还是预测未来,本数据库都能为研究者提供最全面、最合适、最可靠的数据支撑,是探索中国资本市场行为逻辑不可或缺的核心资源。
时间区间
截至2025(实时更新)
数据规模


字段展示
样本数据
A股上市公司股吧帖子详情表
A股上市公司股吧回帖详情表
A股上市公司股吧用户详情表
A股上市公司股吧用户粉丝表
参考文献
- 姜富伟、李梦如、孟令超,2024:《金融稳定沟通与银行系统性风险》,《世界经济》,2024第10期。
- 郑建东、吕晓亮、吕斌、郭峰,2022:《社交媒体平台信息交互与资本市场定价效率——基于股吧论坛亿级大数据的证据》,《数量经济技术经济研究》第11期。
- 尹必超、孔东民、季绵绵,2022:《散户积极主义提高上市公司审计质量吗》,《会计研究》第10期。
- 范小云、王业东、王道平、郭文璇、胡煊翊,2022:《不同来源金融文本信息含量的异质性分析——基于混合式文本情绪测度方法》,《管理世界》第10期。
- 朱孟楠、梁裕珩、吴增明,2020:《互联网信息交互网络与股价崩盘风险:舆论监督还是非理性传染》,《中国工业经济》第10期。
- 孙鲲鹏、王丹、肖星,2020:《互联网信息环境整治与社交媒体的公司治理作用》,《管理世界》第7期。
- 王丹、孙鲲鹏、高皓,2020:《社交媒体上“用嘴投票”对管理层自愿性业绩预告的影响》,《金融研究》第11期。
- 部慧、解峥、李佳鸿、吴俊杰,2018:《基于股评的投资者情绪对股票市场的影响》,《管理科学学报》第4期。
- Yuqin Huang, Feng Li, Tong Li, Tse-Chun Lin, 2024, “Local Information Advantage and StockReturns: Evidence from Social Media“. ContemporaryAccounting Research.
- Chang, Yen-Cheng and Hong, Harrison G. and Tiedens, Larissa and Wang, Na and Zhao, Bin, 2015, “Does Diversity Lead to Diverse Opinions? Evidence from Languages and Stock Markets ”, Rock Center for Corporate Governance at Stanford University Working Paper No. 168, Stanford University Graduate School of Business Research Paper No. 13-16.
- Sheridan Titman, Chishen Wei, Bin Zhao, 2021, “Corporate actions and the manipulation of retail investors in China: An analysis of stock splits”, Journal of Financial Economics.
数据更新频率
年度更新
