中国工业企业数据

中国工业企业绿色专利及引用被引用数据NEW

   国家统计局构建了1998-2013年所有规模以上工业企业的数据,包括全部国有企业和年主营业务收入500 万元及以上的非国有工业企业。可以说,这些企业是中国经济中最重要的一群企业。然而,目前利用专利数据研究公司创新活动的论文主要集中在上市公司层面,而忽视了工业企业这一较大规模的企业的专利信息,这可能是因为中国工业企业数据库中大量不完全统一的企业名称导致的。

   为此,CnOpenData团队参考科学的数据匹配与处理方法(寇宗来、刘学悦:《中国企业的专利行为:特征事实以及来自创新政策的影响》,《经济研究》,2020年第3期)将中国工业企业与中国专利创新数据进行了细致匹配,形成了中国工业企业专利及引用被引用数据库。本数据匹配时主要依据企业名称来完成数据处理,即⼯业企业的企业名称与专利数据中的专利权⼈(专利公布则为申请⼈)之间进⾏匹配。为了最⼤化数据可⽤范围,减少数据中存在的噪音,CnOpenData团队同时对⼯业企业和专利数据中的公司名称进行了加工处理。我们考虑到股份有限公司、有限责任公司、集团公司等的不同,在匹配工作进行前删去“集团”、“有限责任公司” 、“股份有限公司” , “有限公司”、“加⼯⼚ ”、“ ⼯⼚”、“⼚”、 “省 ”、“市”、“ 县” 、“州”、“镇”、“乡”、“村”等字样,通过上述匹配过程可以获得更准确的匹配结果。此外,由于本团队持有数据量的优势,本数据的匹配数据量相较于参考文献更多。

   需要注意的是,虽然中国工业企业数据本身截止到2013年,但我们仍然选择将中国工业企业数据与截止到2023年的所有专利数据进行了匹配,这主要是因为专利的被引数据存在一定的滞后性,匹配到较新的年度可以保证专利被引数据相对完整。

  在结构上,本数据分为专利数量申请表、专利质量申请表、专利详情表。专利数量统计表和质量统计表,分别以专利申请和专利授权为依据再进行划分,专利质量统计表还按专利类型细分为发明、实用新型、外观设计三个模块。专利引用及被引信息体现于专利详情表部分,分为发明申请、发明授权、实用新型、外观设计四个模块,各模块包含基础信息表、引用表、被引用表、事务表四张表格(需要注意的是,外观设计无引用表)。


时间区间

  • 发明公布按照申请公布日统计:1985-2023年
  • 发明授权/实用新型/外观设计按照授权公布日统计:1985-2023年

字段展示

工业企业专利数量统计表

工业企业专利质量统计表

工业企业专利详情表


数据结构展示

工业企业专利文本数据工业企业专利详情表发明公布基本信息表专利引用表专利被引用表事务表发明授权基本信息表专利引用表专利被引用表事务表实用新型基本信息表专利引用表专利被引用表事务表外观设计基本信息表专利被引用表事务表工业企业专利质量统计表专利申请发明/实用新型/外观设计专利授权发明/实用新型/外观设计工业企业专利数量统计表专利申请专利授权中国工业企业专利引用及被引用数据

样本数据

因表格众多,本页仅做专利申请数量/发明专利申请质量/发明申请专利详情展示,其他版块详见左侧各模块分支页面进行查看。

工业企业专利申请数量统计表

工业企业专利申请质量统计表

工业企业发明申请专利基础信息表

中国工业企业发明申请专利引用表

中国工业企业发明申请专利被引用表

中国工业企业发明申请专利事务表


参考文献

  • 寇宗来、刘学悦:《中国企业的专利行为:特征事实以及来自创新政策的影响》,《经济研究》,2020年第3期。
  • 聂辉华、江艇、杨汝岱:《中国工业企业数据库的使用现状和潜在问题》,《世界经济》,2012年第5期。
  • Josh L , Amit S . The Use and Misuse of Patent Data: Issues for Finance and Beyond[J]. The Review of Financial Studies, 2021(6):6.

数据更新频率

年度更新