四知|大师杯数据联赛(第四期)数据亮剑,拔新领异:上海高新技术企业数据竞赛通知
为提高当今社会的数据素养和数据意识,提升公众的数据技能水平,以及为数据驱动方式下的人文社科研究提供实操和交流机会,华东师范大学人文与社会科学研究院举办开放数据竞赛四知|大师杯数据联赛,以数据为核心,结合当下热门话题设置丰富的研究议题,鼓励高校师生及社会人士以团队或个人形式参赛,利用各种技术和工具,对数据集进行深入分析和创新应用。
数据亮剑,拔新领异:上海高新技术企业数据竞赛是四知|大师杯数据联赛的第四期竞赛。本期竞赛围绕上海高新技术企业研究数据,设置多个热门议题,鼓励参赛者自选或针对预设议题进行数据的深入分析和研究,以期在企业画像、企业风险控制、企业舆情应对等问题领域有创新突破。
本期竞赛的上海高新技术企业研究数据为“2000-2021年上海高新技术企业数据集”。该数据集包含了2000-2021年间上海近八千家高新技术企业的企业工商注册、股东、分支机构、主要人员、对外投资、控股企业、变更记录、企业年报、上市、软著、专利、商标、网站、品牌、裁判文书、违法记录、失信记录、经营异常记录、股权冻结、行政处罚、知识产权出质、融资、竞品、项目、行政许可和新闻资讯等信息,共有数据记录1650755条,可为上海高新技术企业的发展概况、研发趋势和经营风险等研究提供数据支撑。
一、赛事组织机制
主办方:华东师范大学人文与社会科学研究院
承办方:华东师范大学调查与数据中心、华东师范大学上海国际首席技术官学院、和鲸科技(上海和今信息科技有限公司)
协办方:江苏省数据工程与知识服务重点实验室、长三角产教融合协同创新中心、上海市高等院校海外交流联谊会/上海市海峡两岸教育交流促进会新文科专委会
学术支持:《科技情报研究》、《农业图书情报》、《情报科学》、《情报理论与实践》、《情报学报》、《情报资料工作》、《数字图书馆论坛》、《图书馆论坛》、《图书馆杂志》、《图书情报知识》、《图书与情报》、《现代情报》(排名不分先后,按首字母拼音顺序排序)
组委会:负责竞赛的整体策划、组织与协调,包括何佳讯(华东师范大学)、邓三鸿(南京大学)、范向伟(和鲸科技)、许鑫(华东师范大学)
秘书处:负责竞赛执行过程中的事务性工作,包括邓璐芗(华东师范大学)、代立扬(华东师范大学)、夏茸昱(华东师范大学)、彭玉鑫(华东师范大学上海国际首席技术官学院)、顾伟耀(和鲸科技)、岳鹏飞(和鲸科技)、梁玉(和鲸科技)
二、赛事介绍
(一)赛题设置
本次竞赛选手可自设研究题目,也可参考如下选题。参考选题如下:
(1)上海高新技术企业研发趋势分析
利用专利信息、软件著作信息、企业年报等数据:
描绘上海高新技术企业研发重点的变化情况
探索上海高新技术企业研发趋势变化的原因
量化分析上海高新技术企业的研发实力和竞争优势
量化揭示上海不同领域高新技术企业的竞争格局
预测上海高新技术企业的潜在上市可能
(2)上海高新技术企业疫情期间生产运作管理分析
结合COVID-19疫情期间各领域数据等内外部数据:
挖掘分析疫情导致的供应链中断对上海高新技术企业生产运作产生的影响及对策
探索分析疫情期间上海高新技术企业复工复产的策略方向
量化分析疫情期间上海高新技术企业在科技研发投入上的变化趋势及改进策略
量化评估疫情期间政府出台的政策对高新技术企业的支撑作用
(3)上海重点产业集群趋势分析(以生物制药为例)
利用信息披露、产业发展白皮书、产业发展蓝皮书、专利信息、企业年报等内外部数据:
分析上海市生物医药产业规模的变化情况
凝练上海市生物医药产业重点领域的分布及动态变化趋势
挖掘近年来上海生物制药产业蓬勃发展的底层驱动力
分析上海生物制药产业集群发展的竞争优势和面临的挑战
量化预测未来3-5年上海生物制药产业中具有较大上市可能的公司
(4)高新技术企业风险评估与预测
利用裁判文书、违法记录、失信记录、经营异常记录、股权冻结、行政处罚等内外部数据:
挖掘高新技术企业在不同阶段存在的风险
探索影响高新技术企业风险的因素
预测高新技术企业未来遭遇风险的类型与可能性
分析高新技术企业的风险应对措施与策略
(二)赛事时间安排
赛事重要时间节点:
日期 |
阶段 |
备注 |
4月25日-6月6日 |
报名 |
6月6日后 报名窗口关闭 |
5月6日-6月6日 |
竞赛 |
6月6日后 比赛窗口关闭 |
5月20日-5月25日 |
赛中评审 |
5月25日后 不再反馈评审意见 |
5月6日-6月6日 |
提交 |
6月6日后 提交窗口关闭 |
6月7日-6月8日 |
初审 |
- |
6月9日-6月15日 |
正式评审 |
- |
6月17日 |
结果发布 |
- |
注意:提交截止日期与报名截止日期相同(均为6月6日)。
(三)参赛对象及参赛方法
高校师生和社会人士均可参赛,选手可以团队或个人的形式报名参赛,对团队规模没有限制。
选手在四知:研究数据众智平台上进行报名注册(文后有报名链接及二维码)、设置赛题、开展分析和研究,并在规定期限内于指定位置提交作品。
(四)赛制安排
选手报名后需自行设计研究题目或参考建议赛题选定研究题目,可基于大赛提供的数据集进行数据分析与研究,也可引入其他数据与大赛数据集结合开展数据分析与研究,进而完成竞赛作品。
作品强调学术研究导向,选题有新意,提出具有学术探讨价值的问题;研究设计严密,研究方法可靠、数据处理方式恰当、分析论证合乎逻辑;研究结论科学合理有创新性,总结出新经验、提出新观点和新思路、提出新对策。
作品形式为Notebook和研究论文。
评委依据评审规则对作品进行打分,按照得分排名筛选相应奖项的获奖作品。
(五)数据
本次竞赛详细数据仅开放给参赛选手。提前了解数据集的情况,请参见:代立扬,邓璐芗,姚占雷,富寅捷,许鑫.2000—2021年上海高新技术企业数据集[J].科技情报研究,2022,4(02):9094.DOI:10.19809/j.cnki.kjqbyj.2022.02.008.
报名参赛后可在 四知:研究数据众智平台 的 工作台 > 数据源 > 上海高新技术企业数据竞赛数据 位置获取到数据集。
数据论文引用格式:代立扬,邓璐芗,姚占雷,等.2000—2021年上海高新技术企业数据集[J].科技情报研究,2022,4(02):90-94.
数据集引用格式:华东师范大学调查与数据中心.上海高新技术企业数据[EB/OL].华东师范大学调查与数据中心,(2021-07-23)[访问日期].dx.doi.org/10.12251/785ec432.1627046109753.
注意:
参赛团队或个人可完全基于大赛提供的数据展开分析和研究,也可使用大赛数据结合其他外部数据,完成竞赛作品。使用大赛数据以外的数据,选手应自行负责该数据的权属、合法性、正确性问题,任何因使用、引用外部数据导致的权属、合法性和正确性问题,均由选手个人承担。
(六)评审规则
评审专家依据如下评分项和权重对参赛团队或个人选手提交的作品进行打分评价。
评审维度 |
评分细项 |
权重 |
研究选题 |
选题有新意 |
15% |
研究问题有学术价值 |
||
研究设计 |
研究方案设计严密 |
25% |
数据处理及分析方法恰当 |
||
论证过程 |
数据处理及分析过程详实清晰可验证 |
30% |
数据可视化分析有效辅助论证过程 |
||
研究结论 |
提出新观点和新思路 |
25% |
总结出新经验、提出新对策 |
||
所有结论均有科学的论证过程支撑 |
||
文档内容 |
对数据集及数据论文的引用有明确标识 |
5% |
参考文献等引用内容的标识明确规范 |
||
行文流畅规范 |
||
总 计 |
100% |
(七)奖项设置
本次竞赛共设置4个奖项,奖金共计15000元,均会颁发荣誉证书。
奖项 |
数量 |
奖金*(元/项) |
一等奖 |
1 |
5000+竞赛官方认证证书 |
二等奖 |
2 |
3000+竞赛官方认证证书 |
三等奖 |
4 |
1000+竞赛官方认证证书 |
优秀奖 |
10 |
竞赛官方认证证书 |
*奖金含税,纳税义务由获奖者承担。
按照各作品评分高低进行排序,从高到低,依次指定一、二、三等奖及优秀奖。获奖优秀作品可推荐发表。
(八)报名
请访问如下链接:
https://www.heywhale.com/u/815fd5
或扫描二维码:
了解更多,请关注如下公众号
华东师范大学
人文与社会科学研究院
华东师范大学
调查与数据中心
华东师范大学
上海国际首席技术官学院
(文章转载自数据大狮)