赛事介绍
广东省政务服务数据管理局指导,珠海市政务服务数据管理局和珠海市横琴新区管理委员会共同主办,珠海数据开放创新应用大赛以“数聚珠海﹒数智未来”为主题,重点面向高等院校、科研单位、互联网企业和创客团队,征集基于开放数据的创新应用解决方案和算法模型,大力推进珠海数字政府建设,促进数字经济发展,推动数据要素市场化配置,释放数据能量和激发社会创新活力,形成高效的城市治理方案,推动大湾区数据跨区域流动和高水平互通。
本次大赛共设立创新应用赛、横琴专题赛、算法专题赛和场景专题赛四个赛道。结合政务服务、城市交通、生态环保、医疗健康、旅游、社会治理等热门话题,充分运用珠海市民生数据开放平台提供的各类数据,征集优秀创新应用和创意。
赛题数据
赛题说明
(一)创新应用赛
(1)赛道说明:
参赛选手可自由选择推荐主题或自选主题;选手需围绕主题方向,主动发现问题,选定切入角度,深入分析本次大赛专用数据集,充分利用珠海市民生数据开发平台数据,选手亦可自筹数据(但需说明来源),设计创意解决方案。
大赛提供政务服务、医疗健康、城市发展、交通出行、环境治理、社会治理和数据资源管理共7个推荐主题。
(2)赛题方向:
1.政务服务:围绕政务服务、“互联网+监管”等展开大数据政府服务创新应用,结合大赛数据集以及珠海市民生数据开发平台数据(选手亦可自筹数据,但需说明来源),形成体现大数据发展理念或基于大数据技术实现、能够解决政务服务各领域实际问题的创新理念或优秀案例。
2.医疗健康:包括数据战疫(涉及疫情演变、疫情防控、疫情影响、复工复产等方面)、养老服务(涉及医养结合、资源匹配、医疗保险等方面)、智慧医疗(涉及医疗健康信息管理、辅助诊断、诈骗识别等方面)以及其他医疗健康方向的问题治理和创新应用。
3.城市发展:围绕珠海市的发展近况,从人口、经济、房产、教育、环境等层面,选择单一角度深入剖析或多角度综合分析城市发展状况、预测城市发展态势、评价城市吸引力和核心竞争力。
4.交通出行:从城市交通出行诱导、航旅特征、绿色出行、公交优化、事故影响、周边城市的客流交互等角度,从城市需求和实际问题出发,提出创新性解决方案。
5.环境治理:就垃圾污染、噪音污染等环境问题提出治理方案,也可以就沿海地区各类自然灾害,提出科技防灾创新方案。
6.社会治理:选手需挖掘各类社会问题并提出针对性解决方案,比如分析共享经济长生的环境与原因、网格化社会治理信息采集和职能实现等。
7.公共数据资源管理:选手需基于公共数据资源全生命周期管理,结合本次大赛的开放数据和自身数据治理经验,立足于支撑未来数字政府的建设,推动数字经济的发展,阐述数据治理最佳实践方案和可行实施路径,并分享成功案例。
(3)比赛流程:
初赛:
作品提交要求
初赛创意方案以简报(PPT)形式呈现,以PDF格式提交,所有素材包括但不限于文字、图片、视频、网站等均需为中文。
注:每支参赛团队仅能提交一个参赛作品;每个作品仅能选定一个赛题。
为了便于评委了解创意方案,提交创意方案时请参考以下格式:
1.作品摘要:对作品做整体介绍;
2.问题需求:描述作品适用的应用场景,清楚说明所解决的问题和受众;
3.数据使用:清楚列举拟使用到的比赛专用数据、开放平台数据、自带数据,并初步说明数据的整合应用方案
4.解决方案:针对问题需求,初步说明技术解决方案;
5.应用成果:说明作品的预期应用成果;
6.价值导向:说明作品的潜在商业价值和社会价值。
评审标准:
作品所体现的问题分析能力、技术含量、创新型、市场性、商业性以及对开放大赛数据的利用程度。
决赛:
进入决赛的参赛队伍参赛者获取更多数据后,需对方案进行优化,设计产品原型,制作在决赛现场发布的方案宣传材料,并在决赛上对方案进行介绍。
作品提交要求
复赛阶段要求参赛团队提交作品原型及其原型文档。作品原型的形式包括但不限于移动应用、网站、可视化等形式,提交时提交指向原型下载地址或测试地址的网络链接。作品原型文档以简报(ppt)形式呈现,提交的标准格式为PDF格式,所有素材包括但不限于文字、图片、视频等均需为中文。
为了便于评委了解作品及其技术细节,各团队在提供可测试原型之外,需提交原型文档,内容请参考以下格式:
1.作品摘要:对作品做整体介绍;
2.问题需求:描述作品适用的应用场景,清楚说明所解决的问题和受众;
3.数据使用:清楚列举解决方案所使用到的比赛专用数据、开放平台数据、自带数据,并详细说明不同数据如何进行关联整合;
4.技术架构:说明作品的整体技术架构;
5.技术细节:介绍数据清洗、挖掘、关联、可视化、应用整合等各阶段的主要技术、方法、流程;
6.原型测试:详细说明原型的使用方法、测试用例、原型局限性;
7.应用成果:说明作品的预期应用成果。
8.价值导向:说明作品的潜在商业价值和社会价值。
评审标准:
作品所体现的问题分析能力、技术含量、创新型、市场性、商业性以及对开放大赛数据的利用程度。
(二)横琴专题赛
(1)赛道说明
横琴专题赛包括3个子赛题,参赛选手需从中选择一道赛题,然后深入分析大赛的开放数据(选手可自筹数据,但需说明来源),主动发现与“城市管理、公共服务、健康和旅游”相关的问题,设计创意解决方案。
赛题1.基于横琴大健康数据的分析和解决方案;
赛题2.基于横琴长隆等旅游数据的分析和解决方案;
赛题3.基于5G、人工智能技术的城市管理和公共服务解决方案。
(2)比赛流程:
初赛:
作品提交要求
初赛创意方案以简报(PPT)形式呈现,以PDF格式提交,所有素材包括但不限于文字、图片、视频、网站等均需为中文。
注:每支参赛团队仅能提交一个参赛作品;每个作品仅能选定一个赛题。
为了便于评委了解创意方案,提交创意方案时请参考以下格式:
1.作品摘要:对作品做整体介绍;
2.问题需求:描述作品适用的应用场景,清楚说明所解决的问题和受众;
3.数据使用:清楚列举拟使用到的比赛专用数据、开放平台数据、自带数据,并初步说明数据的整合应用方案
4.解决方案:针对问题需求,初步说明技术解决方案;
5.应用成果:说明作品的预期应用成果;
6.价值导向:说明作品的潜在商业价值和社会价值。
评审标准:
作品所体现的问题分析能力、技术含量、创新型、市场性、商业性以及对开放大赛数据的利用程度。
进入决赛的参赛队伍参赛者获取更多数据后,需对方案进行优化,设计产品原型,制作在决赛现场发布的方案宣传材料,并在决赛上对方案进行介绍。
决赛:
作品提交要求
复赛阶段要求参赛团队提交作品原型及其原型文档。作品原型的形式包括但不限于移动应用、网站、可视化等形式,提交时提交指向原型下载地址或测试地址的网络链接。作品原型文档以简报(ppt)形式呈现,提交的标准格式为PDF格式,所有素材包括但不限于文字、图片、视频等均需为中文。
评审标准:
作品所体现的问题分析能力、技术含量、创新型、市场性、商业性以及对开放大赛数据的利用程度。
(三)算法专题赛
参赛选手需从给定的2赛题中选择一道赛题,基于赛题对应的数据,构建算法模型完成赛题任务。横琴超算中心为本次算法比赛提供计算能力,参加该赛事的参赛者,需利用横琴超算中心资源完成计算。
1.卫星遥感数据分析:应用“珠海一号”组网卫星数据,实现行业相关地表生态数据的提取和分析。
题目1:“珠海一号”高光谱影像云检测
描述:针对“珠海一号”高光谱影像,将影像中的云覆盖区域检测、识别出来,并对其标注。
算法评价标准:精确率、召回率、计算效率
提供数据:OHS影像(32波段)。
题目2:“珠海一号”高光谱影像地物分类
描述:针对“珠海一号”高光谱影像,对裸地、植被、水体、建筑四种地物进行分类。
算法评价标准:Kappa系数
Kappa系数
Kappa系数用于一致性检验,也可以用于衡量分类精度。Kappa系数代表分类器所得的分类结果与完全随机分类所得结果相比错误降低的比例。其计算方法为:
混淆矩阵其中,是被正确分类的像元除以除以总像元数,即OA。是机遇一致性,在混淆矩阵中,每一类的实际像元个数分别为,而预测像元个数分别为,总样本个数为n,则有:
混淆矩阵用于比较遥感影像分类结果与实际调研数据之间的差异,反映了各个分类结果的精度,并将其呈现在一个矩阵中。其中矩阵的每行代表的是预测类别,每列代表的是实际类别,对于n个类别的混淆矩阵,其形式如下所示:
混淆矩阵
提供数据:OHS影像样本数据、测试数据
数据说明:
本数据集共有90张训练数据以及10张测试数据;
共有四种分类标签,分别为植被(1),建筑(2),裸土(3)以及水体(4)。
具体标签分类为:
像素值为1的是植被
像素值为2的是建筑
像素值为3的是裸土
像素值为4的是水体
像素值为255的是不属于任何一大类,记为背景。
决赛说明
题目高分辨率影像的道路提取。
描述:针对高分辨率遥感影像,对道路进行提取,并标注。
算法评价标准:IOU
IOU(Intersection over Union)交并比。计算真实值和预测值集合的交集与并集之比。相关度越高该值。最理想情况是完全重叠,即比值为1,见下图。
IOU计算方法示例
提供数据:Pléiades卫星样本数据、测试数据
数据说明:
共有14张Pléiades卫星样本数据,其中10张用于训练,四张用于测试。
本次测试数据包含两种测试集,测试集A与训练图像同时期,测试集B则为不同时期影像,用于考察模型的泛化能力。
样本的名称以xxx_src.tif结尾的为原始影像,以xxx_footprint.tif结尾的为标签。
标签分类为:
样本的像素值为1的是道路
其余像素值均为背景
2.生活垃圾分类:基于生活垃圾图片的检测、位置识别和类型判别。
算法数据输出格式要求:
本次比赛提供的训练集中包含了一次性快餐盒、果皮果肉、旧衣服等多种类别垃圾的图片,参赛者需自行划分训练集、验证集和测试集以用于模型优。
数据说明:
决赛说明:
在初赛垃圾图片的基础上增加了更多垃圾类别的图片,参赛者需要将这份新增训练集与初赛训练集合并到一起,成为最终的决赛用训练集。
评分标准:
大赛平台将通过预测值和真实值之间的对比得到预测准确率,以此来评估各队所提交的模型。赛事组根据选手提交算法,利用测试数据集,验证算法的优劣。
3.网格人流预测:基于某区域网格化管理的网格人流数据,以提供的数据为基础,构建预测模型。预测后15分钟所有网格的人流量。
算法数据输出格式要求:
数据为某区域网格化后的网格人流量数据,以5分钟为粒度提供。5个字段,分别为数据时间,网格id,网格中心经度,网格中心纬度,网格人数周期为2019年10月1日至2019年12月30日。
数据说明:
决赛说明:在初赛算法的基础上,进行优化,预测后三个小时所有网格的人流数据情况。
评分标准:
大赛平台将通过预测值和真实值之间的对比得到预测准确率,以此来评估各队所提交的模型。赛事组根据选手提交算法,利用测试数据集,验证算法的优劣。
评审流程:
需提交代码、模型和模型构建相关说明文档,由赛事组进行人工审核代码模型是否符合要求。并且根据评分标准进行排名。
(四)场景专题赛
(1)赛道说明
参赛选手需要从场景赛题中选择一道参赛,然后深入分析赛题对应的开放数据(选手可增加数据,但需说明来源),解决赛题提出的问题,形成创新性方案或成功实践案例。
赛题1.珠海及周边旅游线路推荐
基于珠海及周边区域景点、商圈、文体活动中心等设施的信息,针对珠海本地居民、外地游客两大类人群的需求特征,综合考虑时间、距离、成本、经济带动、主题、受众群体等因素,形成差异性的旅游线路推荐方案。
赛题2.交通拥堵致因分析
基于珠海市范围内交通堵点的相关数据,结合实地调研,分析交通拥堵的产生原因、演变趋势、治理方案等。
赛题3.政务服务效能优化
根据政府服务事项数据,依据各部门的权责清单,梳理政务服务流程的各个环节,设计合理的事项服务方案,进一步整合优化办理流程,简化审批环节,提高审批效率。
(2)比赛流程
初赛:
作品提交要求
初赛创意方案以简报(PPT)形式呈现,以PDF格式提交,所有素材包括但不限于文字、图片、视频、网站等均需为中文。
参赛者提供选定场景问题的方案,内容需包括但不限于:
清晰的数据分析描述——需要完整的分析过程,从对问题的理解出发,经数据统计分析与建模,并对结果进行充分讨论。
具备可行性的实施建议——结合实际的应用场景,根据分析建模的结果,设计可行的改善方案。
评审标准:
作品所体现的问题分析能力、技术含量、创新型、市场性、商业性以及对开放大赛数据的利用程度。
进入决赛的参赛队伍参赛者,需对方案进行优化,根据场景设计可行的解决方案,制作在决赛现场发布的方案宣传材料,并在决赛上对方案进行介绍。
决赛:
作品提交要求
作品原型文档以简报(ppt)形式呈现,提交的标准格式为PDF格式,所有素材包括但不限于文字、图片、视频等均需为中文。
评审标准:
作品所体现的问题分析能力、技术含量、创新型、市场性、商业性以及对开放大赛数据的利用程度。
奖项设置
创新应用赛
一等奖:6万元人民币(1名)
二等奖:4万元人民币(2名)
三等奖:2万元人民币(3名)
优胜奖:0.5万元人民币(4名)
横琴专题赛
一等奖:6万元人民币(1名)
二等奖:4万元人民币(2名)
三等奖:2万元人民币(3名)
优胜奖:0.5万元人民币(4名)
算法专题赛
一等奖:6万元人民币(1名)
二等奖:4万元人民币(2名)
三等奖:2万元人民币(3名)
优胜奖:0.5万元人民币(4名)
场景专题赛
一等奖:6万元人民币(1名)
二等奖:4万元人民币(2名)
三等奖:2万元人民币(3名)
优胜奖:0.5万元人民币(4名)
数据贡献奖
面向数据提供单位
设置5名
发放奖杯
本文来源于 大赛官网,由 欧米网 整理编辑!