竞赛背景
大数据时代,对数据的有效利用将是众多企业的核心竞争力,金融风控、交通导航、商品推荐等无不是对数据价值的完美阐释。在现代化的校园中,一卡通、公共wifi、信息化办公等技术/工具的使用,在便利了学生生活的同时,也为优化教学管理提供了参考依据。
不久前,关于成电暖心科技的报道风靡网络,学校通过分析学生吃饭的消费数据,发现一些学生存在经济困难,就“偷偷”地、主动地通过学生的一卡通中送了关怀。
为此,全国青年学生大数据实验室、电子科技大学和微博校园联合主办,电子科技大学网络文化建设工作办公室、微博信息系统部、电子科技大学教育大数据研究所、DataCastle数据城堡承办这次创意应用大赛,希望通过对大量优质校园数据的挖掘,更好地服务学生、优化校园管理,共建智慧校园。
其中,“全国青年学生大数据实验室”集学术研究、教学实践、成果转化、社会服务为一体,以微博上3100万校园用户的账号特征、用户行为和兴趣偏好等为基础,整合中国校园市场联盟旗下京东、支付宝、完美校园、新东方在线、蚂蚁金服等7家机构的大学生群体的消费行为与消费习惯数据,为此次比赛提供数据支撑。
奖项
本次竞赛将评出以下奖项:
一等奖:1名,奖金20000元人民币,颁发获奖证书
二等奖:2名,奖金10000元人民币,颁发获奖证书
三等奖:3名,奖金5000元人民币,颁发获奖证书
*奖金为税前金额,个人所得税为税前金额的20%,个税由参赛者承担。
其他奖励:
1)方案评审后,排行榜前20的团队进入微博校园的招聘绿色通道(招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段,在校期间均有效)。方案评审后,排行榜前5的主要参赛选手优先内推微博相关技术岗位。
2)方案评审后,排行榜前20的团队优先内推成都寻道科技有限公司相关技术岗位。
3)电子科技大学大数据研究中心访问交流机会。
届时,DC将提供选手个人信息给微博校园和寻道科技,用于招聘联系以获得招聘绿色通道。
时间安排
本次大赛由线上“创意方案提交”和线下“答辩评比(含人才对接)”两大板块组成。
1)线上初赛(创意方案提交)
时间:2017年7月3日11:00:00 – 2017年9月24日23:59:59
任务:竞赛正式上线后,参赛者通过DC平台提交智慧校园全国创意应用大赛创意方案。在初赛提交结束前各团队可多次进行提交,各团队最后一份提交方案将作为本队最终方案呈送专家评委进行打分。
2)线下评审(创意方案评审)
时间:2017年9月25日– 2017年9月30日
任务:邀请多位评审专家参与线下评审,评审专家由学术科研导师、电子科大创新创业导师、教育大数据企业导师、新浪微博专家代表、电子科技大学网络文化建设相关负责人组成。各评委老师独立打分,取均值。
3)线下活动(决赛答辩评比)
时间:2017年10月16日(暂定)
任务:用线下答辩的形式评比出竞赛一二三等奖,并进行优秀人才交流对接。具体入围团队数及答辩规则,后期公布。
参赛与组队规则
所有参赛人员及队伍,视为已同意《DC竞赛作弊管理规则》及其他相关规定。队长对其队员的参赛行为负责。
1)参赛者的年龄不限,以个人或企业的身份参赛均可,无区别对待;
2)一名参赛者仅能参与一支团队,参赛团队应至少由一人组成,最多五人;
3)请谨慎对待解散队伍功能,一旦解散所有数据立即清空,无法恢复;
4)各团队每天有效提交次数为2次。
比赛作品及权责说明
1.比赛作品说明
(1)参赛作品的知识产权归参赛作者所有。获奖作品的知识产权归参赛者和主办方共同所有。大赛组委会(包括主办方及承办方)有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目
(2)参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,大赛组委会将取消其比赛成绩并进行严肃处理
(3)参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证
(4)参赛选手需要自行检查提交作品的正确性,确认无误后再进行提交,组委会不负责对比赛作品进行更改和调整
2.组委会权责说明
(1)组委会保留对比赛规则进行调整修改的权利,并拥有对大赛规则的最终解释权
(2)组委会拥有比赛作弊行为的判定权利和处置权利
(3)组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛
(4)若出现不可控因素,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利
(5)对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利
(6)若因故出现数据更新、评审代码更新、作弊检查等原因组委会有权对参赛结果进行重新测评并更新排行榜
(7)组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目
(8)参赛团队在比赛过程中若被要求提交个人身份信息,组委会承诺个人信息仅用于赛事数据授权与颁奖,对其中所有涉及个人隐私的内容予以保密
团队人数上限5人。
在第一阶段的最后3天无法新建队伍,但是可以加入其它队伍。
在最后一个阶段最后3天无法新建队伍,无法加入队伍。
竞赛进入历史阶段后解除一切限制,注意:答辩队伍成员仅限活跃期间加入的成员。
评分标准
评分标准
1)所有符合资格的团队在竞赛截止日期前可进行多次提交,截止日期前的最后一次方案提交将作为最终提交,送审评分。对于任何在截至日期之后提交的方案大赛组织方将不予以评审。
2)主办方不对任何因电脑、互联网、移动网络故障而造成的参赛作品损坏、缺失、提交延时等后果承担责任。
3)评委对作品的评审结果一旦给出则视为最终结果,不再修改。
4)本次竞赛将由专家评审团进行评分,评分维度包含但不限于创新度、技术应用、解决方案完整度、校园应用价值等。
5)本次竞赛鼓励团队提交创意应用demo。
任务
希望参赛者能够发散思维,并鼓励参赛者广泛采用外部数据(如社交网络、就业形势、经济构成等),通过专业的统计分析和建模,对数据进行充分挖掘,寻找校园学生规律,设计校园场景解决方案——让数据为智慧校园发声,让创意为学校师生服务!
本次大赛参赛者需提交针对智慧校园某一细分方向的解决方案(以下简称“创意方案”)。创意方案可参考但不限于以下内容(不出现团队任何信息):
1)方案摘要:对创意方案做整体介绍,描述适用场景;
2)数据使用:描述数据使用情况,包含大赛数据和大赛以外的数据;
3)技术使用:描述创意方案的技术架构和思路及技术细节;
4)创意成果:说明创意方案的使用方法、局限性、创新性及预期成果;
5)价值导向:说明创意方案的校园价值和社会价值。
本次大赛鼓励团队提交“创意应用demo”。demo可参考但不限于以下内容:
1)demo是一个可工作的原型应用以完整地呈现团队的创意; demo形式可参考但不限于移动应用、网站应用、桌面应用、微信端应用等;
2)参赛团队如提交请提供应用原型下载或测试的网络链接url,以及下载或使用说明,以word文件格式提交;
3)不同形式的应用demo,其url有不同的含义:
(1)你们的原型作品是一个 web app:请直接提供一个指向你们web app的测试地址(请自行解决服务器和域名);
(2)如果你们的原型作品是一个 mobile app:我们推荐使用蒲公英等app测试分发平台来分发你的原型应用,提交指向测试地址的url;
(3)如果你们的原型作品是以其他形式呈现:那么请提供一个指向展示地址或下载地址的url(请不要使用有访问时效限制的存储);
(4)请不要忘记在文档中包含详细的测试步骤和注意事项内容,以方便评委了解如何具体访问、获取、测试提交的原型!
注意:
1)创意方案请以word文档进行提交;创意应用demo(如有)的下载链接和测试说明请以word 文档进行提交。
2)如团队仅提交创意方案,直接上传提交即可;如有其他辅助材料,请打包压缩后提交。
3)提交文件请以“队名-队长姓名-队长联系电话”命名。
4)请勿在提交材料的正文内容中植入任何可以使评委直接识别参赛团队个人身份的信息。若经2名以上评委判定参赛团队作品中有包含上述违规身份信息的,该团队作品将不再纳入评审计分,该参赛团队直接取消参赛资格。
5)方案送审前,提交文件的文件名将被匿名化。
数据
*注 : 报名参赛或加入队伍后,可获取数据下载权限。
1)数据总体描述
本次大赛官方所提供的数据共分为两部分,一部分是来自是来自新浪微博的关于四川高校的数据;另一部分是关于成都某高校学生的数据,分别为:借阅记录.csv,奖学金数据.csv,学生成绩.csv,就业信息.csv,消费记录.csv,论坛发帖频率.csv。
为了保护学生隐私,主办方对数据进行了严格的脱敏处理,比如重编号了学生的ID和刷卡地点等,隐藏了时间上的年份,剔除了借阅图书的题目,对学生的成绩也做了函数变换。详见数据描述。
2)数据详细描述
(1)新浪微博数据
a)四川省高校微博人数统计.csv。共2个字段。
学校名称 人数
内江师范学院 85477
四川师范大学 72315
四川大学 64767
电子科技大学成都学院 62568
b)高校微博用户统计.csv。共11个字段,包括:UID,昵称,认证信息,v区分(认证类型,比如橙V,蓝V),层级,领域,教育信息,城市,最近发博时间,发博量,粉丝量。
(2)成都某高校学生数据
提供了学生的行为数据、成绩数据和奖学金数据。它们在时间上是有关联的,如:学生行为数据发生在2018年1月~4月,成绩便是该学期的期末考试数据,奖学金数据也是此期间的一些奖项。
a)借阅记录.csv。共3个字段。如下例,其中b表示年份。
学号 图书编号 时间
48942293 2831323 b-04-25
23119292 2955108 b-04-25
48942293 2831323 b-04-25
32083779 1316329 b-04-25
b)奖学金数据.csv。共2个字段,出于保护隐私需要,奖项进行了脱敏处理,奖学金的高低顺序为(注:字母并不代表奖学金类别。)x912>z052>x616>y663>z512>x492=y524>y076>z918>z735>y786>x986。
学号 奖项
99279221 z052
63770999 z052
32371993 z052
6191394 z052
c)学生成绩.csv。共5个字段,其中可能因录入错误存在非正常数值,分数为脱敏后数据,大小比较仍可按照现有数值大小。
学号 学年 学期 课程编号 分数
29306140 c-d 1 b2294255 699
29306140 c-d 1 a7299898 727
29306140 c-d 1 b3932207 689
29306140 c-d 1 c2801098 697
d)就业信息.csv。共3个字段,其中薪资为脱敏后数据,可根据先字母顺序后数字大小进行比较,比如不同字母之间有v***>u***>t***>.....>c***>b***>a***,当字母相同时有u914>u808。
学号 流向 薪资
39126127 上海-市辖区-浦东新区 u914
22219222 江苏-南京市-玄武区 u808
63290092 广东-珠海市-斗门区 u787
23942262 上海-市辖区-浦东新区 u389
e)消费记录.csv。共5个字段,其中消费金额出现负的记录可能是由于系统返款、卡内转账等原因,此外消费地点也被做了脱敏处理。
学号 消费类型 消费地点 时间 消费金额
63270289 POS消费 875416971 f05-01 17:14:07 8.0
63270289 POS消费 93670144 f05-01 17:14:14 1.8
63270289 POS消费 25581739 f05-01 17:26:15 3.0
26073968 水控消费 995317194 f05-01 21:26:55 1.1
f)论坛发帖频率.csv,包括学号、日期和发帖次数等字段,其中发帖次数为d-03-31~e-07-29期间对应的发帖次数。
数据使用说明:
1)参赛选手不得在未经组委会授权情况下将比赛数据作为其他用途。
2)本次大赛鼓励参赛者自行获取外部数据,做数据联合和方案创新。参赛者可以从“优化资源”、“安全管理”、“身心健康”、“学业表现”、“就业服务”、“信息共享”以及其他角度切入,进行创新,形成创意方案。
注:
关于数据下载打开乱码问题:不要用excel打开,用notepad++或者vs code。文件格式是通用的编码方式utf-8,如果要用excel,请转换为ansl格式或者gbk格式。
本文来源于 大赛官网,由 欧米网 整理编辑!