客服电话:400-603-2580 官方微信
登录 注册

2018全国高校大数据应用创新大赛

开启你的大数据应用创意Show

“大数据”作为时下最时髦的词汇,已经渗透进各行各业,与我们息息相关的旅游业也不例外,如何通过挖掘开放数据,获取真实有效的游客反馈,提高旅游服务质量,满足游客多元化的旅游体验,一直是业内非常关注的话题。

2018全国高校大数据创新应用大赛浪潮天元数据企业命题赛以此为切入点命题,要求参赛队伍对浪潮天元数据提供的海量景区评价数据进行建模、算法设计和编程,为全国的旅游景点做评价排序。

赛题描述

提供20000条数据作为训练数据,包含评论详情和评论等级,参赛队伍可以借助数据挖掘技术,设计算法分析评论内容和评论等级;

预赛阶段,提供10万条正式比赛数据,仅有评论内容,参赛队伍需要根据评论内容计算出评论等级;

分赛区决赛和全国总决赛阶段,数据集规模将上升为100万条。

开发平台

竞赛队伍可以使用任何平台来完成本竞赛题目
浪潮推荐参赛队伍使用"云海 Insight HD"大数据平台进行算法开发

是一套经过调优和功能增强的Hadoop与Spark企业发行版,包含Hadoop生态中的20+主要组件,帮助参赛队伍应对海量数据的采集、存储、计算、分析挖掘和数据完全等应用场景。

点击查看详情

作品提交与评分标准

1

作品提交

作品提交包括两部分:解决思路+识别结果。

解决思路

字数不多于1000字的word文档,至少包括三个模块:

1

整体思路摘要

2

主要技术算法

3

总结

识别结果

选手需要识别出的分类值保存到TXT文件中,并提交到大赛平台。

预赛提交的TXT文件名:dsjyycxds_preliminary.txt

分区决赛提交的TXT文件名:dsjyycxds_semifinal.txt

所提交的txt文件的内容如下所示

2

评分规则

预赛成绩由平台根据准确率自动计算得分 (准确率=100*预测正确的行数/测试数据集的行数)
分区总决赛和全国总决赛成绩均为参赛队伍在竞赛平台计算出的准确率得分与现场演示、答辩两部分得分之和。

奖项设置

特等奖

10000

一等奖

6000

二等奖

4000

数据集下载

预赛数据集

下载

决赛(分赛区决赛/全国总决赛)数据集

暂未开放

旅游数据推荐

2017年江西景区数据(样例)

¥0.1

2017年江西景区门票数据(样例)

¥0.1

乐山旅游大数据分析报告

¥29.9

枣庄旅游大数据分析报告

¥29.9

鹰潭旅游大数据分析报告

¥29.9

西双版纳旅游大数据分析报告

¥29.9

11月山东省景区评论数量及好评率样例

¥0.01

同程6月份跟团游数据样例

¥0.01

OTA平台12月份山东省跟团游评论样例

¥0.01

2017江西省跟团游数据(样例)

¥0.1

OTA平台10月份山东省跟团游数据样例

¥0.01

OTA平台12月山东省跟团游评论数据样例

¥0.01

点击查看更多

©2018 浪潮卓数大数据产业发展有限公司版权所有

苏ICP备17067797号

苏公网安备32021102000680号

提供计算安全与服务

国家大数据流通与交易工程实验室

国家大数据双创示范基地

大数据应用国家专业化众创空间