2017-Big-Data-Challenge 初赛 训练集3k,测试集100K,数据太大, 所以只上传了部分测试数据,但不影响程序运行。 preliminary 文件夹下: bdc_v1.py 是第一版的想法,线上只有70分左右。 plot.py 与view data.ipynb 用来数据探索 0720_final.ipynb是初赛最后的程序。 data :数据文件夹 plot:轨迹图像文件夹 submission :存放提交结果 复赛在腾讯云服务器上,数据没法下载,代码当时也保存的不全。 final 文件夹下 程序仅供参考,只能在腾讯spark上运行。而且不全。 学习交流的话初赛代码就够用了。