kaggle和天池大数据的比赛给我的感觉完全不一样,天池上面的比赛给我感觉更像一场考试,大家都是自己埋头做自己的东西交流很少,以拟合线上验证集为最大的目标。kaggle上的比赛给人感觉更像一场交流分享(很多比赛的别人的公开的解决方案的成绩的提升速度可能会比自己做的速度还快, 有时候跑不过baseline的感觉让人心态很炸);
但是kaggle上面一些比赛到最后公布最终成绩(private LB)的时候很多人排名变动会非常大,对模型的泛化能力要求很高。天池交流的氛围没有kaggle好,但是天池上面的比赛数目还有种类还是比kaggle要好一些的。两个平台对比的话,我觉得想以学习为主的话可以去kaggle那边做,以最后成绩为主的话可以在天池这边做。
其中还要说一下datacastle,它和kaggle的比赛自由发挥空间很大,踏实做的话可以学到小规模机器学习的方方面面,但做多了基本就是xgboost调参、模型融合;天池的数据量接近真实的业务场景,环境也接近大公司的业务环境,能够积攒分布式项目经验,但在限定的比赛时间内发挥空间不大,基本是xlib里gbdt调参大赛。
kaggle:/
天池:/competition/gameList/activeList
datacastle:/
如果觉得《kaggle和天池大数据比赛的区别》对你有帮助,请点赞、收藏,并留下你的观点哦!