1. 首页
  2. 科技

和鲸科技发布《数据竞赛白皮书·下》,数据竞赛

两周前,和鲸科技发布了《数据竞赛白皮书·上篇·1000场竞赛的深度分析》,通过28000字的研究分析、54个高品质图表,讲透了数据竞赛行业发展,让读者看懂了竞赛高热度背后的逻辑。

上篇发布后,迅速引起了大众广泛的关注与讨论,而今天,和鲸正式发布了《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》,帮助企业找到数据竞赛的最佳入口,用更敏捷、可持续的方式推动数字化转型。

和鲸科技发布《数据竞赛白皮书·下》,数据竞赛的最佳实践

仅在中国,数据竞赛就以年均108.8%的增速、累计超120万人次参加体量、累计高达2.8亿人民币的奖金规模,成为了数据智能行业的创新杠杆。如此高的热度与参与度,此前尚无一份专业研究资料,《数据竞赛白皮书》无疑是填补了这一遗憾。

《数据竞赛白皮书》(以下简称“白皮书”)是在大数据系统软件国家工程实验室的指导下,和鲸科技携旗下第三方数据竞赛平台和鲸社区,联合AWS共同发布,分为《数据竞赛白皮书·上篇·1000场竞赛的深度分析》和《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》两部分。


正因为数据竞赛已经成为科研、政府、产业的头部机构普遍采用的探索模式,可以快速验证数据驱动业务的方向与效果。作为数据竞赛行业的头部平台——和鲸科技频频收到合作伙伴的办赛需求,为了更好地回答有关数据竞赛方面的问题,也为了让更多企业与机构在尝试数据竞赛模式时能够收获更多,我们在《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》首度公开了和鲸的数据竞赛管理方法论与业界最佳实践。

组织数据竞赛的系统方法,为数字化创新落地赋能增效

为什么要掌握数据竞赛的系统方法?

虽然受到了各类机构的广泛欢迎,数据竞赛有着很高的组织成本与技术复杂性,要在数据竞赛中取得满意的成果,仍然是充满挑战的。经过检验的系统方法,能帮助主办方更好利用数据竞赛的工具,取得技术探索、组织发展、业务成长的复合型目标:
· 办比赛:帮助更多企业或机构能自主办赛、进行数字化转型探索。
· 拿成果:帮助企业和机构少走弯路、减少浪费,产出更高价值的算法成果。
· 可落地:匹配业务的真实需求和组织的能力建设,促进算法成果的落地与沉淀。
经过上百场数据赛事验证的系统方法

《数据竞赛白皮书·下篇·办好一场竞赛的实操手册》——和鲸首度开源策划与组织数据竞赛的系统方法,帮助企业利用和鲸科技四年时间积累的上百场赛事经验,用更敏捷、可持续的方式推动数字化转型。

和鲸科技发布《数据竞赛白皮书·下》,数据竞赛的最佳实践

数据竞赛的系统方法主要构成模块

如何设计数据竞赛的赛题?

好的赛题能够贴合赛事主体的业务需求,有创新探索价值。一道好的赛题制定需考虑以下方面:

1、赛题的未来应用价值在紧凑的竞赛周期内能够基于现行技术实现;
2、赛题与现有数据条件充分契合;
3、赛题具有充分的可解性,又能够保有一定的难度和挑战;
4、赛题表述清晰、明确,选手易懂;
5、赛题配套的测评方法需要综合考量学术指标、生产指标与竞赛效果;
6、可引入行业专家共同参与赛题的打磨并对赛题质量提出意见。

如何用好云计算的基础设施?
云计算技术日趋成熟,上云也已是全球趋势,如何用好云计算的基础设施,实现数据竞赛的过程可控、体验提升和成果落地:

· 安全:数据安全是赛事发起方的主要考虑之一,在云端环境直接调用数据,可以避免公开下载数据的潜在传播。
· 公平:云计算为选手提供了统一的赛事环境,帮助选手专注于算法创新和业务洞察,赛事的成绩不再依赖于选手拥有的计算资源。
· 成果可复现:成果管理是数据竞赛实现价值的“最后一公里”,云计算使得赛事成果可以被追踪、评价、复现、改进,从而实现在业务场景中的价值落地。

高水平的数据竞赛需要数据科学协同工具的支撑,能帮助选手和主办方更高效率、更加便利地使用云计算资源,如Kaggle Kernels、Google Colab,以及国内的K-Lab:

本文来自投稿,不代表本人立场,如若转载,请注明出处:/keji/115277.html