前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >未来中国版Kaggle锋芒初显 :CCF大数据与计算智能大赛完美收官

未来中国版Kaggle锋芒初显 :CCF大数据与计算智能大赛完美收官

作者头像
新智元
发布于 2018-03-26 08:57:34
发布于 2018-03-26 08:57:34
1K0
举报
文章被收录于专栏:新智元新智元

【新智元导读】2016年12月25日,“2016CCF大数据与计算智能大赛”(BDCI)正式落幕。多位大数据与计算智能领域顶尖强者,用作品赢得了行业专家的一致认可,也体现了大数据发展的蓬勃活力。

2016年12月25日,第四届“大数据与计算智能大赛(Big Data & Computing Intelligence Contest, BDCI)”在青岛完美收官,各奖项、奖金也名花有主,获奖队伍在圣诞节的衬托下更添喜悦。从大赛启动到决赛嘉年华,整整历时九十天,虽然比儒勒·凡尔纳笔下的福格环游地球还多花了十天,但参赛的一万余名“夜猫子”环游比特世界的征程是比走遍山川美景更为独特的智力冒险。

决赛队伍答辩现场

大赛规格猛升,队伍构成更加多元

与上届相比,今年的大赛规模实现了爆发式增长,参与人数、队伍数、境外高校数以及提交作品数均比上年增长3.3倍以上,创下历史新高。“我们又回来了-美林数据”等多个战队的选手之前都参与过多次大数据赛事,且取得了非常好的成绩,为本次大赛增添了几缕“星光”。

从地域、校园、性别等的分布都可以发现参赛队伍多元化特征非常明显。地域上不仅覆盖全国34个省、自治区和直辖市,更吸引了港澳及美国、英国、法国、日本、澳大利亚的海外参赛者。学生来源几乎覆盖了国内所有985/211高校以及众多普通高校、地方院校,甚至包括数个中学。工业界选手也有增多的趋势。性别上,来自两名北京大学“女汉子”组成的“Foo & Bar”队,取得了CCF最佳技术创新奖及对应赛题的一等奖,并且其他获奖参赛队伍骨干中也经常能看到女生的身影。

队名显现活力与趣味。参赛队伍的名称可谓“八仙过海,各显萌通”,比如“打酱油`拎壶冲”、“401数据挖掘施工队”、“SmartRookie”等等,让台下观众都有评一个“最有创意队名奖”的冲动了,当然,名字让人印象深刻的“诗人都藏在水底”还凭借独特的算法商业性,获得了CCF最佳商业潜力奖及对应赛题一等奖。

揭开数据面纱,深度挖掘特征

CCF决赛专家评审组 最终成绩复核现场

在数据挖掘领域有这么一句话广泛流传:“数据和特征工程(Feature Engineering)决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。所谓特征工程,就是最大限度地从原始数据中提取特征以供算法和模型使用。这类似斯坦福大学教授保罗·瓦茨拉维克在《改变》一书中提出的“第一序改变”与“第二序改变”的关系。比如开车的时候,不管你踩多大的油门都是“第一序改变”,只能无限接近档位限定的速度,只有换档才是“第二序改变”。

因此,基于领域知识,针对数据本身的深度分析是大赛致胜的关键。各参赛队伍在数据清洗、压缩以及特征提取方面下足了功夫,如分对象抽取的用户、商户、优惠券、Label窗等特征,以及分层次抽取的全局特征、局部特征、元特征等。以“fgo非洲人”战队为例,其通过对“Human or Robot?”赛题的1.5亿条数据进行特征分析,将数据量压缩至500万条,只有原来的三十分之一,极大提升了后续模型训练的时间,取得了“第二序改变”的优势,最终获得CCF最佳算法能力奖,及相应赛题一等奖。

用模型的暖阳唤醒黑暗中沉睡的数据

“Fgo 非洲人”队在做决赛答辩

各战队在特征工程的基础上,也创新了多个算法模型。除了熟练运用XGBoost、随机森林(RandomFore)、卷积神经网络(CNN)、循环神经网络(RNN)等常用数据挖掘模型,参赛队伍还对已有模型进行了优化和创新,如针对小目标检测的R-FCN算法、多任务学习框架的精细化人体属性识别算法。另有战队提出的多通道多窗口CNNs模型,只需54秒即可完成2w数据量的训练。“401数据挖掘施工队”结合地理数据的经验,针对“基于多源数据的青藏高原湖泊面积预测”赛题,引入了数量平衡方程、彭曼蒸发公式等领域模型,利用时空关系构建的湖泊预测模型,实现了很好的效果。

网络、移动终端无处不在的今天,大量未被利用的数据在黑暗中沉睡,这些虽略显稚嫩的模型创新,无疑像一缕暖阳,昭示着唤醒的努力。

夜猫子间的战争

会务组统计时发现一个非常有趣的数据,在近三万份结果中,有超过六分之一的是在22:00-6:00点提交的,足见各参赛选手在学业和工作之余显示出的“拼命三郞”精神,把自己生生逼成了“夜猫子”。

“睡一觉起来榜单就可能产生翻天覆地的变化”,有参赛选手这样感叹比赛的激烈程度。很多人提到,比赛期间的心情起伏非常大,每天都有新想法,尝试后却发现没有效果提升,竞争对手还纷纷赶上,尤其是复赛时,甚至会为实现0.001分的提升焦灼不已。

在这种你追我赶的过程中,很多队伍的指导老师尽职尽责,甘当幕后英雄。比如大连理工大学林鸿飞教授指导的两支队伍都取得了各自赛题的一等奖,让人艳羡之余也更添一份敬佩。

场景落地与开源开放,实现智力侵略

中科院院士梅宏、青岛市副市长张德平为CCF综合特等奖获奖团队“S-LAB”颁奖

九十天的智力冒险最终在两天的决赛嘉年华中完美收官,120万元奖金找到归属。青岛市对决赛的举办给予资金和场地方面的大力支持,青岛市副市长张德平、李沧区委书记王希静、李沧区区长李兴伟等均亲临现场为获奖队伍颁奖。最大赢家是“S-LAB”团队,获得了CCF综合特等奖,在决赛中大放异彩。万国云商的50万元特别奖则授予了石油大数据智能处理平台Chase。共有54支队伍获得了企业单项奖。组委会还另外设置了CCF最佳算法能力奖、CCF最佳技术创新奖、CCF最佳商业潜力奖、优秀指导老师奖和特别贡献奖。

中国工程院院士倪光南 致辞

国网信通、寰景信息等出题企业都对比赛取得的成果赞誉有加,表示将持续支持成绩优异的战队。中国联通研究院甚至准备与参赛队伍签约,以进一步优化结果,应用于真实的业务场景。此外,“Aaron_Hunter”等战队还率先在Github开源了其提出的MUSCLE-LEADER算法,用更开放的心态拥抱未来。倪光南院士在总结发言中也击节叹赏大赛展现的竞技风貌和取得的丰硕成果。

所谓科学,就是你到了任意一个国家、面对任意一种制度,都能很好地生存的能力。而智力侵略,则是你到了任意一个星球、任意一个组织都能够很好地发展的能力。本届的参赛队伍无疑用科学严谨的态度、积极有效的行动诠释并展现了如何对比特世界进行“智力侵略”。

未来的中国版Kaggle锋芒初显

《甲方乙方》中有句经典台词:“1997年过去了,我很怀念它”。平淡温和的话语背后,饱含着时代快速变迁的感慨,以及每个人努力实现、苦甜交加、荒诞又魅惑的梦想。这是佐藤信夫修辞分类中的“默说”,意在言中,而又偏离了词典规范的零度。

中科院院士梅宏 致辞

中国科学院计算技术研究所副所长、CCF大数据专家委员会秘书长程学旗 做大赛成果展示

所以,梅宏院士在颁奖典礼最后特意改用了“2016年过去了,我很怀念它”,用含蓄的“默说”告诉我们,这届CCF大数据与计算智能大赛确实是一个转折,极大提升了赛事的规格与水准,官方竞赛平台DataFountain也日益强大,形成了平台+服务的完整闭环,未来的中国版Kaggle已经锋芒初显,梦想仍然继续迷人又富有挑战。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-12-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大赛丨2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出
2016 年 12 月 25 日,由 CCF 中国计算机学会主办、DataFountain 大数据平台等单位承办的“2016 CCF 大数据与计算智能大赛”(BDCI)正式落幕。 “CCF大数据与计算
AI科技评论
2018/03/09
9230
大赛丨2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出
2017 CCF大数据与计算智能大赛(BDCI)完美收官
2017 CCF大数据与计算智能大赛(BDCI)在江苏常熟圆满落下帷幕。本次大赛共吸引全球495个团队,14991人参赛,参赛队伍来自450所高校和495家企事业单位。大赛共评选出12个企业单项一等奖、9个二等奖、11个三等奖。中国科学院计算技术研究所、清华大学、北京大学、中国科学技术大学、南京大学等30多所知名高校获得高校奖项。大赛还评选出12个CCF综合大奖,27个CCF专项奖。颁奖典礼上,大赛组委会还特设“CCF BDCI最佳商业价值奖”,表彰在工业界落地方面取得突出成绩的团队。
挖掘大数据
2017/12/27
1.7K0
2017 CCF大数据与计算智能大赛(BDCI)完美收官
专访2016CCF大数据与计算智能大赛冠军:针对广告位的作弊检测算法
大数据文摘记者 | 魏子敏 Facebook近日称,2016年第一季度,其DSP平台Atlas半年的流量质量测试结果显示,由机器人模拟和黑IP等手段导致的非人恶意流量高达75%。一石激起千层浪,这一报道在国内数字营销领域内引发热议同时,“广告反欺诈(Anti-Fraud)”的问题再次被推到舆论的风口浪尖,而如何更好的监测作弊流量也收获了广泛关注。 12月25日,为期两个月的2016CCF大数据与计算智能大赛在青岛落下帷幕。其中,荣获CCF最佳算法能力奖的北京大学“fgo非洲人”团队的参赛作品“Human
大数据文摘
2018/05/22
1.1K0
2016 CCF大数据与计算智能大赛 开源资料整理
2016 CCF大数据与计算智能大赛 开源资料整理 2016 CCF 大数据与计算智能大赛已经落下帷幕,11个赛题由众多大神包揽奖项,其中有些还在赛后开源了比赛资料,现将目前已知的资料整理如下,供各位同学一起参考学习。若有意公开自己的比赛资料或者发现整理的列表中有遗漏的,可以联系我(金陵书生, netivs@qq.com )补充修订。有问题也可在群里讨论。部分比赛PPT已经放到大数据比赛交流群,请在群文件里查看。 1)O2O 赛题 wepon、天音和charles提供的CCF O2O比赛第一名的全套代码
学到老
2018/03/16
1.2K0
CCF 大数据与计算智能大赛:挑战 11 题,成为顶尖数据科学家
2016年10月18日, 世界人工智能大会技术分论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容:美团技术学院院长刘江担任主持人,微软亚洲研究院常务副院长芮勇、360人工智能研究院院长颜水成、北京理工大学计算机学院副院长黄华、联想集团副总裁黄莹、Intel 中国研究院院长宋继强、新华网融媒体未来研究院院长杨溟联袂出席。 【新智元导读】2016 CCF大数据与计算智能大赛9月24日启幕,发布了 11 道高质量创新赛题,涉及智能电网、搜索广告、O2
新智元
2018/03/23
1.1K0
2022年未来之光——未来网络科技创新大赛初赛说明
由网络通信与安全紫金山实验室、江苏省未来网络创新研究院联合主办的“2022年未来之光——未来网络科技创新大赛”报名截止,目前初赛正在进行中,现将初赛相关事宜通知如下: 大赛主题 大赛以未来网络技术应用创新为主题,参赛作品可以围绕软件定义网络、数据中心网络、可编程网络、网络安全、网络人工智能、5G/6G、物联网/工业互联网等未来网络细分方向展开。 作品评审 大赛形式为作品赛。参赛团队根据大赛主题自主进行作品选题和研究实现。作品要求涉及未来网络相关技术领域的研究、设计、开发、部署等,或将相关技术用于解决经济社会
SDNLAB
2022/06/02
3550
2022年未来之光——未来网络科技创新大赛初赛说明
2017年中国国际大数据挖掘大赛落幕 大数据与产业融合是大势所趋
2017年中国国际大数据挖掘大赛在贵安落幕,吸引全球19个国家和地区的12646支项目团队、5万余人参赛,覆盖政务、医疗、交通、金融、教育等领域。大赛旨在唤醒沉睡的数据,发掘数据的价值。最终麻省理工大学三位博士研发的“数据融合平台”获“数据开放的价值”板块一等奖,博为101异构数据采集平台获“数据挖掘的魅力”板块一等奖,众智云基站项目获得“数字经济的效能”特别奖,蓝杞数据——冷数据黑技术和阿尔法鹰眼获“数字经济的效能”板块一等奖。此外,大赛还举办智慧交通预测挑战赛等三项系列赛事,并发起寻访高成长性大数据“幼苗”活动。
企鹅号小编
2018/01/08
6750
2017年中国国际大数据挖掘大赛落幕 大数据与产业融合是大势所趋
2021博世中国 x机器之心AIoT线上黑客松,决赛一触即发!
智慧物联,焕新生活。作为人工智能(AI)与物联网(IoT)基础设施在实际应用中的落地融合, AIoT 的发展已经无处不在,成为各大传统行业智能化升级的重要通道。从 To C 侧的智能家居,到 To B/To G 侧的智慧工厂、智慧家园等,AIoT 在应用、平台及服务层面不断深化万物互联。 作为一家低调的百年制造企业,博世正在向创新型物联网 (AIoT) 公司转型。其中,互联交通、互联工业、碳中和和互联生活这 4 大课题所需要的技术和人才积累,有关于实现未来世界物联化的一切,都是博世近年来致力研究的课题。 从
机器之心
2023/03/29
3630
2021博世中国 x机器之心AIoT线上黑客松,决赛一触即发!
2019腾讯广告算法大赛完美收官,算法达人鹅厂“出道”
7月8日,2019腾讯广告算法大赛“终极之战”在深圳腾讯滨海大厦顺利举行。在前两届成功经验的基础上,今年大赛在赛题专业性和赛事体验上都有了更大的提升,进而吸引了更多海内外优秀选手参加,最终报名人数高达10,571人。 本届算法大赛选手的构成也更加多元化,其中进入复赛的TOP 20队伍就涵盖了包括华南理工大学、浙江大学、东南大学、北京大学、西安电子科技大学、北京航空航天大学、厦门大学等16所顶尖院校的37名学生,此外还有14名来自海内外工业界的精英选手。 经过三个月的激烈角逐,实力超强的10强决赛队伍从
腾讯高校合作
2019/07/11
1.5K0
2019腾讯广告算法大赛完美收官,算法达人鹅厂“出道”
暨南大学首次问鼎ASC世界超算大赛!清华获亚军,中山大学再破计算性能纪录
5 月 12 日,在深圳的南方科技大学,世界大学生超级计算机竞赛 ASC20-21 正式落下帷幕。冠军奖项由暨南大学摘得,清华大学获得大赛亚军和 e Prize 计算挑战奖,最高计算性能奖则由中山大学获得。
机器之心
2021/06/08
8030
2018百度之星落幕:14年传承再添新丁
9月18日,2018百度之星大赛颁奖典礼在百度大厦举行。程序设计大赛冠军由来自清华大学的毕克同学获得;开发者大赛的桂冠由来自华南理工大学、首都师范大学、哈尔滨工业大学(深圳)的联合战队收入囊中。百度地图事业部总经理李莹、百度搜索总监谢天、百度校园品牌部高级经理计湘婷作为颁奖嘉宾出席典礼。
用户1386409
2018/10/24
5640
2018百度之星落幕:14年传承再添新丁
快手x清华即日启动大数据挑战赛,60万大奖悬赏你的最佳解决方案
4月16日,2018年中国高校计算机大赛——大数据挑战赛(下称大数据挑战赛)正式开启报名。
朱晓霞
2018/07/23
3760
快手x清华即日启动大数据挑战赛,60万大奖悬赏你的最佳解决方案
首届中国虚拟现实创新创业大赛福州赛区大赛完美落幕
企鹅号小编
2017/12/26
8160
首届中国虚拟现实创新创业大赛福州赛区大赛完美落幕
智慧城市路在何方?合肥三十万重金诚邀大数据英才!
“随着信息化时代到来,不论是各级政府还是社会大众,在日常工作和生活中,都会遇到诸多制约政府高效运转的痛点、阻碍群众便利生活的难点。因此,全面布局数字合肥建设,加快实现政府、企业、个人资源的整合与利用迫在眉睫。”
Python中文社区
2018/12/04
4740
智慧城市路在何方?合肥三十万重金诚邀大数据英才!
一等奖 5 万,华为 openinula 的开源大赛有点东西啊
为什么是『又』呢,因为上一次,我带队参加了,并且还得了个三等奖。你们可不要小瞧三等奖,许多大厂的参赛作品也只有三等奖,而我作为散兵游将,能拿到三等奖已经非常不容易了,含金量非常高。
用户6901603
2024/07/25
1720
一等奖 5 万,华为 openinula 的开源大赛有点东西啊
[人工智能/数据科学比赛]海上风场SCADA数据缺失智能修复
2019数字中国创新大赛(Digital China Innovation Contest, DCIC 2019)由福建省数字福建建设领导小组办公室、福建省工业和信息化厅、福州市人民政府、中国电子信息产业发展研究院和数字中国研究院联合主办,第十二届全国政协副主席王钦敏担任大赛总顾问。作为第二届数字中国建设峰会的重要组成部分,本届赛事分为大数据、人工智能、工业互联网三大类算法题,旨在解决数字经济建设发展中的痛点、难点,推动新一代信息技术和传统产业的深入融合,助力数字中国建设。
统计学家
2019/04/08
1.1K0
报名 | 2022中国高校计算机大赛——微信大数据挑战赛即将开启
2022中国高校计算机大赛——微信大数据挑战赛(以下简称“大赛”)由清华大学和腾讯微信事业群联合举办,由腾讯云提供大赛资源支持。本次大赛是以企业真实场景和实际脱敏数据为基础、面向全球开放的高端算法竞赛。大赛旨在通过竞技的方式,提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。 一、 参赛对象 本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科、研究生)以及科研机构和企业从业人员均可参赛。 二、 赛制说明 本次大赛
数据派THU
2022/04/22
1.1K0
报名 | 2022中国高校计算机大赛——微信大数据挑战赛即将开启
IJCAI 2018国际广告算法大赛迁移学习夺冠,中国包揽冠亚季军
---- 新智元报道 来源:IJCAI-18阿里妈妈国际广告算法大赛 编辑:文强 【新智元导读】IJCAI-18阿里妈妈国际广告算法大赛上周结束,来自中国的团队包揽了冠亚季军。冠军方案采用了迁移学习的方法,核心代码只有一页。 IJCAI 2018阿里妈妈国际广告算法大赛上周圆满结束,有来自50多个国家和地区的6000多名选手组成的5300多支队伍参赛(有700多名来自国外)。 中国团队包揽了前三名。 实际上,进入决赛的8支队伍均来自中国。 这代表了中
新智元
2018/06/22
9680
代码过招 数字角逐 !2021“数字贵州双创杯”圆满收官
近日,2021“数字贵州双创杯”腾讯云数字经济产业基地低代码开发大赛决赛暨颁奖典礼在贵阳喜来登贵航酒店精彩开赛,来自全国的10个优秀项目同台竞技,角逐决赛总冠军。 “2021数字贵州双创杯”大赛圆满收官 本次大赛由南明区人民政府主办,腾讯云和贵州启云智谷科技有限公司承办。 2021数字贵州双创杯以“科技赋能 汇智创新”为主题,以“智慧城市、数智南明”为方向,基于WeCity技术底座和WeDa低代码平台两大技术赛道。 围绕政务办事、政企民互动、健康防疫、职业教育、生活便民服务等九大应用场景,通过可视化、组件
云产品技术支持小助手
2022/06/24
1.7K0
代码过招 数字角逐 !2021“数字贵州双创杯”圆满收官
从700多支队伍脱颖而出,知乎这个算法大赛冠军这样让大V「谢邀」答题
知乎是目前国内最大的知识问答社区。截止 2019 年 1 月,它已经成为一个拥有 2.2 亿用户的平台。每天平台上都会产生大量的新提问,但是如此海量的问题往往不会被能够回答问题的答题者主动发现。因此,有时候需要用户或平台算法主动向潜在的答题者提出邀请,让他们来回答问题。
机器之心
2020/02/12
8050
从700多支队伍脱颖而出,知乎这个算法大赛冠军这样让大V「谢邀」答题
推荐阅读
大赛丨2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出
9230
2017 CCF大数据与计算智能大赛(BDCI)完美收官
1.7K0
专访2016CCF大数据与计算智能大赛冠军:针对广告位的作弊检测算法
1.1K0
2016 CCF大数据与计算智能大赛 开源资料整理
1.2K0
CCF 大数据与计算智能大赛:挑战 11 题,成为顶尖数据科学家
1.1K0
2022年未来之光——未来网络科技创新大赛初赛说明
3550
2017年中国国际大数据挖掘大赛落幕 大数据与产业融合是大势所趋
6750
2021博世中国 x机器之心AIoT线上黑客松,决赛一触即发!
3630
2019腾讯广告算法大赛完美收官,算法达人鹅厂“出道”
1.5K0
暨南大学首次问鼎ASC世界超算大赛!清华获亚军,中山大学再破计算性能纪录
8030
2018百度之星落幕:14年传承再添新丁
5640
快手x清华即日启动大数据挑战赛,60万大奖悬赏你的最佳解决方案
3760
首届中国虚拟现实创新创业大赛福州赛区大赛完美落幕
8160
智慧城市路在何方?合肥三十万重金诚邀大数据英才!
4740
一等奖 5 万,华为 openinula 的开源大赛有点东西啊
1720
[人工智能/数据科学比赛]海上风场SCADA数据缺失智能修复
1.1K0
报名 | 2022中国高校计算机大赛——微信大数据挑战赛即将开启
1.1K0
IJCAI 2018国际广告算法大赛迁移学习夺冠,中国包揽冠亚季军
9680
代码过招 数字角逐 !2021“数字贵州双创杯”圆满收官
1.7K0
从700多支队伍脱颖而出,知乎这个算法大赛冠军这样让大V「谢邀」答题
8050
相关推荐
大赛丨2016 CCF 大数据与计算智能大赛完美落幕,11 支技术团队脱颖而出
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档