本文作者:小嗷
微信公众号:aoxiaoji
简书链接:https://www.jianshu.com/u/45da1fbce7d0
在本篇中,您将和地球上的每一个人站在同一起跑线:
TGS盐识别的挑战 --- 在地球表面下的盐份
本文你会找到以下问题的答案:
挑战成功,第一名5W美金,第二名2.5w,第三名1W5,第四名1W
报名截止 + 最后提交日期
相关信息等等
2.1 比赛描述
地球上的几个区域,有大量的石油和天然气,在地表之下也有大量的盐。
但不幸的是,知道大盐矿的确切位置是非常困难的。专业的地震成像技术仍然需要人类对盐体的解释。这就导致了非常主观的,高度可变的渲染。更令人担忧的是,这将给石油和天然气公司的钻探者带来潜在的危险。
为了创造出最精确的地震图像和3D渲染,TGS(世界领先的地球科学数据公司)希望Kaggle的机器学习社区能够建立一种算法,自动准确地识别地下目标是否为盐。
2.2 评估
这种竞争是在不同的交叉(IoU)阈值上的平均平均精度进行评估的。一组对象像素和一组真实的对象像素的IoU被计算为:
度规扫过一系列的IoU阈值,在每一点计算一个平均精度值。阈值范围从0。5到0。95,步长为0。05:(0.5,0。55,0。6,0。65,0。75,0。8,0。85,0。9,0。95)。换句话说,在0。5的阈值下,如果一个被预测的物体与一个地真物体的交叉点大于0。5,那么它被认为是一个“命中”。
在每一个阈值tt中,一个精确值是根据真实的阳性(TP)、假阴性(FN)和假阳性(FP)的数量来计算的,因为将预测的对象与所有的对象进行比较。
当一个单一的预测对象与一个高于阈值的IoU相匹配时,就会计算出一个真正的正数。假阳性表示一个预测的物体没有相关的地面真相物体。假阴性表示地真对象没有相关的预测对象。然后,在每个IoU阈值中计算出单个图像的平均精度,即上述精度值的平均值:
最后,竞争指标返回的分数是在测试数据集中的每个图像的单个平均精度的平均值。
提交文件
为了减少提交文件的大小,我们的度量标准使用像素值上的运行长度编码。你将提交一组包含起始位置和运行长度的值,而不是提交一份详尽的索引列表。如。“1 3”意味着从像素1开始,运行总共3个像素(1,2,3)。
竞争格式需要一个空格分隔的成对列表。例如,“1 3 10 5”意味着像素1 2 3 10 11 12 13 14将被包含在蒙版中。像素是一个索引的,从上到下编号,然后从左到右:1是像素(1,1),2是像素(2,1),等等。
该文件应该包含一个标题,并具有以下格式。在你的提交中,每一行代表一个对给定图像的单一预测的盐分割。
2.3 日期
2018年10月12日——进入最后期限。为了竞争,你必须在这个日期之前接受竞争规则。
2018年10月12日-团队合并的最后期限。这是最后一天参与者可以加入或合并团队。
2018年10月19日——最后提交截止日期。
已经活动开始4天
2.4 还能一对一的鬼佬大神交谈
反正小嗷都是用翻译软件和这群鬼佬交谈,哈哈哈,没什么可耻。
2.5 最新大神排行榜
小嗷观察前30名有没有中国人面孔,发现一个都没有,小嗷不经想起,媒体经常吹清华北大什么人工智能全球第一,是不是吹给国民看,值得深思(看到日本人/韩国/华裔)
2.6 核心程序(因为都是用Google的TF,所以是py写的)
其实,小嗷主要是看他们的思路而已
2.7 比赛数据(官网可以下载)
kaggle比赛所用的数据是随机选取的不同地下位置的一组图像。图像为101 x 101像素“灰度图像”,每个像素分为盐或沉积物。除了地震图像之外,还为每个图像提供成像位置的深度。比赛的目标是分割标示出含盐区域。
训练图像示例:
训练集包含4000幅101 x 101像素地震图像和与其对应的标示出盐体的mask图像、地下深度数据,测试集包含18000幅相同大小的地震图像和与其对应的深度数据。
比赛参与者的目标是使用算法为18000幅地震图像生成盐体mask图像。
无
无
领取专属 10元无门槛券
私享最新 技术干货