前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >商汤(现在)是一家怎样的公司?

商汤(现在)是一家怎样的公司?

作者头像
量子位
发布2018-03-27 16:33:04
1.7K0
发布2018-03-27 16:33:04
举报
文章被收录于专栏:量子位
李根 发自 清华科技园 量子位 报道 | 公众号 QbitAI
刚完成B轮4.1亿美元融资的商汤科技

刚宣布4.1亿美元B轮融资的商汤科技,是一家令人熟悉又陌生的AI公司。

人们在他单轮巨额融资时议论,在他科研论文刷屏CVPR时议论,在ImageNet五项比拼三项夺冠时议论。但又鲜有“编外”人员准确贴切地给商汤一个定义,这真是一家“人尽皆知”而又距离感明显的公司。

为了讲清楚商汤现在是一家什么样的公司,薛音在北京清华科技园的办公室里耗费了半小时。在不超过20平的展厅内,这位代表商汤讲解业务的员工不仅需要“说”,还要“动”。

薛音展示SenseAR应用

每一个小型业务展示台的相同标配是摄像头和屏幕,摄像头记录薛音的一言一行,屏幕相应做出实时反馈。

不同则是反馈的表现和目的,有的是为了识别,有的出于动态追踪,有的用于娱乐比颜值,有的则让直播网红们通过手机交互就能更炫酷一些,比如主播动手比个心,屏幕就真的出现了爱心——你或许不陌生,但多半不知道原来微博直播等背后的技术提供方是商汤。

所以商汤究竟是一家怎么样的公司?

从现有业务上看

在这场搜狐科技组织的观察活动来看,至少我们不难知道商汤正在做什么,每一个小展台都是一项具体落地业务的直观展示,可以归结为四大模块:

第一是软件的、系统的应用,如监控视频实现智能分析,主要应用在安防领域。

在目前落地的业务中,人脸布控、视图情报研判、人脸比对和视频结构化服务等成为落地重点。

商汤联合创始人杨帆还举例说,比如在成都太古里等密集商圈,商汤的智能视频分析技术,已经在帮助警察减轻反扒压力,并且具体作用不止于案发后对比追踪,更在于实时甚至是事前的研判预警。在此应用中,人脸识别、动作行为检测、人群分析,合理布控等技术被综合集成使用。

商汤智能视频分析应用展示

第二是偏软硬件一体的智能前端设备应用,涵盖人脸识别闸机、身份验证一体机、商户娱乐营销使用的互动广告机之类的软硬件落地业务。

第三则基于智能手机,这也是目前商汤最容易被“视而不见”的落地业务。小米、OPPO、vivo,华为等智能手机中均已纷纷上马。比如拍照时的人脸监测、相册相片的智能归类、美肤美颜,以及OPPO等宣传广告中铺天盖地的双摄解决方案。

实际上,第四项业务与智能手机也密不可分。不过这项名为SenseAR(增强显示感绘)的技术之所以被单独列出,一方面原因是核心技术上,最近商汤把人脸关键点定位技术从106点,提高到240点;另一方面则是因为该技术最为“亲民”,在FaceU、美图、一直播、小咖秀,熊猫直播等火热的视频类App中,AR交互基本源自该方案。

此外,还有一些基于识别的身份验证和文字识别技术相关的业务,它们更多被落地在金融相关的业务场景中,构成商汤400多家B端合作方的一部分。

不过通过以上四大主要业务模块,只能定义商汤的此时此地此身,这或许还不是全部。

从即将进入的领域看

在B轮4.1亿美元的官宣消息中,商汤还宣布将进入自动驾驶领域,这无疑为已经火热不已的无人车行业又添了一把火,不过具体如何进入、进入多深,期望如何,商汤并未展开。

在此次采访中,商汤科技创始人及CEO徐立向量子位给出了回答。

徐立说,商汤在自动驾驶方面的开拓进展,会和OEM厂商合作来进行。

他解释了具体原因:首先,现今无人车行业可以大致分为三大群体——1)做地图,无论是3D地图还是高精度地图;2)整体运营车辆及其部署;3)OEM厂商。

在这三大方向上选择,徐立认为当前最稀缺的资源在于OEM厂商,他们拥有在数据收集方面的绝对优势。比如完全以商汤自主来做,造1万辆车,全部上路收集数据,不谈可能性可行性,也已经看到极限。但OEM厂商,比如上汽一年出货量400多万,每台车上收集一个数据,就已经相当于商汤1万台车做400年……

所以在徐立看来,与车厂的结合是更高效更现实的方案,商汤在自动驾驶领域会结合双方优势,采取与OEM厂商合作的模式,无论是ADAS还是L4以上的完全无人驾驶,只要OEM厂商想做、能做,商汤都会在技术方案模块上去参与。

徐立最后还强调,与OEM厂商的合作,可能是将来自动驾驶实现的必由之路。

另一新领域将是零售。

在商汤现有的展示中,已然可以看出他们利用智能视频分析,把宜家等商超里的视频变成结构化数据,形成了分析和辅助决策的方案模型。

商汤方面透露称,零售方面具体的、落地的合作将在不久后宣布,他们的目的非常明确,即利用视频分析能力,结合线下零售场景,让线下商超具备精准营销和定向挖掘反馈的能力。

这还不止于线下零售。

徐立以近期火热的电视剧《我的前半生》为试验,在视频画面中,每一个物体,不论是茶杯、衣服、西装,只要出现,都被识别。然后进一步赋予链接也变得顺其自然。

在这位商汤创始人看来,这会让整个电商增加一个全新的空间,诸如阿里京东一样的电商公司,会在现有的规模上发挥更大效应和累积。

当然,自动驾驶和零售也不会成为商汤的业务边界。在被问及商汤的计划时,徐立给出了答案。

这位商汤创始人说,商汤科技想要做的事情,本身在打造一个人工智能为核心的底层架构,可以和很多垂直行业进行结合,在结合过程中,需要结合各个合作伙伴,把应用场景定义清楚。

所以商汤科技未来会展现出怎样的业务?某种意义上是从个人的芯片到端,手机社交,再加上家居商业,再到整个城市的链条,提供驱动行业发展的AI方案及模块。

商汤科技创始人及CEO徐立

商汤=1+1+X

除了直观表述,徐立甚至给还出了公式。他认为“1+1+X”就是商汤。

其中,“1”代表商汤科技本身,包含商汤的所有技术和能力;“+1”表示与产业进行结合,实现产研一体化;“+X”则意味着技术赋能。通过三者作用,实现产业的效率、效益和价值最大化。

如果按比喻来说,徐立认为商汤科技是卖深度学习的“乐高积木”,而且这个积木会通过与合作伙伴的联合,有更为明确的落地应用,可以搭无人车,可以搭人脸闸机,而商汤通过这套积木,就能卖很好的价钱,恰如特斯拉的自动驾驶模块——有需求就额外付费使用。

但说易行难,这种直接掏钱使用的价值模块,不仅要好用,还能持久,这对创立刚满3年的商汤不可谓不是挑战。

徐立回应称,这也是B轮4.1亿美元最核心的用途所在。他认为归根结底,商汤的核心竞争力现在基于三方面。

首先是垂直行业的结合与延伸,可以不断丰富产品线,实现公司的商业运转和进一步创新。

其次是基础核心应用平台。自创立以来,商汤出现在大众印象中的公司图片是一间服务器机房,这实际是商汤耗时费力后搭建起的深度学习专用的高性能GPU集群,也是商汤各类AI系统的基础层面的保障。

在这间机房里,拥有近3000块英伟达的GPU计算芯片,共有4个GPU集群。目前,如此规模的深度学习计算平台算得上全球罕见,也是商汤巨额融资背后的原因之一。

徐立告诉量子位,他们内部常调侃称,这样的平台上调整一次参数后出结果,就能耗费50万,而按照现在公司120名博士数目来计,每天按下的“按钮”——其实就是点击鼠标,都是大额支出,而且这也会是常态。不过徐立也表示,也是由于这些支出,保证了商汤跑得更快,技术护城河更深更厚。

最后也是最核心的竞争力,是人才。这位商汤创始人称,公司创立之初的18位教授和120位顶尖博士,正在产研结合中成为“导师”级人才,商汤未来更多会从学生中挑选,让导师带队,培养起自己的人才梯队,并打造真正的可持续的造血机制。

商汤科技创始人徐立、联合创始人杨帆

OMT:商汤心得:从学术界到工业界的建议

最后,作为从学术界到工业界的创业代表,商汤也向我们分享了相关看法:(综合了商汤科技创始人徐立和商汤联合创始人杨帆的观点)

从学术圈出来,很多人喜欢做命题作文,学术圈一定要成为某个行业的世界第一,才能发表出好的文章。在学术的概念当中,你一定要解决现有存在的问题,然后来做。甚至可以从现有的问题,把这个范围不停的缩小,缩小到这个范围不能再缩小为止。

比如我们以视觉为研究对象,而视觉里一个比较有意思的就是跟踪,就是通用的物体跟踪,我跟踪一个物体,结果发现全世界有100名顶级学者,你要做到世界顶级第一,你相对比较难,因为你要超过100个人。

其中研究更细分的利用视觉技术把物体变形,也有50个人来做,要成为50个人里面第一还是很难。

于是更细分,可以解决半透明的物体跟踪,全世界只有十个人干,相对竞争少了一些,但是要做全球第一还是有难度。最后,你可能研究的论题就变成了一个热的、非钢体的半透明的物体,全世界只有你一个人能做,然后你发表一个论文。

最后不难发现,在命题情况下,只能缩小它的应用范围,使得这个应用范围在切实情况下最终落到一个实际的点来实现解决。

然而,工业界完全不是这样的,工业界要有一个实际运营场景,我要解决开水放在这个透明玻璃瓶里。我要解决我家猫的动作跟踪,而且这个猫的动作可能牵扯到非常多的变化——光线的变化,皮毛的变化,于是你需要重新定义这件事情,不管是从猫的四肢开始解决,还是猫的脸开始解决,或者是整个猫的部分开始解决,这个问题的重定义,会变得非常关键。

然后在解决过程中,还需要把问题拆解称若干步骤,最后再拼接、落地应用,而且要高效、性能消耗合理。

大家看商汤的很多产品,比如SenseFace,其实就是人脸识别——这可能只是表象。你光讲一个人脸识别,在非场景中怎么去做人脸识别?这个事情可不可行?在实际的抓逃中,就会产生场景问题,所以我们还需要对模糊增强、比对,最后一系列技术问题解决后,才能只展现一个人脸识别系统。

看起来简单直白的场景应用,背后可能牵涉到一个系统的工程,涉及无数小问题和小方案,在工业界,研究和工程是并行的,无法分割,而对问题的重新定义,优先且最关键。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 从现有业务上看
  • 从即将进入的领域看
  • 商汤=1+1+X
  • OMT:商汤心得:从学术界到工业界的建议
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档