本文约2000字,建议阅读5分钟 本文为你介绍国产科幻视觉特效制作。 内容一览:在春节档科幻电影「流浪地球 2」中,主演吴京、刘德华、沙溢等人饰演的角色,跨越 14 年之久,视效团队正是借助 Deepfake de-aging 技术,呈现出了演员不同年龄段的容貌。 关键词:De-aging Deepfake 流浪地球 流浪地球官方微博发布的一段视频中,讲述了换脸特效背后繁复的工程难度。 吴京:不要被我年轻俊美的容颜吓坏哦 视频来源:@电影流浪地球官方微博 在知乎提问「《流浪地球 2》幕后有哪些
在拍照时我们常常会遇到这样的苦恼:由于设置的快门时间太长,快速运动的物体会在身后产生严重的拖影。
内容一览:在春节档科幻电影「流浪地球 2」中,主演吴京、刘德华、沙溢等人饰演的角色,跨越 14 年之久,视效团队正是借助 Deepfake de-aging 技术,呈现出了演员不同年龄段的容貌。
Plane-Aided Visual-Inertial Odometry for 6-DOF Pose Estimation of a Robotic Navigation Aid
针对存在非视距(non-line-of-sight, NLOS)的室内定位算法进行研究. 首先描述室内定位中的常用技术和算法(航迹推算、指纹识别定位、邻近探测、极点定位、三角定位、多边定位、质心定位), 概括其原理、优缺点和适用场景; 其次, 通过仿真测试说明研究NLOS识别和抑制的必要性; 再次, 分别介绍NLOS识别和NLOS抑制的几类算法, NLOS识别算法包括统计学方法、几何关系法、机器学习法、信道特征提取法和虚点密度识别法, NLOS抑制算法包括模糊理论法、引入平衡参数法、几何关系法、小波去噪法、机器学习类算法、凸优化类算法、残差类算法、最小二乘类算法和多维缩放类算法; 最后, 对全文进行总结并指出NLOS室内定位亟待解决的问题.
随着深度学习和机器学习的发展,机器人已经走出实验室,越来越多地地应用于各行各业,其中,仓储物流和工业化领域就有许多适合机器人作业的场景环境。
来源丨https://www.zhihu.com/question/63159179/answer/257832184
ArcGIS是一个强大的地理信息系统软件,它可以用于地图制作、数据管理和空间分析等多个领域。而在这些领域中,ArcGIS具有许多独特的功能,可以帮助用户快速准确地进行地理信息数据处理和分析。在本文中,我们将主要介绍ArcGIS的三个独特功能:三维建模、空间插值和数据驱动页面,并通过实际案例来帮助读者更好地理解。
能够感知手的形状和运动,这是改善各种技术领域和平台的用户体验的重要组成部分。例如,它可以形成手语理解和手势控制的基础,并且还可以在增强现实中实现物理世界之上的数字内容和信息的叠加。虽然对人们来说很自然,强大的实时手感是一项极具挑战性的计算机视觉任务,因为手经常遮挡自己或彼此(例如手指/手掌闭塞和手抖)并且缺乏高对比度模式。
中国叶面积指数(LAI)月度合成产品,由航天宏图实验室提供,根据NASA MODIS数据(MCD15A2H.061)通过航天宏图 Smoother计算得到的平滑后LAI产品,解决了影像云雾覆盖、像元异常值等问题。对处理后的覆盖中国区域的影像结果镶嵌,生成了分辨率为500米的月合成产品。前言 – 人工智能教程
3D揭秘 一、3D概率原理所有的×××游戏都是一种古典型概率事件,服从古典型概率的基本原则。我们从最简单的机会游戏开始:当我们连续抛一枚硬币50次,当连续九次出现正面时,让您来猜第十次,您是猜正面还是
近日,就读于世界计算机专业顶级院校卡内基梅隆大学(CMU)的 1 名中国博士生开发了一个机器学习算法 Higashi,可以诠释人体细胞核中基因组的折叠方式、以及这些折叠如何影响基因的表达,研究登上了《Nature Biotechnology》!
Slam:同步定位与建图,就是在定位的同时,建立环境地图。 主要思路是根据运动学模型计算位姿,并通过传感得到的环境信息,对估计位姿调整优化,从而得到准确位姿,根据定位及感知数据绘制地图。 下图为slam主流框架:
文章:A Survey on Odometry for Autonomous Navigation Systems
1.比较笨的枚举算法思想 2聪明—点的递推算法思想 3.充分利用自己的递归算法思想 4.各个击破的分治算法思想 5.贪心算法思想并不贪婪 6.试探法算法思想是—种委婉的做法 7.迭代算法 8.模拟算法思想
针对存在非视距(non-line-of-sight, NLOS)的室内定位算法进行研究. 首先描述室内定位中的常用技术和算法(航迹推算、指纹识别定位、邻近探测、极点定位、三角定位、多边定位、质心定位), 概括其原理、优缺点和适用场景; 其次, 通过仿真测试说明研究NLOS识别和抑制的必要性; 再次, 分别介绍NLOS识别和NLOS抑制的几类算法, NLOS识别算法包括统计学方法、几何关系法、机器学习法、信道特征提取法和虚点密度识别法, NLOS抑制算法包括模糊理论法、引入平衡参数法、几何关系法、小波去噪法、机器学习类算法、凸优化类算法、残差类算法、最小二乘类算法和多维缩放类算法; 最后, 对全文进行总结并指出NLOS室内定位亟待解决的问题. 全球定位系统(global positioning system, GPS), 凭借其广泛的应用范围和较高的定位精度, 受到了各方面专家和学者的青睐, 其在室外可以提供比较可靠的定位服务. 然而, 由于室内环境较为复杂, 信号的传播过程中会遇到障碍物(行人、墙壁、桌椅等)的阻塞, 使得信号发生反射、折射或散射, 导致强度减弱, GPS并不能实现精确的定位, 即在存在非视距(non-line-of-sight, NLOS)的室内环境中, 定位精度会有所下降. 如何有效识别和抑制NLOS, 从而提高定位精度是目前室内定位研究的热点问题之一. 室内定位作为定位技术在室内环境的延续, 应用更加广泛. 精确的节点位置信息可以应用在环境监测、军事侦察、定位打击目标、公共安全及应急响应等方面.
桔妹导读:机场、商场、火车站等大型室内场所内GPS信号不稳定、室内面积大、路线复杂、用户判断方向难等问题,给在大型场所内发单的乘客找上车点带来了很大的挑战,用户急需一种操作简单、交互友好的引导功能。本文讲述了使用三维重建技术、传感器计算技术和增强现实(AR)技术所开发的滴滴AR实景导航产品,并对开发过程中遇到的难点、挑战和解决思路展开介绍。
检测并归类图像中的物体是最广为人知的一个计算机视觉任务,随着ImageNet数据集挑战 而更加流行。不过还有一个令人恼火的问题有待解决:视频理解。视频理解指的是对视频片段进行分析并进行解读。虽然有一些最新的进展,现代算法还远远达不到人类的理解层次。
今天为大家介绍的是来自Shuqi Lu团队的一篇论文。近年来,在各种下游任务中基于3D结构的预训练蛋白质模型的发展激增,这代表了预训练蛋白质语言模型的重大进步。然而,大多数现有的基于结构的预训练模型主要关注残留物水平,即α碳原子,而忽略了如侧链原子等其他原子。作者认为,在残基和原子水平上对蛋白质进行建模是很重要的,因为侧链原子对许多诸如分子对接等下游任务也至关重要。然而,作者发现在预训练中天真地结合残基和原子信息通常会失败。一个关键原因是输入中包含原子结构导致的信息泄漏,这使得残差级预训练任务变得微不足道,导致残差表示的表达不足。为了解决这个问题,作者在3D蛋白质链上引入了一个跨度掩模预训练策略,以学习残基和原子的有意义表示。这导致了一种简单而有效的方法来学习适合于各种下游任务的蛋白质表示。结合位点预测和功能预测任务的大量实验结果表明,该预训练方法明显优于其他方法。
SLAM和三维重建的落地应用一直走的比较艰难,之前华为mate30 发布三维重建应用时,还是很亮眼的,计算机视觉life 当时也第一时间进行了解读(看这里:华为 Mate20 Pro 3D建模,真的能让宅男的手办老婆复活吗?)
当机器人高速进入工厂流水线时,在建筑领域,机器人的存在却接近于零。不过,学术界有许多建筑机器人研究项目正在进行,在未来十年中,他们将确定出现在现实的建筑工地上。 这些机器人会来是什么样的呢?人形机器人?工业机械手?大型3D打印机?或者是一些我们还未见过的形状?我认为,建筑机器人最终会有他们自己独特的外观,是我们前所未见的。不仅建筑机器人看起来不同,建筑构件和施工方法的设计也将可能发生巨大的改变。 首先,让我们看看建筑机器人不应该是什么样子的,为什么。 为什么不是人形机器人? 每次我问我的非工程
Arxiv 链接:https://arxiv.org/abs/2304.04672
直线检测是经典的底层视觉任务,对一些视觉任务,如自动驾驶、场景3D建模、无人机地平线检测等不可或缺。我们熟知的霍夫变换,就是解决直线检测问题的经典算法。然而,传统算法缺乏鲁棒性,只能受限于简单的应用场景。如今在充分的标注数据支持下,基于神经网络的直线检测算法对检测精度和鲁棒性有了很大提升。在数据驱动下,通过神经网络解决底层视觉任务,效果一般会更好。
科技正在以一种近乎革命性的手段解决生活中真实存在的难题。人工智能的出现,重新定义了文物保护的方法,克服了传统方式中的困难和挑战,以更快、更高效的方式解决凭借人力无法解决的问题。
通过英特尔人工智能技术、深度学习技术、无人机技术等,如果实现对于箭扣长城的保护与修缮?答案就在视频里。
文章:Ctrl-VIO: Continuous-Time Visual-Inertial Odometry for Rolling Shutter Cameras
算法(algorithm)就是一个过程,是一种特殊的过程。它必须描述为一个有限步骤序列,且必须在有限时间内结束。每个步骤必须是良好定义的,达到人类可用一支笔和一张纸执行它的程度。
苹果公司在3月18日发布新款ipad pro等产品,基于新搭载的DToF激光雷达,有望将AR应用效果的精确度、流畅性提高到新的级别,同时可以降低设备功耗。国内的3D摄像头公司对TOF技术很熟悉,大家使用的都是基于IToF的方案;DToF技术多数厂商还都很陌生,国内的相关产业链也还不成熟,网上关于DToF的资料也相对较少,为了更好的理解DToF技术,根据从去年下半年开始对DToF的追踪,我们整理了这篇文章,目的是方便大家加深对这个技术的理解。
关于理解PID控制算法最典型的一个例子就是一个漏水的水缸的问题。网上有很多讲解PID的帖子会讲到这个例子。这里我也把我自己对于PID的理解用这个例子阐述一遍。
通过英特尔人工智能技术、深度学习技术、无人机技术等,如何实现对于箭扣长城的保护与修缮? 答案就在视频里。
通过英特尔人工智能技术、深度学习技术、无人机技术等,如何实现对于箭扣长城的保护与修缮?答案就在视频里。
既能准确计算进出人数,又能有效过滤掉干扰物体(如推车、行李箱、人员徘徊、拥挤及躯体重叠、人员经过未进入等,另外用户也需要有特殊应用,比如身高低于1.2米的儿童进出不计数等),使得客流统计准确率号称可以达到97%以上。
本文为joshua317原创文章,转载请注明:转载自joshua317博客 https://www.joshua317.com/article/113
项目代码:https://github.com/liyongqi2002/TadNER
在现在的焊接生产过程中,不同的产品通常需要特定的焊接设备及工装夹具,需要设计不同类型的生产线及生产流程,即便是同类的产品,由于型号不同,通常也需要更换工装夹具。同时由于工件在组对过程中存在组对误差,加工过程存在加工误差,所以会导致实际焊接的工件与设计图样存在差异,工件一致性较差,对于机器人焊接来说简单的示教通常存在较大的误差。在焊接过程中的热形变也会引起误差,造成焊接缺陷。以上问题在一般工业生产中普遍存在,这就需要焊接自动化生产线具有精确定位工件和纠正偏差的能力,同时在焊接过程中能够对焊缝实时检测,调整焊接的路径,纠正焊接的偏差,保证焊接的质量,这样也可以大幅降低操作人员的工作量,提高焊接效率,降低制造成本,实现智能的柔性制造。
通知:这篇文章有15篇论文速递信息,涉及目标检测、目标跟踪、姿态估计、SLAM、GAN、行为识别、去雾、网络优化等方向 创办CVer公众号,渐渐半个多月了,很感谢得到这么多童鞋的关注和支持。特别是看到后台有人给我留言:加油,我很喜欢你的公众号。我心里很满足,也很有动力。 我尽量维持1.5day频率的更新速度,但写一篇推文确实太耗时间了,哪怕暂时是以“译文”为主的文章。在此向那些奉献知识的工作者表示致敬。 最近有同学建议我,可以开启打赏功能,分享知识的同时,获得物质上的赞赏,也是作为对你的工作一种肯定。我没有
机器之心原创 作者:杜伟 继让老照片动起来、唱歌之后,腾讯微视又解锁了照片的跳舞技能。 80、90 后的小伙伴,应该很熟悉香港歌手陈慧琳的热门歌曲《不如跳舞》吧,歌词中的「聊天不如跳舞,谈恋爱不如跳舞……」风靡了大街小巷,使很多人爱上了跳舞。遗憾的是,对于一些四肢不协调的小伙伴,在人前跳舞无异于一种折磨。但是,不会跳并不意味着看不到自己跳舞的样子。 随着计算机视觉和生成对抗网络的快速发展,人体动作迁移技术的出现使那些没有跳舞天赋的小伙伴也有机会展示自己的舞姿。简单来讲,给定一段别人跳舞的视频和用户的一张照
鱼羊 Alex 发自 凹非寺 量子位 | 公众号 QbitAI 又一个AI老大难问题,被DeepMind攻克了: 一只名叫DreamerV3的AI,在啥也不知道的情况下被丢进《我的世界》(MineCraft)里,摸爬滚打17天,还真就学会了如何从0开始挖钻石。 △就是从撸树开始的那种 要知道,之前为了攻克这个问题,CMU、微软、DeepMind和OpenAI还联手在NeurIPS上拉了个比赛,叫MineRL。 结果搞了三四年,AI们也没能在不参考人类经验的情况下,完成挖钻石任务。 此前表现最好的VPT选手
深度传感镜头作为智能手机创新模式,苹果在最新版iPad Pro上搭载了D-ToF(直接飞行时间法)深度传感镜头,推动了3D视觉在消费场景的应用。
比特币白皮书在工作量证明章节中解释了工作量证明(PoW)的方式: 我们在区块中补增一个随机数(Nonce),这个随机数要使得该给定区块的随机散列值出现了所需的那么多个0。我们通过反复尝试来找到这个随机数,直到找到为止,这样我们就构建了一个工作量证明机制。只要该CPU耗费的工作量能够满足该工作量证明机制,那么除非重新完成相当的工作量,该区块的信息就不可更改。由于之后的区块是链接在该区块之后的,所以想要更改该区块中的信息,就还需要重新完成之后所有区块的全部工作量。 那这个随机数难度值是怎么产生的呢? 原理是简单
对不同的场景,标注技术是完全不同的,比如:视线分类的标注、身体姿态估计的标注、SegFuse 比赛中图片像素级的标注。
现在主流的VR硬件设备,主要的输入输出设备还是类似传统游戏手柄的外设:Oculus在Touch没发布之前,一直用的是微软的Xbox的手柄;HTC和索尼都有自己研制开发的控制器作为交互工具。 但是如果想要在VR中达到更加自然的交互和沉浸体验,摆脱外设的手势识别必然是未来发展的一个大方向。 手势识别技术的发展 手势识别技术的发展,可以粗略分为两个阶段:二维手势识别以及三维手势识别。 早期的手势识别识别是基于二维彩色图像的识别技术,所谓的二维彩色图像是指通过普通摄像头拍出场景后,得到二维的静态图像,然后再通过计算
文/I.Issak 杜修琪 转自大象公会 3月30日,中国台湾爆发反服贸抗议游行。下午1点,游行民众在凯达格兰大道集结。晚间7点40分左右,学生代表林飞帆宣布凯道活动告一段落,但强调占领“立法院”行动不会停止。 对于前往凯道参加反服贸游行的人数,各方说法大相径庭。截至当天下午2点06分,中国台湾警方估计人数已突破21万人,学生团体则估计高达35万人,而中国台湾“警政署”公布的统计数字则为8.1万人。 反服贸游行现场 政府和组织者对集会人数各执一词的情况并不鲜见,它几乎每年都要在中国香港发生两次。比如在
---- 新智元报道 编辑:武穆 桃子 【新智元导读】今天,脑科学计划宣布启动的「细胞图谱网络项目」,目标是绘制世界上最全面的人类大脑细胞图谱。这种雄心,堪比当年的人类基因组计划。 今天,美国国立卫生研究院(NIH)宣布了两个由「脑科学计划」发起的创新项目: 一个是「脑科学计划之细胞图谱网络项目」(BICAN),另一个是「精确脑细胞访问设备中心」。 未来5年,BICAN项目将获得5亿美元的资助,旨在绘制世界最全面的脑细胞图。 研究院认为,这些BRAIN 2.0项目旨在改变我们对脑细胞类型的理解
领取专属 10元无门槛券
手把手带您无忧上云