前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >实战案例 | 财务人员必学的数据赋能实战案例:一秒钟对账

实战案例 | 财务人员必学的数据赋能实战案例:一秒钟对账

作者头像
CDA数据分析师
发布于 2022-11-17 07:20:17
发布于 2022-11-17 07:20:17
76000
代码可运行
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师
运行总次数:0
代码可运行


CDA数据分析师 出品

作者:曹鑫

01

如果你是一个财务人员

我知道,一说到数字经济,数字化转型,数字化人才,你第一感觉就是:跟我有半毛钱关系。诶,不要着急!

至少 Excel 你天天在用吧?只不过你可能用的最多的就是复制粘贴记录一下数据。你不要怀疑,这高低、左右,都算是数字化技能!因为数字化技能的核心就是数据能力,而且数据能力贯穿着公司业务全流程的每个环节,这也是为什么说,数字经济时代的新生产资料是数据!看看这张数据能力图,分成四个层面:需求层、数据层、分析层、输出层;第一层是需求层,是目标确定的过程,对整个业务进行拆解,为数据工作指明方向;第二层是数据层,包含数据获取、数据清洗、数据整;第三层是分析层,包含描述性统计制图、业务根因分析,这里就涉及到专业的算法;第四层是输出层,面向管理层、决策层、执行层,给出不同的数据报告、业务仪表盘、落地模型等。

02

面对这样一个问题

今天遇到一个任务是「财务对账」。

对账,可以说是财务最常做的一个工作,也是基础工作之一。就算你们公司的系统已经非常完整了,你还是会遇到两个表要核对差异在哪里的情况。你会怎么做?

当数据量不大的时候,我们最简单的做法,也是最符合第一直觉的做法,把两张表放到一起,一左一右,左边有个268,右边有个268,这就对上了;左边有个20.1,右边没找到20.1,这就是多记了,但是右边有个21,所以也有可能是错记了;左边有个100,右边也有个100,左边还有个100,右边没有100了,那这里可能是多记了。剩下右边还有个8,那这就是左边漏记了,这样就把不同情况都分析出来了。

但如果数据量大了,几百上千行,甚至几万行,这个方法就有点累了,比如我们现在有的两张数据表,一份公司银行存款明细账和一份银行流水,我们需要将公司银行存款明细中的借方与银行流水的收款金额进行核对。别说几百上千行了,光看这个100多行,我就觉得看着累。

03

解析问题

如果用 Python 来做,效率就会大大提升。我们先看看Python实现的逻辑,还是之前的例子:我们要看数据有没有重复,就是统计每个数据在两个表分别出现的次数,然后两个表中的个数相减。

  • 268,在两张表中分别出现了1次,重复次数就是0,说明268这个数字不重复;
  • 20.1,只在公司银行存款明细账中出现了一次,重复次数就是1次,说明20.1在公司账多记录了一次,也可能是记错了;
  • 100,在公司银行存款明细中出现了2次,银行流水出现了1次,重复次数就是1次,说明100在公司账多记录了一次,也可能是记错了;
  • 21,只在银行流水出现了1次,重复次数就是-1次,说明21在公司账里面漏记了;
  • 8,跟21是一样的情况,也是在公司账里面漏记录了,因为银行流水就是银行直接导出的,有钱出入才会有记录,所以以银行流水为准。

知道了逻辑,我们就可以来操作了。先看看效果,就是这30多行代码,作为新人,你别怕,我们先看看有多爽!

04

效果演示

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

# 读取公司明细账
df_gs = pd.read_excel('./对账数据/公司银行存款明细账.xlsx',header=1)

# 读取银行流水
df_yh = pd.read_excel('./对账数据/银行流水.xlsx',header=1)

df_gs_jie = df_gs[['凭证号','借方']]
df_gs_jie = df_gs_jie.rename(columns={'借方':'金额'})

df_yh_shou = df_yh[['收款金额','对方户名']]
df_yh_shou = df_yh_shou.rename(columns={'收款金额':'金额'})

# 将两张表的借方-收款拼接
mergedStuff_jie_shou= df_gs_jie.append(df_yh_shou)
mergedStuff_jie_shou = mergedStuff_jie_shou[mergedStuff_jie_shou['金额'] != 0]

df_count = mergedStuff_jie_shou.groupby(by='金额').count()

# 判断金额出现的次数
df_count['重复次数']  =  df_count['凭证号'] - df_count['对方户名']

# 重复次数不为0,就是没有对上
df_result =  df_count[df_count['重复次数'] != 0].copy()

# 判断错误问题
df_result['错误原因'] = df_result.apply(lambda x: '漏记' if x['重复次数']< 0 else ('重复记录/多记' if x['重复次数'] > 1 else '多记/错记'), axis=1)
print('借方-收款出现的错误')
df_result[['错误原因']]
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 列出两张表中具体的行
# 公司银行存款明细账中的多记/错记
df_gs[df_gs['借方'] == 1.00]
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 银行流水中的漏记
df_yh[(df_yh['收款金额'] == 637146.52) |
      (df_yh['收款金额'] == 27023289.88) ]

05

实操代码

读取两张 Excel 表的数据

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

# 读取公司明细账
df_gs = pd.read_excel('./对账数据/公司银行存款明细账.xlsx',header=1)
df_gs.head()
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 读取银行流水
df_yh = pd.read_excel('./对账数据/银行流水.xlsx',header=1)
df_yh.head()

数据清洗:修改列名

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df_gs_jie = df_gs[['凭证号','借方']]
df_gs_jie = df_gs_jie.rename(columns={'借方':'金额'})
df_gs_jie.head()
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df_yh_shou = df_yh[['收款金额','对方户名']]
df_yh_shou = df_yh_shou.rename(columns={'收款金额':'金额'})
df_yh_shou.head()

拼接两张表

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 将两张表的借方-收款拼接
mergedStuff_jie_shou= df_gs_jie.append(df_yh_shou)
mergedStuff_jie_shou = mergedStuff_jie_shou[mergedStuff_jie_shou['金额'] != 0]  # 剔除金额为 0 的行
mergedStuff_jie_shou

根据金额进行统计

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df_count = mergedStuff_jie_shou.groupby(by='金额').count()
df_count
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 判断金额出现的次数
df_count['重复次数']  =  df_count['凭证号'] - df_count['对方户名']
df_count
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 重复次数不为0,就是没有对上
df_result =  df_count[df_count['重复次数'] != 0].copy()
df_result
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 判断错误问题
df_result['错误原因'] = df_result.apply(lambda x: '漏记' if x['重复次数']< 0 else ('重复记录/多记' if x['重复次数'] > 1 else '多记/错记'), axis=1)
print('借方-收款出现的错误')
df_result[['错误原因']]
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 多记/错记
df_gs[df_gs['借方'] == 1.00]
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 漏记
df_yh[(df_yh['收款金额'] == 637146.52) |
      (df_yh['收款金额'] == 27023289.88) ]

未来,你只要修改好需要读取的表,确定需要比对的列,然后一键运行,结果一瞬间就出来了,而且你之后每个月,每周,甚至每天要比对的时候,你只需要确定好你要比对的表,比对的数据列,就可以快速得到结果,代码复用效率极高。你还可以进一步查看各自表中具体行的数据,方便你具体判断。

今天的内容就分享到这里,如果你想了解其他方面的内容,欢迎给我们留言哦。

本文出品:CDA数据分析师

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-11-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
​新加坡 & 纽约大学 & 字节 提出 PLLaVA | 简单高效视频语言模型适应方法,超越GPT4V,突破资源限制 !
多模态大型语言模型(MLLMs)在训练大规模图像-文本对时已显示出在图像理解方面的卓越能力。与图像领域类似,最近的视频理解模型也探索了类似的流程,在大规模视频-文本数据上对LLMs进行微调。然而,这种方法需要高昂的计算资源和视频数据标注成本。一种更为实用的方法是调整预先训练好的图像领域MLLMs以适应视频数据。
AIGC 先锋科技
2024/07/08
5190
​新加坡 & 纽约大学 & 字节 提出 PLLaVA | 简单高效视频语言模型适应方法,超越GPT4V,突破资源限制 !
国防科大最新 | SceneTracker:在4D时空中追踪万物
本文分享论文SceneTracker: Long-term Scene Flow Estimation Network,提出 SceneTracker,首个公开的(2024.03)有效解决在线 3D 点跟踪问题或长时场景流估计问题(LSFE)的工作。
CV君
2024/05/20
2260
国防科大最新 | SceneTracker:在4D时空中追踪万物
文字生成图片综述 - plus studio
根据文字生成图像,是近几年大模型领域和多模态比较热门的研究。以NovelAI,waifu等为代表的二次元模型极大地拓展了 stable diffusion [5][24]模型和生态的想象空间。例如原本做AIGC生成小说的NovelAI推出了自己的二次元图像生成模型,基于 SD 算法框架和 Danbooru 二次元图库数据集进行训练和优化。像 NovelAI 这类的二次元模型对于用户输入的描述词的专业程度要求较高,也由社区自发整理了大量的魔典(prompt).精确控制图像的生成也是AI绘画的一个发展方向,各种可以控制人物动作,位置的方法[10][13][19]被提出.最近openai也开源了他们最新的研究Consistency Models[20] ,可以1s内生成多张图片。此外,stable diffusion也被用在了3d模型的生成方面,例如 dreamfusion[25],Point-E[26] 等。
plus sign
2024/02/28
6970
文字生成图片综述 - plus studio
ICCV 2023 | 基于模型的深度视频压缩
传统的混合视频编码框架和现有的基于深度学习的视频压缩(DLVC)方法都遵循相同的视频压缩方法,通过设计各种模块来减少空间和时间冗余。它们使用同一帧或相邻帧中的相邻像素作为参考来导出帧内或帧间预测值。由于视频序列是以高帧率(例如30fps或60fps)捕获的,因此同一场景可能出现在时域中高度相关的数百个帧中。然而,现有的压缩策略并不能很好地去除块级或帧级预测中的场景冗余。
用户1324186
2023/10/24
1.4K0
ICCV 2023 | 基于模型的深度视频压缩
太强!AI没有落下的腾讯出YOLO-World爆款 | 开集目标检测速度提升20倍,效果不减
YOLO系列检测器已将自己确立为高效实用的工具。然而,它们依赖于预定义和训练的物体类别,这在开放场景中限制了它们的适用性。针对这一限制,作者引入了YOLO-World,这是一种创新的方法,通过视觉语言建模和在大型数据集上的预训练,将YOLO与开集检测能力相结合。具体来说,作者提出了一种新的可重参化的视觉语言路径聚合网络(RepVL-PAN)和区域文本对比损失,以促进视觉和语言信息之间的交互。作者的方法在以零样本方式检测广泛范围的物体时表现出色,且效率高。 在具有挑战性的LVIS数据集上,YOLO-World在V100上实现了35.4 AP和52.0 FPS,在准确性和速度上都超过了许多最先进的方法。此外,经过微调的YOLO-World在包括目标检测和开集实例分割在内的几个下游任务上取得了显著性能。
集智书童公众号
2024/02/01
4.3K0
太强!AI没有落下的腾讯出YOLO-World爆款 | 开集目标检测速度提升20倍,效果不减
厦门大学突破 SRKD框架 | 雨天无阻,显著提高了检测精度
近年来,利用点云数据进行三维目标检测的研究兴趣日益增长。为了在自动驾驶等领域广泛应用,这些模型必须在多种环境下展现出稳健的性能。尽管在基准数据集上的三维目标检测已经取得进展,但在恶劣天气条件(例如,雨天)下实现一致且可靠性能仍是一个开放的挑战。
集智书童公众号
2024/04/12
8400
厦门大学突破 SRKD框架 | 雨天无阻,显著提高了检测精度
IEEE Transactions on Multimedia | 实时自由视角视频生成系统
随着5G网络和边缘计算技术的普及,实时自由视角视频合成方法在自由视角视频直播、3D电视、快速自由视角视频渲染以及许多其他场景中的应用越来越广泛。一般来说,实时自由视角视频合成方法可以分为五类:密集相机布置、基于3D模型重建的合成、基于神经渲染的合成、帧插值,以及基于深度图像的渲染(DIBR)。在这五类中,DIBR是在自由视角视频系统中最有效和广泛使用的方法。 为了开发基于DIBR的自由视角视频渲染方法,已经做出了巨大努力,因为它们提供了几个优点:
用户1324186
2024/04/26
5790
IEEE Transactions on Multimedia | 实时自由视角视频生成系统
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
SCTransNet有效地编码了目标与背景之间的语义差异,从而提升了其内部表征,以准确检测小红外目标。 在三个公开数据集NUDT-SIRST、NUAA-SIRST和IRSTD-1k上的大量实验表明,所提出的SCTransNet优于现有的IRSTD方法。 代码:https://github.com/xdFai
集智书童公众号
2024/02/21
2.1K0
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
MambaMOS| 一种新的激光雷达点云运动目标精确分割技术,性能表示 SOTA !
基于激光雷达的移动对象分割(MOS)任务对于准确描绘当前激光雷达扫描中的移动实体(如汽车或行人)至关重要,它是自动驾驶系统感知功能的基础组件[5, 46]。MOS在两个方面做出贡献。
AIGC 先锋科技
2024/07/08
3960
MambaMOS| 一种新的激光雷达点云运动目标精确分割技术,性能表示 SOTA !
标题:逆光、眩光问题视觉模型怎么解决?一个感知卷积让检测/识别/跟踪/深度估计等任务,统统适用!
一个准确且鲁棒的环境感知系统对于智能交通的发展至关重要,尤其是在自动驾驶车辆的情况下。满足J3016国际标准中规定的第5级自主性的要求,意味着需要具备在所谓的操作设计域之外进行操作的能力。不是在精心管理(通常是城市)的环境中,拥有大量专用基础设施。自动驾驶车辆(AVs)应该能够在不可控环境中运行,包括具有挑战性的天气、眩光、霾和雾造成的照明变化、标识不良的道路以及不可预测的道路使用者。
集智书童公众号
2024/04/26
1.5K0
标题:逆光、眩光问题视觉模型怎么解决?一个感知卷积让检测/识别/跟踪/深度估计等任务,统统适用!
文生图文字模糊怎么办 | AnyText解决文生图中文字模糊问题,完成视觉文本生成和编辑
前者使用文本的字符、位置和掩码图像等输入来为文本生成或编辑生成潜在特征。后者采用OCR模型将笔划数据编码为嵌入,与来自分词器的图像描述嵌入相结合,以生成与背景无缝融合的文本。作者在训练中采用了文本控制扩散损失和文本感知损失,以进一步提高写作准确性。据作者所知,AnyText是第一个解决多语言视觉文本生成的工作。 值得一提的是,AnyText可以与社区现有的扩散模型相结合,用于准确地渲染或编辑文本。经过广泛的评估实验,作者的方法在明显程度上优于其他所有方法。 此外,作者还贡献了第一个大规模的多语言文本图像数据集AnyWord-3M,该数据集包含300万个图像-文本对,并带有多种语言的OCR注释。基于AnyWord-3M数据集,作者提出了AnyText-benchmark,用于评估视觉文本生成准确性和质量。 代码:https://github.com/tyxsspa/AnyText
公众号-arXiv每日学术速递
2023/11/15
1.2K0
文生图文字模糊怎么办 | AnyText解决文生图中文字模糊问题,完成视觉文本生成和编辑
浙江理工 & 谷歌开源 CFMW | 挑战恶劣天气,Mamba 引领目标检测新风向!
在开放和动态的环境中,目标检测面临如雨、雾和雪等具有挑战性的天气条件。基于深度学习的目标检测方法的快速发展显著提高了识别和分类物体的能力。得益于先进的特征提取和融合策略,跨模态目标检测方法已达到高精度,例如CFT(杨等人,2017年)、GAFF(杨等人,2017年)和CFR
集智书童公众号
2024/05/10
1.6K0
浙江理工 &  谷歌开源 CFMW | 挑战恶劣天气,Mamba 引领目标检测新风向!
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
基于LiDAR的感知系统对于自动驾驶汽车[20]或移动机器人[41]的安全导航至关重要。一个关键挑战是在车辆环境中对物体进行可靠检测和分类[54]。最先进的(SOTA)三维目标检测方法在很大程度上依赖于用于训练的数据集的质量和多样性,同时也取决于这些数据集在推理过程中如何真实地反映现实世界条件。获取和标注此类数据仍然是一项重大的技术和实践挑战,既耗时又劳动密集。这在三维目标检测模型的大规模开发和部署中构成了一个主要障碍。
集智书童公众号
2024/05/10
9270
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
ICCV 2023 | DIMOS: 在 3D 室内场景中合成多样化人物运动
图 1:我们提出了一种在真实世界的复杂场景中生成自然的人物-场景交互事件序列的方法。如图所示,人物首先走到凳子旁坐下(黄色到红色),然后走到另一张椅子旁坐下(红色到洋红色),最后走到沙发旁躺下(洋红色到蓝色)。
用户1324186
2023/10/24
6530
ICCV 2023 | DIMOS: 在 3D 室内场景中合成多样化人物运动
论文精读 | 2023 [PR] DDGCRN:用于交通流量预测的分解动态图卷积循环网络
题目:A Decomposition Dynamic graph convolutional recurrent network for traffic forecasting
时空探索之旅
2024/11/19
2990
论文精读 | 2023 [PR] DDGCRN:用于交通流量预测的分解动态图卷积循环网络
深度学习应用篇-计算机视觉-视频分类8:时间偏移模块(TSM)、TimeSformer无卷积视频分类方法、注意力机制
视频流的爆炸性增长为以高精度和低成本执行视频理解任务带来了挑战。传统的2D CNN计算成本低,但无法捕捉视频特有的时间信息;3D CNN可以得到良好的性能,但计算量庞大,部署成本高。作者提出了一种通用且有效的时间偏移模块(TSM),它通过沿时间维度移动部分通道来促进相邻帧间的信息交换,同时它可以插入到2D CNN中实现零计算和零参数的时间建模,以此兼具2D卷积的高效与3D卷积的高性能。
汀丶人工智能
2023/06/11
9710
深度学习应用篇-计算机视觉-视频分类8:时间偏移模块(TSM)、TimeSformer无卷积视频分类方法、注意力机制
卡内基梅隆大学提出CSC-Tracker|一种新的视觉分层表示范式,用于多目标跟踪
判别性视觉表示可以有助于在多目标跟踪中的基于外观的关联中避免不同目标之间的不匹配。作者提出了一种新的视觉表示范式,通过在层次结构中融合来自不同空间区域的视觉信息。作者认为,与仅使用边界框特征的传统范式相比,所提出的层次化视觉表示更具判别性,且不需要额外的标注。
集智书童公众号
2024/03/01
4050
卡内基梅隆大学提出CSC-Tracker|一种新的视觉分层表示范式,用于多目标跟踪
VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度!
近期,机器人技术和自动驾驶系统利用实时的深度传感器,如激光雷达(LiDARs),来实现三维感知。激光雷达产生的点云可以提供丰富的几何信息,并帮助机器理解环境感知。早期方法集中于从静态点云中解析现实世界,忽略了时间变化。为了更好地理解时间变化的世界,近期研究更专注于在4D空间理解点云视频,包括三个空间维度和一个时间维度。已有几项工作在4D点云建模方面取得进展。这些方法要么旨在设计改进的网络来建模4D点云,要么采用自监督方法来提高4D点云表示的效率。
AIGC 先锋科技
2024/07/08
4550
VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度!
加利福尼亚大学提出 EM-VLM4AD | 轻量级、多帧的视觉-语言模型,减少10倍的内存和浮点运算!
视觉-语言模型(VLMs)已经成为一种强大的工具,它们具备整体知识,能够解决视觉和语言交叉领域的问题。这使得它们在自动驾驶(AD)中具有巨大的潜力,允许驾驶员与VLM互动,VLM能够提供各种驾驶安全任务的易于理解的语言表示。此外,VLM可以作为端到端的自动驾驶系统,消除了在自动驾驶特定子任务(如感知和轨迹规划)的单独模型之间的集成和传播错误。这些潜在的好处推动了许多为自动驾驶应用量身定制的视觉-语言模型和多模态语言模型的发展。这些模型涵盖了自动驾驶的各个方面,包括闭环控制、感知任务和交通代理行为分析。
AIGC 先锋科技
2024/07/08
3340
加利福尼亚大学提出 EM-VLM4AD | 轻量级、多帧的视觉-语言模型,减少10倍的内存和浮点运算!
UniFormer v2改进升级 | CUENet优化SA注意力,用高效加性注意力机制,加速Transformer落地!
根据世界银行的数据,过去五年全局犯罪率有所上升。监控摄像头通常被部署以帮助威慑暴力,提供实时监控并收集犯罪或暴力活动的证据。得益于技术的进步,监控系统越来越经济实惠,部署也变得更加容易。随着部署的监控摄像头数量的增加,对于人工操作员来说,手动监控摄像馈送变得既昂贵又具有挑战性。因此,对于简化暴力检测(VD)的过程,实现自动化监控摄像头的方法具有极大的需求,这种方式要更加准确和高效。
集智书童公众号
2024/05/10
7880
UniFormer v2改进升级 | CUENet优化SA注意力,用高效加性注意力机制,加速Transformer落地!
推荐阅读
​新加坡 & 纽约大学 & 字节 提出 PLLaVA | 简单高效视频语言模型适应方法,超越GPT4V,突破资源限制 !
5190
国防科大最新 | SceneTracker:在4D时空中追踪万物
2260
文字生成图片综述 - plus studio
6970
ICCV 2023 | 基于模型的深度视频压缩
1.4K0
太强!AI没有落下的腾讯出YOLO-World爆款 | 开集目标检测速度提升20倍,效果不减
4.3K0
厦门大学突破 SRKD框架 | 雨天无阻,显著提高了检测精度
8400
IEEE Transactions on Multimedia | 实时自由视角视频生成系统
5790
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
2.1K0
MambaMOS| 一种新的激光雷达点云运动目标精确分割技术,性能表示 SOTA !
3960
标题:逆光、眩光问题视觉模型怎么解决?一个感知卷积让检测/识别/跟踪/深度估计等任务,统统适用!
1.5K0
文生图文字模糊怎么办 | AnyText解决文生图中文字模糊问题,完成视觉文本生成和编辑
1.2K0
浙江理工 & 谷歌开源 CFMW | 挑战恶劣天气,Mamba 引领目标检测新风向!
1.6K0
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
9270
ICCV 2023 | DIMOS: 在 3D 室内场景中合成多样化人物运动
6530
论文精读 | 2023 [PR] DDGCRN:用于交通流量预测的分解动态图卷积循环网络
2990
深度学习应用篇-计算机视觉-视频分类8:时间偏移模块(TSM)、TimeSformer无卷积视频分类方法、注意力机制
9710
卡内基梅隆大学提出CSC-Tracker|一种新的视觉分层表示范式,用于多目标跟踪
4050
VG4D | 突破4D点云识别局限,融合视觉-语言模型实现动作识别新高度!
4550
加利福尼亚大学提出 EM-VLM4AD | 轻量级、多帧的视觉-语言模型,减少10倍的内存和浮点运算!
3340
UniFormer v2改进升级 | CUENet优化SA注意力,用高效加性注意力机制,加速Transformer落地!
7880
相关推荐
​新加坡 & 纽约大学 & 字节 提出 PLLaVA | 简单高效视频语言模型适应方法,超越GPT4V,突破资源限制 !
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档