前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >TF-IDF:数据分析岗位最看重什么?

TF-IDF:数据分析岗位最看重什么?

作者头像
herain
发布2023-09-01 09:15:01
1980
发布2023-09-01 09:15:01
举报
文章被收录于专栏:数据指象

数据分析岗位最看重什么,你说我说的主观臆断,不如数据说的客观公正。

一,数据的简单描述:

我们随机打开招聘网站,随机抽取13家公司招聘数据分析岗位的要求。数据分析岗位薪酬分布:8-50k,岗位要求描述:总计61行,用词 2899个。

二,TF-IDF 让枯燥文字说话

TF是词频(Term Frequency)表示词条在文本中出现的频率,度量词频的普遍性。

IDF是逆向文件频率(Inverse Document Frequency)某一特定词语的IDF,由总文件数除以包含该词语的文件的数,商取对数得到。如果包含词条t的文档越少, IDF越大,则说明词条具有很好的类别区分的特殊性。

所以我们可以通过TF的词频的多少,我们可以找出数据分析岗位 具有普遍性的要求,也就是我们说的入门必备能力。并使用TF-IDF=TF*TDF辅助我们抽取不同企业和薪酬下对数据分析从业者的特殊性要求,这些特殊性的要求是选拔优秀者的关键要求,能够在众家中找出独家,所以在众多面试者中,满足特殊性的要求是很重要的。

2.1 TF发现数据分析的基础能力

我们使用切词工具,提取出数据分析岗位要求的关键性名词/动词,计算每个关键词的词频,使用词云可视化。数据中显露出来数据基础能力的要求:

需要在具备的相关专业(统计学、数学、经济学等)的前提之下,有全面的数据分析能力和分析经验积累,能够熟练使用数据分析工具(Execle、SQL、Python等)挖掘数据价值。

2.2 TF-IDF挖掘数据分析的特殊性要求

计算出每家公司招聘词的TF-IDF,我们知道TF-IDF值越大越能够代表企业对候选人的特殊要求。在这13家公司中 我们进一步挖掘top5特殊词,发现每一家对公司数据候选人的特殊性要求。

关键词很多,我们通过抽象分析,进行了简单的归纳,偏向个人的软实力和业务的独特性需求。

1,主观能动性的要求高:希望候选人具备 “抗压力、自驱动、好奇心、热爱、好学、主动性”等主观态度。

2,偏业务的认知:通过“电影、游戏”等词,可以发现对企业相关业务了解的候选人更关注。

3,对写作也有要求:通过“撰写、报告、听说、英文、文本”等词,听说读写可以使数据分析者更加突出自我。

三,数据说数据分析岗位最重要的是什么

基于普遍性的和特殊性的能力要求关键词,我们可以总结出数据分析最重要的能力,可以分为两个方面:一是硬实力、二是软实力。硬实力的基础的入门的能力,软实力的拔尖的独特性能力。硬实力决定我们能不能做好、软实力决定我们能做的有多好。在职场中低阶的更看硬实力、高阶需要靠软实力。

数据分析哪些硬实力更重要:

1,专业功底,本科数据统计/数学相关专业。

2,数据处理的能力,能熟练使用excel、python、sql 完成数据的ETL。

3,数据的分析能力,掌握统计描述和统计推断,必备常用的多维分析、聚类、判别分析能力。

数据分析哪些软实力更重要:

1,业务知识:了解从事行业的经营模式及运营策略。

2,正向的主观能动性:热爱学习、自我驱动、积极主动推动等。

3,听说读写:听懂业务背景、说清业务逻辑、读懂数据价值、写好数据报告。

愿大家,必备硬实力,发展软实力。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据指象 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档