首页
学习
活动
专区
工具
TVP
发布

数据处理

专栏成员
97
文章
153080
阅读量
33
订阅数
selenium、chromedirver
driver = webdriver.Chrome() driver.get("https://www.zhipin.com/web/geek/job?query=%E6%95%B0%E6%8D%AE
用户1733462
2022-10-09
3600
多项式拟合
可见a商品2018年与2019年的价格走势,都反应了年初到月份价格走低趋势,4月份过后到年底价格回升走高,具有一定的周期性。
用户1733462
2019-11-19
7130
shell 递归求阶乘
#!/bin/bash fact() { local num=$1 local fac if ((num==1)) then fac=1 else
用户1733462
2019-06-11
8360
vim正则匹配若干操作
将第一个//之间的正则表达式替换成第二个//之间的字符串。 :s/正则表达式/替换字符串/选项
用户1733462
2019-05-22
3.5K0
shell脚本打印99乘法表
首先建立sh脚本 vim multable.sh for((i=1;i<10;i++)) do m=1 while((m<i)) do # 不换行输出 echo -ne " \t" ((m=m+1)) done for((j=i;j<10;j++)) do ((k=i*j)) echo -ne "$i*$j=$k\t"
用户1733462
2019-05-21
2.1K0
shell脚本批量添加用户
使用useradd 添加用户, passwd设置密码, 这时候有两种方式读取username.txt文件中用户名
用户1733462
2019-05-10
1.9K0
推荐架构
image.png
用户1733462
2019-03-05
7570
object __new__函数
class Foo(object): def __new__(cls,*agrs, **kwds): print(agrs) #inst = super(Foo,cls).__new__(cls,*agrs, **kwds) 这样写会报错,原因是父类object的__new__不支持那么多参数 inst = super(Foo,cls).__new__(cls) print(inst) return inst
用户1733462
2019-03-04
4510
x轴坐标斜着显示set_xticklabels(tt.index,rotation=45)
# 修改x轴显示 fig = plt.figure(figsize=(10,5)) ax = fig.add_subplot(111) xticks = range(0,len(tt.index), 1) xlabels = [el for el in tt.index] ax.set_xticks(xticks) ax.set_xticklabels(tt.index,rotation=45) ax.set_xlabel("中心维度") ax.set_ylabel("中心坐标值") plt.title('
用户1733462
2019-03-04
5.6K0
pycharm 连接远程服务器
部署同步 image.png ip端口账号密码配置 目录映射 配置解释器
用户1733462
2019-02-15
26.1K0
pandas plot
如果id不是字符串型需要先转化为字符串才行,title加标题,subplots设置日期斜着显示 pp = pd.DataFrame({"id":["1001", "1001", "1001", "1002", "1002", "1002", '1002', "1003", "1003", "1003", '1003', '1003'], "day":["2018-7-15", "2018-7-16",
用户1733462
2019-01-28
7060
pandas操作一列数据
def tt(x): if x.name == "distribution": return [el[0:10] for el in x.values] else: return x test1 = test.apply(tt)
用户1733462
2018-12-05
1.9K0
hive sql 分区
将t2数据插入到t1,分区日期是‘2018-10-27’,使用overwrite会删除之前分区所有内容,into将内容追加到分区 注意SELECT必须在同一行,不然我的编辑器会报错
用户1733462
2018-12-04
8420
hive sql练习1
参考 DROP TABLE student; create TEMPORARY TABLE student ( sid string, sname string, sage int, ssex string ); INSERT into student values("01","zhaolei",19900101,"M"); INSERT into student values("02","qiandian",19901221,"M"); INSERT into student values
用户1733462
2018-10-10
6780
hive sql练习
参考 -- 创建学生表,学号,姓名,性别,年龄,班级 DROP TABLE student; CREATE TEMPORARY TABLE student( Sno int, Sname VARCHAR(20), Sex VARCHAR(20), Sage int, Sdept VARCHAR(20) ); -- 创建 课程表, 课程编号,课程名称 DROP TABLE course; create TEMPORARY TABLE course( Cno int, Cname
用户1733462
2018-10-10
2.8K0
关联规则挖掘算法
设 为所有项目的集合, 为事务数据库,事物 是一个项目子集( )。每一个事务具有唯一的事务标识 。设 是一个由项目构成的集合,称为 。事务 包含项集 ,当且仅当 。如果项集 中包含 个项目,则称其为
用户1733462
2018-09-20
6870
回归
看一下损失函数的导函数tanh(x),当x偏离0时,tanh(x)趋向+1或者-1
用户1733462
2018-09-20
3920
Home Depot Product Search Relevance
kaggle赛题链接Home Depot Product Search Relevance,这个题目关键点就是特征提取,给的数据需要观察处理
用户1733462
2018-08-13
5960
gensim,dictionary
操作词汇的库很多nltk,jieba等等,gensim处理语言步骤一般是先用gensim.utils工具包预处理,例如tokenize,gensim词典官网,功能是将规范化的词与其id建立对应关系
用户1733462
2018-07-25
1.1K0
ssh免密登陆上传下载文件直接使用scp命令
在滴滴云申请了三台服务器,分别命名Master,Worker1,Worker2,用来配置spark环境,需要在本地远程免密操作三台机器,首先在本地生成RSA公私钥对
用户1733462
2018-07-25
1.3K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档