首页
学习
活动
专区
圈层
工具
发布

数据看Kobe,请让我以这样的方式说再见

———献给看着Kobe打球长大的所有人 在2011年的时候,一位球迷为科比设计了一款T恤,样式上并无特别之处,文字上却打动人心,设计者在T恤上写道:“那些现在恨我的人,当我离开的时候,会想念我的。”...技术说明:R语言抓取数据,数据来源:http://stats.nba.com/ 以下是对科比以往比赛成绩数据的简单分析 一、抓取Kobe数据并对原始数据进行处理 利用R语言抓取科比职业生涯20个赛季的数据...,并对初始数据作处理,得出以下数据: 本文,我们重点致敬飞侠,再加上篇幅所限,在此就不啰嗦爬虫程序及数据了。...做一个简单的kmeans聚类分析,聚类的结果如下: 将聚类结果与上面的实际分类作比较,如下图: 可以看出聚类结果跟我们之前设想的差不多,仅有14-15赛季仍被判定为“巨星”赛季!...想要数据的童鞋,可以加笔者微信(lhf_Peter)索要! 最后:你巅峰时我慕名而来,你落寞时我无法转身离开! 送给Kobe……

94180

最后,请让我以这样的方式说再见:从球员数据看Kobe

———献给看着Kobe打球长大的所有人 在2011年的时候,一位球迷为科比设计了一款T恤,样式上并无特别之处,文字上却打动人心,设计者在T恤上写道:“那些现在恨我的人,当我离开的时候,会想念我的。”...技术说明: R语言抓取数据,数据来源:http://stats.nba.com/ 数据的简单分析 一、抓取Kobe数据并对原始数据进行处理 利用R语言抓取科比职业生涯20个赛季的数据,并对初始数据作处理...二、Kobe数据分析 1、Kobe与乔丹差别在哪里?看下图: 两人除了在三分球数据上有点较大的出入外,其它数据二人旗鼓相当,NBA历史上最伟大SG,非两人莫属!...做一个简单的kmeans聚类分析,聚类的结果如下: 将聚类结果与上面的实际分类作比较,如下图: 可以看出聚类结果跟我们之前设想的差不多,仅有14-15赛季仍被判定为“巨星”赛季!...想要数据的童鞋,可以加笔者微信(lhf_Peter)索要! 最后:你巅峰时我慕名而来,你落寞时我无法转身离开! 送给Kobe…

96350
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    用Java获取PostgreSQL变更数据完整源码

    你是否在做数据同步项目,是否想自己实现数据变更的捕获?...一、基础知识 PostgreSQL数据库提供了两种复制方式:物理复制和逻辑复制。 1、物理复制 物理复制是指将主库 WAL 日志的日志页直接发到备机,备机完全应用的一种复制方式。...二、PostgreSQL 配置 要使用 PostgreSQL 的逻辑复制功能,首先需要对数据库进行相应的配置以支持逻辑复制功能。...String PASSWORD = "repuser"; 2、启动测试 运行 PgReplicationDBTest 项目中的 PgReplicationTest.java 类中的,在启动完成后,在数据库表中插入数据即可...例如在数据库中插入一条数据执行如下SQL: insert into test (id, name) values ('4','d'); 程序会输出如下内容: BEGIN 1051 table public.test

    48810

    【Python系列】使用 `psycopg2` 连接 PostgreSQL 数据库

    在开始今天的分享之前,我想先推荐一篇非常精彩的文章。 文章就是《渗透测试文件包含漏洞原理与验证(1)——文件包含概述》 链接是:点击这里。...Python,作为一种流行的编程语言,提供了多种方式与数据库交互,其中 psycopg2 是连接 PostgreSQL 数据库的流行选择之一。...pip install psycopg2-binary 连接到 PostgreSQL 数据库 连接到 PostgreSQL 数据库需要数据库的配置信息,包括主机名、用户名、端口号、密码和数据库名。...插入和更新数据 除了查询数据,psycopg2 也可以用来插入和更新数据库中的数据。...如果插入过程中发生错误,我们使用 rollback() 方法回滚事务,以保持数据库的一致性。 错误处理 在使用 psycopg2 时,错误处理是非常重要的。

    83400

    Flask和SQLite并发写入的bug

    今天我想分享一下这个bug的排查过程、解决方法以及避坑经验。问题现象我们的项目是一个简单的Web应用,主要功能是记录用户的操作日志。...前端通过POST请求发送操作信息到后端,后端使用Flask接收请求,并将日志信息插入到SQLite数据库中。...为了验证这个猜想,我查看了Flask应用的代码结构,发现日志记录部分使用的是直接创建数据库连接的方式,而不是通过SQLAlchemy提供的Session机制。...排查步骤步骤一:检查数据库连接方式首先,我回顾了日志记录模块的代码,发现如下片段:import sqlite3 def log_operation(user_id, action): conn...然而,我发现即使使用SQLAlchemy,SQLite仍然无法很好地支持高并发写入。因此,我考虑将数据库切换为PostgreSQL,以获得更好的并发性能。

    28010

    JDBC连接PostgreSQL数据库的若干问题

    首先说一个我在创建数据库的时候遇到的一个问题:PostgreSQL在创建数据表的时候,我想创建一个User表,但是PLSQL命令提示符提示有错,我后来改成userinfo就好了,我上网查了查要是给User...Class.forName(driver); con = DriverManager.getConnection(url, user, password); /* //这里是插入数据的代码...本来是 jdbc:postgresql://localhost:5432/newDB 我少写了一个冒号: jdbc:postgresql//localhost:5432/newDB 导致数据库连接失败...问题2:我在数据库设计的时候想让表的id类型为UUID,作为行的唯一标示。结果我不知道Java中哪个类型对应中PostgreSQL中的UUID类型。...解决方法如下: UUID id = UUID.randomUUID(); stmt.setObject(1, id); 设置成Object类型就好了。

    2.1K30

    PostgreSQL PG序列 与 序列是否可以绑定到多个表的疑问

    最近有点累,想休息几天,散散心,下一次更新在周五。 ? ? POSTGRESQL 表的自增类似ORACLE 的做法, 当然这不是说就是一样,只是类似....与Oracle 不同的是PostgreSQL 的基本对于序列的使用是一个表一个序列的方式....postgresql 的序列是可以循环使用的达到了最大值后,如果设置了循环是可以从头开始的 4 cache 这个是PG对于自增序列的一个友好和快速数据分配和插入的支持,我们可以 create sequence...2 我可以多个表绑定一个序列吗 3 我删除数据后,序列会有变化吗 4 我事务得到分配的序列值后,如果回滚了我的序列值应该在那个位置? ?...而上面的明显的在绑定第二个表后,插入数变为了1100 的主要的原因是cache ,cache 中设置的数字决定了你绑定下一个表的基数,也就是插入数据后第一个数据起始值.

    2.5K50

    猫头虎分享:Python库 SQLAlchemy 的简介、安装、用法详解入门教程

    在不丢失性能的前提下,它提供了对数据库的抽象,使你可以以面向对象的方式操作数据。SQLAlchemy 主要包括两个核心部分: Core:提供底层数据库连接和执行 SQL 语句的功能。...基本用法详解 安装完后,我们来看看如何使用 SQLAlchemy 进行基本的数据库操作。下面我将一步步讲解如何通过 SQLAlchemy 连接数据库,创建表,并插入、查询、更新和删除数据。 ️...代码如下: from sqlalchemy import create_engine # 创建一个 SQLite 数据库连接(可以换成你实际使用的数据库类型) engine = create_engine...有了表结构之后,我们就可以往表里插入数据啦!...领域最强大的数据库交互工具之一,无论你是想要享受 ORM 的便捷,还是想直接写原生 SQL,它都能满足你的需求。

    1.8K10

    Vapor奇幻之旅(07 连接服务端PostgreSQL)

    修改过后需要重启服务才能生效: sudo service postgresql restart 在此文件中用户校验有以下7种配置方式: 连接类型 数据库 用户名 数据库地址 校验方式 local database...包含的选项如下: trust 只要能连接到postgresql数据库的服务器就能够连接数据库,无需密码或其他校验 reject 拒绝连接,可以用来设置黑名单 scram-sha-256 通过SCRAM-SHA...经过对pg_hba.conf中各种配置的解释,我想以下的内容就很好理解了: 1、打开文件 sudo vim /etc/postgresql/10/main/pg_hba.conf 2、修改 local...)一文中我介绍了怎么连接到Mac 本地的postgresql数据库,那么现在我们就可以连接远程的数据库了。..."password": "*******", "database": "postgres", "port": 5432 } 接着运行程序,执行插入和查询操作,可以看到数据成功插入了服务器的数据库中

    1.6K20

    PostgreSQL 的JSON 处理甩“你”几条街

    首先这里的你绝对不是MONGODB ,至于是谁,你是谁,那的先了解POSTGRESQL 处理 JSON 的方式后,才能确定那个你是谁。...,格式是jsonb ,但如果你用MONGODB 的方式来理解,你可以找到一点不一样的地方 可以看到,其实要展示数据在POSTGRESQL 中也并不是难事 然后我们创建一个索引,熟悉PG的人都知道他模糊查询的厉害...下面我们创建,一个新的collection create table test_json_2 (info jsonb); 插入数据 insert into test_json_2 select ('...当然如果你统计的数据是全表,或大部分数据,则还是要走全表扫描的 这里大致的看了一下POSTGRESQL 对JOSN 的支持,相对于某些数据库还是友好的,并且符合人类快速理解和上手的方式。...MONGODB 的支持,想使用JSON 或文档的方式在数据库里面不想失望的使用,POSTGRESQL 是一个选择,不错的。

    5.2K40

    流行的开源数据库们有哪些维护索引的怪癖?

    索引维护的挑战 对于任何数据库管理者来说,索引维护都可能是一项真正的挑战,而更棘手的是,不同的开源数据库对索引维护的处理方式各不相同。...当在表中添加、更新或删除行时,数据库必须调整索引,这与计算机时代之前图书馆的运作方式类似。想象一下,许多索引,例如:作者、标题、主题,都存储在装满小抽屉的柜子里的纸卡上。...6.0.20 插入结果 插入 20M 行所需的读取和写入 IOP 数量如下所示。...数据插入率稳定性 虽然重点是索引维护,但我还是不得不关注插入率的稳定性。数据库性能稳定性非常重要,因为性能的突然下降会给整个基础架构的稳定性带来压力。...MyRocks/RocksDB 插入率稳定性 虽然上述结果是存储引擎设计所预期的,但我对 PostgreSQL 的初步结果却令人失望,如下所示: PostgreSQL 神秘的插入停滞 虽然大多数时候插入速率都比较稳定

    27610

    ORACLE物化视图解决CMS数据同步一例 与 来不及的DATA PIPLELINE

    而且我发现一个问题,就是怎么想都是简单的事情,到真做的时候,就变得不那么单纯了,各种问题出现,其实干了这么多年,大风浪还是见过的,所以一直不敢说,这个没问题,那个很一般,这个一定能行(当然打气,鼓励别人或自己的时候...,而如果以不清楚的方式来面对如何撰写相关的提取语句,则这样的结果就会引起一个关联的效应, 1 由于抽取数据的变化点无法找到,所以提取数据的点就无法找到,2 无法找到点,则就无法进行SQL语句的增量的提取...3 实际上,没有,如果这时我在插入数据,因为按照主键的方式,则我还插入原来的已经删除的主键,则上面的语句就会出错,因为新插入的数据被过滤了。...最后,我还是期待用新技术来将某些业务中问题解决掉,快速,安全,稳定,例如我期待的 Data Pipleline 能增加 postgresql 目的端的功能,则那些期待从Oracle ,sql server...,转移到Postgresql 的项目人员的头发还能茂盛更长一段时间。

    1.3K20

    PostgreSQL 库,表,字段,值大小写的问题

    群里,经常看到一些学友们,对PostgreSQL 的大小写问题有疑惑,本着自己也敢兴趣的原则,并且也想弄清楚这件事情,这里的做点功课。...需要测试的内容如下 1 数据库大小写 2 表名大小写 3 字段大小写 4 字段值得大小写 一些相关的大小写的函数以及数据的转换函数 let's go 1 数据库名的大小写 首先会建立三个数据库名字为...,都建立一个表,good, 里面插入的数据会有他自己数据库的名字 我们来对这些数据库的表进行访问 通过以上测试,可以得出,数据库的库名是大小写是敏感的,所以在建库的时候,需要注意大小写的问题。...我们还是在test 数据库里面建立表,并且会在这个表里面建立三个字段 分表是 name Name NAME 并且在每个字段里面的值,也是和字段名的撰写方式一样。...可以: 只需要这样就可以,详见下图,其实我到是觉得这个是POSTGRESQL 比别的数据库强的地方,很严谨,但如果需要宽松也是支持的。

    6.3K20

    POSTGRESQL 带时区的日期的技术与狠活

    从技术的角度来说, 基于POSTGRESQL 数据库中的数据格式,相对于其他的数据库,类型是丰富的这里主要是POSTGRESQL 的时间是可以带有时区的,也就是with zone 。...这里我们通过命令 pgconfig --configure 来查看当前的我们的POSTGRESQL 编译时的是否加载了 --with-system-tzdata 这个编译想,如果选择了这个项目则你使用的是操作系统提供的时区信息的支持...3 时区的显示问题 关于时区的问题,在POSTGRESQL UTC 本身并不存在,换来的是POSTGRESQL 中的epoch ,这主要是于计算机发明的时间有关,计算机中的时间并不是我们日常看到的时间表达方式...2 我们将时间变为utc 的时间,并且再次插入看看是否能在插入时对日期数据插入后数值进行变化。我们变换方式,在插入的日期中变换格式,将日期标定为UTC 的时间。...结论:在输入时间的过程中,如果你想将你当前时区的时间输入到其他时区的数据库中,并且以它所在的时区的时间进行显示,请使用 3 方法来输入数据。

    4.2K20

    Vapor奇幻之旅(05 Fluent)

    MySQL,稍显遗憾,开发团队最近都在进行Vapor 3的开发,相信不久后就可以有更多的数据库类型支持了,而且由于Fluent的抽象的特性,只要有相应的驱动,适配任何数据库我想只是时间问题。...我想给我的网站加一段名人名言,于是我创建一个名为Quotes的模型,代码如下: import Vapor import FluentProvider import HTTP /// 名人名言 final...查询插入的结果 ? 更新刚刚插入的数据 ?...删除刚刚插入的数据 由于默认的数据库是基于内存加载的,重新运行程序则会清空,如果想要保存数据到服务器,你需要使用持续化的数据库,如MySQL、PostgreSQL以及MongoDB,后面我会对这几个数据库操作一一介绍...) Vapor奇幻之旅(07 连接服务端PostgreSQL) Vapor奇幻之旅(08 连接服务端MongoDB) Vapor奇幻之旅(09 连接MySQL) 希望你对我的教程能够喜欢,你们的赞是我持续的动力

    1.5K30

    CynosDB的计算层设计优化揭秘——兼容PostgreSQL版

    CynosDB 是腾讯数据库研发团队推出的自研数据库,有PostgreSQL和MySQL两个版本。本文以兼容PostgreSQL版CynosDB为例,介绍我们的架构设计和优化思路。...计算层负责SQL解析、日志生成等;存储层负责数据存储、日志归档以及日志合并等。本节以CynosDB的PostgreSQL兼容版本为例来介绍计算层架构。其计算层架构如下图所示。...Access:数据库的访问层,定义了对象的组织方式和访问方法。其中包括: lHeap:表实现以及访问方法,包括扫描、更新、插入、删除等。...lbtree/gin/gist/spgist/hash/brin:索引实现,包括各种索引的实现和操作方式,如索引扫描、插入等。 lCLOG/MultiXACT:与事务提交状态以及并发等。...以表插入元组为例,PostgreSQL原来的XLog日志格式可能是: <relfilenode, pageno, offsetnum,informask2,infomask,hoff,tuple_data

    16.6K84

    数据库可视化WEB工具对比

    关于AI 清羽AI正在绞尽脑汁想思路ING··· 清羽のAI摘要 GLM-4-Flash 碎碎念 时光飞逝,转眼间,我也成了要离开学校的一批人了,四年时间过得飞快,快的我不知道具体干了什么事情,快的有些彷徨...构建,再通过服务器拉取,以做到静态文件的更新,如果没有这个,我想只能采取其他方式咯,比如SSH,FTP之类的,目前还是没有想好用什么更安全,如果朋友有什么建议欢迎指导!...UI展示 phpMyAdmin整体的功能性是在线的,常见的搜索,插入,导出,权限设置,都可以通过web直接管理,但是这个UI略显时代感,个人不太喜欢,但是并不影响,他是装机量最多的数据库管理工具之一。...这个程序我并没有怎么测试过,由于他的单文件性质,导致我很怀疑他的功能性,项目地址如下: 引用站外地址,不保证站点的可用性和安全性 Adminer Database management in a single...通过chatGPT的询问,我了解到了adminer虽然是个但文件工具,但是也支持了日常中的绝大部分核心功能,如下: 支持多种数据库:包括 MySQL、MariaDB、PostgreSQL、SQLite、

    1.1K10

    PostgreSQL还是MongoDB?选错数据库,你的Node.js应用可能快不了

    你是否在某个项目里被这个灵魂拷问击中过:"为什么别人的API响应快到飞起,我的却慢得让人想砸键盘?"...这背后往往不是代码逻辑的问题,而是一个你可能没有好好思考过的决策——选择什么样的数据库,以及用什么方式去连接它。...今天我想从源码和实战角度,为你拆解 Node.js 连接 PostgreSQL 和 MongoDB 的底层原理,帮你理解:为什么选择不同的库、不同的连接方式会导致完全不同的性能表现?...PostgreSQL:严谨的数据守护者 为什么选PostgreSQL? 我先坦白:PostgreSQL 并不是"最快"的选择,但它是"最稳"的选择。...', items: [...] }; // 需要时分别查询 性能基准测试(真实对比) 让我基于常见场景做个粗略的性能对比: 操作 PostgreSQL MongoDB 备注 简单插入 10万 ~500ms

    13410

    POSTGRESQL 事务并发机制与 MVCC

    两个字段,而不去使用类似ORACLE MYSQL 的 UNDO REDO 的方式来进行数据的操作和回滚。...数据也一直是在数据表中,事务失败也可以以最快速的方式来进行数据的“回滚”。 我们可以做一个实验看看POSTGRESQL 是怎么来对待数据的 I D U 的操作, ?...上图中,在插入了一条数据后, t_xmin 初始了一个数值, t_xmax 值为0 , t_ctid = 0 , 在我们更新了数据后, 产生了两条记录,一条是原有的记录,另一条是新的记录。...通过这样的手段,POSTGRESQL 实现了MVCC 多版本的控制,在多个事务访问和更改数据的时候会存在多个版本的数据行。 ?...MVCC 多版本控制在POSTGRESQL 上最终想实现的目的是,数据读不堵塞写,但这样的实现的方式有以下注意的事项 1 不同的事务会看到不同版本的记录,所以POSTGRESQL 会保留较多的同一数据的多个版本

    94330
    领券