前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >分享30个超级好用的Pandas实战技巧

分享30个超级好用的Pandas实战技巧

作者头像
用户6888863
发布于 2022-06-08 10:58:03
发布于 2022-06-08 10:58:03
67500
代码可运行
举报
文章被收录于专栏:AI篮球与生活AI篮球与生活
运行总次数:0
代码可运行

今天小编来和大家分享几个Pandas实战技巧,相信大家看了之后肯定会有不少的收获。

读取数据

read_csv()用来读取csv格式的数据集,当然我们这其中还是有不少玄机在其中的

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pd.read_csv("data.csv")

只读取数据集当中的某几列

我们只是想读取数据集当中的某几列,就可以调用其中的usecols参数,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = pd.read_csv("house_price.csv", usecols=["Id", "SalePrice"])
df.head()

output

时间类型的数据解析

主要用到的是parse_dates参数,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = pd.read_csv("Tesla.csv", parse_dates=["Date"])
df.head()

output

对于数据类型加以设定

主要调用的是dtype这个参数,同时合适的数据类型能够为数据集节省不少的内存空间,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = pd.read_csv("data.csv", dtype={"house_type": "category"})

设置索引

用到的是index_col这个参数,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = pd.read_csv("Tesla.csv", index_col="Date")
df.head()

output

只读取部分读取

用到的是nrows参数,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = pd.read_csv("Tesla.csv", nrows=100)
df.shape

output

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(100, 7)

跳过某些行

要是数据集当中存在着一些我们并不想包括在内的内容,可以直接跳过,skiprows参数,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pd.read_csv("data.csv", skiprows=[1, 5])  # 跳过第一和第五行
pd.read_csv("data.csv", skiprows=100)  # 跳过前100行
pd.read_csv("data.csv", skiprows=lambda x: x > 0 and np.random.rand() > 0.1) # 抽取10%的数据

遇到了空值咋办呢?

要是遇到了空值,我们可以将空值用其他的值来代替,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = pd.read_csv("data.csv", na_values=["?"])

那么布尔值呢?

对于布尔值而言,我们也可以设定换成是其他的值来代替,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = pd.read_csv("data.csv", true_values=["yes"], false_values=["no"])

从多个csv文件中读取数据

还可以从多个csv文件当中来读取数据,通过glob模块来实现,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import glob
import os

files = glob.glob("file_*.csv")

result = pd.concat([pd.read_csv(file) for file in files], ignore_index=True)

要是从PDF文件当中来读取数据

我们的表格数据存在于pdf文件当中,需要从pdf文件当中来读取数据,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 安装tabula-py模块
# %pip install tabula-py 

from tabula import read_pdf
df = read_pdf('test.pdf', pages='all')

探索性数据分析

三行代码直接生成

通过调用pandas_profilling模块,三行代码直接生成数据分析的报告,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 安装pandas-profilling模块
# %pip install pandas-profiling

import pandas_profiling

df = pd.read_csv("data.csv")
profile = df.profile_report(title="Pandas Profiling Report")
profile.to_file(output_file="output.html")

基于数据类型的操作

pandas能够表示的数据类型有很多

基于数据类型来筛选数据

我们希望筛选出来的数据包含或者是不包含我们想要的数据类型的数据,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 筛选数据
df.select_dtypes(include="number")
df.select_dtypes(include=["category", "datetime"])

# 排除数据
df.select_dtypes(exclude="object")

推断数据类型

主要调用的是infer_objects()方法,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df.infer_objects().dtypes

手动进行数据类型的转换

我们手动地进行数据类型的转换,要是遇到不能转换的情况时,errors='coerce'将其换转成NaN,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 针对整个数据集都有效
df = df.apply(pd.to_numeric, errors="coerce")

# 将空值用零来填充
pd.to_numeric(df.numeric_column, errors="coerce").fillna(0)

一次性完成数据类型的转换

用到的是astype方法,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = df.astype(
    {
        "date": "datetime64[ns]",
        "price": "int",
        "is_weekend": "bool",
        "status": "category",
    }
)

列的操作

重命名

rename()方法进行列的重命名,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df = df.rename({"PRICE": "price", "Date (mm/dd/yyyy)": "date", "STATUS": "status"}, axis=1)

添加前缀或者是后缀

add_prefix()方法以及add_suffix()方法,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df.add_prefix("pre_")
df.add_suffix("_suf")

新建一个列

调用的是assign方法,当然除此之外还有其他的方法可供尝试,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 摄氏度与华氏度之间的数制转换
df.assign(temp_f=lambda x: x.temp_c * 9 / 5 + 32)

在指定的位置插入新的一列

同样也是用到insert方法,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
random_col = np.random.randint(10, size=len(df))
df.insert(3, 'random_col', random_col) # 在第三列的地方插入

if-else逻辑判断

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df["price_high_low"] = np.where(df["price"] > 5, "high", "low")

去掉某些列

调用的是drop()方法,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df.drop('col1', axis=1, inplace=True)
df = df.drop(['col1','col2'], axis=1)
df.drop(df.columns[0], inplace=True)

字符串的操作

列名的操作

要是我们想要对列名做出一些改变,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 对于列名的字符串操作
df.columns = df.columns.str.lower()
df.columns = df.columns.str.replace(' ', '_')

Contains()方法

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## 是否包含了某些字符串
df['name'].str.contains("John")
## 里面可以放置正则表达式
df['phone_num'].str.contains('...-...-....', regex=True)  # regex

findall()方法

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## 正则表达式
pattern = '([A-Z0-9._%+-]+)@([A-Z0-9.-]+)\\.([A-Z]{1,9})'
df['email'].str.findall(pattern, flags=re.IGNORECASE)

缺失值

查看空值的比例

我们要是想要查看在数据集当中空值所占的比例,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def missing_vals(df):
    """空值所占的百分比"""
    missing = [
        (df.columns[idx], perc)
        for idx, perc in enumerate(df.isna().mean() * 100)
        if perc > 0
    ]

    if len(missing) == 0:
        return "没有空值数据的存在"
        
    # 排序
    missing.sort(key=lambda x: x[1], reverse=True)

    print(f"总共有 {len(missing)} 个变量存在空值\n")

    for tup in missing:
        print(str.ljust(f"{tup[0]:<20} => {round(tup[1], 3)}%", 1))

output

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
总共有 19 个变量存在空值

PoolQC               => 99.521%
MiscFeature          => 96.301%
Alley                => 93.767%
Fence                => 80.753%
FireplaceQu          => 47.26%
LotFrontage          => 17.74%
GarageType           => 5.548%
GarageYrBlt          => 5.548%
GarageFinish         => 5.548%
GarageQual           => 5.548%
GarageCond           => 5.548%
BsmtExposure         => 2.603%
BsmtFinType2         => 2.603%
BsmtQual             => 2.534%
BsmtCond             => 2.534%
BsmtFinType1         => 2.534%
MasVnrType           => 0.548%
MasVnrArea           => 0.548%
Electrical           => 0.068%

空值的处理方式

我们可以选择将空值去除掉,或者用平均值或者其他数值来进行填充,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 去除掉空值 
df.dropna(axis=0)
df.dropna(axis=1)

# 换成其他值来填充
df.fillna(0)
df.fillna(method="ffill")
df.fillna(method='bfill')

# 取代为其他的数值
df.replace( -999, np.nan)
df.replace("?", np.nan)

# 推测其空值应该为其他什么数值
ts.interpolate() # time series
df.interpolate() # fill all consecutive values forward
df.interpolate(limit=1) # fill one consecutive value forward
df.interpolate(limit=1, limit_direction="backward")
df.interpolate(limit_direction="both")

日期格式的数据处理

获取指定时间的数据

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 从今天开始算,之后的N天或者N个礼拜或者N个小时
date.today() + datetime.timedelta(hours=30)
date.today() + datetime.timedelta(days=30)
date.today() + datetime.timedelta(weeks=30)

# 过去的一年
date.today() - datetime.timedelta(days=365)

通过日期时间来获取数据

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df[(df["Date"] > "2015-10-01") & (df["Date"] < "2018-01-05")]

通过指定日期来获取数据

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 筛选出某一天的数据
df[df["Date"].dt.strftime("%Y-%m-%d") == "2022-03-05"]

# 筛选出某一个月的数据
df[df["Date"].dt.strftime("%m") == "12"]

# 筛选出每一年的数据
df[df["Date"].dt.strftime("%Y") == "2020"]

将格式化数据集

保留指定位数

对于一些浮点数的数据,我们希望可以保留小数点后的两位或者是三位,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
format_dict = {
    "Open": "${:.2f}",
    "Close": "${:.2f}",
    "Volume": "{:,}",
}

df.style.format(format_dict)

output

高亮显示数据

对于指定的一些数据,我们希望是高亮显示,代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
(
    df.style.format(format_dict)
    .hide_index()
    .highlight_min(["Open"], color="blue")
    .highlight_max(["Open"], color="red")
    .background_gradient(subset="Close", cmap="Greens")
    .bar('Volume', color='lightblue', align='zero')
    .set_caption('Tesla Stock Prices in 2017')
)

output

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 关于数据分析与可视化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
10月准备读的3本书
9月份准备读这些书: 《人生海海》 《钱商》 《羊皮卷》 画外音:坚持一件事很难,但读书,真的有用。 《人生海海》 “没有在深夜痛哭过的人,不足以谈论人生。” 这句话很多都不会陌生,看到这句话,大部分人都会心有戚戚焉,这是因为,每个人都曾经历过痛彻心扉的时候。 “人生总是如此痛苦吗,还是只有小时候是这样?” “总是这样” 《人生海海》中,作者想通过这本书表达的就是关于痛苦的话题。 面对痛苦,作者麦家的解读是:既然每个人都跑不掉逃不开,那不如去爱上生活。 人生海海,敢死不是勇气,活着才需要勇气。你要替我记
架构师之路
2022/10/08
3340
10月准备读的3本书
人工智能的革命:人类的死或生(5/10)
让我感到意外的是,那些不同意Kurzweil的专家,绝大多数并不是全盘否定。当他们读到这些对未来的怪异描述时,他们并不是直接批评“很明显这些不会实现”,而是认为“如果我们能安全的过渡到超级AI,这些是有可能的,但超级AI很难实现。” Bostrom是一位警告AI危险性的主要人物,他也承认: “很难想象,超级AI能解决问题或间接帮助我们解决问题。配备先进的纳米技术,一台超级AI就有能力帮助我们搞定疾病,贫穷,环境的破坏以及各种无谓的煎熬。同时,它给予我们无限的生命,通过纳米医学
Peter Lu
2018/06/20
5890
俞敏洪:一个优秀的人的标志和特点
  背景:俞敏洪6月12日在新东方教育科技集团2012财年获奖人员集团领导见面会上的讲话
用户1432189
2018/09/05
3380
你愿意选择数字永生吗?
电影《流浪地球2》中有这样的桥段:“数字生命计划”能够将人类的记忆、意识上传,通过数字世界中的“永生”实现人类文明的延续。电影中,刘德华扮演的图恒宇将濒死的女儿图丫丫的意识进行了上传。作为数字生命的她,目光会随人的动作而移动,能跟爸爸进行交流。随着电影的热映,数字生命成为了各界关注的焦点,技术的飞速发展亦为这一科幻情节在未来得以实现提供了可能。
小腾资讯君
2024/03/14
3980
你愿意选择数字永生吗?
电气电子工程师职业前途问题的15个反思
我经过同电气工程师朋友们的真诚交流,长时间的深刻思考电气工程师一直纠结于心中的难题,提取了15个电气工程师最关心的问题,并做了浅显的分析,写得不当之处,还望能得到批评指正。 1 电气新手“没事做,没人教,工作没有技术含量”的矛盾心态 电气新手往往心浮气躁,拒绝进步,拒绝沉淀,害怕丢脸。我不怕丢脸时刻:记住每一个让你丢脸的人,他们是你的贵人。我感激那些给他难堪的人;感激那些给他启发的老师;我感激当面给他扔臭鸡蛋的人;我时刻反省并不断地提高自己。电气研发工作上的时忙时闲,是很正常的事情。缺乏对电气行业的整体认识
机器人网
2018/04/23
1.4K0
【晋升必看】我曾感叹于世界之大,也曾和你一样默默写码
本文作者曾是一个农村出身的技术宅,在大家都高呼“不拼爹、无未来”的时候,他坚信人只要足够努力,就能改变命运。当他在国企呆过5年之后,毅然决定跳槽到互联网公司,在经历过一些摸爬滚打后,以一个并不年轻的身份,在高压中突出重围,带团队、做晋升评委等。如果你问他,觉得成功最需要具备的是什么,他会告诉你:是敢说的勇气,和会说的能力,展开来说,就是沟通、演讲的基本素质。
CSDN技术头条
2018/07/30
5400
马斯克最新访谈完整版:追求最大真实性的人工智能极其关键,AI不应被教导说谎
② 马斯克称其从未亲眼目睹过任何外星生命存在的证据,星链卫星也从未因UFO被迫进行机动规避。
小腾资讯君
2024/05/10
4440
消失的中国互联网元老陈天桥:为神经科学捐助10亿,不担心机器人崛起
即使你没听说过“盛大游戏”,也一定听说过“传奇”。把风靡一时的网游“传奇”引入中国的陈天桥,是国内网游界当之无愧的元老,马化腾也表示曾将他作为学习的对象。
大数据文摘
2018/07/31
4480
消失的中国互联网元老陈天桥:为神经科学捐助10亿,不担心机器人崛起
黑客帝国:【Matrix的前世今生】-----黑客帝国全解析
我看了很多有观MATRIX的评论,发现有些仁兄或者是没看MATRIX动画版或者是没玩MATRIX游戏版,他们对MATRIX一知半解,对MATRIX这个结构逻辑严密的系统有一些不正确(或者说是非官方)的解释,而这些解释所衍生出的种种“浪漫““奇幻“的猜想(如ZION虚拟说,NEO超能力说,甚至在科幻片里最忌讳的宗教神秘说等等)让人哭笑不得,我不得不把各个版本MATRIX里对MATRIX系统的各种描述做个总结,让大家对电影的情节有更好的理解。   前世篇   这里的资料来源主要是MATRIX动画.一切从近未来的某一天开始,当时人工AI的机器人服务于人类生活的各个领域,这天,一台人工AI的机器人突然爆走杀死了它的人类主人,这次事故引发了类似消灭“有狂犬病的疯狗“的运动,人类社会对人工AI的机器人进行了蛮不讲理的“屠杀“和“驱赶“,大部分人工AI机器人被破坏,一小部分被抛弃的人工AI机器人汇集到一个被人类抛弃的地方开始了自立的生活(大约在中东地区某地,在那个时代估计中东的石油早被开采尽了,于是就成了荒漠).但那个原来很渺小的利用太阳能作为动力的机器人国家迅速强大膨胀,这不可避免使之的和人类发生接触和摩擦,在某一天的联合国大会上,两个人形的机器人大使试图使“机器国“加入联合国,但人类认为这是奇耻大辱,当场驱赶了机器人大使,其后机器人帝国和人类国家的各种摩擦升级成全面战争,但人类的血肉之躯难以抵挡机器人的进攻,战争中人类节节败退,输红眼的人类终于拿出终极武器“核弹“,但大规模的核爆没有能对 机器人方面造成实质的毁灭,核爆后的放射污染对机器人根本无效,机器人的强大攻势丝毫未减.   已经山穷水尽的人类这时通过了一个“遮蔽天空“的战斗计划,因为机器人的能源供应是依赖太阳能的,如果切断太阳能,机器人的能源供应就会出现短缺,转换能源供应体系不是短时间内能办到的(至少在人类社会里以上理论是成立的,但是对机器人....),就在这个时候,发动最后的反攻一举扑灭所有机器人。   于是人类开始了这个疯狂而愚蠢的计划,没多久地球的天空被一层黑色不透光的云遮蔽,但是人类期待的情况并没发生,出现能源短缺的机器人并没有大批的瘫痪,他们就地取材得把战场上受伤的人类战俘当作临时“电池“(这是MARIX产生的最初动机,当时只是把人类简单的一排排得接在机器上,通过刺激人类的脑部使人类的身体发电,但连接在机器上的人类很快会死亡,死亡意味着电池没电,为了使电池的寿命更长久,机器人才开始研究人类的脑部,并完善了食物供应体系,使人类在连上机器后能存活更长时间),机器人击退了人类集中所有力量的最后反扑,在消灭了人类最后的政府后,人类所有有组织的抵抗宣告结束,人类的时代宣告终结。其实机器人也因为人类遮蔽了天空能源出现的问题,虽然把人类战俘当电池用暂时解决了危机,但是短时间内转换能源供应体系也非易事,只有先把更多的人类当做电池来解决眼前的能源短缺,于是大批的人类被抓去当做电池,最后几乎所有地球上人类都被当电池,可是被当作电池的人类会很快死亡,于是已经对人类脑部有了相当了解的机器人开发出了可循环的人体电池系统,人类的脑部连接在一个电脑虚拟的空间里,这就是最初的MATRIX系统,在这个系统里,人类是生活在完美的世界上,所有欲望和需要都被满足,机器人以为这样的系统可以使人类长久的生存,但是对人的情感世界缺乏了解的机器人错了,连接在这个完美世界里的人类电池大量死亡......   今生篇   现在进入电影里的MATRIX世界,这里的MATRIX是模拟人类某个历史时期,大多数人类并不知道自己生活在虚幻的世界里,但是这个虚幻的世界并不十全十美无懈可击,在世界的某个角落里总是存在着一些或大或小的BUG(如动画版里小女孩发现的奇妙废弃大楼),还有人类中的某些特殊体质的个体似乎能超越系统的控制(动画版里超越体能极限的短跑高手),更有甚者一些程序和人类接触中有了自我意识,他们学会了逃避系统的删除。   这些难以估计后果的错误有可能导致整个系统的崩溃,对此早期的MATRIX是用亡羊补牢或对知情者灭口的消极方式加以应对,可是这样的运转模式显然无法长久,问题是会越积越多的,修补系统错误带来的可能是更多的错误,必须有一个方法定期对系统进行“大清洗“并重新启动(试想一个充满BUG的游戏服务器,这个服务器从来不停机维护)这就是大家一再提到的“MATRIX升级“,但是麻烦的是连接在MATRIX上的无数人类生命显然是无法重新启动的,这时对人类情感世界已经有相当了解的MATRIX找到了一个“最经济“的方案,那就是反过来利用错误来消灭错误,并利用错误创造重新启动系统的机会,这个完美的计划就是电影黑客帝国三部曲的全部内容。
云深无际
2021/04/14
2.5K0
黑客帝国:【Matrix的前世今生】-----黑客帝国全解析
2021-06-05按键精灵实现远程获取消息内容
用户3519280
2023/07/06
3260
风物长宜放眼量,人间正道是沧桑 - 一位北美留学生的内心独唱
我对于本科时光的印象,还停留在那所普通大学的建筑物之间,我坐在大学的时光长廊里,满眼望去,都是经历的过的故事。可毕业后回首,却很少有人能说,自己从来没有迷茫过。迷茫,仿佛就是一团乌云,笼罩在每一个心中怀有抱负的人的头上。每当夜深人静,思绪归于对自己人生未来的严肃思考,不知去往何处的苦闷,再加之不断迫近的升学/就业选择的压力,一些看似周密的计划,由于想把每一环都做的尽善尽美,往往不仅减少了反馈(一切的目标、报偿都在最后)、还因为人生的不确定性而失败:以保研为例,我常常见到一些平常学习认真、热心参加学术活动的人,但是由于不关心所在院系制度,到保研时因为一些硬性规定(如必须完成某些并不喜欢的所谓保研必修课)、或者是不公平的排名标准(比如说活动成绩、竞赛成绩计算很高,导致成绩上产生的差距在计算时权重过低)导致与原本准备了很长时间的保研机会失之交臂,而此时离考研也已不远,本来就没有提前准备,也很容易落榜。在这样的过程中,亲历者绝望、愤懑甚至因而导致抑郁的,我都见过,以至于都有些麻木了。太阳照常升起,一个人的悲哀苦痛,回到这个宏大的时代与社会中,连一粒尘埃也算不上。而那些看多了这样的故事的人,也难免兔死狐悲,故而更难聚集其一股欲与天公试比高的拼搏的意志。
乔戈里
2020/02/26
6950
对话尤瓦尔·赫拉利:人类对秩序的渴求先于真相,是互联网和AI控制个人的首要原因
3月26日,在北京王府井的一个会议室内,我们见到了尤瓦尔·赫拉利。这位写出《人类简史》这本畅销书的历史学家和作家,现在已成为全球科技社会发展的重要观察家和思想家。他的新书《智人之上》探讨了网络、神话和技术如何塑造世界。
小腾资讯君
2025/04/09
1350
纽约客:AI 是否会成为人类的最后发明?
【导读】Nick Bostrom 是《超级智能:路线图、危险性与应对策略》的作者,他认为真正的人工智能可能拥有巨大的威胁,如果人类没有小心处理,很可能会走向自我灭绝的道路。 Bostrom 提出了大过滤器的观点,他说生命总倾向于扩张,但到目前为止我们还没有观察到外星生命。Bostrom 说这可能是大过滤器的原因,所有的文明可能都得发展出某些技术,而新的技术发现也许会导致普遍的生存灾难。 这里所说的技术,就是人工智能。 Bostrom 的论述总有一种“优雅”的悖论:一方面是逻辑清晰的分析和论述,另一方面又不
新智元
2018/03/13
1.6K0
纽约客:AI 是否会成为人类的最后发明?
专访探索AGI的孤勇者,传奇工程师John Carmack:惊讶看不到如我这样的人
---- 新智元报道   来源:智源社区 编辑:好困 【新智元导读】John Carmack,这位传奇游戏开发者、火箭工程师和VR梦想家已经转向一个大胆的新挑战:开发人工通用智能——一种超越模仿人类智能而理解事物和解决问题的AI形式。 我坚信,实现AGI程序的源代码,一个人就能编写,规模是几万行。而不是Chrome三千万或者Twitter两千万那种量级。推理是:人的DNA信息量不到1GB,而大脑只有40MB,其中还有冗余和不精密的部分。十年内我们也能拥有匹配的硬件完成这项工作。 职业生涯早期,当我有个
新智元
2023/02/24
3480
专访探索AGI的孤勇者,传奇工程师John Carmack:惊讶看不到如我这样的人
最后走的人关灯,人类的任务是迎接智能机器的来临吗?
保罗·若里翁,人类学家、社会学家、人工智能专家、经济学家,著有多部著作,曾任布鲁塞尔大学、剑桥大学、巴黎第八大学、加州大学等世界知名大学教授,研究领域广泛,开设的有关人工智能、人类复杂系统以及经济学思考的博客在欧美受到广泛欢迎。
晨涵
2024/05/15
560
最后走的人关灯,人类的任务是迎接智能机器的来临吗?
20世纪最伟大的智者之一 Alan Turing (by 宋方敏)
引言 美国TIME杂志在1999年出版专卷介绍20世纪100个最伟大的智者,在计算机科学领域中英国数理逻辑学家Alan Turing列入其中(数学有Kurt Gödel,物理有Albert Einstein,后来Einstein列为The person of the 20th century)。由于Turing对于人类的极出贡献,他成为20世纪最有影响科学家和思想家之一。本文介绍Alan Turing的生平和主要工作,以此纪念计算机科学的奠基人。 Turing评说 在数理逻辑的神秘王国里,一个天才提出了质疑
用户1107453
2018/06/21
1.2K0
奥特曼回应一切:GPT-5、董事会宫斗、Ilya当时看到了什么
不仅如此,去年亮相的 ChatGPT、GPT-4,更是把 AI 直接带入到生成式人工智能领域。作为一家引领科技潮流的机构,大家自然对其方方面面都产生好奇。
机器之心
2024/03/26
1150
奥特曼回应一切:GPT-5、董事会宫斗、Ilya当时看到了什么
《纽约客》:还原真实的扎克伯格
本文作者欧逸文(Evan Osnos)是《纽约客》驻华记者,曾获得2008年普利策奖。文章由公众号“新闻别动队”韩巍翻译。
AI科技大本营
2018/10/22
1.4K0
沸腾新青年盛典 | 万字长文,读懂中国青年沸腾力量
穿过2021,行至2022,我们向着历史的新坐标迈进。 宇宙深处,“羲和”探日、“天问”奔火,中国人首次进入自己的空间站,女航天员王亚平太空漫步。换了人间,在宏大无匹的时代浪潮中,青年躬身入局激荡起更大的浪花。奥运会上,杨倩射落首金、全红婵一跃惊人、苏炳添刷新纪录;抗疫战场,一线医护、志愿者、普通居民在与病毒的交锋中守望相助;教育的田野,孩子们回归校园,职场人重回“课堂”开启“新学习时代”…… 来自全国最大在线终身学习平台腾讯课堂的数字表明,即便在疫情之下,依然有更多的青年在用拼搏的音符,谱写自己的乐章和
鹅老师
2022/01/21
6120
清华大学胡翌霖 | “人工智能”的现象学漫谈
这篇文章是为了今年的现象学科技哲学会议准备的,酝酿了几个月,最后也没写成完整的论文,把随笔形式的文字交了差,这次参会人数太多,吴老师不准备每个参会者都讲论文,有些论文收录会议文集但不安排报告,我就更乐意凑合一下了。论文写不出来,主要原因自然是花的时间不够,文献读偏了,啃了写关于“意向性”的资料,最后发现“意向性”水太深,驾驭不了。
数据科学人工智能
2022/03/31
9340
推荐阅读
相关推荐
10月准备读的3本书
更多 >
LV.1
树融科技前端开发工程师
目录
  • 读取数据
    • 只读取数据集当中的某几列
    • 时间类型的数据解析
    • 对于数据类型加以设定
    • 设置索引
    • 只读取部分读取
    • 跳过某些行
    • 遇到了空值咋办呢?
    • 那么布尔值呢?
    • 从多个csv文件中读取数据
    • 要是从PDF文件当中来读取数据
  • 探索性数据分析
    • 三行代码直接生成
  • 基于数据类型的操作
    • 基于数据类型来筛选数据
    • 推断数据类型
    • 手动进行数据类型的转换
    • 一次性完成数据类型的转换
  • 列的操作
    • 重命名
    • 添加前缀或者是后缀
    • 新建一个列
    • 在指定的位置插入新的一列
    • if-else逻辑判断
    • 去掉某些列
  • 字符串的操作
    • 列名的操作
    • Contains()方法
    • findall()方法
  • 缺失值
    • 查看空值的比例
    • 空值的处理方式
  • 日期格式的数据处理
    • 获取指定时间的数据
    • 通过日期时间来获取数据
    • 通过指定日期来获取数据
  • 将格式化数据集
    • 保留指定位数
    • 高亮显示数据
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档