Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >从 数据工程 到 Prompt 工程

从 数据工程 到 Prompt 工程

作者头像
数据科学工厂
发布于 2023-08-10 03:24:36
发布于 2023-08-10 03:24:36
24700
代码可运行
举报
运行总次数:0
代码可运行

数据工程构成了数据科学过程的很大一部分。在 CRISP-DM 中,这个过程阶段称为“数据准备”。它包括数据摄取、数据转换和数据质量保证等任务。在本文[1]章中,我们使用 ChatGPTPython 解决了典型的数据工程任务。通过这样做,我们探索了数据工程与提示工程新学科之间的联系。

简介

2022 年 5 月,斯蒂芬·沃尔夫勒姆 (Stephen Wolfram) 和莱克斯·弗里德曼 (Lex Fridman) 发表了题为“编程已死吗?”的深刻见解。他们讨论了未来开发者是否还会使用高级语言。根据 Wolfram 的说法,许多编程任务可以通过大型语言模型 (LLM) 实现自动化。在撰写本文时,此类模型最突出的例子是 ChatGPT。自 2022 年底推出以来,它产生了惊人的效果。指定要由 LLM 执行的操作称为“提示工程”。如果 Wolfram 是对的,至少软件开发的一部分将从编写代码转向编写提示。

在数据科学方面,数据准备可能是一项耗时且乏味的任务。那么,为什么不尝试使用 LLM 使其自动化呢?在以下部分中,我们将使用 ChatGPT 和 Python 解决不同的数据工程问题。我们没有自己编写 Python 代码,而是使用提示工程来生成它。我们的实验是在 2023 年 5 月 19 日基于当时最新的免费 ChatGPT 版本 (GPT-3.5) 进行的。

创建数据框

让我们从一个简单的问题开始,并从样本数据集创建一个 Pandas 数据框。表 1 包含例如世界银行提供的国家指标。

image-20230524153840794

为了从上面的示例中创建数据框,我们开始了与 ChatGPT 的新对话并发布了以下提示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Create a Pandas table with the following data:
Continent, Country, Year, Category, Variable, Value
Asia, China, 2022, Economy, GDP, 18.1
Asia, China, 2022, Demographics, Population, 1412
North America, USA, 2022, Economy, GDP, 25.5
North America, USA, 2022, Demographics, Population, 333
Europe, Germany, 2022, Economy, GDP, 3.9
Europe, Germany, 2022, Demographics, Population, 84

作为响应,该模型生成了以下 Python 代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

data = {
    'Continent': ['Asia', 'Asia', 'North America', 'North America', 'Europe', 'Europe'],
    'Country': ['China', 'China', 'USA', 'USA', 'Germany', 'Germany'],
    'Year': [2022, 2022, 2022, 2022, 2022, 2022],
    'Category': ['Economy', 'Demographics', 'Economy', 'Demographics', 'Economy', 'Demographics'],
    'Variable': ['GDP', 'Population', 'GDP', 'Population', 'GDP', 'Population'],
    'Value': [18.1, 1412, 25.5, 333, 3.9, 84]
}

df = pd.DataFrame(data)
print(df)

运行脚本时,我们看到输出符合我们的规范:

尽管我们在实验中使用了示例,但下一节中生成的代码原则上也可以处理更大的数据集。

旋转数据框

对于数据科学,我们在第一个提示中创建的表结构并不是最优的。相反,所谓的“平板”会更方便。在表 1 中,指标“GDP”和“人口”分别用名为“Variable”和“Value”的两列表示。相比之下,平面表格将为每个指标包含单独的列,如表 2 所示。

将表 1 的格式转换为表 2 的格式称为“透视”。让我们尝试使用 ChatGPT 来解决这个任务。为此,我们在对话中发布了第二个提示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Transform the table into the following format:
Continent, Country, Year, GDP, Population
Asia, China, 2022, 18.1, 1412
North America, USA, 2022, 25.5, 333
Europe, Germany, 2022, 3.9, 84

上述消息基于所需数据格式的示例。或者,我们也可以纯口头表达我们的要求。与经典编程一样,在提示工程中有实现目标的替代解决方案。在不久的将来,寻找最佳方式将是一项激动人心的任务。根据我们的提示,ChatGPT对Python代码进行了如下调整:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

data = {
    'Continent': ['Asia', 'Asia', 'North America', 'North America', 'Europe', 'Europe'],
    'Country': ['China', 'China', 'USA', 'USA', 'Germany', 'Germany'],
    'Year': [2022, 2022, 2022, 2022, 2022, 2022],
    'Category': ['Economy', 'Demographics', 'Economy', 'Demographics', 'Economy', 'Demographics'],
    'Variable': ['GDP', 'Population', 'GDP', 'Population', 'GDP', 'Population'],
    'Value': [18.1, 1412, 25.5, 333, 3.9, 84]
}

df = pd.DataFrame(data)

# Pivot the table
pivot_df = df.pivot_table(index=['Continent', 'Country', 'Year'], columns='Category', values='Value').reset_index()

# Rename the columns
pivot_df.columns.name = None
pivot_df.columns = [column if column != 'Variable' else None for column in pivot_df.columns]

print(pivot_df)

然而,运行脚本的第二个版本显示输出不是我们所要求的:

该表包含名为“人口统计”和“经济”的两列,而不是预期的“GDP”和“人口”列。为了解决这个问题,我们发布了下一个提示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
The columns are not correct, you should have used 
the variables GDP and population

作为响应,模型纠正了错误并生成了另一个版本的 Python 代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

data = {
    'Continent': ['Asia', 'Asia', 'North America', 'North America', 'Europe', 'Europe'],
    'Country': ['China', 'China', 'USA', 'USA', 'Germany', 'Germany'],
    'Year': [2022, 2022, 2022, 2022, 2022, 2022],
    'Category': ['Economy', 'Demographics', 'Economy', 'Demographics', 'Economy', 'Demographics'],
    'Variable': ['GDP', 'Population', 'GDP', 'Population', 'GDP', 'Population'],
    'Value': [18.1, 1412, 25.5, 333, 3.9, 84]
}

df = pd.DataFrame(data)

# Pivot the table
pivot_df = df.pivot_table(index=['Continent', 'Country', 'Year'], columns='Variable', values='Value').reset_index()

# Rename the columns
pivot_df.columns.name = None
pivot_df.columns = ['Continent', 'Country', 'Year', 'GDP', 'Population']

print(pivot_df)

运行脚本表明这次旋转已正确实现:

富集数据框

另一个典型的数据工程任务是用附加信息丰富数据集。为此,我们要求 ChatGPT 通过发布以下提示将 ISO 国家代码添加到我们的数据中:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
For each country, in the table above, add its ISO code

结果,模型调整了响应并返回了以下代码片段:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

data = {
    'Continent': ['Asia', 'Asia', 'North America', 'North America', 'Europe', 'Europe'],
    'Country': ['China', 'China', 'USA', 'USA', 'Germany', 'Germany'],
    'Year': [2022, 2022, 2022, 2022, 2022, 2022],
    'Category': ['Economy', 'Demographics', 'Economy', 'Demographics', 'Economy', 'Demographics'],
    'Variable': ['GDP', 'Population', 'GDP', 'Population', 'GDP', 'Population'],
    'Value': [18.1, 1412, 25.5, 333, 3.9, 84]
}

iso_codes = {
    'China': 'CN',
    'USA': 'US',
    'Germany': 'DE'
}

df = pd.DataFrame(data)

# Add ISO code column
df['ISO Code'] = df['Country'].map(iso_codes)

# Pivot the table
pivot_df = df.pivot_table(index=['Continent', 'Country', 'ISO Code', 'Year'], columns='Variable', values='Value').reset_index()

# Rename the columns
pivot_df.columns.name = None
pivot_df.columns = ['Continent', 'Country', 'ISO Code', 'Year', 'GDP', 'Population']

print(pivot_df)

运行脚本显示一个带有 ISO 代码的新列已添加到数据框中。

派生列

接下来让我们通过将一个国家的 GDP 除以其人口规模来得出一个新的列“人均 GDP”。为此,我们发送了以下提示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Derive a new column "GDP per capita" by dividing the GDP 
of a country by its population size

对此,模型修改了代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

data = {
    'Continent': ['Asia', 'Asia', 'North America', 'North America', 'Europe', 'Europe'],
    'Country': ['China', 'China', 'USA', 'USA', 'Germany', 'Germany'],
    'Year': [2022, 2022, 2022, 2022, 2022, 2022],
    'Category': ['Economy', 'Demographics', 'Economy', 'Demographics', 'Economy', 'Demographics'],
    'Variable': ['GDP', 'Population', 'GDP', 'Population', 'GDP', 'Population'],
    'Value': [18.1, 1412, 25.5, 333, 3.9, 84]
}

iso_codes = {
    'China': 'CN',
    'USA': 'US',
    'Germany': 'DE'
}

df = pd.DataFrame(data)

# Add ISO code column
df['ISO Code'] = df['Country'].map(iso_codes)

# Pivot the table
pivot_df = df.pivot_table(index=['Continent', 'Country', 'ISO Code', 'Year'], columns='Variable', values='Value').reset_index()

# Calculate GDP per capita
pivot_df['GDP per capita'] = pivot_df['GDP'] / pivot_df['Population']

# Rename the columns
pivot_df.columns.name = None
pivot_df.columns = ['Continent', 'Country', 'ISO Code', 'Year', 'GDP', 'Population', 'GDP per capita']

print(pivot_df)

输出表明脚本产生了预期的结果:

分析数据

一旦数据转换完成,实际的分析就可以开始了。最后让我们计算一下各国GDP与人口的相关系数。为此,我们贴出最后一个提示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Use the table above to calculate the correlation coefficient between 
the GDP and the population of the countries

结果,模型返回了以下代码片段:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

data = {
    'Continent': ['Asia', 'Asia', 'North America', 'North America', 'Europe', 'Europe'],
    'Country': ['China', 'China', 'USA', 'USA', 'Germany', 'Germany'],
    'Year': [2022, 2022, 2022, 2022, 2022, 2022],
    'Category': ['Economy', 'Demographics', 'Economy', 'Demographics', 'Economy', 'Demographics'],
    'Variable': ['GDP', 'Population', 'GDP', 'Population', 'GDP', 'Population'],
    'Value': [18.1, 1412, 25.5, 333, 3.9, 84]
}

df = pd.DataFrame(data)

# Pivot the table
pivot_df = df.pivot_table(index=['Continent', 'Country', 'Year'], columns='Variable', values='Value').reset_index()

# Calculate correlation coefficient
correlation_coefficient = pivot_df['GDP'].corr(pivot_df['Population'])

print("Correlation Coefficient: {:.3f}".format(correlation_coefficient))

运行脚本时,我们发现两个变量之间存在很强的正相关性,这并不奇怪:

总结

不可否认,我们的实验是基于一个简单的数据集。然而,结果是显著的。我们执行了几项数据工程任务,而没有编写一行代码。 ChatGPT 不仅能够在大多数情况下正确执行我们的提示。但即使模型犯了错误,它也能够反映和修复错误。与软件开发一样,生成的代码必须经过测试。此外,它可能需要重构和优化。在 AI 时代使用 pylint 仍然是一个好主意。然而,总而言之,我们必须同意 Wolfram 的观点:在未来,数据工程的重要部分将从编码转向提示工程。这种新方法不会取代数据工程师,但会提高他们的效率。

往期推荐

Reference

[1]

Source: "https://towardsdatascience.com/from-data-engineering-to-prompt-engineering-5debd1c636e0"

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 冷冻工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
谷歌战略揭秘:押注人工智能,云服务和Moonshots(一)
在谷歌无人驾驶汽车,企业云,以及智能手机业务中,人工智能是不可或缺的重要组成部分。 自1998年在加州门洛帕克的一个车库成立以来,谷歌已经成为后互联网时代企业创新的领导者。谷歌孵化创新的能力已经从几个
点滴科技资讯
2018/04/28
4.1K0
谷歌战略揭秘:押注人工智能,云服务和Moonshots(一)
谷歌重组硬件部门:裁员数百人,Fitbit创始人离职
1月11日消息,谷歌(Google)近日向外媒9to5Google证实,将对负责Pixel、Nest、Fitbit硬件的装置和服务部门进行组织重整,预计将裁员数百名员工,与AR扩展现实、Google助理业务相关的员工受影响最大。这似乎也表明谷歌不再自主开发AR硬件产品,而是选择与硬件伙伴合作开发。
芯智讯
2024/01/12
2190
谷歌重组硬件部门:裁员数百人,Fitbit创始人离职
Nest创始人:“智能家居”是伪概念
去年开始,有关“智能家居”和“智能硬件”的创业开始在中国火热起来。Nest Labs 无疑是当时这个领域里全球做的最好的公司。于是8月左右我联系了对方希望进行采访,而他们也爽快的答应了。 但是后来进展一直不太顺利,采访对象从联合创始人及CEO Tony Fadell 变到到联合创始人及副总裁 Matt Rogers,采访提纲也几易其稿。最终在去年年底的时候,对方正式拒绝了我的采访。随后发生了什么事大家都知道了,今年1月,Google宣布32亿美元收购了Nest。 在最近的 GigaOM Roadmap 大会
大数据文摘
2018/05/23
5860
Google Nest收购Dropcam,不只是为了摄像头
被Google以30亿美金收入囊中的Nest正式拿下了Dropcam,价格为5.55亿美金。对于收购目的,Nest联合创始人罗杰斯表示“Nest和Dropcam都希望能为客户提供整体化的使用体验,同时也都致力于帮助人们出门在外时仍然能与自己的家保持联系。”,Dropcam是目前最受欢迎的平民家居摄像头,并且开创了基于摄像头的云存储服务的“硬件即服务“模式。 一个是温控器+燃气报警器,另一个则是家庭监控摄像头。两个看上去本来不相关的公司之间的共同点在于,它们是都“智能家居”产品。智能家居单品之间的联合协作是必
罗超频道
2018/04/25
8370
谷歌为何32亿美金收购Nest?
谷歌北京时间昨天早间宣布将以32亿美元的价格收购智能家居设备生产商Nest Labs,支付方式为全现金,震惊业内。 仔细分析,谷歌收购的理由不外乎有以下三个。 行业大势转换: 从刚刚结束的CES上看,消费电子的趋势已经告别智能手机,进入可穿戴智能设备、智能家居、互联网汽车等新的领域。包括智能手机、平板电脑等硬件厂商都已经认清这一形势。尤其是智能家居,因为成为巨头争抢的大市场。在CES上,三星等多家厂商展示各自家居自动化系统和智能家电产品。通过这些产品,用户可随时了解家庭能源、水的使用等
大数据文摘
2018/05/22
9090
是权谋还是不当竞争,自动驾驶领域为何频发“技术偷窃”事件?
无论是古往今来的权谋故事、军事战争、还是商业大片之中,派遣己方人员去“敌方”卧底窃取机密总是最令看客们心惊胆战却倍感刺激的情节。近年来,这一经典的情节在自动驾驶领域频繁上演,其中夹杂着出走、背叛、信念不合种种,背后究竟是人性的“扭曲”,还是道德的“沦丧”?
镁客网
2019/05/07
4580
是权谋还是不当竞争,自动驾驶领域为何频发“技术偷窃”事件?
绕过运营商也能发短信?苹果正在研发下一代手机通讯
近两年,人们对于苹果公司的创新能力议论纷纷,它还能再创辉煌吗?事实上苹果公司对于创新的追求始终没有止步。据悉,苹果近期正在疯狂招聘,希望先发制人,在未来5年内缔造一个新的“通讯时代”。
大数据文摘
2020/02/12
6050
从软件到硬件,谷歌在物联网领域做了什么?
物联网一直被认为是继计算机和移动互联网之后颠覆人们生活的第三次革命。 根据今年秋天外国数据研究机构BI Intelligence发布的一份报告预测,到2020年,全球通过物联网链接的设备总数将达到240亿台,占到全球总体联网设备数的70%。在今后的5年中,全球物联网解决方案的总开支预计将达到6万亿美元。 面对如此庞大的市场,作为互联网时代的科技巨头之一,谷歌自然不会视而不见。实际上,从2011年开始,谷歌在物联网方面的布局就首次进入了人们的视野。 软件:系统 + 通讯 2011年5月,在当年的Goo
AI研习社
2018/03/29
1.1K0
从软件到硬件,谷歌在物联网领域做了什么?
包子解读微软收购Linkedin
今天早上6点,不想起床的小编朦朦胧胧起床,随便刷一手微信,突然发现某朋友分享了一条题目无比夸张的重磅消息:微软以262亿美元的价格收购Linkedin! 刚看到这个消息的那一刻,小编的内心是一个大写
包子面试培训
2018/04/20
8550
包子解读微软收购Linkedin
全面布局AI,IBM、Google是如何做的?
雷锋网按:本文摘选自长城证券报告——互联网迎来AI 时代,海外科技巨头争先布局:人工智能深度报告(国外篇一),在未改变原意的基础上略有删减。 PC互联网时代的企业核心竞争力为软件产品的快速反应能力,移动互联网时代是构建移动端的生态系统,人工智能时代则更为依赖 AI 核心技术。 AI技术拥有两大要素: 核心技术平台 数据循环 只有将 AI 技术与数据结合,才可形成实用性的业务。本文主要侧重于介绍IBM、Google在基础层、技术层、应用层全面布局AI,并对其扩展应用场景等内容进行介绍。 IBM——Watso
AI科技评论
2018/03/08
2K0
全面布局AI,IBM、Google是如何做的?
【重磅揭秘】Google帝国原力觉醒:2016将征战哪些新疆域?
又到了半年一度的时候了:我们对 Google 的发展轨迹进行了追踪。对于正在不断扩张疆域的Google帝国,我们概括了所有(我们知道的)处于进展中的项目,推出半年一期的系列文章。 虽然从现在开始,也许我们应该说是 “Alphabet帝国中所有处于进展中的项目”了。“Google”现在仅仅只是“Alphabet”——Google创始人们新成立的总公司——下属公司之一。我们过去一直在追踪的Google的项目,已经落地生根成为了Alphabet下属的许多公司。不过放心吧,一切仍然尽在我们的追踪之中。 与往期相同,
新智元
2018/03/14
1.1K0
【重磅揭秘】Google帝国原力觉醒:2016将征战哪些新疆域?
展望 IoT 市场:机器学习能力定生死
机器哪怕价值上亿,也无法替代医生来治病救人;但一个25美元的可穿戴设备却知道你什么时候该去看医生。 1996 年,美国芝加哥的库克郡医院急诊室采用了一种算法来判断出现胸痛症状的患者中,哪些面临更高的心脏病发作风险,是否在医院床位紧缺的情况下有住院的充分理由。该算法严格按照流程执行系统的基础测试,被证明不但快速高效,且及其精准。相比单纯依赖医生的判断,该算法判定的低风险患者数量多了 70%,而高风险患者数量则达到实际数量的 95%(医生判断仅为 75-89%)。这真是让人惊叹——要知道那个年代,深度运算还未问
CSDN技术头条
2018/02/12
5700
展望 IoT 市场:机器学习能力定生死
Fitbit 就快上市了,为何中国手环依然硬不起来?
中国智能手环厂商在经历数个坏消息之后,终于迎来一个好消息。坏消息 1 是小米出了 79 元手环,坏消息 2 是 Apple Watch上市大受欢迎并且很大程度取代了手环,坏消息 3 是数据显示人们佩戴
罗超频道
2018/04/28
5800
Fitbit 就快上市了,为何中国手环依然硬不起来?
起个大早,赶个晚集,谷歌云业务还“有戏”吗?
全球公有云市场上,谷歌在向前追赶亚马逊和微软的途中,却被阿里云和IBM弯道超车。当竞争对手逐渐形成垄断之势,谷歌云还有机会打破现有的云计算版图吗?
科技云报道
2022/04/14
5240
起个大早,赶个晚集,谷歌云业务还“有戏”吗?
OpenAI 计划以要约收购的形式出售股票,投资者质疑其盈利能力
作者| 李冬梅 1 OpenAI 被曝就收购要约展开谈判 当地时间 1 月 5 日,据《华尔街日报》报道,有知情人士透露,爆红的聊天机器人 ChatGPT 背后的研究实验室 OpenAI 正在谈判以收购要约的形式出售现有股份,交易对该公司的估值达到 290 亿美元左右,使其在没有什么收入的情况下成为账面上最值钱的美国初创公司之一。 这些知情人士说,风投公司 Thrive Capital 和 Founders Fund 正在商谈投资该笔交易,交易中出售的股票总额至少为 3 亿美元。这些知情人士说,这项交
深度学习与Python
2023/03/29
3860
OpenAI 计划以要约收购的形式出售股票,投资者质疑其盈利能力
30天「开猿节流」!拆解硅谷大厂裁员新套路:部门重组
---- 新智元报道   编辑:Aeneas 好困 【新智元导读】最近,硅谷大厂们接连开启「部门重组」。如果在期限内找不到新岗位,对不起,你可以自己润出去了。 最近,硅谷的互联网大厂们为了「降本增效」,纷纷开始悄没声地裁员了。 But,大厂的「裁员」可不叫「裁员」,而是——「部门重组」。 当然,这个「重组」是有期限的。时间一到,没找到落脚点儿的人就得乖乖卷铺盖走人。 Meta:距离你被开除,还有30天 近日,彭博社的亿万富豪榜显示,小扎的资产缩水了一半。 小扎哭晕在厕所 而Meta计划在未来几个月
新智元
2022/09/22
2770
30天「开猿节流」!拆解硅谷大厂裁员新套路:部门重组
裁员的沃森健康,问题重重的IBM人工智能业务
李杉 编译整理 量子位 出品 | 公众号 QbitAI 沃森(Watson),IBM最重要的人工智能部门,搭载着这家公司的诸多期望。 就在上个月,IBM CEO罗睿兰还在一次会议上表示,我们正处在历史转折点上,把人工智能打造成无处不在的技术可以让企业的发展呈现出“指数级曲线”。 她甚至认为,有朝一日可能会因此而诞生“沃森定律”。 但在沃森部门上一轮裁员中被扫地出门的工程师却表示,该公司针对“认知计算”平台的推广,掩盖了他们在利用人工智能盈利的过程中遇到的真正困境。 “IBM沃森拥有了不起的人工智能技术。”一
量子位
2018/07/19
7480
谷歌上海研发院院长带队出走创业!VC热捧,塞钱都得跑得快
金磊 博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一边是美国总部,业务进展不顺败退,团队裁员重组。 另一边则是中国分舵,负责人带队出走创业,热捧之盛,累计拿到上亿美元融资,动作慢一点的VC连塞钱进去的机会都没有。 说的是谷歌,讲的是医疗健康业务,具体是上海研发中心几十号员工出走创业。 就在最近,一家名为耀乘的上海AI公司,隐秘低调,但又备受追捧。 因为其创始人,是谷歌上海研发中心的高管,其团队也都悉数出自谷歌上海office。 谁是耀乘? 公开资料显示,创办于2020年8月,位于上海。 其后
量子位
2023/03/10
5080
谷歌上海研发院院长带队出走创业!VC热捧,塞钱都得跑得快
谷歌Bard被曝剽窃ChatGPT?BERT一作跳槽OpenAI,揭惊天内幕
---- 新智元报道   编辑:编辑部 【新智元导读】谷歌有大麻烦了!外媒爆料说,Bard的训练数据部分来自ChatGPT。谷歌可能跳到黄河里也洗不清了。 3月29日,外媒The Information曝出了一个惊天大瓜! 谷歌的离职员工、已跳槽OpenAI的顶级研究员竟然曝出——Bard竟是用ChatGPT的数据训练的! 如果事情为真,这可真算得上是谷歌的顶级丑闻了。 对抗ChatGPT的AI,竟然用的是ChatGPT的训练数据,这可太讽刺了。 并且,这也明显违反了OpenAI的服务条款——要知道
新智元
2023/04/01
3410
谷歌Bard被曝剽窃ChatGPT?BERT一作跳槽OpenAI,揭惊天内幕
独立 SOAR 的终结?Google以5亿美元收购以色列网络安全初创公司Siemplify
Google正在收购以色列网络安全初创公司、SOAR供应商Siemplify。收购的价格估计为5亿美元,这是Google首次收购活跃在网络安全领域的以色列公司。Siemplify在以色列、美国和伦敦有200名员工,他们将在收购后加入Google。有分析师认为,这笔交易是独立 SOAR 和安全信息与事件管理 (SIEM) 市场终结的信号。
SDNLAB
2022/01/19
4200
独立 SOAR 的终结?Google以5亿美元收购以色列网络安全初创公司Siemplify
推荐阅读
相关推荐
谷歌战略揭秘:押注人工智能,云服务和Moonshots(一)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验