使用python同时读取不同的json文件集

文章/答案/技术大牛

发布

1回答

、、、、

我有两组文件b和c (JSON)。每个文件的数量通常在500-1000之间。现在我正在单独阅读这篇文章。我可以使用多线程同时读取这些代码吗？我有足够的内存和处理器。yc=no of c filesfor num in range(yc): c_json_file/output/d_c_'+str(nu

浏览 19提问于2021-04-30得票数 0

1回答

如何解析Octave中的json文件？

、

和标题一样，有没有一种内置的方式来解析/解码一个.json文件？我已经看过了Octave文档和不同的工具，但是我发现的唯一一件事就是这个工具：编辑：目的是能够在两个不同的环境中使用相同的json文件: python。因此应该是: 1.定义配置；2.运行octave脚本，从config.json读取配置；3.运行<em

浏览 0提问于2018-03-08得票数 2

回答已采纳

1回答

Flask+d3.js:将多个数据集传递给html

、、、

我目前正在学习用于可视化的d3.js，使用Flask作为python后端，并遵循，在同一页面上显示两个具有不同数据集的简单图表。我正在尝试以下修改:我不使用csv，而是从python后端传递一个json文件(这个示例只是从两个csv文件中读取数据)。如何传递2个json数据集？</script> 我曾尝试编写另一个p

浏览 6提问于2017-03-06得票数 3

2回答

ValueError:读取json文件时解码'string‘时不成对的高代理项

、、

我目前正在开发python 3.8.6。在python中读取(数千个) json文件时，我收到以下错误：我尝试使用以下解决方案，同时检查其他堆栈溢出帖子，但都不起作用： json.loads('

浏览 3提问于2021-02-02得票数 1

1回答

将类似json的对象作为参数传递到python2.7失败

、

我尝试过this解决方案，排名最高的解决方案是here和none。我有一个java自动化脚本，我需要远程运行python脚本，同时为它提供一个JSON对象作为字典。JSON对象作为java提供：{\'oracle_11gd.pcap\'：\'19.0.0.10\‘，\'oracle_11g_also.pcap\'：\'19.0.0.17\'} 这个对象实际上更长，

浏览 8提问于2019-03-10得票数 0

1回答

在AWS spot实例上运行一批作业

、、、

我有一批python作业，它们只读取不同的输入文件，例如：python main.py --input=file2.json > log_file2.txt...所有这些工作都是独

浏览 5提问于2020-08-04得票数 1

4回答

如何在Python中将文件作为列表类型加载？

、、

我有一个关于Python 2.5的问题。首先，我以列表格式保存一个文件，如下所示：list = [{"a" : "b", "c" : 100}, {"a" : "c", "c": 101}]所以，我们得到一个这样的list.txt： [{

浏览 0提问于2012-07-25得票数 1

回答已采纳

1回答

如何编辑和保存json文件中的更改？

、、

我尝试编辑.json文件并保存它。我不知道怎么写剩下的代码。value}}</textarea> </form>views.py --编辑的-: if request

浏览 3提问于2014-12-13得票数 2

回答已采纳

1回答

如何在pandas DataFrame中转换或解码Unicode字符？

、、、、

我使用pandas从excel文件中读取了一些数据，并进行了一些行遍历，以生成python字典，然后将其放入json文件中。问题是我在json文件本身中获得了Unicode字符：如上所示，我不需要Unicode '\u00a0‘，而是希望在我的json文件中<

浏览 5提问于2017-12-26得票数 1

回答已采纳

1回答

为C和Python创建共享参数文件

、

我需要创建一个可以跨Python3.7和C代码库管理的参数文件。该文件需要由C或Python程序修改，更改将在其他软件上生效(更新函数将处理读取更新的文件)。最好是文件不是人类可读的，因为它包含的信息更好地留在混淆。我可以创建单独的python和C文件，但是参数集将随着时间<

浏览 0提问于2019-03-25得票数 0

回答已采纳

1回答

如何在Flask应用程序中将yaml文件转换为json？

、、、、

是否有一种方法将yaml文本数据(从Flask上的python请求)转换为json格式，或者至少是exract键值对。我正在使用python请求从http获取这个yaml文件：print(result.text) #prints text现在是否有办法将这个文本格式的yaml文件转换为json格式，或者至少提取键值？

浏览 9提问于2022-05-11得票数 -1

1回答

有没有一种方法可以在不下载的情况下使用pyspark处理s3桶中的json文件？

、、、、

我在一个特定的s3桶文件夹中有一些大型json文件。每个文件每一行都包含json对象。我试图使用spark.read.json(s3a://bucket/prefix/file.json)下载它，但是得到了“内容长度分隔消息体的过早结束”错误。我想知道是否有办法处理json中的空行，同时读取它？我们如何逐行

浏览 2提问于2020-10-02得票数 0

1回答

如何导入和读取大熊猫中的多个json文件？

、、、

我正在尝试使用python读取多个json文件。我的文件看起来是这样的： - message1.json - message1.json - message1.json - message1.j

浏览 3提问于2021-10-29得票数 1

回答已采纳

1回答

AWS存储慢同步读取

、

我们发现在同时读取时，使用来自GP2或GP3的AWS文件存储(EFS或EBS )非常缓慢。下面是一个例子：这样做一次大约需要16毫秒。但是，如果我在同一个EC2实例上生成8个并行进程，每个进程读取不同集的30个二进制文件，则每个进程平均占用105 ms (比单个进程慢556%)。这几乎就像8读是串行的，而不是并行的</

浏览 0提问于2023-01-20得票数 0

回答已采纳

1回答

为什么火花处理要花更长的时间？

、

我正在尝试使用Python (Pyspark)来学习火花。我写了这个简单的例子：import time lines = lines.lower()rdd1.take(N) print(f"Spark processing: {end_time - start_time}")Regular processing

浏览 0提问于2022-02-21得票数 0

1回答

有没有一种方法可以在运行时获取扩展的设置(在package.json中定义)？

、、、

在Visual代码扩展中，是否有一种方法可以在运行时获取扩展的设置(在package.json中定义)？我想得到一些值(比如displayName)。

浏览 0提问于2018-09-06得票数 4

回答已采纳

1回答

在Python应用程序中，我需要一个非常简单的持久存储。通常，我只需制作一个数据集，并在它更改时用pickle或json存储它，然后在启动时将其读取回去。只有当只有一个进程时，这才有效。如果我有多个进程，我可以在使用它之前读取数据，但是我仍然会得到一个进程没有写入另一个进程的争用条件，或者两个进程都试图同时写。性能不是问题，写很少(分钟或小时之间)，而且数据很小(几十个条目)。一个正确的数据库可以工作，但会过度<e

浏览 8提问于2022-10-13得票数 0

2回答

如何在spark map函数中使用字典中的json文件？

、、、

我使用的是pyspark。我想在Google地图上加载一个常规的file文件，比如" region -polygon-mapping“文件，其中包含了区域名称和它的多边形。当我处理另一个数据集RDD时，我想在map函数中使用" region - polygon -mapping“，比如测试RDD中的点是否在多边形的区域中。问题是如何在RDD map函数中将json用作常规<em

浏览 0提问于2017-06-13得票数 0

1回答

如何用python2 cPikle读取带有python3泡菜的序列化数据？

、、、、

我正在尝试使用包含的。import cPickle data = cPickle.loadUnicodeDecodeError: &#

浏览 1提问于2015-11-22得票数 5

回答已采纳

1回答

用文件名激发read.json

、

我需要从HDFS目录中读取一堆JSON文件。完成处理后，Spark需要将文件放在不同的目录中。在此期间，可能会有更多的文件添加，所以我需要一个清单的文件读取(和处理)，因为我不想删除那些尚未处理的文件。函数read.json立即将文件转换为DataFrames，这很酷，但它没有给出像wholeTextFiles这样的</

浏览 7提问于2016-04-20得票数 0

点击加载更多