我正在尝试循环一些文件,并使用pandas跳过每个文件标题之前的行。所有的文件都是相同的数据格式,除了一些文件在标题之前要跳过不同的行数。当一些文件比其他文件有更多的行要跳过时,有没有一种方法可以遍历文件并从每个文件的头部开始?例如,某些文件需要以下内容:有些人需要这样做:
f = pd.read_csv
我想知道当火花消耗卡夫卡的数据时,如何跳过标题。我的卡夫卡主题在特定的时间包含了如下信息:ton,33,2018每当我使用kafka的数据时,我都想跳过标题部分。").load
val interval=kafkaDatademostr.select(col("value").cast("string"),col("timestamp")).alias("cs