我的初始数据如下所示: ColA ColB ColC
Sku1 Life/Personal NA
Sku2 Children NA
Sku3 Grooming/Hair/Makeup NA 我想永远在B列中使用斜杠("/"),后面的文本应该在另一行中出现。对于ex,上述数据应如下所示: ColA ColB ColC
Sku1 Life NA
Sku1 Personal NA
Sku2 Children NA
Sku3
我有一个dataframe,其中一些列包含长字符串(例如30000个字符)。我希望每4000个字符对这些列进行分割,这样我就得到了一个包含最多4000个字符串的新列。我在字符串长度上有一个上限,所以我知道最多应该有9个新列。我希望总是有9个新列,在字符串较短的列中没有一个/NaN。
作为一个示例(n= 10而不是4000列和3列而不是9列),假设我有dataframe:
df_test = pd.DataFrame({'id': [1, 2, 3],
'str_1': ['This is a long st
我在试着改变这一点: "This is a test this is a test" 如下所示: ["This is a", "test this is", "a test"] 我试过这个: const re = /\b[\w']+(?:[^\w\n]+[\w']+){0,2}\b/
const wordList = sample.split(re)
console.log(wordList) 但我得到了这个: [ '',
' ',
' '] 为什么会这样呢
基本上,我有一堆大字符串,我想删除其中的空格/标点符号/数字,我只需要单词。
这是我的代码:
String str = "hughes/conserdyne corp, unit <hughes capital corp> made bear stearns <bsc> exclusive investment banker develop market 2,188,933 financing design installation micro-utility systems municipalities. company systems sel
我在拆分以下字符串时遇到问题。
String str = "eat big mac .at East MacDonald .from onwards";
我想让结果出来
[ eat big mac, .at, East MacDonald, .from, onwards]
我不能用空格或点来拆分,有什么方法可以拆分吗?
我编写了以下函数:
def read_data(filename):
lines = [line.strip() for line in open(filename)]
coordinates = [line.split(' ') for line in lines]
coordinates = [(float(c[0]), float(c[1])) for c in coordinates]
return tuple(coordinates)
它读取并转换为元组,很好。
但是,它在和上失败。
使用
coordinates = [(flo
我需要编写一个方法,在给定一个句子的情况下,返回一个包含所有其他单词的数组。需要从单词中删除标点符号。我可以让它每隔一个单词就返回一次,但是我被困在删除标点符号上了。到目前为止,我是这样写的:
def alternate_words(str)
return_array = []
str.split.map.each_slice(2) do |x, y|
return_array << x
end
end
我有一个字符串,格式如下:
'User ID: 2894, Task ID: 68, Some other text'
假设我需要将此字符串转换为以下内容:
'User ID: 2684, Task ID: <replaced>, Some other text'
显然,这样做的方法是用字符串68替换字符串<replaced>。
var str = 'User ID: 2894, Task ID: 68, Some other text';
var newStr = str.replace('68',
我想将列A分成2列results1和results2,其中first分隔符<出现在字符串中,同时保留分隔符。
目前我正在使用:
df[['result1', 'result2']] = df['A'].str.split('<', 1, expand=True)
但它在拆分后移除分隔符<。
预期产出:
A C result1 result2
0 NaN NaN NaN N
我有一个Pandas DataFrame,包含一个带有分号分隔的位置名的列:
index locations
39951 Credit; Mount Pleasant GO
40976 Ajax GO; Whitby GO; Credit; Oshawa GO; Bayly
14961 Credit; Mount Pleasant GO; Port Credit GO
...
我想要做的是根据指定的位置是否出现在分号分隔的列表中进行筛选,首先拆分字符串(在;上),然后检查列表中是否有一个位置。
使用str.contains()在这里不起作用,因为这里有重叠的位置名称(例如,Cr
这是我的代码:
def split_string(source,splitlist):
sl = list(splitlist)
new = source.split(sl)
return new
当我运行它时:
print split_string("This is a test-of the,string separation-code!"," ,!-")
我有以下错误:
new = source.split(sl)
TypeError: expected a character buffer object
我怎么才能解决这个问题?
我试图将一个字符串分解为一个由文本行组成的数组列表。每90个字符创建一行,或者在遇到行中断(\r)时创建行。
我使用它将字符串每90个字符分解成一个数组(代码中为partionSize):
private static List<String> getParts(String string, int partitionSize) {
List<String> parts = new ArrayList<String>();
int len = string.length();
for (int i=0; i<len; i
我的目标是只在双空格上拆分下面的字符串。参见下面的示例字符串以及使用常规拆分函数的尝试。
我的尝试
>>> _str='The lorry ran into the mad man before turning over'
>>> _str.split()
['The', 'lorry', 'ran', 'into', 'the', 'mad', 'man', 'before', 'turning'