我有一个很大的元素列表(在这个例子中,我将假设它是由数字填充的)。例如:l = [1,2,3,4,5,6,7,8,9,10]现在我想从列表中取两个样本,一个包含80%的元素(当然是随机选择的),另一个包含剩余的元素( 20%),这样我就可以使用更大的一个来训练机器学习工具,其余的来测试训练。我使用的函数来自random,我是这样使用它的:per = int((80 * sz) / 100) #This will be the length of the sample list with the 80% of the
我需要按标记类进行拆分(标记可以是h、p、span、div或其他标记)。例如,如果我有一个字符串,比如:
$string = 'Hi this is a <h1><strong>long</strong><h1> <span class="cut">string</span> and I need to <p class="cut">split it into chunks<
虽然代码在第一次拆分字符串时似乎工作正常,但它似乎认为其中还有另一条换行符,因为它返回一条错误消息:substring not found。但是,当我打印cut的值时,它返回kdfjsalsdjf,显示换行符代码已被删除。x='lksjdfalkjdsflkajsdfkl\n\nkdfjsalsdjf'
if i=='\n':
Traceback (most recent cal
我需要按元素类进行拆分(元素可以是h、p、span、div或其他未知标记)。例如,如果我有一个字符串,比如:
$string = 'Hi this is a long <span class="cut">string</span> and I need to <span class="cut">split it into chunks</span> and I need help for <span class=&qu