我正在处理从QIIME获得的几个输出,我想要操作这些文本来获取盒图。每个输入都是以相同的方式格式化的,因此操作总是相同的,但它会更改源名。对于每个输入,我想提取最后5行,对每一列/样本有一个平均值,将这些值关联到从映射文件中获取的示例实验标签(Group),并将它们按我用来绘制所有所获得的所有数据的盒图的顺序排列。
在bash中,我执行类似于"for i in GG97 GG100 SILVA97 SILVA100 NCBI RDP; do cp ${i}/alpha/collated_alpha/chao1.txt alpha_tot/${i}_chao1.txt; done“
我有两个地点和每个地点的季节性浮游生物样本。我已经为每个季节和站点执行了多样性指数,并且我使用ggplot2和geom_boxplot表示了同一地块上的所有内容(我向您展示了这个图)。
下面是我在情节中使用的命令:
level_order <- c("Win", "Spr","Sum","Aut") #serve per cambiare l'ordine dei gruppi sull'asse delle x
ggplot(div, aes(x = factor(season, level = level
我需要做一个网络可视化,我有数据,但还没有正确的格式!数据在R中的数据中如下所示:
Title Name
Article1 Johnson
Article1 Hansson
Article1 Michaels
Article2 Nielsson
Article2 Madsen
Article2 Shannon
Article2 Paddington
我希望找到基于标题的名称组合,即协作作者,因此以这种格式输出。
Source Target Title
Johnson Hansson Article1
John
我有下面这本字典。如果我想打印下面这样的输出,我应该如何用python编写它?
John is 20 years old with GPA 3.3.
Shannon is 21 years old with GPA 3.4.
Eileen is 20 years old with GPA 3.5.
students = {
101: ["John", 20, 3.3],
102: ["Shannon", 21, 3.4],
103: ["Eileen", 20, 3.5]
}
我希望使用awk解析一个空格分隔的输入文本文件。列代码对于每个组可以有多个行。我非常感谢在这方面的任何帮助。
LOCATION
SHANNON
GROUP NUM SWITCH CODE HEX
0 4 OFF 1 3
1 13 ON 2 4
8
14
LOCATION
LOUTH
GROUP NUM SWITCH CODE HEX
0 1 OFF 1 4
1 2 ON
我试图把一些NMDS坐标画成x和y,并且用一个多样性度量(Shannon)来绘制等高线,但是我一直得到以下的错误,我不明白为什么.
Error in if (empty(new)) return(data.frame()) :
missing value where TRUE/FALSE needed
我的代码是:
all_merge <-read.table("test.txt", header=TRUE)
p <- ggplot(all_merge, aes(NMDS1, NMDS2, z = shannon))
p + geom_contour()
如何按字母顺序排序我的inventory数组?
这是我正在做的一个项目。我试着使用Arrays.sort(inventory);,但是它没有起作用。
有人能告诉我我做错了什么吗?
图书班:
//Filename: BookStore.java
//Description: Purpose is to display what books are in stock and ISBN, title, author name, year, publishers name, and price.
//Author Name: David Finocchi
//Date: 01/19/2014
impo
这个问题以前也被问过,但不知何故,答案对我没有帮助。 所以我有以下数据: NW是不同的森林,分为两组("Gruppe"),一些已经被围栏(Z),一些没有(KZ)。然后,对于每一森林的两组,我计算了生物多样性(香农指数,H)和均匀度(E)。 Here a short section of the data (i am not allowed to upload pictures yet :D) 我想创建两个散点图,一个用于香农指数,另一个用于Eveness,其中在x轴上显示森林(NW),并将每个森林的不同组相互比较/相邻。我试图这样做,但问题是,R使用NW作为标度,并不是每个数
我想把这两个函数组合在一起,得到香农多样性指数。
能做什么呢?
第一个函数是使用Data::Dumper来获得唯一的数字。
#!perl
use warnings;
use strict;
use Data::Dumper;
$Data::Dumper::Sortkeys=1;
my @names = qw(A A A A B B B C D);
my %counts;
$counts{$_}++ for @names;
printf "\$VAR1 = { %s};\n",
join ' ',
我正在尝试创建一个下拉菜单,但是我在“隐藏”嵌套菜单项时遇到了困难。链接和样式都工作得很好,只是下拉效果让我错过了一些东西。想法?
css-
#header .social {
float: right;
list-style: none;
padding-top: 20px;
}
#header .social ul li {
display: inline;
position: relative;
}
#header .social ul li ul {
display: none;
}
#header .social ul li a
我有以下df country street postcode id
SA XX0 1
GB 17 abc road 2
BE 129 def street 127 3
US nan nan 4 我想计算country、street和postcode的值的熵;空字符串或NaN默认情况下会得到0.25的值; from entropy import s
我有一个有站点的数据框架DF,一个ID号和一个多样性指数。我希望选择具有最大索引号的站点和ID (本例中的站点6)。基本上是这样的。
Sites ID Shannon.index
Site 1 1 1.9555920
Site 2 2 1.5091915
Site 3 3 1.9630550
Site 4 4 1.1068400
Site 5 5 1.8947205
Site 6
我在python 3.7中运行了这段代码:
import matplotlib.pylab as plt
LETTERS = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
def frequency_analysis(plain_text):
#the text we analyise
plain_text = plain_text.upper()
#we use a dictionary to store the letter-frequency pair
letter_frequency = {}
#initi
我正在尝试构建一个函数来计算数据帧中的条件香农熵。我给它提供以下参数:
import random
rows = 1000
columns = 3
data=pd.DataFrame([[random.randrange(0, 4, 1) for x in range(columns)] for y in range(rows)], columns=['a', 'b', 'c'])
target = ['a', 'b']
conditional = ['c']
所以在这个例子中,我将同时计算H(a