当将DNA翻译成蛋白质时,核糖体读取DNA核苷酸3×3的序列。每组3个核苷酸被称为密码子,每个密码子编码一个氨基酸,存在一些冗余。这是大多数有机体使用的转换表(表读左、上、右):人类和大多数其他生物只使用一个氨基酸作为“开始”密码子:蛋氨酸,也就是a。相遇,M,或ATG。TCT GGT GAT TAAmet ala phe ile ser ala asp ser glu ser gly asp STOP
但是如果
我一直在运行一个名为genewise的程序,将核苷酸序列转换为基因的蛋白质序列。输入包括来自许多样本的组装的核苷酸序列。为了解析genewise输出,我使用以下命令选择了fasta头:
for i in `ls`; do (cd "$i" && awk '/^>*/{flag=1;} /\/\// {fla
最后,编写transcribe( S )。以下是它的描述:
在一项被称为转录的不可思议的分子壮举中,你的细胞创造了信使RNA分子,它反映了你DNA中核苷酸的序列。然后,RNA被用来制造蛋白质来完成细胞的工作。编写一个递归函数transcribe( S ),它应该以字符串S作为输入,该字符串具有DNA核苷酸(大写字母As、Cs、Gs和Ts)。也许还有其他的字符,尽管它们会被你的转录功能忽略--这些可能是空格或其他不是真正的DNA核苷酸的