python脚本

Python

import csv

打开fasta文件

with open('E:\泛基因组分析\ORF\ORFHMMERextrct\ORF_FAS\ORF4.fasta', 'r') as f: # 读取所有行 lines = f.readlines()

初始化变量

output = [['id'] + list(range(1, len(lines[1].strip()) + 1))] currentid = '' currentseq = []

循环遍历所有行

for line in lines: line = line.strip() # 去掉行末尾的换行符 # 如果是一个新的序列的id行 if line.startswith('>'): # 如果之前已经读取了一个序列的id和序列 if currentid != '': # 将当前的id和序列添加到输出列表中 output.append([currentid] + current_seq)

        # 重置当前id和序列
        current_id = ''
        current_seq = []
    # 获取新的序列的id
    current_id = line.strip()[1:]
# 如果是一个序列行
else:
    # 将碱基添加到当前序列中
    nucleotides = list(line.strip())
    nucleotides_with_spacer = ', '.join(nucleotides)
    current_seq.append(nucleotides_with_spacer)

将最后一个序列添加到输出列表中

output.append([currentid] + [''] + currentseq[:-1] + [current_seq[-1].replace(',','')])

在最后添加一个空行

output.append([])

将输出列表写入到csv文件中

with open('E:\泛基因组分析\ORF\ORFHMMERextrct\ORFFAS\output.csv', 'w', newline='') as f: writer = csv.writer(f, delimiter='\t', quoting=csv.QUOTENONE) writer.writerows(output)

这个脚本要把碱基一个一个的分开为什么最后一行没有被分开

好问题 0 评论收藏举报

查看全部 2 个回答

孟浩巍超级管理员用户来自于: 北京市
2023-06-14 22:11

提交代码的时候，不要用markdown，要用代码插入插件。重新提交一下，我再看看。

赞同 0 0评论

关于作者

: 是筱贺吖 问题大王
这家伙很懒，还没有设置简介

0: 回答

0: 文章

14: 问题

问题动态

发布时间: 2023-06-10 19:31

更新时间: 2023-06-14 22:11

关注人数: 2 人关注

python脚本

python脚本

打开fasta文件

初始化变量

循环遍历所有行

将最后一个序列添加到输出列表中

在最后添加一个空行

将输出列表写入到csv文件中

0 评论

0 评论

关于作者

问题动态

相关问题

推荐内容