반응형
파이썬에은 다양한 방법으로 생물정보학 분석에 사용될 수 있다. 그 중 기본적으로 사용될 수 있는 fasta 파일을 읽는 방법을 알아본다.
먼저 fasta 파일은 다음과 같이 >와 함께 나오는 헤더(header)와 시퀀스로 구성되어있다. 내가 필요한 건 주로 시퀀스이기 때문에 코드를 다음과 같이 짤 수 있었다.
import re
with open("input.fasta") as file:
f = file.read().replace("\n","").split(">")
st = []
seq = []
for i in range(len(f)):
st.append(f[i].replace("Rosalind_",""))
st = [v for v in st if v]
for i in range(len(st)):
seq.append(re.sub(r'[0-9]','',st[i]))
나는 로잘린드 문제 해결을 위한 코드여서 다음과 같이 짰지만, header 정보도 필요하다면 따로 list에 append 하는 등의 방법으로 저장할 수 있다.
반응형
'Python' 카테고리의 다른 글
[Python] 파이썬에서 txt, csv 파일 불러오기 (0) | 2023.07.31 |
---|