Python

[Python] 파이썬으로 fasta 파일 읽기

구리걸 2023. 7. 25. 11:56
반응형

파이썬에은 다양한 방법으로 생물정보학 분석에 사용될 수 있다. 그 중 기본적으로 사용될 수 있는 fasta 파일을 읽는 방법을 알아본다. 

 

 

먼저 fasta 파일은 다음과 같이 >와 함께 나오는 헤더(header)와 시퀀스로 구성되어있다. 내가 필요한 건 주로 시퀀스이기 때문에 코드를 다음과 같이 짤 수 있었다.

 

 

import re

with open("input.fasta") as file:
	f = file.read().replace("\n","").split(">")
    
    st = []
    seq = []
    
for i in range(len(f)):
	st.append(f[i].replace("Rosalind_",""))
st = [v for v in st if v]


for i in range(len(st)):
	seq.append(re.sub(r'[0-9]','',st[i]))

 

 

나는 로잘린드 문제 해결을 위한 코드여서 다음과 같이 짰지만, header 정보도 필요하다면 따로 list에 append 하는 등의 방법으로 저장할 수 있다.

반응형

'Python' 카테고리의 다른 글

[Python] 파이썬에서 txt, csv 파일 불러오기  (0) 2023.07.31