[Python] 파이썬으로 fasta 파일 읽기

Python

[Python] 파이썬으로 fasta 파일 읽기

구리걸 2023. 7. 25. 11:56

파이썬에은 다양한 방법으로 생물정보학 분석에 사용될 수 있다. 그 중 기본적으로 사용될 수 있는 fasta 파일을 읽는 방법을 알아본다.

먼저 fasta 파일은 다음과 같이 >와 함께 나오는 헤더(header)와 시퀀스로 구성되어있다. 내가 필요한 건 주로 시퀀스이기 때문에 코드를 다음과 같이 짤 수 있었다.

import re

with open("input.fasta") as file:
	f = file.read().replace("\n","").split(">")
    
    st = []
    seq = []
    
for i in range(len(f)):
	st.append(f[i].replace("Rosalind_",""))
st = [v for v in st if v]


for i in range(len(st)):
	seq.append(re.sub(r'[0-9]','',st[i]))

나는 로잘린드 문제 해결을 위한 코드여서 다음과 같이 짰지만, header 정보도 필요하다면 따로 list에 append 하는 등의 방법으로 저장할 수 있다.

'Python' 카테고리의 다른 글

[Python] 파이썬에서 txt, csv 파일 불러오기 (0)	2023.07.31

현재글[Python] 파이썬으로 fasta 파일 읽기

ggplot2 #ggplot() #geom_density(), r #rstudio #r강의 #r기초 #ggplot2, for문 #반복문 #, R #R외부파일 #R커맨드라인파일 #Rscript #Rscript 입력, densityplot #histogram #히스토그램 #밀도 #밀도곡선 #밀도함수 #그래프 #그래프그리기, R에서텍스트, txt읽기, 파이썬강의 #파이썬기초 #, r #rstudio #r기초 #r강의 #r반복문, csv읽기, 엑셀조건, ls 옵션 #리눅스 명령어, 리눅스명령어 #sed #리눅스파일 특정 줄 확인 #리눅스 파일 특정 행 확인 #, R에서파일읽기, 리눅스 $linux #bash #bashshellscript #for문 #for구문 #디렉토리안파일반복 #리눅스반복문, 엑셀 강의, txt불러오기, 데이터프레임, Rosalind #cons #파이썬 #fasta읽기 #re #생물정보학 #생물정보학파이썬 #생물정보학코딩연습, 엑셀,

Today :
Yesterday :

티스토리툴바