2016-08-17 4 views
0

정제 통계 등의 헤더/REMARK 섹션에서 (대부분의) 정보를 추출 할 수있는 PDB 파일 (Protein Data Bank) 용 파서가 있습니까?파이썬 (단백질 구조 파일)을 사용하여 PDB 헤더 정보를 파싱 하시겠습니까?

나는 Protein Data Bank에 이미 저장되어있는 구조가 아니라 파일이 생성 된 직후 파일에서 데이터에 액세스하는 데 주로 관심이 있다는 점에 유의할 가치가 있습니다. 이는 사용 된 정제 소프트웨어에 따라 처리해야 할 다양한 "적절한"포맷이 있다는 것을 의미합니다.

필자는 Biopython을 살펴 봤지만 FAQ에서 "데이터 마이닝 PDB 헤더에 관심이 있다면 여기에는 제한적인 지원 만 있기 때문에 다른 곳을보고 싶을 것입니다."

나는이 정보를 mmCIF 파일에서 추출하는 것이 훨씬 쉽다는 것을 잘 알고 있지만 불행히도 이러한 정보는 많은 고분자 결정학 프로그램에서 일상적으로 출력되지 않습니다.

답변

1

가장 좋은 방법은 pdb_extract (온라인 또는 독립 실행 형)를 사용하여 PDB 파일을 mmcif 형식으로 변환하는 것입니다.

mmcif 파일은 Biopythons Bio.PDB- 모듈을 사용하여 파싱 할 수 있습니다. mmcif 파일에 쓰기가 조금 까다 롭습니다. 파이썬 PDBx는 상당히 잘 작동하는 것 같습니다.

이 도구 및 기타 유용한 PDB-/mmcif 도구는 http://mmcif.wwpdb.org/docs/software-resources.html

에 있습니다.