BioPython을 사용하여 PubMed 제목에서 인용에 대한 데이터의 CSV 파일을 채 웁니다. 지금까지이 쓴 :BioPython을 사용하여 PubMed 검색 및 CSV로 작성
import csv
from Bio import Entrez
import bs4
Entrez.email = "my_email"
CSVfile = open('srData.csv')
fileReader = csv.reader(CSVfile)
Data = list(fileReader)
with open('blank.csv','w') as f1:
writer=csv.writer(f1, delimiter='\t',lineterminator='\n',)
for id in Data:
handle = Entrez.efetch(db="pubmed", id=id, rettype="gb", retmode="xml")
record = Entrez.read(handle)
title=record[0]['MedlineCitation']['Article']['ArticleTitle']
abstract=record[0]['MedlineCitation']['Article']['Abstract']
mesh =record[0]['MedlineCitation']['MeshHeadingList']
descriptors = ','.join(term['DescriptorName'] for term in mesh)
writer.writerow([title, abstract, descriptors])
그러나,이 제목, 초록 및 메쉬 용어는 자신의 유형에 따른 인 내가 감히 구분 된 여러 컬럼에 걸쳐 확산되지 않는 특이한 출력을 생성합니다.(). 내 csv 테이블을 제목이 포함 된 세 개의 열과 다른 하나의 추상 및 다른 메쉬 용어로 구성해야합니다.
어떻게하면됩니까?
는명확히하기 위해 샘플 출력은, 첫 번째 열은 전체 제목을 포함하고 추상적이고 다음 몇 컬럼의 시작은 추상의 다음 부분을 포함한다. 나는 그것들을 별개의 열로 나누어야한다. 즉. 첫 번째 열은 제목 만 포함해야합니다. 초록은 초록, 세 번째는 MeSH 만 사용합니다.
현재, 첫 번째 열은 포함
는"Distinct and combined vascular effects of ACE blockade and HMG-CoA reductase inhibition in hypertensive subjects. {u'AbstractText': ['Hypercholesterolemia and hypertension are frequently associated with elevated sympathetic activity. Both are independent cardiovascular risk factors and both affect endothelium-mediated vasodilation. To identify the effects of cholesterol-lowering and antihypertensive treatments on vascular reactivity and vasodilative capacity"
당신이 제목 "무엇을 의미합니까를, 추상 및 MeSH 용어는 여러 열에 걸쳐 있습니다. " 샘플 출력을 보여줄 수 있습니까? – larsks
@ 아이스크. – Toby