RSS 2.0 피드의 제목 태그를 해당 피드의 각 항목에 대한 세 가지 변수로 구문 분석하려고합니다. 당신이 볼 수 있기 때문Python 구문 분석
내가 포함feed = getfeed("http://www.tourfilter.com/dallas/rss/by_concert_date") for item in feed: print repr(item.title[0:-1])
에서, item.title임을 A : 각 제목 [뺀 뒤 )
] 아래의 코드를 인쇄 할 수 있도록 ElementTree를 사용하여 난 이미 RSS를 분석했습니다 repr() 데이터 형식에 대해서는 많이 알지 못합니다.
대화 창에 특정 repr(item.title[0:-1])
print
ED는 다음과 같다 :
'randy travis (Billy Bobs 3/21' 'Michael Schenker Group (House of Blues Dallas 3/26'
사용자가 밴드를 선택하고, I는 희망 3 개 변수 (대역 장소 각각 하나씩, 및로 각각 item.title
파싱 후 날짜 또는 아마도 배열 또는 모르겠다 ...) 선택한 밴드와 관련된 것들만 선택하십시오. 그런 다음 지오 코딩을 위해 Google에 전송되지만 다른 이야기입니다.
나는 regex
의 몇 가지 예를 보았으며 그 내용을 읽었지만 매우 복잡해 보입니다. 그렇지? 나는 지적인 방법으로 정확하게 이것을하는 방법에 관해서는 여기에있는 누군가가 약간의 통찰력을 가지고있을 것이라고 생각했다. re
모듈을 사용해야합니까? 출력이 현재 repr()
s입니까? 더 좋은 방법이 있습니까? 나는 (내가 쓰고 있어요이 메모의 단지 종류, 내 pseudoPython이다) 내가 좋아하는 루프를 사용하는 거라고 생각했다 :
list = bandRaw,venue,date,latLong for item in feed: parse item.title for bandRaw, venue, date if bandRaw == str(band) send venue name + ", Dallas, TX" to google for geocoding return lat,long list = list + return character + bandRaw + "," + venue + "," + date + "," + lat + "," + long else
을 결국, 나는 .CSV에서 선택한 항목을 (이 필요합니다 쉼표로 구분) 파일은 다음과 같습니다.
band,venue,date,lat,long randy travis,Billy Bobs,3/21,1234.5678,1234.5678 Michael Schenker Group,House of Blues Dallas,3/26,4321.8765,4321.8765
이 질문이 너무 많지 않기를 바랍니다. 나는 그것을 스스로 조사 할 것이고, 나는 그것이 대답을 받았는지 확인하기 위해 여기에 게시해야한다고 생각했다.
그래서 질문은 feed
의 각 repr(item.title[0:-1])
을 어떻게 3 개의 개별 값으로 구문 분석하면 .csv 파일로 연결할 수 있습니까?
답변 해 주셔서 감사합니다. 그게 많은 도움이됩니다! 나는 약간 혼란 스럽다. 필드를 개별적으로 식별하여 Google에 보내고 연결해야한다. 각 값을 어떻게 호출합니까? 예를 들어, 값을 연결하는 방법은? – Alan
정규식은 밴드 및 장소 이름에 후행 공백을 남기지 만 쉽게 수정할 수 있습니다. –
네, 그 점도 알아 챘지만 각'item.title'의 처음 두 값에'[0 : -1] 트릭을 넣었습니다. – Alan