나는 여전히 나 자신을 훑어보기에 초보자라고 생각한다. 나는 2 개의 빠른 문법을 함께 던졌지 만 어느 것도 성공하려고 노력하지 않는다. 나는 정말로 간단하게 보이는 문법을 생각해 내려고 노력하고있다. 그러나 그것은 (적어도 나를 위해) 그렇게 사소하지는 않다. 언어에는 하나의 기본 정의가 있습니다. 키워드와 본문 텍스트로 분류됩니다. 몸은 여러 줄에 걸쳐있을 수 있습니다. 키워드는 처음 20 자 정도의 줄 시작 부분에 있지만 ';' (따옴표 제외). 그래서 저는 몇 가지 문법으로 테스트 할 수있는 간단한 데모 프로그램을 만들었습니다. 그러나 나는 그들을 사용하려고 할 때, 그들은 항상 첫 번째 키워드를 얻는다.문법을 사용하여 텍스트에서 하나 이상의 키워드를 읽을 수 있음
예제로 소스 코드를 첨부하고 발생하는 출력을 첨부했습니다. 이 코드는 테스트 코드 일 뿐이므로 습관적으로 문서 작업을 수행했습니다. 아래의 예에서 두 키워드는 NOW입니다. 마지막으로 이상적으로는 세미콜론을 키워드에 포함시키지 않을 것입니다.
내가이 작업을하기 위해해야 할 아이디어가 있습니까?
from pyparsing import *
def testString(text,grammar):
"""
@summary: perform a test of a grammar
2type text: text
@param text: text buffer for input (a message to be parsed)
@type grammar: MatchFirst or equivalent pyparsing construct
@param grammar: some grammar defined somewhere else
@type pgm: text
@param pgm: typically name of the program, which invoked this function.
@status: 20130802 CODED
"""
print 'Input Text is %s' % text
print 'Grammar is %s' % grammar
tokens = grammar.parseString(text)
print 'After parse string: %s' % tokens
tokens.dump()
tokens.keys()
return tokens
def getText(msgIndex):
"""
@summary: make a text string suitable for parsing
@returns: returns a text buffer
@type msgIndex: int
@param msgIndex: a number corresponding to a text buffer to retrieve
@status: 20130802 CODED
"""
msg = [ """NOW; is the time for a few good ones to come to the aid
of new things to come for it is almost time for
a tornado to strike upon a small hill
when least expected.
lastly; another day progresses and
then we find that which we seek
and finally we will
find our happiness perhaps its closer than 1 or 2 years or not so
""",
'',
]
return msg[msgIndex]
def getGrammar(grammarIndex):
"""
@summary: make a grammar given an index
@type: grammarIndex: int
@param grammarIndex: a number corresponding to the grammar to be retrieved
@Note: a good run will return 2 keys: NOW: and lastly: and each key will have an associated body. The body is all
words and text up to the next keyword or eof which ever is first.
"""
kw = Combine(Word(alphas + nums) + Literal(';'))('KEY')
kw.setDebug(True)
body1 = delimitedList(OneOrMore(Word(alphas + nums)) +~kw)('Body')
body1.setDebug(True)
g1 = OneOrMore(Group(kw + body1))
# ok start defining a new grammar (borrow kw from grammar).
body2 = SkipTo(~kw, include=False)('BODY')
body2.setDebug(True)
g2 = OneOrMore(Group(kw+body2))
grammar = [g1,
g2,
]
return grammar[grammarIndex]
if __name__ == '__main__':
# list indices [ text, grammar ]
tests = {1: [0,0],
2: [0,1],
}
check = tests.keys()
check.sort()
for testno in check:
print 'STARTING Test %d' % testno
text = getText(tests[testno][0])
grammar = getGrammar(tests[testno][1])
tokens = testString(text, grammar)
print 'Tokens found %s' % tokens
print 'ENDING Test %d' % testno
출력은 다음과 같습니다 : 여기에 전체 테스트 및 대안-선택 인프라를 (파이썬 2.7을 사용하고 2.0.1 대한 파싱) 내가 TDD와 괜찮아
STARTING Test 1
Input Text is NOW; is the time for a few good ones to come to the aid
of new things to come for it is almost time for
a tornado to strike upon a small hill
when least expected.
lastly; another day progresses and
then we find that which we seek
and finally we will
find our happiness perhaps its closer than 1 or 2 years or not so
Grammar is {Group:({Combine:({W:(abcd...) ";"}) {{W:(abcd...)}... ~{Combine:({W:(abcd...) ";"})}} [, {{W:(abcd...)}... ~{Combine:({W:(abcd...) ";"})}}]...})}...
Match Combine:({W:(abcd...) ";"}) at loc 0(1,1)
Matched Combine:({W:(abcd...) ";"}) -> ['NOW;']
Match {{W:(abcd...)}... ~{Combine:({W:(abcd...) ";"})}} [, {{W:(abcd...)}... ~{Combine:({W:(abcd...) ";"})}}]... at loc 4(1,5)
Match Combine:({W:(abcd...) ";"}) at loc 161(4,20)
Exception raised:Expected W:(abcd...) (at char 161), (line:4, col:20)
Matched {{W:(abcd...)}... ~{Combine:({W:(abcd...) ";"})}} [, {{W:(abcd...)}... ~{Combine:({W:(abcd...) ";"})}}]... -> ['is', 'the', 'time', 'for', 'a', 'few', 'good', 'ones', 'to', 'come', 'to', 'the', 'aid', 'of', 'new', 'things', 'to', 'come', 'for', 'it', 'is', 'almost', 'time', 'for', 'a', 'tornado', 'to', 'strike', 'upon', 'a', 'small', 'hill', 'when', 'least', 'expected']
Match Combine:({W:(abcd...) ";"}) at loc 161(4,20)
Exception raised:Expected W:(abcd...) (at char 161), (line:4, col:20)
After parse string: [['NOW;', 'is', 'the', 'time', 'for', 'a', 'few', 'good', 'ones', 'to', 'come', 'to', 'the', 'aid', 'of', 'new', 'things', 'to', 'come', 'for', 'it', 'is', 'almost', 'time', 'for', 'a', 'tornado', 'to', 'strike', 'upon', 'a', 'small', 'hill', 'when', 'least', 'expected']]
Tokens found [['NOW;', 'is', 'the', 'time', 'for', 'a', 'few', 'good', 'ones', 'to', 'come', 'to', 'the', 'aid', 'of', 'new', 'things', 'to', 'come', 'for', 'it', 'is', 'almost', 'time', 'for', 'a', 'tornado', 'to', 'strike', 'upon', 'a', 'small', 'hill', 'when', 'least', 'expected']]
ENDING Test 1
STARTING Test 2
Input Text is NOW; is the time for a few good ones to come to the aid
of new things to come for it is almost time for
a tornado to strike upon a small hill
when least expected.
lastly; another day progresses and
then we find that which we seek
and finally we will
find our happiness perhaps its closer than 1 or 2 years or not so
Grammar is {Group:({Combine:({W:(abcd...) ";"}) SkipTo:(~{Combine:({W:(abcd...) ";"})})})}...
Match Combine:({W:(abcd...) ";"}) at loc 0(1,1)
Matched Combine:({W:(abcd...) ";"}) -> ['NOW;']
Match SkipTo:(~{Combine:({W:(abcd...) ";"})}) at loc 4(1,5)
Match Combine:({W:(abcd...) ";"}) at loc 4(1,5)
Exception raised:Expected ";" (at char 7), (line:1, col:8)
Matched SkipTo:(~{Combine:({W:(abcd...) ";"})}) -> ['']
Match Combine:({W:(abcd...) ";"}) at loc 5(1,6)
Exception raised:Expected ";" (at char 7), (line:1, col:8)
After parse string: [['NOW;', '']]
Tokens found [['NOW;', '']]
ENDING Test 2
Process finished with exit code 0
의견을 보내 주셔서 감사합니다. 잘만되면 곧 나는이 느낌을 갖기 시작할 것이다. – Div
또한 scanString 팁에 감사드립니다. 나는 그것을 사용할 계획이다. – Div