는
>>> data = "धर्मक्षेत्रे"
>>> re.findall(".", data)
['ध', 'र', '्', 'म', 'क', '्', 'ष', 'े', 'त', '्', 'र', 'े']
그래서 아마이 사용 '्
'्
를 분할 당신이 원하는. 이제 표기 문자라고 부르 자. 첫 번째 표기 문자로 ord(data[2])
을 인쇄하면 2381
이됩니다. 이제이 값
>>> for i in range(2350, 2400):
... print(i, chr(i))
...
2350 म
2351 य
2352 र
2353 ऱ
2354 ल
2355 ळ
2356 ऴ
2357 व
2358 श
2359 ष
2360 स
2361 ह
2362 ऺ
2363 ऻ
2364 ़
2365 ऽ
2366 ा
2367 ि
2368 ी
2369 ु
2370 ू
2371 ृ
2372 ॄ
2373 ॅ
2374 ॆ
2375 े
2376 ै
2377 ॉ
2378 ॊ
2379 ो
2380 ौ
2381 ्
2382 ॎ
2383 ॏ
2384 ॐ
2385 ॑
2386 ॒
2387 ॓
2388 ॔
2389 ॕ
2390 ॖ
2391 ॗ
2392 क़
2393 ख़
2394 ग़
2395 ज़
2396 ड़
2397 ढ़
2398 फ़
2399 य़
주위에 조사하면 우리는 2362
와 2391
사이의 값에 주로 관심이 있습니다. 그래서 우리는 그러한 값의 배열을 만듭니다.
다음으로 해당 표기 기호가 있거나없는 모든 패턴을 찾고 싶습니다.
>>> re.findall(".[" + split + "]?", "धर्मक्षेत्रे")
['ध', 'र्', 'म', 'क्', 'षे', 'त्', 'रे']
>>> re.findall(".[" + split + "]?", "कुरुक्षेत्र")
['कु', 'रु', 'क्', 'षे', 'त्', 'र']
이렇게하면 사용자가 찾고있는 것일 수 있습니다. 좀 더 복잡한 처리가 필요하다면 @OphirYoktan 링크를 클릭해야합니다.
덕분에 많은 :
테스트 기능 : 이것은 당신이 무엇을 달성하고자하는 경우
을 참조하십시오. 나는 여기에서 그것을 취할 수있다. –