text-parsing

2열

3답변

문자열에서 마지막 비 공백 문자의 위치를 찾으려면 이식성있는 함수/서브 루틴이 필요합니다.. 두 가지 옵션, LEN_TRIM 및 LNBLNK을 발견했습니다. 그러나 다른 컴파일러는 다른 표준을 갖고있는 것처럼 보입니다. IBM : LEN_TRIM 인텔 : LNBLNK 및 LEN_TRIM gfortran : LNBLNK 및 LEN_TRIM 다음 컴파일러

1열

3답변

런타임까지 SimpleParse 비 결정적 문법

저는 파이썬에서 ASCII 문자열 (읽기 : EOL 종료 됨)과 바이너리 데이터를 모두 전송할 수 있어야하는 기본 네트워킹 프로토콜로 작업하고 있습니다. 후자가 가능하기 때문에 나는 바이너리가 될 바이트 수를 포함하는 문법을 작성하기로했다. SimpleParse의 경우, 문법이 [1] 지금까지 같을 것이다 EOL := [\n] IDENTIFIER := [

1열

2답변

한 구절 또는 단락에서 대문자 구절을 찾는 법

구절에서 문장 구절을 어떻게 파싱합니까? 는이 구절 에서 예를 들어 코난 도일은 홈즈의 문자가 도일은 에딘버러 로얄 의무실에서 점원으로 일했다 누구를 위해 박사 조셉 벨, 영감을 얻었다 고 말했다. Holmes와 마찬가지로, Bell은 가장 작은 관찰 결과에서 큰 결론을 이끌어 냈습니다. [1] Michael Harrison은 Ellery Queen의 My

1열

5답변

대용량 문서의 텍스트 분석

나는 여러 장의 문서를 두 번째 문서와 비교하여 유사성을 판단해야하는 프로젝트가 있습니다. 문제는이 일을 어떻게 수행해야하는지, 어떤 접근법이 존재하는지 또는 이용 가능한 라이브러리가 있는지 전혀 모릅니다. 내 첫 번째 질문은 ... 무엇이 비슷합니까? 일치하는 단어의 수, 일치하는 연속적인 단어의 수? 단어와 위치가있는 배열에 각 문서를 넣은 다음 파서를

1열

4답변

Cure에서 문자열 수를 얻는 확실한 방법은 무엇입니까?

나는 이것에 대해 어떻게 해야할지 잘 모릅니다. 지금은 문자열의 단어 수를 얻기 위해 공백을 계산하지만 이중 공간이 있으면 단어 수가 부정확 할 것입니다. 이 작업을 수행하는 더 좋은 방법이 있습니까?이 나를 위해 작동하는 것 같다

0열

1답변

Oracle PL/SQL의 정규식 캡처 그룹

자유 형식 텍스트를 좀 더 구조화 된 것으로 변환하려고합니다. 사용할 수있는 데이터의 대다수 (허용 가능한 한도를 훨씬 상회하는)와 일치하는 복잡한 패턴이 있습니다. 문자를 파싱하는 대신 데이터 구조화를 돕기 위해이 패턴을 사용하고 싶습니다. 내가 막 실행 한 문제는 오라클이 캡처 그룹을 처리 할 방법이 없다는 것입니다. 예를 들어, 내 표현에는 ((?<r

3열

1답변

라이브러리에서 상대 날짜 (예 : Google 캘린더처럼)를 구문 분석 할 수 있습니다.

How can I parse relative dates with Perl?과 동일한 질문을하지만 C#을 사용하고 있습니다. 죄송합니다. 중복 된 경우 죄송합니다. 그렇다면 삭제하십시오. 라이브러리가 있습니까? 이 도움이 될 감사

1열

3답변

PHP를 사용하여 짧은 텍스트 (500 ~ 1000 단어)로 언급 된 위치를 결정하십시오.

사용자가 입력 한 텍스트를 가져 와서 텍스트에서 언급 된 맵의 주소를 결정하는 방법을 찾고 싶습니다. 너무 많은 리소스를 소비하지 않는 스크립트를 사용하거나 무료 웹 서비스를 사용하면 행복 할 것입니다. 이렇게하는 것이 상상할 수있는 한 가지 방법은 주소 지정과 각 텍스트를 개별적으로 검색하는 거대한 데이터베이스를 이용하는 것입니다. 그러나 이는 효율적으로

0열

1답변

청크/텍스트 파싱 NLTK를 사용하여

문장을 파싱하고 문장을 만들려고합니다. 나는 NLTK에 익숙하지 않고 NLTK에서 뭔가를 찾으려고 노력하고 있습니다. 지금까지 나는 nltk.ne_chunk과 nltk.pos_tag을 보았습니다. 나는 그 (것)들을 아주 도움이되지 않는 찾아 나는 좋은 온라인 문서를 찾아 낼 수 없다. 나는 또한 LancasterStemmer을 사용하려고했지만, 그것이 무

1열

3답변

텍스트 파일의 각 줄에서 개별 열 값을 분리하려면 어떻게해야합니까?

구문 분석 할 ASCII 텍스트 파일에 줄이 있습니다. 열은 예를 들면, 공간의 가변 개수의 분리 : 제가 값만의 배열을 반환하도록 라인을 분할 얼마나 column1 column2 column3 ? 감사