text-parsing

    0

    1답변

    나는 셰익스피어의 전체 작품 데이터를 here에서 가지고 있는데, 단어 생성 알고리즘에서 모델을 만들기 위해 사용하고 싶습니다. 모델의 요구 사항은 전체 텍스트가 하나의 공백 만 제공되고 다른 종류의 공백은 제공되지 않는다는 것입니다. 이것을 어떻게 할 수 있습니까? 단일 문자열에 대해이 작업을 수행하는 방법을 찾았지만 텍스트 파일에서는 작동하지 않습니다.

    0

    1답변

    텍스트 파일을 읽으려면 MATLAB 코드를 개발해야합니다. | 1 | 1 | 6.000 | 454.000 | 423 | | 1 | 1 | 11.000 | -454.000 | 426 | | 1 | 1 | 45.000 | 454.000 | 428 | 는 수직 막대를 생략 할 수있는 방법이 있나요 덕분에 많은 : 선은 다음과 같은 형태

    1

    1답변

    을 사용하여 일치를 찾은 후 다음 줄을 선택하십시오. 작은 PowerShell 스크립트에서 작업 메신저 .. 아이디어는이 정보를 분석하는 것입니다 Hostname: xxxxx-CS0,xxxx Network: IPv4 Address = xxxxx IPv4 Netmask = 255.255.254.0 IPv4

    0

    2답변

    자바 음성 제어 계산기를 구축 중이며 입력을 구문 분석하는 데 문제가 있습니다. 예를 들어 나는 다섯 에 의해 입력 열 나누기를하고 난 배열에 공백이 문자열을 분할 할,하지만 난 출력이 보일 것입니다, 그래서 분리 될 수 없음 "으로 나누기"를 원하는 같은 열 분할 다섯 로 도와주세요. 정규 표현식을 사용하려고했지만 행운이 없었습니다. 고마워요.가 아닌 분

    2

    2답변

    안녕 얘들 아, 내가 텍스트 파일을 구문 분석하고 있습니다 : 114.474998474121 15.7440004348755 25.806999206543 -873 172 182 188 114.46199798584 15.7419996261597 25.8799991607666 -1396 180 192 205 을 그리고 다음과 같이 읽을 수 있기를 바랍니다.

    -2

    1답변

    큰 스위치 케이스가 들어있는 파일이 입력되어 있습니다. 사례는 0에서 n까지 증가합니다. 각각의 경우에는 몇 가지 특정 요소 (a, b 등)가 있습니다. 출력은 모든 고유 요소를 포함하는 벡터, 요소가 사용되는 첫 번째 위치 (대소 문자) 및 마지막으로 요소의 주기성을 포함하는 세 번째 벡터를 포함하는 벡터의 세 가지로 구성됩니다. , 벡터 1 것 {A,

    0

    2답변

    C의 문자열 ++에서 값의 쌍을 추출 할 수 있습니다 : 나는 동안 중첩 사용하여 시도했다 ... "name1":1234 " name2 " : 23456 "name3" : 12345 등을 루프와 두 개의 정수 string::substr에 사용할 위치와 길이를 저장하는 것이지만 적절한 방법을 찾을 수는 없습니다 (대부분 문자열로 끝납니다). 값을 저장하지

    0

    1답변

    API가없는 사이트에서 일부 통계를 받아야합니다. 소스 코드를 확인한 후 필자는 필요한 데이터가 통계 그래픽을 작성하는 데 사용되는 것을 확인했습니다. 나는 힘내라 요청 &를 사용하여 스크립트 태그를 얻을 수있었습니다 : request(nodeUrl, function(error, res, body) { var $ = cheerio.load(body

    0

    1답변

    일부 문장의 머리말을 찾으려고합니다. 그러나 다른 구 유형에 대해서는 예외적으로 No head rule defined이 있습니다. 일부 구문 유형은 저에게 중요하지 않으므로 if 절로 tham을 무시할 수 있습니다. 그러나 예를 들어, AP (Adjective Phrase)은 저에게 중요하며 그러한 문구의 선두 단어를 갖고 싶습니다. 그것에 관한 어떤 도움

    -2

    1답변

    필자는 앱이 필요로하는 완전히 구조화 된 단일 데이터 테이블을 보유하고 있습니다. 이것은 몇 천 개의 행과 3 개의 열 (공백으로 구분 된 텍스트 파일)로 구성되어 있으며 특정 우선 순위를 할당해야합니다. 우선 순위는 int로 저장되며 수정됩니다. 나는 모든 것을 메모리에 유지하는 것을 고려했다. (이것은 매우 짧은 문자열이다.) 그리고 세션이 끝날 때 업