탭으로 구분 된 필드의 행을 포함하는 유니 코드 파일 (UTF-16 FFFE 리틀 엔디안 BOM)이 있습니다.탭/LF/CR 유니 코드 문자
Splitting unicode (I think) using .split in ruby을 읽으십시오. Ruby split (파일을 줄에 입력하고 줄을 입력하십시오)을 사용하려고합니다.
- LF
- CR
- 탭
감사 :
BTW, 유니 코드 문자는 무엇이다!
탭으로 구분 된 필드의 행을 포함하는 유니 코드 파일 (UTF-16 FFFE 리틀 엔디안 BOM)이 있습니다.탭/LF/CR 유니 코드 문자
Splitting unicode (I think) using .split in ruby을 읽으십시오. Ruby split (파일을 줄에 입력하고 줄을 입력하십시오)을 사용하려고합니다.
감사 :
BTW, 유니 코드 문자는 무엇이다!
LF: U+000A CR: U+000D Tab: U+0009
유니 TAB는 u0009
이다. LF는 u000a
이고 CR은 u000d
실제로 ASCII와 같습니다.
에서는, UTF-16 FFFE의 덩어리를 분할하는 무엇 라틴어 -1. 첫 번째 128에 대해 ASCII를 사용합니다. – Joey
정말 질문입니까, 유니 코드의 세 문자에 대한 코드 포인트는 무엇입니까? –
정말 동의합니까? 이것은 인터네트에 대한 빠른 점검으로 대답 할 수 있었지만 나중에 참조 할 수 있습니다 : http://www.unicode.org/charts/#symbols 그리고 특히 http://www.unicode.org/charts/PDF/U0000. pdf 및 http://en.wikipedia.org/wiki/Basic_Latin_Unicode_block –
Ruby 구문에서 유니 코드 문자와 유니 코드 코드를 모두 묻습니다. blob (blob = Record.first.file_attached)이 UTF-16 원시 데이터를 저장한다고 가정합니다. then : rows = blob.split ("\ u000D") rows.size return 1 내가 u8rows = Iconv.conv ("utf-8", "utf-16le", blob)하면 .split (" \ n ") u8rows.size 232 내 질문입니다 : 유니 코드 CR/LF의 문자는 유니 코드의 처음 256 코드 포인트와 동일합니다 간단하기 때문에 루비 – ohho