data-cleansing

    0

    2답변

    : "호빗 : 70 주년 기념 에디션" "호빗" "호빗 (일러스트/콜렉터 에디션) 다시 또는이와 뒤로 " "호빗 :가 다시 돌아] " "호빗 선물 세트 " 등등 ... 나는 어떻게 든 제목을 정규화하는 경우, 각 버전은 참조 무슨 책을 알 수있는 자동화 된 방법을 구현하기 쉬울 것이라고 생각했다. normalised = ''.join([char for ch

    4

    3답변

    나는 최근에 Coldfusion 9으로 일해 왔으며 사용자가 제출 한 입력/문자열을 '정리/정리'하는 방법을 고민하면서 머리를 긁적니다. . 저는 HTMLSAFE로 만들고 싶습니다. 자바 스크립트 나 SQL 쿼리 삽입을 없애고 싶습니다. CF9와 함께 제공되는 기능을 간과 해주기를 바라고 있습니다. 누군가 적절한 방향으로 나를 가리킬 수 있습니까?

    1

    1답변

    아주 자명한데, 사용자의 HTML이 웹 페이지에 표시되도록 허용하고 싶습니다. <p><strong><em><a><ul><li>과 같은 요소를 허용하고, ID, 클래스, <script>, <style>, 인라인 자바 스크립트 등을 허용하지 않는 것이 이상적입니다. HTML 유효성을 보장하는 것은 큰 장점입니다. HTML (XHTML과 반대로, 또는 적어도 선

    2

    1답변

    텍스트 설문 조사 응답에서 웹 사이트를 추출해야합니다. 알고리즘은 대체로 일치해야합니다. 예를 들어 "나 같은 환자"또는 "patientslikeme"는 "patientslikeme.org"로 인식되어야합니다. 아래 데이터 세트의 응답을 포함 시켰습니다. 이 작업을 수행하기위한 스크립트를 작성하기 시작했지만 추가 필터 및 사전을 허용 할 강력한 디자인 패턴