특정 어댑터 조각을 사용하여 DNA 시퀀싱에서 생성 된 문자열 집합 S가 있습니다. 즉, S의 모든 문자열에는 어댑터 순서의 접두어와 (스크립트 오류로 인해) 거의 일치하는 접미사가 포함됩니다. 어떻게 집합 S 만 주어지면 S를 생성하는 데 사용되는 가장 가능성있는 어댑터 순서를 추론 할 수 있습니까?조각 집합에서 어댑터 시퀀스를 추측
집합 S는 매우 큽니다. 각 조각의 길이는 50 자입니다. 나는 집합 S를 통해 일반화 된 접미어 트리를 만드는 것이이 문제에서 크게 도움이된다는 것을 알고 있지만 가장 가능성있는 어댑터 시퀀스를 찾는 데 사용할 방법이 확실하지 않습니다.
문자열은 시퀀싱 오류의 어떤 종류를 포함 할 수 있습니다? 특히, 단지 (또는 대체로) 대체 오류가 있습니까? 삽입 및/또는 삭제도 가능합니까? –
오류는 대체 오류로만 제한됩니다. – Wims
키워드는'blast de novo assembly'입니다. GYYF – wildplasser