dna-sequence

    0

    1답변

    나는 입력 파일에서 DNA 서열을 취하여 루프를 사용하여 개별 A의 T 's C 's와 G 's의 수를 세고, "ATCG"가 아닌 문자가 있다면 I 예를 들어 내 입력 파일이 "오류"를 인쇄해야합니다 Seq1 AAAGCGT Seq2 금주 모임 tGcGt의 t Seq3 AF GtgA cCTg I가 함께 왔어요 코드 : acount = 0 ccount = 0

    1

    2답변

    Unix의 grep을 사용하여 파일 내의 특정 시퀀스를 검색하려고합니다. 파일은 대개 A, T, C 및 G의 매우 큰 (~ 1Gb) 파일입니다. 이 파일은 또한 많은 행을 포함하며 각 행은 60 자의 단어입니다. 내가 가지고있는 문제는 이러한 파일 내에서 특정 시퀀스를 검색 할 때 grep은 한 줄에 나타나는 패턴에 대한 결과를 반환하지만 패턴이 줄 (중간

    0

    1답변

    C 언어의 텍스트 파일에서 DNA 서열을 읽고이를 어레이에 저장하고 각 뉴클레오티드 위치에서 시작하는 주어진 길이의 모든 부분 문자열을 추출하는 방법은 무엇입니까? 예컨대 시퀀스는 텍스트 파일에서 다음과 같은 방식으로 모든 출발 위치 cctgatagacgctatctggctatccaggtacttaggtcctctgtgcgaatctatgcgtttccaaccat

    1

    1답변

    내 멀티 FASTA 보관이 형식에와 다음 라인 연결합니다 : >miRNA65 dvex2345 CGATGCTAGATGCTATGACAACGATGCCTCG-G >miRNA60 dvex1234 T-TAA-ACTCATCATCATCATACTCATCATCATCATCAGCATATTAACAAG >miRNA65 dvex2345 T-TAA-ACTTATCATCATCAT

    0

    1답변

    bam 파일에서 일부 FastQ 파일을 추출하려고합니다. Picard는 SamToFastq로이 작업을 수행 할 수 있습니다.이 도구의 설명서에는 bam 또는 sam 파일 중 하나가 허용됩니다. 하지만 실행하면 읽기 하나만 추출한 다음 종료됩니다. 다음은 오류 메시지입니다. 어떤 도움을 주셔서 감사합니다. 그것이 나오는 것에 따라 [[email protect

    1

    2답변

    파일에서 DNA 정보를 추출하려고합니다. 기본 GCAT로 구성된 DNA 데이터 앞에 ORIGIN이라는 단어가 있고 그 뒤에 //이 있습니다. 이 마커 사이에 이러한 기지를 얻기 위해 정규 표현식을 작성하려면 어떻게해야합니까? 다음을 시도했지만 작동하지 않습니다. [ORIGIN(GCATgcat)////] 샘플 데이터 : ORIGIN 1 acag

    1

    1답변

    나는 생물 정보학 프로젝트에서 일하고 있으며 Python 2.7에서 pycogent라는 모듈을 실행하려고합니다. 내 목표는 정렬 된 16s Fastq 시퀀스로 구성된 파일에서 조상 시퀀스를 만드는 것입니다. from cogent import LoadSeqs aln = LoadSeqs('FullStrep.fasta') lf.setAlignment(aln)

    0

    1답변

    저는 생물 정보학을 가르치려고합니다. 컴퓨터 과학 및 고성능 컴퓨팅을 통해 파티에 도착합니다. (필자는 생물학을 배우려고 노력하고 있습니다.) 저는 최근에 BioPython을 발견했으며 지금까지는 훌륭하다고 생각합니다. 그러나 누군가가 BioPython에서 sequence 데이터를 변환하기 위해 translate() 메소드를 사용하는 이유를 알아 내면 도움

    1

    3답변

    시퀀스의 긴 목록 간의 쌍으로 된 차이점의 수를 계산하여이를 다시 매트릭스 폼에 넣고 싶습니다. 저는 몇백 개의 유전 적 서열을 가지고 있으며, 각 서열은 이미 정렬되어 있으며 길이가 같습니다 (약 300 자). 내가 편집 거리 알고리즘 (해밍, leveinstein의 등) 중 하나를 찾고 아니지만 대신 두 시퀀스 간의 절대 차이의 수를 얻고 싶습니다. 각

    0

    4답변

    다음 코드를 Perl로 작성했습니다. 한 번에 문자열 3 자리 (문자)를 반복하고 싶습니다. TAA, TAG 또는 TGA (종료 코돈)가 나타나면 종료 코돈까지 인쇄하고 나머지 문자를 제거하고 싶습니다. 예 : data.txt로 ATGGGTAATCCCTAGAAATTT ATGCCATTCAAGTAACCCTTT 답변 : ATGGGTAATCCCTAG (제거 마지막