bioinformatics

1열

2답변

초기 문자열이 나온 후 다양한 문자열 반복을 찾아야하는 문제에 대해서는 데이터 파일에 다음과 같은 시퀀스가 포함되도록 ACTGAC을 사용한다고 가정합니다. 그래서 그 문자열에 우리가 ACTGAC을 발견하면 AAACTGACACCATCGATCAGAACCTGA는 내가 몇 가지 규칙에 의해 이동 문자열의 반복을위한 다음 10 개 개의 문자를 분석 할 필요가있다

1열

4답변

Perl을 사용하여 가장 큰 오픈 리딩 프레임 찾기

나는 상보적인 가닥을 생성 할 수있는 DNA 서열을 읽을 수있는 프로그램을 만들었으며, 이는 mRNA로 번역됩니다. 그러나 그 DNA에 대한 가능한 가장 긴 독서 프레임을 찾아야합니다. 코딩을했는데 문장을 출력 할 때 대답이 없습니다. 도움? 이것은 내가 가지고있는 것입니다. # Search for the longest open reading frame f

2열

2답변

병렬로 파일 구문 분석

에 fasta 파일을 구문 분석하는 방법을 고려 중입니다. 당신의 사람들을 위해 FASTA 포맷을 예를 모르고 : >SEQUENCE_1 MTEITAAMVKELRESTGAGMMDCKNALSETNGDFDKAVQLLREKGLGKAAKKADRLAAEG LVSVKVSDDFTIAAMRPSYLSYEDLDMTFVENEYKALVAELEKENEERRRLKDPNKPEHK

1열

1답변

Bio :: DB :: Sam - bam 파일의 모든 읽기에 대한 매핑 수 얻기

성적 표현식을 계산하려고하므로 bam 파일의 모든 읽기에 대한 매핑 수를 얻어야합니다. 나의 현재 절차는 전체 성적표를 가져 가서 Bio :: DB :: Sam을 사용하여 매핑 된 읽기를 얻는 것입니다. 결과는 read_name을 키 (10 자)로, number_of_mappings을 값 (정수)으로 갖는 해시에 저장됩니다. use Bio::DB:Sam;

4열

1답변

계통 발생 트리의 비교

phylogenetic tree 비교를위한 새로운 알고리즘을 개발했습니다 (계통 발생 트리는 단순히 뿌리가 이진 트리입니다). 입력으로 우리는 두 개의 나무가 있으며, 우리는 그들의 유사성 비율을 계산하고 싶습니다. 이러한 유형의 알고리즘 중 하나의 예는 here입니다. 그러나 대부분의 알고리즘은 알고리즘의 정확성을 검사하는 좋은 방법을 제공하지 못했습니다

6열

1답변

3 면체 주사위에 대한 숨겨진 마코프 모델

나는 HMM을 가르쳐 주었고이 숙제 문제를 안고있었습니다. 나는 그것의 일부를 이해했다. 그러나 나는 그것이 정확한지 확실하지 않다. 문제는 : 이 딜러는 동전, 내리고 대신 는 3면 라벨 1, 2 죽을 압연 및 3. (무엇에 대해 생각하지 않으려 고 노력하지 않는 다른 게임을 고려 3면 과 같이 보일 수 있습니다.) 딜러에는 두 개의 주사위 D1과 D2가

2열

2답변

주어진 코인 출력을 풀기위한 HMM

HMM에서이 과제 질문을 받았고 해결했습니다. 나는 내가 올바른지 알고 싶다. 문제는 다음과 같습니다. 부정직 한 딜러에게는 동전 2 개, 공정한 하나와 편향된 1 개가 있다고 가정합니다. 편향된 동전 에는 머리 확률 1/4이있다. 딜러가 절대 동전을 바꾸지 않는다고 가정하십시오. 어느 동전이 시퀀스 HTTTHHHTTTTHTHHTT을 생성했을 가능성이 더

0열

1답변

동일한 단백질 (metagenome)의 단편의 계통 발생 트리

좋아, 나는 관심있는 단백질 (699 개의 서열)의 수백 조각을 정렬시키고, 이웃하는 나무를 합류시키고 싶다. 이 단편들은 많은 경우 서로 잘 정렬되지 않습니다 (동일하거나 유사한 단백질의 다른 영역). 그러나, 전체 단백질 서열이 정의되어 NCBI 및 기타 데이터베이스 등에 제출되었습니다. 또한이 단백질에 대한 문헌에 나무가 있습니다. 메타 데이터에서 조

2열

6답변

Java에서 합의 시퀀스를 구현하는 좋은 방법은 무엇입니까?

I는 다음과 같은 문제가있다 : I 한두 점이 다르다 DNA 시퀀스 (ACGT 이루어진)의 2 문자열을 갖는다. 차이점을 찾기 은 사소한, 그래서 난 그냥 수 알고 모두 가능성을 나타냅니다 그냥 각각의 차이 , 내가 consensus symbol (A 또는 C 예 : M)를 얻고 싶은 것을 무시하자 커다란 인 경우 캐스케이드하지만 추악하고 유지하기가 어려울

11열

2답변

효율적으로 저장된 사전. 이 데이터 구조가 존재하고 그것의 이름은 무엇입니까?

나는 종종 서로 비슷한 낮은 엔트로피 데이터를 많이 저장하는 데이터 구조를 원합니다. 나는 그것들을 효율적으로 (어떤 식 으로든 압축하여) 저장하고 인덱스 또는 매치로 검색하려고한다. 빠른 검색은 압축보다 중요하지만 압축되지 않은 상태로 저장하는 것은 옵션이 아닙니다. 제가 생각할 수있는 가장 좋은 예는 (디스크에 압축 된 형태로) 많은 양의 텍스트에서 가