bioinformatics

    2

    2답변

    차별적으로 발현 된 유전자를 확인하기위한 분석을 수행하고 싶습니다. 차별화 된 유전자를 찾기 전에 quantile normalization 또는 중간 절대 편차를 사용하여 데이터를 스케일해야합니까, 아니면 RMA를 통해 얻은 데이터에 anova를 직접 적용해야합니까? 사전에 많은

    0

    2답변

    을 무시 : >1 PLAARRPRRGKSLAGFESLACSFPVVSRGFLASRSARSLSSEGGTMPDNRQ PRNRQPRIRSGNEPRSAPAMEPDGRGAWAHSRAALDRLEKLLRCSRCTNIL REPVCLGGCEHIFCSNCVSDCIGTGCPVCYTPAWIQDLKINRQLDSMIQL >2 PLWRPAVPDAGRARPVWSRWSAASLW

    3

    1답변

    생물학적 진화 시뮬레이터를 쓰고 있습니다. 현재 모든 코드는 Python으로 작성되었습니다. 대부분의 경우, 이것은 훌륭하며 모든 것이 충분히 잘 작동합니다. 그러나 오랜 시간이 걸리며 스칼라에서 다시 작성하고 싶은 두 단계가 있습니다. 첫 번째 문제 영역은 시퀀스 전개입니다. 대량의 단백질과 관련된 계통 발생 나무가 있다고 상상해보십시오. 각 가지의 길이

    2

    1답변

    많은 히스토그램을 사용합니다. 특히 이러한 히스토그램은 인간 게놈상의 세그먼트를 기준으로 한 기본 값입니다. x 축의 각 점은 DNA를 구성하는 네 개의 질소 염기 (A, C, T, G) 중 하나이며 y 축은 기지를 "호출"할 수 있었던 횟수를 나타냅니다 (또는 시퀀서 기계에 의해 인식되어, 게놈을 따라 서열을 결정할 수 있으며, 게놈을 따라 각 염기의 신

    5

    1답변

    유전자 이름과 염색체 위치를 가진 gene_info 파일을 찾으려고합니다. 그러나 NCBI FTP 사이트에서 찾을 수 없습니다. 누구든지 내게 포인터를 줄 수 있습니까?

    0

    2답변

    시퀀스 문자열 전체에 특정 문자열 ('GAATTC'라고 함)이 여러 번 반복되는 긴 시퀀스가 ​​있습니다. 나는 현재 패턴 정규 표현식 .span()을 사용하여 'GAATTC'패턴이있는 곳의 색인을 제공합니다. 이제 그 색인을 사용하여 G와 A 사이의 패턴을 자르려고합니다 (즉 'G | AATTC'). 어떻게 일치 객체의 데이터를 사용하여 슬라이스 할 수

    3

    4답변

    나는 작업중인 생물 정보학 프로젝트에 약간의 코딩 문제가 있습니다. 기본적으로, 내 임무는 데이터베이스에서 모티프 시퀀스를 추출하고 정보를 사용하여 시퀀스 정렬 파일에 주석을 달아주는 것이다. 정렬 파일은 일반 텍스트이므로 주석은 정교한 파일이 아닙니다. 추출 된 시퀀스를 정렬 파일 자체의 별표로 바꾸는 것만으로도 정교합니다. 나는 데이터베이스 파일을 스캔

    1

    1답변

    일부 시퀀스 로고를 그릴 때 seqLogo 패키지를 사용하고 있습니다. 로고를 더 넓게 만들 필요가 있습니다. 기본 그림은 로고를 사각형 그래프로 만듭니다. 이것을 할 수있는 방법이 있습니까?

    3

    1답변

    BioJava의 메소드를 검색하여 PDB 파일에서 Atom 시퀀스를 가져옵니다. BioJava API를 보았지만 getAtomSequence()의 경우 아미노산을 잡습니다. BioJava에서 여러 가지 다른 방법을 시도했지만 원하는대로 작동하지 않았습니다. 아무도 나를 도와 줄 수 있습니까? 감사

    1

    3답변

    주어진 2 개의 서열에서 나는 3 개의 코돈마다 점검 할 필요가있다. 그리고 그 변화가 다음 목록에서와 동일하다면, 나는 변화의 위치와 변화된 코돈을 조사하고 그들의 발생 횟수를 계산해야한다. 예를 들어 :는 sequence 1 - TTCAUUUCCCAU sequence 2 - TTTAUAUCGCAC 내가 얻을 필요 출력은 TTC->TTT consid