저는 현재 약물을 분석하고 결과를 유사성 패턴에 따라 그룹화해야하는 생물 정보학 프로젝트를 진행 중입니다. 이를 위해 유클리드 거리와 마할 라 노비스 거리와 같은 알고리즘을 사용합니다. 현재 도서관 Clusterfck을 사용하고 있지만 매우 제한적이며 정보가 기본적으로 완전히 생성됩니다. JavaScript 또는 PHP에 이러한 계산을 구현 한 다른 라이브
blastx를 실행하는 bash에서 스크립트를 만들었습니다. #!/bin/sh -l
# $Id: Barrine.sh federicogaiti $
echo "Right now it is:"
date
echo ""
function usage() {
echo "Barrine.sh script by Federico Gaiti, March 2013."
데이터 집합은 ~ 200 개의 99x20 배열로 구성되며 각 열은 1로 합산됩니다. 나는 과 같은 히트 맵을 사용하여 이들을 플롯했습니다. 각 배열은 꽤 희박하며, 99 위치 당 약 1-7/20 값이 0이 아닙니다. 그러나이 샘플을 주파수 프로파일이 얼마나 유사한 지 (최소 유클리드 거리 또는 그와 유사한 것)에 따라 클러스터하고 싶습니다. 각 99x20
차별적으로 발현 된 유전자를 획득하고 차별화하기 위해 Bioconductor RankProduct 패키지에 익숙한 사람이 있는지 궁금합니다. 소프트웨어에 대한 정보는 다음과 같습니다. paper, manual, documentation. 아마도 R 언어에 대한 지식이 부족하기 때문에 프로그램을 사용하면서 몇 가지 문제가 발생했습니다. 위의 pdf 파일의 단
동일한 키가 큰 사전 가입 : dict1:
{
'PRO-HIS-MET': {
'A': ([1,2,3],[4,5,6],[7,8,9]),
'B': ([5,2],[6],[8,9]),
'C': ([3],[4],[7,8])},
'TRP-MET-GLN': {
'F': ([-5,-4,112
Bio::SeqIO을 사용하여 정렬 된 시퀀스를 하나씩 fasta 파일로 내보내려고합니다. 결과는 시퀀스가 60 줄마다 새 줄로 끊어집니다. 어떻게 피합니까? 시퀀스를 '와이드'형식으로 내보내려고합니다. 즉, 시퀀스에서 줄 바꿈이 필요하지 않습니다. 내 코드는 대략 다음과 같습니다 while (my $seq = $seqin->next_seq) {
저는 파이썬에서 생물 정보학을위한 CGH 분석을위한 모듈을 찾고 있습니다. 몇 가지 도구를 찾았지만 웹 기반이고 파이썬에서 CGH 분석을 모든 그래프와 함께 처리하는 모듈을 찾지 못했습니다. 커맨드 라인 모듈을 파이썬으로 원합니다. 친절히 알려주세요. 누구나 똑같이 알고 있다면. 감사합니다.
패턴을위한 뉴클레오티드 문자열 내에서 검색하기 위해 Perl 스크립트를 작업 중입니다. 지금까지 다음 정규 표현식을 사용할 수있었습니다 my $regex1 = qr/(([ACGT]{2}) \2{9,})/x;
my $regex2 = qr/(([ACGT]{3}) \2{6,})/x;
my $regex3 = qr/(([ACGT]{4}) \2{6,
HTML5 웹 페이지에서 RNA Second 구조를 식별하려면 RegExp가 필요합니다. RNA Second Structure는 단순히 도트 점과 균형 조정 괄호가 포함 된 문자열로, RNA 모양을 식별하는 데 사용되며, 목표 RNA 모양을 알면 그와 함께 RNA를 만들 수있는 염기 서열을 추측 할 수 있습니다 대상 모양. 최소한 하나의 점 .을 포함해야합