chEMBL 22 데이터베이스에서 사용 가능한 FDA 승인 의약품에 스마일 코드를 사용하고 있습니다. 나는 package rcdk를 사용하고 나는이 코드를 사용하고 있습니다 : library(rcdk)
dat1<-read.csv("chembl_22_drug_export.txt",sep="\t",header=T)
smi <-lapply(as.charac
INCHI의 메인 레이어, 충전 레이어 및 스테레오 화학 레이어 (INCHI 문자열)를 사용하여 화학 분자 구조 검색 (유사성 및 하위 구조 검색)을 비교할 수 있다고 생각합니다. 대부분의 응용 프로그램은 유사성 검색 또는 하위 구조 검색을 수행하는 화학 지문 검색에 사용됩니다. INCHI에서 누락 된 화학 지문 (예 : daylight 또는 기타 지문)이
I가 살펴 봉착 .. 분자 autoencoder 우리는 화합물 https://arxiv.org/pdf/1610.02415.pdf 용지가 입력을 받아 스트링 (텍스트 표현을 미소 구배 기반 최적화 보간 및 수행 할 분자의) 다음 그것을 변이 된 인코더를 사용하여 2D 잠재 공간으로 매핑합니다. 헥산 -3- 올 "CCCC (O) CC"공백 120 개 문자들이
.smiles 파일을 작업 중입니다. .smiles 파일의 파일 구조는 다음과 같습니다. http://en.wikipedia.org/wiki/Chemical_file_format#SMILES 미소 파일에서 모든 원자를 얻고 싶습니다. 그것은 하나의 'C'원자가있는 경우 4 개의 'H'원자가 연결될 것임을 의미합니다. 파이썬에서 미소 형식을 구문 분석 할 수
한 번에 하나씩 3 가지 화학 파일을 응용 프로그램에 업로드하고 있습니다. 각 파일에는 SMILE의 화합물이 들어 있지만 태그 이름은 다릅니다. 파일을 읽음으로써 IAtomContainer 스트림을 생성 중입니다. 스트림에서 연결이 끊긴 구조를 제거하고 싶습니다. SMILES을 수동으로 확인하는 대신 제거 할 수있는 방법이 있습니까? 나는 cdk 1.5.1
다음을 Python으로 구현하고 싶습니다. 그러나 시작할 위치를 모르겠습니다. 이 유형의 최단 경로 문제에 대한 우수한 모듈이 있습니까? I는 XYZ의 주어진 집합 내의 특정 원자 (노드) 다른 원자 (노드)에에서 최단 경로를 정의하는 것을 시도하고는 3D 화학 구조 (그래프) 좌표. 원자 (노드) 사이의 결합은 노드에서 노드로의 이동이 허용되는 에지입니다