.. 분자 autoencoder 우리는 화합물 https://arxiv.org/pdf/1610.02415.pdf문자열 입출력 표현
용지가 입력을 받아 스트링 (텍스트 표현을 미소 구배 기반 최적화 보간 및 수행 할 분자의) 다음 그것을 변이 된 인코더를 사용하여 2D 잠재 공간으로 매핑합니다. 헥산 -3- 올 "CCCC (O) CC"공백 120 개 문자들이 패드 짧은 문자열 논문에서
위한
예 미소 문자열.
용지가
는 그런 다음 다시 미소 문자열로 3 정문 반복 단위 GRU 잠상 공간에 다음지도 위치를 사용하여 미소 스트링의 잠상 표현으로 1D 컨벌루션 네트워크 스택을 사용하여 문자열을 인코딩 .
이 백서를 이해하는 데있어 문제는 입력 및 출력 구조가 어떻게 보이는지를 결정하는 것입니다.
이 용지는 입력 및 출력 구조가 약간 모호합니다. 1 차원 전환 망의 사용으로 I는 입력 용지
RNN 디코더 드 인터넷 NES 확률 분포의 마지막 층 위에 말한다 출력을
'C' = 1 'O' = 2 '(' = 3 ')' =4 ' ' = 0 #for padding #so the hexan-3-ol smiles above would be [1,1,1,1,3,2,4,1,1,0...padding to fixed length]
와 유사한 벡터화 표현이라고 생각 35 개 개의 가능한 미소 문자로 용지에 사용되는 (120)의 최대 미소 길이 미소 문자열
따라서 각각의 위치에서 가능한 모든 문자는 그 출력이 [120x35] 배열임을 의미 하는가?
그 논리를 앞으로 나르면 자동 입력기 대신에 입력이 평평한 [120 * 35] 배열임을 알 수 있습니다.
그와 내 문제는 자사가 도움 [120 * 35] 배열
감사 평탄화 경우 시퀀스의 다음 원자를 커버하기에 충분하지 않을 것이다 (9)의 최대 길이를 사용 1dConv이고 ...