tom_test2 postgresql 테이블을 탄성 검색으로 내보내고 싶습니다.logstach : jdbc_page_size가 모든 데이터를 탄성 검색에 덤프하지 않습니다.
GET tom/tom_test/_search
"hits": {
"total": 176805,
"max_score": 1,
}
내 인덱스를 삭제하고 있습니다 : 탄성 검색
=> select count(*) from tom_test2;
count
--------
176805
(1 row)
다음 logstach의 conf 파일 가져 오기가 제대로 내 데이터 : 탄성 검색에서
input {
jdbc {
# Postgres jdbc connection string to our database, mydb
jdbc_connection_string => "xxx"
# The user we wish to execute our statement as
jdbc_user => "xxx"
jdbc_password => "xxx"
# The path to our downloaded jdbc driver
jdbc_driver_library => "xxx"
# The name of the driver class for Postgresql
jdbc_driver_class => "org.postgresql.Driver"
# our query
statement => "select * from tom_test2"
}
}
output {
elasticsearch {
hosts => ["xxx"]
index => "tom"
document_type => "tom_test"
}
}
표는 176,805 행이 탄성 검색에서 :
delete tom
그리고 지금 내 데이터가 커지게 경우 jdbc_page_size를 사용하여 동일한 작업을 수행하고자하는 내 logstach의 conf 파일은 지금 :
GET tom/tom_test/_search
"hits": {
"total": 106174,
"max_score": 1,
}
176805로 :
input {
jdbc {
# Postgres jdbc connection string to our database, mydb
jdbc_connection_string => "xxx"
# The user we wish to execute our statement as
jdbc_user => "xxx"
jdbc_password => "xxx"
# The path to our downloaded jdbc driver
jdbc_driver_library => "xxx"
# The name of the driver class for Postgresql
jdbc_driver_class => "org.postgresql.Driver"
# our query
statement => "select * from tom_test2"
jdbc_page_size => 1000
jdbc_paging_enabled => true
}
}
output {
elasticsearch {
hosts => ["xxx"]
index => "tom"
document_type => "tom_test"
}
}
내 카운트가 지금 잘못 -106174 = 70631 개의 행이 누락되었습니다
모든 로그를 응답하거나 elasticsearch입니까? 작은 페이지 크기를 설정해야하는 이유는 무엇입니까? (기본값은 100000입니다.) –
두 번째 줄리앙의 덧글, 더 많은 정보가 있습니까? – Val