2017-04-03 5 views
0

나는 rapidminer에서 상업용 속성의 예제를 필터링하려고합니다. 속성 거래 내역이 데이터 테이블에 포함되어 있고 많은 속성이 데이터 테이블 기간에 두 번 이상 판매 되었기 때문에 많은 속성이 복제됩니다. 내가하고 싶은 일은 각 속성에 대한 가장 최근의 거래를 제외한 모든 거래를 필터링하는 것입니다.Rapidminer에서 가장 최근의 예제 레코드 필터링하기

가장 최근의 거래 날짜를 제외한 모든 레코드를 필터링하는 방법을 알 수 없습니다. 어떤 도움을 주시면 감사하겠습니다.

+0

오늘 아침에 잠에서 깨어 났을 때 간단하고 난처하게 명백한 해결책 인 것처럼 보였기 때문에 잠을 좀 자고 싶었을 수도 있습니다. 날짜별로 설정된 예제를 정렬하면 '중복 제거'가 작동하는 것으로 나타났습니다. 이 연산자는 날짜순으로 정렬 된 경우 가장 최근의 예제 세트 내에 예제의 첫 번째 발생을 저장합니다. –

답변

0

지금까지 시도한 것을 보여주는 데이터가 포함 된 독립 실행 형 재현 가능한 예제를 게시해야합니다.

이 정보가 없으면 일반적인 조언이이 줄에 표시 될 수 있습니다. Aggregate 연산자를 사용하여 주어진 속성의 최대 날짜를 찾은 다음 Join 연산자를 사용하여 원래 예제 세트를 maxima가 포함 된 예제 세트로 내부 결합합니다.

다음은 귀하의 경우에 적용 가능한 홍채 데이터 세트를 사용하는 장난감의 예입니다.

<?xml version="1.0" encoding="UTF-8"?><process version="7.4.000"> 
    <context> 
    <input/> 
    <output/> 
    <macros/> 
    </context> 
    <operator activated="true" class="process" compatibility="7.4.000" expanded="true" name="Process"> 
    <process expanded="true"> 
     <operator activated="true" class="retrieve" compatibility="7.4.000" expanded="true" height="68" name="Retrieve Iris" width="90" x="112" y="187"> 
     <parameter key="repository_entry" value="//Samples/data/Iris"/> 
     </operator> 
     <operator activated="true" class="aggregate" compatibility="7.4.000" expanded="true" height="82" name="Aggregate" width="90" x="313" y="187"> 
     <list key="aggregation_attributes"> 
      <parameter key="a1" value="maximum"/> 
     </list> 
     <parameter key="group_by_attributes" value="label"/> 
     </operator> 
     <operator activated="true" class="join" compatibility="7.4.000" expanded="true" height="82" name="Join" width="90" x="514" y="187"> 
     <parameter key="use_id_attribute_as_key" value="false"/> 
     <list key="key_attributes"> 
      <parameter key="label" value="label"/> 
      <parameter key="a1" value="maximum(a1)"/> 
     </list> 
     </operator> 
     <connect from_op="Retrieve Iris" from_port="output" to_op="Aggregate" to_port="example set input"/> 
     <connect from_op="Aggregate" from_port="example set output" to_op="Join" to_port="right"/> 
     <connect from_op="Aggregate" from_port="original" to_op="Join" to_port="left"/> 
     <connect from_op="Join" from_port="join" to_port="result 1"/> 
     <portSpacing port="source_input 1" spacing="0"/> 
     <portSpacing port="sink_result 1" spacing="0"/> 
     <portSpacing port="sink_result 2" spacing="0"/> 
    </process> 
    </operator> 
</process>