2014-09-27 2 views
0

인터넷 트래픽 분류에 대한 기계 학습 과정에서 프로젝트를 수행하고 있습니다. http://wand.net.nz/wits/에서 추적 파일 (pcap 형식)을 다운로드했습니다. 이제 같은 데이터 세트를 감독 분류하여 FTP, 메일, HTTP 등으로 트래픽을 분류하고 싶습니다.MATLAB의 Naive Bayes Classifier를 사용한 인터넷 트래픽 분류

이 모든 트래픽 분류는 Matlab에서 수행하고 Naive Bayes 분류기를 사용합니다. 자, 저는 막혔습니다 - Matlab에서이 pcap 파일을 어떻게 처리하고 교육 단계에서 클래스 변수 (예 : FTP, Mail, HTTP)를 얻어야합니까? 직면

문제 : CSV와 같은 사람이 읽을 수있는 형식으로이 PCAP 파일을 변환 할 수 없습니다

  1. .
  2. Wireshark에서 pcap 파일을 열고 추적을 식별 할 수 있지만 Matlab에서 처리 할 수 ​​있도록 어떻게 형식으로 저장해야합니까?

도움을 주시면 대단히 감사하겠습니다.

답변

1

모델을보다 잘 처리 할 수있는 형식으로 데이터를 사전 처리해야하는 것으로 보입니다.

저는 C# 용 라이브러리를 사용하기 전에 Pcap.Net이라고 불렀습니다. 이렇게하면 오프라인 PCAP 파일을 읽고 Matlab 모델에 필요한 데이터를 수집하고 처리 할 수 ​​있습니다.

오프라인 PCAP 파일을 읽기위한 자습서는 here입니다. 여기에서 필요한 패킷의 세그먼트를 가져 와서 디자인중인 모델에 따라 형식을 지정할 수 있습니다.

희망이 도움이됩니다.