안녕하세요, 내가 할 수있는 다른 사이트에서 데이터를 추출하려고하지만 문제는 내가 원하는 방식으로 내 데이터를 추출 할 수 없다는 것입니다. 목표를 달성 할 수있는 방법은 무엇입니까?정규식을 사용하여 다른 사이트에서 데이터를 추출하는 방법은 무엇입니까?
여기에 내가
import com.gargoylesoftware.htmlunit.BrowserVersion;
import java.util.StringTokenizer;
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.firefox.FirefoxDriver;
import org.openqa.selenium.htmlunit.HtmlUnitDriver;
import org.openqa.selenium.support.ui.Select;
import java.sql.*;
public class Getdata2 {
Statement st=null;
Connection cn=null;
public static void main(String args[]) throws InterruptedException, ClassNotFoundException, SQLException {
WebDriver driver = new HtmlUnitDriver(BrowserVersion.getDefault());
String sDate = "27/03/2014";
String url="http://www.upmandiparishad.in/commodityWiseAll.aspx";
driver.get(url);
Thread.sleep(5000);
new Select(driver.findElement(By.id("ctl00_ContentPlaceHolder1_ddl_commodity"))).selectByVisibleText("Jo");
driver.findElement(By.id("ctl00_ContentPlaceHolder1_txt_rate")).sendKeys(sDate);
Thread.sleep(3000);
driver.findElement(By.id("ctl00_ContentPlaceHolder1_btn_show")).click();
Thread.sleep(5000);
WebElement findElement = driver.findElement(By.id("ctl00_ContentPlaceHolder1_GridView1"));
String htmlTableText = findElement.getText();
// do whatever you want now, This is raw table values.
htmlTableText=htmlTableText.replace("S.No.DistrictMarketPrice","");
System.out.println(htmlTableText);
driver.close();
driver.quit();
}
}
은 내가 내 원하는 출력을 얻을 수있는 방법이
1 Agra Achhnera NIL
2 Agra Agra NIL
3 Agra Fatehabad NIL
4 Agra FatehpurSikri NIL
5 Agra Jagner NIL
6 Agra Jarar NIL
7 Agra Khairagarh NIL
8 Agra Shamshabad NIL
9 Aligarh Atrauli NIL
10 Aligarh Chharra NIL
11 Aligarh Aligarh 1300.00
12 Aligarh Khair 1300.00
13 Allahabad Allahabad NIL
14 Allahabad Jasra NIL
15 Allahabad Leriyari NIL
16 Allahabad Sirsa NIL
17 AmbedkarNagar Akbarpur NIL
18 Ambedkar Nagar TandaAkbarpur NIL
처럼 내 데이터를 추출 할 않았다 내 코드는
미리 감사드립니다.
가능한 중복 [웹 htmlunitsriver를 사용하여 긁어 작업을 수행하는 방법에?] 많은 계정이 어떻게 (http://stackoverflow.com/questions/22807527/how-to-do-web-scraping-using-htmlunitsriver) – Nadun
를 있니? 왜 그런가요? – Nadun
왜 내 계정이 7 일간 차단되어 있는지 알지 못합니다. – user3496498