Профессиональная разработка интернет приложений

Java, PHP, ROR…

Тег «XPATH»

Использование HtmlUnit

Когда вашему проекту понадобятся функциональные тесты, обратите внимание на HtmlUnit. Он поддерживает javascript и его очень просто использовать. Вот небольшой пример:
Первым делом, добавляем зависимость в проект:
<dependencies>
<dependency>
<groupId>net.sourceforge.htmlunit</groupId>
<artifactId>htmlunit</artifactId>
<version>2.1</version>
</dependency>
</dependencies>
Чтобы начать тестирование сайта, необходимо создать клиент и загрузить нужную страницу:
WebClient webClient = new WebClient();
HtmlPage page = (HtmlPage) webClient.getPage(”http://google.com”);

Связанные записи

CyberNeko html parser [...]

Отзывов (4)

CyberNeko html parser + XPATH

Получать информацию из html страницы удобно с помощью языка XPATH. В Java для этого существует интерфейс javax.xml.xpath.XPath. Для его применения необходимо иметь DOM структуру документа. Чтобы ее получить, можно использовать CyberNeko html parser:
PLAIN TEXT
XML:

<dependency>

    <groupId>nekohtml</groupId>

    <artifactId>nekohtml</artifactId>

    <version>1.9.6.2</version>

</dependency>

Пример для получения третей строки таблицы из html страницы:
PLAIN TEXT
JAVA:

InputSource source = new InputSource(pageStream);

DOMParser [...]

Отзывов (2)