java如何获取网页中的文字

 我来答
数阔八爪鱼采集器丨RPA机器人
2021-08-23 · 前往八爪鱼RPA应用市场,免费获取机器人
数阔八爪鱼采集器丨RPA机器人
向TA提问
展开全部
package test;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.Authenticator;
import java.net.HttpURLConnection;
import java.net.PasswordAuthentication;
import java.net.URL;
import java.net.URLConnection;
import java.util.Properties;

public class URLTest {
// 一个public方法,返回字符串,错误则返回"error open url"
public static String getContent(String strUrl) {
try {
URL url = new URL(strUrl);
BufferedReader br = new BufferedReader(new InputStreamReader(url
.openStream()));
String s = "";
StringBuffer sb = new StringBuffer("");
while ((s = br.readLine()) != null) {
sb.append(s + "/r/n");
}
br.close();
return sb.toString();
} catch (Exception e) {
return "error open url:" + strUrl;
}
}

public static void initProxy(String host, int port, final String username,
final String password) {
Authenticator.setDefault(new Authenticator() {
protected PasswordAuthentication getPasswordAuthentication() {
return new PasswordAuthentication(username,
new String(password).toCharArray());
}
});
System.setProperty("http.proxyType", "4");
System.setProperty("http.proxyPort", Integer.toString(port));
System.setProperty("http.proxyHost", host);
System.setProperty("http.proxySet", "true");
}

public static void main(String[] args) throws IOException {
String url = "https://www.jb51.net";
String proxy = "http://192.168.22.81";
int port = 80;
String username = "username";
String password = "password";
String curLine = "";
String content = "";
URL server = new URL(url);
initProxy(proxy, port, username, password);
HttpURLConnection connection = (HttpURLConnection) server
.openConnection();
connection.connect();
InputStream is = connection.getInputStream();
BufferedReader reader = new BufferedReader(new
InputStreamReader(is));
while ((curLine = reader.readLine()) != null) {
content = content + curLine+ "/r/n";
}
System.out.println("content= " + content);
is.close();
System.out.println(getContent(url));
}
}
班千亦0B
2016-05-21 · 超过48用户采纳过TA的回答
知道小有建树答主
回答量:127
采纳率:0%
帮助的人:53万
展开全部
java是后台. 网页呢属于前段. 如果需要让java获取到网页上的文字这就是交互
可以通过超链接. ajax.等手段向后台制定接口传值. 这样后台也就是java就会获取到了
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
扑火的飞蛾06
推荐于2018-05-06 · TA获得超过1156个赞
知道小有建树答主
回答量:1895
采纳率:62%
帮助的人:279万
展开全部
可以使用jsoup进行网页html读取,然后遍历html获取对应的文字内容。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友5c33719
2016-06-01 · 超过30用户采纳过TA的回答
知道答主
回答量:116
采纳率:100%
帮助的人:25.7万
展开全部
如果要获取表单的内容,
<from>
<input type="text" name= "username" value=""/>
</from>
request.getparameter("username");

如果是获取网页内容,估计是要获取url,从头到尾爬了
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友ff78b2c
2016-06-28 · 超过19用户采纳过TA的回答
知道答主
回答量:107
采纳率:66%
帮助的人:21.6万
展开全部
	//获取页面上的文字用String就可以了呀
String name=request.getParament("name");
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(5)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式