博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Java HTML页面抓取实例
阅读量:5300 次
发布时间:2019-06-14

本文共 1167 字,大约阅读时间需要 3 分钟。

import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.UnsupportedEncodingException;import java.net.HttpURLConnection;import java.net.MalformedURLException;import java.net.URL;public class Url {    public static void main(String[] args) throws Exception{        String html = getURLContent();        System.out.println(html);    }        /**     * 获取网页内容     */    private static String getURLContent() throws MalformedURLException, IOException, UnsupportedEncodingException {        URL urlmy = new URL("http://www.baidu.com");        HttpURLConnection con = (HttpURLConnection) urlmy.openConnection();        HttpURLConnection.setFollowRedirects(true);        con.setInstanceFollowRedirects(false);        con.connect();        BufferedReader br = new BufferedReader(new InputStreamReader(con.getInputStream(),"UTF-8"));        String s = "";        StringBuffer sb = new StringBuffer();        while ((s = br.readLine()) != null) {            sb.append(s+"\r\n");        }                return sb.toString();    }}
posted on
2014-07-18 08:25  阅读(
...) 评论(
...) 收藏

转载于:https://www.cnblogs.com/shibazi/p/3852615.html

你可能感兴趣的文章
TCP粘包拆包问题
查看>>
JAVA学习之开发环境配置
查看>>
Java中Runnable和Thread的区别
查看>>
C#通过webbrowser控件与javascript交互
查看>>
mongodb 的安装(Centor OS )
查看>>
设计模式之迭代器模式
查看>>
Android高效加载大图、多图解决方案,有效避免程序OOM
查看>>
git操作
查看>>
css常识
查看>>
css浮动
查看>>
golang字符串常用系统函数
查看>>
SQL Server中利用正则表达式替换字符串
查看>>
POJ 1015 Jury Compromise(双塔dp)
查看>>
hrbustOJ 1373Leyni, LOLI and Leaders(图论)
查看>>
[QT_QML]qml假如调试信息 qDebug console.debug
查看>>
波浪子序列 (Wavio Sequence,UVa 10534)
查看>>
apache简介与安装
查看>>
从头开始写框架(二):孕育框架的种子_下
查看>>
华为手机在开发Android调试时logcat不显示输出信息的解决办法
查看>>
TCP 建立连接为什么要握 3 次手?
查看>>