Java读取网页HTML 汉字乱码 (已解决,bufferedReader中编码改成跟网页的一致即��?)

本文介绍了如何处理Java在用utf-8编码读取GB2312编码的网页HTML时出现的汉字乱码问题。通过在BufferedReader中设置正确的编码方式,即改为与网页相同的GB2312编码,可以成功解决乱码问题,确保内容正确输出��?

摘要生成��? C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#网页HTML的编码是gb2312

<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

#Java用utf-8 读取汉字乱码,读取网页HTML内容后输出汉子乱��?
乱码截图

 URLConnection urlConnection = new URL(url).openConnection();
        HttpURLConnection connection = (HttpURLConnection) urlConnection;
        connection.setRequestMethod("GET");
        //连接
        connection.connect();
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader
                    (connection.getInputStream(), StandardCharsets.UTF_8));
            StringBuilder bs = new StringBuilder();
            String l;
            while ((l = bufferedReader.readLine()) != null) {
                if(l.indexOf("<P align=center><IMG style=")>-1){
                    System.out.println(l);
                    bs.append(l).append("\n");
                }
         
评论 2
添加红包

请填写红包祝福语或标��?

��?

红包个数最小为10��?

��?

红包金额最��?5��?

当前余额3.43��? 前往充��? >
需支付��?10.00��?
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红��?
实付��?
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明��?

1.余额是钱包充值的虚拟货币,按��?1:1的比例进行支付金额的抵扣��?
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程��?

余额充��?