首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >java模仿网络爬虫简单案例

java模仿网络爬虫简单案例

作者头像
知识浅谈
发布2021-09-27 11:20:27
发布2021-09-27 11:20:27
4360
举报
文章被收录于专栏:分享学习分享学习

java模仿网络爬虫简单案例,直接看代码

代码语言:javascript
复制
package com.example.demo1;

import java.io.*;
import java.net.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @author: YinLei
 * Package:  com.example.demo1
 * @date: 2021/9/7 20:23
 * @Description: java爬虫测试
 * @version: 1.0
 */
public class Crawler {
    public static void main(String[] args) {
        URL url = null;   //用于定义url类型
        URLConnection urlConnection = null; //用于定义url连接类型
        BufferedReader br = null; //缓存读取
        PrintWriter pw = null; //输出流
        try {
            url = new URL("http://search.dangdang.com/?key=%BB%FA%D0%B5%B1%ED&act=input");//爬取的网址、这里爬取的是一个生物网站
            urlConnection = url.openConnection();  //url连接
            pw = new PrintWriter(new FileWriter("D:/SiteURL.txt"), true);//将爬取到的内容放到D盘的SiteURL文件中
            System.out.println("Stay Here1!!");
            br = new BufferedReader(new InputStreamReader(
                    urlConnection.getInputStream(),"UTF-8"));
            String buf = null;
            System.out.println("Stay Here2!!");
            Pattern p = Pattern.compile("1\\d{10}");

            while ((buf = br.readLine()) != null) {
//                System.out.println(buf);
                Matcher m = p.matcher(buf);
                while (m.find()){
                    pw.println(m.group());
                }
            }
            System.out.println("success!");
        } catch (MalformedURLException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/09/07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档