网络数据采集技术:Java网络爬虫实战在线阅读
会员

网络数据采集技术:Java网络爬虫实战

钱洋等
开会员,本书免费读 >

计算机网络编程语言与程序设计6.1万字

更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结

立即阅读
加书架
下载
听书

书籍简介

本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

钱洋等
主页

同类热门书

最新上架

  • 会员
    《Java多线程并发体系实战(微课视频版)》全面、系统地介绍了与Java多线程相关的核心知识点,将官方多线程的核心知识点用链路的方式进行讲解。读者在学习的过程中需要循序渐进,核心知识点的理解是非常重要的,由核心知识点扩展开来就可以形成万物,希望读者在学习和创造的过程中能拥有自己的成长和思维。《Java多线程并发体系实战(微课视频版)》全书共10章。首章~第3章介绍了线程的核心知识点,第4章讲解了线
    刘宁萌编著计算机4.5万字
  • 会员
    本书围绕Python技术栈,讲解测试开发技术栈领域的各项核心技术要点。全书共11章,首先讲解pytest单元测试框架在测试领域的技术栈要点,包含pytest从最基本的应用到高阶应用。接着讲解服务端测试开发领域主流的核心思想、主流测试开发工具在解决服务端测试开发中的技术难点,以及服务端测试框架的设计和项目实战案例。在框架的基础上扩展了服务端测试开发领域的知识面,主要介绍Docker容器化技术、基于D
    无涯编著计算机7.8万字
  • 会员
    《Node.js从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Node.js进行Web应用开发需要掌握的各方面技术。全书分为4篇,共18章,包括Node.js环境搭建、第一个Node.js服务器程序、npm包管理器的使用、Node.js基础、事件的监听与触发、util工具模块、fs文件系统模块、os操作系统模块、异步编程与回调、I/O流操作、Web应用构建基础、
    明日科技编著计算机10.4万字
  • 会员
    本书采用理论与实践相结合的原则,在各章的开篇会采用图解方式,将所有知识点先贯穿起来,然后对每个知识点配套案例讲解。用读者易于理解且可随时直接套用的案例,方便读者以最短的时间高效掌握最实用的技能是本书创作的初衷。全书共分为6篇:第一篇为入门篇(第1章和第2章),第二篇为基础篇(第3章和第4章),第三篇为强化篇(第5~7章),第四篇为进阶篇(第8章和第9章),第五篇为高阶篇(第10章和第11章),第六
    黄福星编著计算机11.8万字
  • 会员
    本书重点关注和介绍SpringBoot2框架的技术应用。SpringBoot是目前微服务架构使用最为广泛的框架之一,一旦开发人员掌握了该框架的配置和使用技巧,则对于当前微服务应用的开发将得心应手。本书详细介绍了SpingBoot2的开发环境、开发方式、数据库应用、MVC、RESTful、安全及测试等。对于刚开始接触微服务架构、SpringBoot的开发人员来说,这是一本很适合的书籍。本
    李世川编著计算机8.6万字
  • 这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。本书共分为17章。第1~4章主要介绍作者对性能优化的理解以及性能优化体系及评测方法。第5~9章对网络、
    于君泽 曹洪伟 李伟山 秦金卫 陈龙泉计算机23.3万字
  • 会员
    这是一本面向RPA开发初学者的实战图书,囊括了RPA在金融、政务、制造、电商、医疗等十大行业的RPA开发实战案例,每个案例都有详细的步骤拆解,图文并茂,手把手教会大家完成自动化流程的开发。
    张丽蓝 余冰冰 陈德炼 钟燕 张雪英计算机11.1万字
  • 会员
    本书就Python基础知识和交易策略的基本原理为切入点,由浅入深介绍了如何从零基础使用vn.py搭建自己交易系统。本书从原理着手到代码实践,内容由最基本的Python基础知识与Python中金融分析的常用包,逐步由浅入深介绍常用的指标并将使用vn.py进行实现。本书共分为8章,第1章与第2章介绍vn.py的环境搭建与Python常用的工具包,为后面使用vn.py实现交易策略做准备;第3章与第4章介
    欧阳鹏程编著计算机8.2万字
  • 会员
    C++是信息学奥赛指定的编程语言。本书以通俗易懂的方式深入浅出地介绍了C++编程语言,适合作为小学生学习的教材类读物。《小学生C++创意编程(视频教学版)》的特点在于紧密结合生活,将算法融入其中。精心挑选了100多个案例,旨在逐步引导读者掌握编程技巧。书中的案例难度梯度设计合理,既能够满足孩子的挑战欲,又能让他们在完成任务后获得内在的成就感。本书以逻辑思维、算法思考为核心,旨在激发孩子对编程的学习
    刘凤飞计算机7.6万字

同类书籍最近更新

  • 会员
    ThebookwouldappealtowebdevelopersandPythonprogrammerswhowanttostartusingversion3.5andwritecodeefficiently.BasicknowledgeofPythonprogrammingisexpected.
    Micha? Jaworski Tarek Ziadé程序设计12.9万字
  • 会员
    本书紧扣全国高等学校计算机水平考试(一级)考试大纲和全国计算机信息高新技术考试考点,阐述简明清楚,侧重应用,突出实践,以强化动手能力为目的,既包括了基础知识和基本原理,又密切联系实际。主要内容包括计算机基础、计算机系统、操作系统、文字处理软件Word2010、电子表格处理软件Excel2010、演示文稿制作软件PowerPoint2010、计算机网络与Internet、网页制作与网站建设基础、网络
    蔡龙飞 雷文彬程序设计26.1万字
  • 会员
    本书根据教育部高等学校非计算机专业计算机基础课程教学指导委员会最新编制的《关于进一步加强高等学校计算机基础教学的意见暨计算机基础课程教学基本要求》,结合多年的教学研究和改革成果,全国计算机等级考试一级、二级的新要求,以及全球第一个计算机基础综合技能认证(InternetandComputingCoreCertification,互联网和计算核心认证)要求而编写。主要内容包括计算机基础知识、操作系统
    于玉海程序设计15.6万字
  • 会员
    ThisbookisforalltheprofessionalsandstudentswhowanttolearnSTATAprogrammingandapplypredictivemodellingconcepts.ThisbookisalsoveryhelpfulforexperiencedSTATAprogrammersasit
    Prasad Kothari程序设计2.3万字
  • 会员
    本书是一本通过漫画形式讲解Python的入门书,基于Python3.7版本编写,介绍了Python语言的特点、Python语言的应用领域、Python环境的安装等学习Python的预备知识,以及Python的基本语法、基本类型、二进制、内置容器类型、运算符、分支结构、循环结构、函数等相关知识。本书适合对计算机了解不多,没有系统地学习过编程,但对编程感兴趣的读者阅读。
    耿景武 檀飞飞编著程序设计991字
  • 会员
    本书从初学者的角度出发,以通俗易懂的语言,配合丰富多彩的实例,详细介绍了使用VisualC++2013进行程序开发应该掌握的各方面知识。全书共分11章,包括VisualC++2013概述,Windows编程基础,MFC对话框程序设计,MFC控件程序设计,菜单、工具栏和状态栏的开发使用,图形和图像,动态链接库,多线程编程,数据库编程,网络Sochet编程,VisualC++2013程序
    朱文伟程序设计37.1万字