网络数据采集技术:Java网络爬虫实战在线阅读
会员

网络数据采集技术:Java网络爬虫实战

钱洋等
开会员,本书免费读 >

计算机网络编程语言与程序设计6.1万字

更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结

立即阅读
加书架
下载
听书

书籍简介

本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

钱洋等
主页

最新上架

  • 会员
    本书是一份旨在帮助Java求职者在面试中脱颖而出的重要指南。本书涵盖Java并发编程的多个关键主题,如并发原理和线程安全、并发关键字原理、并发锁和死锁、并发容器和工具、并发线程池以及并发设计与实战等。本书的特色在于将“大厂”“名企”的面试问题和实践经验相结合,不仅对面试问题和面试官心理进行深度剖析,还对面试问题解答和相关技术点进行详细介绍,这样更有利于读者全面理解相关知识点和技术,并能够在实际工作
    吴晓勇 梁建全编著计算机17.6万字
  • 会员
    本书使用深入浅出、通俗易懂的语言阐述JavaWeb相关知识,并结合典型的Web应用案例,帮助读者掌握Web应用程序的开发技术。本书共15章,详细讲解了网页开发的基础知识和JavaWeb开发的核心知识,其中网页开发基础知识包括HTML技术、CSS技术、JavaScript技术和Bootstrap技术,而JavaWeb的核心知识包括Servlet技术、会话技术,JSP技术、JDBC技术和数据库连
    黑马程序员编著计算机16.6万字
  • 会员
    本书系统地讲述了HTML5、CSS3、JavaScript、Bootstrap等开发技术,满足Web前端开发基础学习的需求。本书包括了HTML5与CSS3的典型案例、使用Bootstrap框架开发、响应式布局等内容,适应Web前端开发从PC端转向移动端的变化。
    张大为 刘德山 崔晓松 张也非主编计算机14.3万字
  • 会员
    本书系统地阐述了区块链技术的理论体系结构,辅以典型工程案例,为读者展示成熟的分析方法和解决方案。全书内容包括区块链概述、区块链开发基础、区块链核心技术解析、区块链数据存储、区块链网络构建、以太坊技术解析、区块链技术改进、区块链安全性分析、区块链项目实战案例。本书难易适中,内容充实,层次清晰,可作为普通高等学校信息安全、网络空间安全、软件工程、计算机科学与技术等专业本科生和研究生教材,也可以作为区块
    王瑞锦主编计算机18.8万字
  • 会员
    本书从网页开发的基础知识HTML5、CSS、JavaScript开始,以项目实战的方式介绍如何构建自适应网页,并通过工具免费发布自己的网站。在后面的章节中,以主流的3D框架ThreeJS为技术支撑,在网页中编写JavaScript代码,让读者构建完整的3D应用场景。
    少儿编程网编著计算机0字
  • 会员
    本书是魏永明近30年来开发和维护MiniGUI、HVML等开源项目的经验总结,旨在帮助有一定C程序编写经验的软件工程师在短时间内有效提高设计能力和编码水平。全书分为?3?篇。基础篇从可读性和可维护性出发,阐述了如何提高代码的可读性、用好写好头文件、正确理解编译警告并消除潜在问题、定义和使用常量等,介绍了如何有效利用构建系统生成器(CMake)来维护项目;模式篇阐述了常见的C程序接口设计模式,说明了
    魏永明计算机19.6万字
  • 这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。本书共分为17章。第1~4章主要介绍作者对性能优化的理解以及性能优化体系及评测方法。第5~9章对网络、
    于君泽 曹洪伟 李伟山 秦金卫 陈龙泉计算机23.3万字
  • 会员
    本书书分为以下几部分:第一部分:预备知识:介绍数据结构和算法的基本概念,并演示如何搭建开发环境、编写测试用例。第二部分:数据结构:介绍常见的数据结构,包括数组、链表、矩阵、栈、队列、跳表、散列、树、图等。第三部分:常用算法:介绍常用的算法,包括分而治之、动态规划、贪婪算法、回溯、分支界定、遗传算法等。第四部分:商业实战:介绍汉诺塔及五子棋两款游戏的实现。
    柳伟卫计算机0字
  • 会员
    本书详细介绍C语言及其程序设计方法。全书共12章,主要内容包括:概述;数据类型、运算符及表达式;顺序结构程序设计;选择结构程序设计;循环结构程序设计;数组;指针;函数和变量的存储类型;结构体、公用体和枚举类型;编译预处理;位运算;文件。
    杨崇艳主编计算机13.7万字