![自己动手写网络爬虫(修订版)在线阅读](https://wfqqreader-1252317822.image.myqcloud.com/cover/332/27111332/b_27111332.jpg)
会员
自己动手写网络爬虫(修订版)
罗刚编著更新时间:2021-04-02 22:21:53
最新章节:本章小结开会员,本书免费读 >
本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教程。
品牌:清华大学
上架时间:2016-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
自己动手写网络爬虫(修订版)最新章节
查看全部- 本章小结
- 10.2 网页聚类
- 10.1 网页分类
- 第10章 分类与聚类的应用
- 本章小结
- 9.4 分布式文档排重
- 9.3 SimHash排重
- 9.2 利用“语义指纹”排重
- 9.1 何为“重复”的文档
- 第9章 去掉“重复”的文档
罗刚编著
主页
同类热门书
最新上架
- 会员
深入理解Go语言
本书为深入理解学习Go语言必经之路中的重点知识领域,采用大量精美详细的图文介绍,文章讲解深入浅出,极大降低了理解Golang底层精髓的学习门槛。本书包含3篇:第一篇为深度理论篇(第1章~第4章),包含深入理解Golang中GPM模型、深入理解Golang垃圾回收GC三色标记与混合写屏障、深入理解Golang内存管理模型、网络IO复用模型等。第二篇为Golang实战中需要进阶的知识盲区介绍(第5章~计算机0字 - 会员
剑指大数据:企业级数据仓库项目实战(金融租赁版)
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了金融租赁行业离线数据仓库的搭建过程。在整个数据仓库的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并在其中穿插了许多大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、金融租赁业务概述、数据仓库理论介绍和数据仓库建模等。本书的第1章至第3章是项目前期准备阶段,主要为读者介绍了数据仓库的概念、计算机7.4万字 - 会员
FFmpeg开发实战:从零基础到短视频上线
《FFmpeg开发实战:从零基础到短视频上线》是一本FFmpeg开发的实战教程,由浅入深,由基础到高级,带领读者一步一步走进音视频开发的神奇世界。全书共分为12章。其中,第1~5章是基础部分,主要讲解FFmpeg的环境搭建、FFmpeg的开发基础、FFmpeg的编解码、FFmpeg处理图像和FFmpeg处理音频;第6~10章是进阶部分,主要讲解FFmpeg加工视频、FFmpeg添加图文、FFmpe计算机20.1万字 - 会员
C语言程序设计案例式教程(第2版)
本书在《C语言程序设计案例式教程》的基础上进行了完善、补充和修订,内容更加丰富、翔实,结构层次更加清晰、合理。本书共11章,第1章主要介绍C语言概述、C语言开发环境的搭建和C语言程序的编译机制等;第2章和第3章主要介绍C语言的基础知识,包括关键字、标识符、常量、变量、数据类型、类型转换、运算符与表达式等;第4~9章主要介绍C语言的核心知识,包括结构化程序设计、数组、函数、指针、字符串、结构体等;第计算机16.3万字 - 会员
Python高级编程
本书是一部系统讲述Python编程语言与编程方法的案例化教程。全书共分为9章:第1章为Python编程基础知识;第2章为组合数据类型及使用;第3章为函数及调用规则;第4章为程序设计;第5章为面向对象程序设计方法;第6章为文件操作与异常处理;第7章为Python的GUI设计;第8章为Python绘图方法;第9章为Python网络爬虫。每章都设置了大量应用案例跟踪指导。本书可作为高等学校Python程计算机6.5万字 - 会员
Java从入门到精通(第7版)
《Java从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细讲解了使用Java语言进行程序开发需要掌握的知识。全书分为4篇共24章,内容包括初识Java,开发工具(IDEA、Eclipse),Java语言基础,流程控制,数组,类和对象,继承、多态、抽象类与接口,包和内部类,异常处理,字符串,常用类库,集合类,枚举类型与泛型,lambda表达式与流处理,I/O(输入/计算机20.4万字 - 会员
细说Python编程:从入门到科学计算
《细说Python编程:从入门到科学计算》以Python3.x为平台,由两位博士执笔,详尽细致地阐述Python编程的基础知识和高级技巧,并以大量示例代码进行实践,同时还介绍人工智能领域广泛使用的科学计算工具NumPy。《细说Python编程:从入门到科学计算》分为两篇,共19章。第1篇(第1~11章)为基础知识,主要讲解Python的编译环境、入门知识、字符串、容器、函数、循环、条件选择、模块计算机18.9万字 - 会员
软件开发中的决策:权衡与取舍
本书详细阐述如何在设计、规划和实现软件时做出更好的决策,通过真实的案例,以抽丝剥茧的方式分析那些失误的决策,探讨还有哪些可能的解决方案,并对比各种方案的优缺点,摸索软件设计的常青模式。本书通过实例来说明某些决策的后果,例如代码重复如何影响系统的耦合与演进速度,以及如何在日期和时间信息方面隐藏细微差别。本书还介绍如何根据帕累托法则有效地缩小优化范围,确保分布式系统的一致性。通过阅读本书,读者很快就可计算机23.9万字 - 会员
机器学习系统:设计和实现
本书系统地介绍了机器学习系统的设计原则和实践经验,侧重于介绍机器学习的原理、神经网络和优化器、自动差分算法、机器学习系统编程模型、控制流和数据流,异构硬件加速器的原理和编程、数据流图编译器前端、数据流图编译器后端、数据准备和增强、模型部署相关技术、分布式训练、弹性训练、联合训练和评估平台、调试和优化工具、数据隐私和安全等。在讲授的过程中,本书将根据MindSpore的自身特点,在各个章节突出讨论M计算机19.7万字