登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2025年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書

『簡體書』基于R语言的自动数据收集:网络抓取和文本挖掘实用指南

書城自編碼: 2743025
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: [德]西蒙·蒙策尔特等
國際書號(ISBN): 9787111527503
出版社: 机械工业出版社
出版日期: 2016-03-01
版次: 1
頁數/字數: 366/455000
書度/開本: 16开 釘裝: 平装

售價:HK$ 148.5

我要買

** 我創建的書架 **
未登入.



新書推薦:
精准表达:一说就懂的四句沟通术
《 精准表达:一说就懂的四句沟通术 》

售價:HK$ 65.8
愤怒的葡萄(陈宗琛译本;美国版《活着》,一部扎根生活的人间史诗)
《 愤怒的葡萄(陈宗琛译本;美国版《活着》,一部扎根生活的人间史诗) 》

售價:HK$ 72.6
鲁迅与抗日战争--启蒙与救亡(鲁迅文化基金会丛书)
《 鲁迅与抗日战争--启蒙与救亡(鲁迅文化基金会丛书) 》

售價:HK$ 85.8
2045:AI改变人类未来的十大趋势(揭示未来二十年超级震撼的科技变革全景图)
《 2045:AI改变人类未来的十大趋势(揭示未来二十年超级震撼的科技变革全景图) 》

售價:HK$ 74.8
新知文库精选·骆驼来自何处:外来入侵物种的故事与科学
《 新知文库精选·骆驼来自何处:外来入侵物种的故事与科学 》

售價:HK$ 75.9
沟通:终身原则(第八版)
《 沟通:终身原则(第八版) 》

售價:HK$ 217.8
小狗心理疗愈日记  史努比陪你找到自我主体性  走出艰难时刻
《 小狗心理疗愈日记 史努比陪你找到自我主体性 走出艰难时刻 》

售價:HK$ 46.2
心灵银行 脑科学轻松创造真正的改变 世界级催眠大师约翰卡帕斯送给普通人改写命运的秘密武器
《 心灵银行 脑科学轻松创造真正的改变 世界级催眠大师约翰卡帕斯送给普通人改写命运的秘密武器 》

售價:HK$ 74.8

建議一齊購買:

+

HK$ 45.0
《数据处理技术与SPSS实验教程》
+

HK$ 148.5
《R语言实战 第2版》
+

HK$ 103.5
《SQL优化最佳实践:构建高效率Oracle数据库的方法与技巧》
+

HK$ 48.0
《文本挖掘技术及其应用》
+

HK$ 73.5
《R语言初学指南》
內容簡介:
本书共17章。第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识。这一部分内容涉及互联网上通信、交换、保存和显示信息的基础技术(如HTTP、HTML、XML、JSON、AJAX、SQL等),并讲解用于查询网络文档和数据集的基本技术(XPath和正则表达式)。第9~11章介绍网络抓取和文本挖掘的实用工具箱。这一部分由三个核心章节组成:第9章讲解多种网络抓取技术,涉及正则表达式的使用、XPath、各类API接口、其他数据类型以及开源社区相关的技术;第10章深入介绍用于统计性文本处理的技术;第11章给出关于用R管理数据的项目中常见问题的一些见解。第12~17章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。这些案例分析针对日常的数据抓取和文本处理的工作流程、真实环境数据中的陷阱以及规避它们的方法等问题提供一些实用的见解。
目錄
译者序
前 言
第1章概述
1.1案例研究:濒危世界遗产地
1.2有关网络数据质量的一些讨论
1.3传播、提取和保存网络数据的技术
1.3.1在网络上传播内容的技术
1.3.2从Web文档中提取信息的
技术
1.3.3 数据保存的技术
1.4本书的结构
第一部分网络和数据技术入门
第2章HTML
2.1浏览器显示及源代码
2.2语法规则
2.2.1标签、元素和属性
2.2.2树形结构
2.2.3注释
2.2.4保留字符和特殊字符
2.2.5文档类型定义
2.2.6 空格和换行
2.3标签和属性
2.3.1 锚标签a
2.3.2 元数据标签meta
2.3.3 外部引用标签link
2.3.4 强调标签b、i和
StrOng
2.3.5段落标签p
2.3.6 标题标签hl、h2、
h3等
2.3.7 通过ul、ol和dl
列举内容
2.3.8组织型标签div和
Span
2.3.9 form标签及其同伴
2.3.10 外部脚本标签script
2.3.11 表格标签table、tr、
td和th
2.4解析
2.4.1 解析简介
2.4.2丢弃节点
2.4.3在创建过程中提取信息
小结
延伸阅读
习题
第3章 XML和JSON
3.1 XML文档示例
3.2 XML语法规则
3.2.1 元素和属性
3.2.2 XML结构
第4章xpath
第5章HTTP
第6章AJAX
第7章SQL和关系型数据库
第8章正则表达式和基本字符串函数
第二部分网络抓取和文本挖掘实用工具箱
第9章网络抓取
第10章统计性文本处理
第11章管理数据项目
第三部分一组案例分析
第12章美国参议院里的合作网络
第13章从半结构化文档解析信息
第14章利用Twitter预测2014年奥斯卡奖
第15章绘制姓氏地理分布图
第16章采集关于手机的数据
第17章分析产品评论里的情绪

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2026 (香港)大書城有限公司  All Rights Reserved.