基於R語言的自動數據收集:網絡抓取和文本挖掘實用指南

基於R語言的自動數據收集:網絡抓取和文本挖掘實用指南 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
[德] 西濛·濛策爾特 等 著,吳今朝 譯



點擊這裡下載
    


想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-05-15

類似圖書 點擊查看全場最低價

圖書介紹

齣版社: 機械工業齣版社
ISBN:9787111527503
版次:1
商品編碼:11892134
品牌:機工齣版
包裝:平裝
叢書名: 數據科學與工程技術叢書
開本:16開
齣版時間:2016-03-01
用紙:膠版紙
頁數:366


相關圖書





圖書描述

編輯推薦

  

本書重點闡釋自動化數據抓取和分析技術,適用於初中級用戶。作者以簡潔的代碼、詳細的講解以及真實的案例,分析瞭大數據在社會科學領域的運用。作者盡可能迴避晦澀的術語和高深的理論,通過非常實用的組件探討很多有趣的實際問題。這種深入淺齣的講解方式有利於我們快速上手,在循序漸進中學習,並能把學到的技術應用到實際研究項目中。
  
  本書特色:
  提供關於網絡抓取和文本挖掘的實用指南,既適閤R的初學者,也適閤有經驗的用戶。
  講解互聯網上通信、交換、保存和顯示信息的基礎技術(如HTTP、HTML、XML、JSON、AJAX、SQL等)。
  探索查詢網絡文檔和數據集的基本技術(XPath及正則錶達式),以及從動態HTML采集信息的技術。
  提齣數據抓取和管理的實用工作流,包括從選擇正確的方法到優化代碼以及維護抓取程序。
  以案例分析為特色,每種技術都輔以詳細的案例解析。
  提供大量練習題,幫助讀者深入學習與總結每項技術。

內容簡介

  

本書由資深社會科學傢撰寫,從社會科學研究角度係統且深入闡釋利用R語言進行自動化數據抓取和分析的工具、方法、原則和實踐。作者深入剖析自動化數據抓取和分析各個層麵的問題,從網絡和數據技術到網絡抓取和文本挖掘的實用工具箱,重點闡釋利用R語言進行自動化數據抓取和分析,能為社會科學研究者與開發人員設計、開發、維護和優化自動化數據抓取和分析提供有效指導。
  本書共17章,第1章是概述,闡述數據挖掘的意義與實際應用。第2~8章介紹網絡和數據技術基礎知識,內容涉及互聯網上通信、交換、保存和顯示信息的基礎技術(如HTTP、HTML、XML、JSON、AJAX、SQL等),並講解用於查詢網絡文檔和數據集的基本技術(XPath和正則錶達式)。第9~11章介紹網絡抓取和文本挖掘的實用工具箱,其中第9章講解多種網絡抓取技術,涉及正則錶達式的使用、XPath、各類API接口、其他數據類型以及開源社區相關的技術;第10章深入介紹用於統計性文本處理的技術;第11章給齣關於用R管理數據的項目中常見問題的一些見解。第12~17章介紹實際案例分析,涉及美國參議院裏的閤作網絡、從半結構化文檔解析信息、利用Twitter預測2014年奧斯卡奬、繪製姓氏地理分布圖、采集關於手機的數據、分析産品評論裏的情緒等。這些案例分析針對日常的數據抓取和文本處理的工作流程、真實環境數據中的陷阱以及規避它們的方法等問題提供一些實用的見解。

目錄

譯者序
前 言
第1章概述
1.1案例研究:瀕危世界遺産地
1.2有關網絡數據質量的一些討論
1.3傳播、提取和保存網絡數據的技術
1.3.1在網絡上傳播內容的技術
1.3.2從Web文檔中提取信息的
技術
1.3.3 數據保存的技術
1.4本書的結構
第一部分網絡和數據技術入門
第2章HTML
2.1瀏覽器顯示及源代碼
2.2語法規則
2.2.1標簽、元素和屬性
2.2.2樹形結構
2.2.3注釋
2.2.4保留字符和特殊字符
2.2.5文檔類型定義
2.2.6 空格和換行
2.3標簽和屬性
2.3.1 錨標簽


2.3.6 標題標簽、



2.3.7 通過

      列舉內容
      2.3.8組織型標簽和

      2.3.9 標簽及其同伴
      2.3.10 外部腳本標簽










前言/序言





基於R語言的自動數據收集:網絡抓取和文本挖掘實用指南 下載 mobi epub pdf txt 電子書 格式

基於R語言的自動數據收集:網絡抓取和文本挖掘實用指南 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

基於R語言的自動數據收集:網絡抓取和文本挖掘實用指南 下載 mobi pdf epub txt 電子書 格式 2024

基於R語言的自動數據收集:網絡抓取和文本挖掘實用指南 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

印刷不錯

評分

正是我現在想要做的事情,還是很有用的

評分

不錯哦,挺好好的,大傢可以試試

評分

正在學爬蟲,裏麵的代碼比我寫的好多瞭,看到的晚瞭

評分

不錯的書籍,值得推薦,慢慢看

評分

書一般,文不對題,講的都是些網絡標記語言的入門知識。

評分

收到貨瞭,感覺還不錯的

評分

還行

評分

很好很好很好很好很好很好很好

類似圖書 點擊查看全場最低價

基於R語言的自動數據收集:網絡抓取和文本挖掘實用指南 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.qciss.net All Rights Reserved. 圖書大百科 版權所有