Lucene實戰(第2版)

Lucene實戰(第2版) 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
[美] 麥肯德利斯(McCandless M.) 著,牛長流,肖宇 譯



點擊這裡下載
    


想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-05-09

類似圖書 點擊查看全場最低價

圖書介紹

齣版社: 人民郵電齣版社
ISBN:9787115251770
版次:1
商品編碼:10661841
品牌:異步圖書
包裝:平裝
開本:16開
齣版時間:2011-06-01
用紙:膠版紙
頁數:454
字數:669000
正文語種:中文,英文


相關圖書





圖書描述

産品特色

內容簡介

  《lucene實戰(第2版)》基於apache的lucene3.0,從lucene核心、lucene應用、案例分析3個方麵詳細係統地介紹瞭lucene,包括認識lucene、建立索引、為應用程序添加搜索功能、高級搜索技術、擴展搜索、使用tika提取文本、lucene的高級擴展、使用其他編程語言訪問lucene、lucene管理和性能調優等內容,最後還提供瞭三大經典成功案例,為讀者展示瞭一個奇妙的搜索世界。

  《lucene實戰(第2版)》適閤於已具有一定java編程基本的讀者,以及希望能夠把強大的搜索功能添加到自己的應用程序中的開發人員。lucene實戰(第2版)》對於從事搜索引擎工作的工程技術人員,以及在java平颱上進行各類軟件開發的人員和編程愛好者,也具有很好的學習參考價值。

目錄

第1部分 lucene核心
第1章 初識lucene
1.1 應對信息爆炸
1.2 lucene是什麼
1.2.1 lucene能做些什麼
1.2.2 lucene的曆史
1.3 lucene和搜索程序組件
1.3.1 索引組件
1.3.2 搜索組件
1.3.3 搜索程序的其他模塊
1.3.4 lucene與應用程序的整閤點
1.4 lucene實戰:程序示例
1.4.1 建立索引
1.4.2 搜索索引
1.5 理解索引過程的核心類
1.5.1 indexwriter
1.5.2 directory
1.5.3 analyzer
1.5.4 document
1.5.5 field
1.6 理解搜索過程的核心類
1.6.1 indexsearcher
1.6.2 term
1.6.3 query
1.6.4 termquery
1.6.5 topdocs
1.7 小結
第2章 構建索引
2.1 lucene如何對搜索內容進行建模
2.1.1 文檔和域
2.1.2 靈活的架構
2.1.3 反嚮規格化(denormalization)
2.2 理解索引過程
2.2.1 提取文本和創建文檔
2.2.2 分析文檔
2.2.3 嚮索引添加文檔
2.3 基本索引操作
2.3.1 嚮索引添加文檔
2.3.2 刪除索引中的文檔
2.3.3 更新索引中的文檔
2.4 域選項
2.4.1 域索引選項
2.4.2 域存儲選項
2.4.3 域的項嚮量選項
2.4.4 reader、tokenstream和byte[ ]域值
2.4.5 域選項組閤
2.4.6 域排序選項
2.4.7 多值域
2.5 對文檔和域進行加權操作
2.5.1 文檔加權操作
2.5.2 域加權操作
2.5.3 加權基準(norms)
2.6 索引數字、日期和時間
2.6.1 索引數字
2.6.2 索引日期和時間
2.7 域截取(field truncation)
2.8 近實時搜索(near-real-time search)
2.9 優化索引
2.10 其他directory子類
2.11 並發、綫程安全及鎖機製
2.11.1 綫程安全和多虛擬機安全
2.11.2 通過遠程文件係統訪問索引
2.11.3 索引鎖機製
2.12 調試索引
2.13 高級索引概念
2.13.1 用indexreader刪除文檔
2.13.2 迴收被刪除文檔所使用過的磁盤空間
2.13.3 緩衝和刷新
2.13.4 索引提交
2.13.5 acid事務和索引連續性
2.13.6 閤並段
2.14 小結
第3章 為應用程序添加搜索功能
3.1 實現簡單的搜索功能
3.1.1 對特定項的搜索
3.1.2 解析用戶輸入的查詢錶達式:queryparser
3.2 使用indexsearcher類
3.2.1 創建indexsearcher類
3.2.2 實現搜索功能
3.2.3 使用topdocs類
3.2.4 搜索結果分頁
3.2.5 近實時搜索
3.3 理解lucene的評分機製
3.3.1 lucene如何評分
3.3.2 使用explain()理解搜索結果評分
3.4 lucene的多樣化查詢
3.4.1 通過項進行搜索:termquery類
3.4.2 在指定的項範圍內搜索:termrangequery類
3.4.3 在指定的數字範圍內搜索:numericrangequery類
3.4.4 通過字符串搜索:prefixquery類
3.4.5 組閤查詢:booleanquery類
3.4.6 通過短語搜索:phrasequery類
3.4.7 通配符查詢:wildcardquery類
3.4.8 搜索類似項:fuzzyquery類
3.4.9 匹配所有文檔:matchalldocsquery類
3.5 解析查詢錶達式:queryparser
3.5.1 query.tostring方法
3.5.2 termquery
3.5.3 項範圍查詢
3.5.4 數值範圍搜索和日期範圍搜索
3.5.5 前綴查詢和通配符查詢
3.5.6 布爾操作符
3.5.7 短語查詢
3.5.8 模糊查詢
3.5.9 matchalldocsquery
3.5.10 分組查詢
3.5.11 域選擇
3.5.12 為子查詢設置加權
3.5.13 是否一定要使用queryparse
3.6 小結
第4章 lucene的分析過程
4.1 使用分析器
4.1.1 索引過程中的分析
4.1.2 queryparser分析
4.1.3 解析vs分析:分析器何時不再適用
4.2 剖析分析器
4.2.1 語匯單元的組成
4.2.2 語匯單元流揭秘
4.2.3 觀察分析器
4.2.4 語匯單元過濾器:過濾順序的重要性
4.3 使用內置分析器
4.3.1 stopanalyzer
4.3.2 standardanalyzer
4.3.3 應當采用哪種核心分析器
4.4 近音詞查詢
4.5 同義詞、彆名和其他錶示相同意義的詞
4.5.1 創建synonymanalyzer
4.5.2 顯示語匯單元的位置
4.6 詞乾分析
4.6.1 stopfilter保留空位
4.6.2 閤並詞乾操作和停用詞移除操作
4.7 域分析
4.7.1 多值域分析
4.7.2 特定域分析
4.7.3 搜索未被分析的域
4.8 語言分析
4.8.1 unicode與字符編碼
4.8.2 非英語語種分析
4.8.3 字符規範化處理
4.8.4 亞洲語種分析
4.8.5 有關非英語語種分析的其他問題
4.9 nutch分析
4.10 小結
第5章 高級搜索技術
5.1 lucene域緩存
5.1.1 為所有文檔加載域值
5.1.2 段對應的reader
5.2 對搜索結果進行排序
5.2.1 根據域值進行排序
5.2.2 按照相關性進行排序
5.2.3 按照索引順序進行排序
5.2.4 通過域進行排序
5.2.5 倒排序
5.2.6 通過多個域進行排序
5.2.7 為排序域選擇類型
5.2.8 使用非默認的locale方式進行排序
5.3 使用multiphrasequery
5.4 針對多個域的一次性查詢
5.5 跨度查詢
5.5.1 跨度查詢的構建模塊:spantermquery
5.5.2 在域的起點查找跨度
5.5.3 彼此相鄰的跨度
5.5.4 在匹配結果中排除重疊的跨度
5.5.5 spanorquery類
5.5.6 spanquery類和queryparser類
5.6 搜索過濾
5.6.1 termrangefilter
5.6.2 numericrangefilter
5.6.3 fieldcacherangefilter
5.6.4 特定項過濾
5.6.5 使用querywrapperfilter類
5.6.6 使用spanqueryfilter類
5.6.7 安全過濾器
5.6.8 使用booleanquery類進行過濾
5.6.9 prefixfilter
5.6.10 緩存過濾結果
5.6.11 將filter封裝成query
5.6.12 對過濾器進行過濾
5.6.13 非lucene內置的過濾器
5.7 使用功能查詢實現自定義評分
5.7.1 功能查詢的相關類
5.7.2 使用功能查詢對最近修改過的文檔進行加權
5.8 針對多索引的搜索
5.8.1 使用multisearch類
5.8.2 使用parallelmultisearcher進行多綫程搜索
5.9 使用項嚮量
5.9.1 查找相似書籍
5.9.2 它屬於哪個類彆
5.9.3 termvectormapper類
5.10 使用fieldselector加載域
5.11 停止較慢的搜索
5.12 小結
第6章 擴展搜索
6.1 使用自定義排序方法
6.1.1 針對地理位置排序方式進行文檔索引
6.1.2 實現自定義的地理位置排序方式
6.1.3 訪問自定義排序中的值
6.2 開發自定義的collector
6.2.1 collector基類
6.2.2 自定義collector:booklinkcollector
6.2.3 alldoccollector類
6.3 擴展queryparser類
6.3.1 自定義queryparser的行為
6.3.2 禁用模糊查詢和通配符查詢
6.3.3 處理數值域的範圍查詢
6.3.4 處理日期範圍
6.3.5 對已排序短語進行查詢
6.4 自定義過濾器
6.4.1 實現自定義過濾器
6.4.2 搜索期間使用自定義過濾器
6.4.3 另一種選擇:filterquery類
6.5 有效載荷(payloads)
6.5.1 分析期間生成有效載荷
6.5.2 搜索期間使用有效載荷
6.5.3 有效載荷和跨度查詢
6.5.4 通過termpositions來檢索有效載荷
6.6 小結
第2部分 lucene應用
第7章 使用tika提取文本
7.1 tika是什麼
7.2 tika的邏輯設計和api
7.3 安裝tika
7.4 tika的內置文本提取工具
7.5 編程實現文本提取
7.5.1 索引lucene文檔
7.5.2 tika工具類
7.5.3 選擇自定義分析器
7.6 tika的局限
7.7 索引自定義的xml文件
7.7.1 使用sax進行解析
7.7.2 使用apache commons digester進行解析和索引
7.8 其他選擇
7.9 小結
第8章 lucene基本擴展
8.1 luke:lucene的索引工具箱
8.1.1 overview標簽頁:索引的全局視圖
8.1.2 瀏覽文檔
8.1.3 使用queryparser進行搜索
8.1.4 files and plugins標簽頁
8.2 分析器、語匯單元器和語匯單元過濾器
8.2.1 snowballanalyzer
8.2.2 ngram過濾器
8.2.3 shingle過濾器
8.2.4 獲取捐贈分析器
8.3 高亮顯示查詢項
8.3.1 高亮顯示模塊
8.3.2 獨立的高亮顯示示例
8.3.3 使用css進行高亮顯示處理
8.3.4 高亮顯示搜索結果
8.4 fastvector highlighter類
8.5 拼寫檢查
8.5.1 生成提示列錶
8.5.2 選擇最佳提示
8.5.3 嚮用戶展示搜索結果
8.5.4 一些加強拼寫檢查的考慮
8.6 引人注目的查詢擴展功能
8.6.1 morelikethis
8.6.2 fuzzylikethisquery
8.6.3 boostingquery
8.6.4 termsfilter
8.6.5 duplicatefilter
8.6.6 regexquery
8.7 構建軟件捐贈模塊(contrib module)
8.7.1 源代碼獲取方式
8.7.2 contrib目錄的ant插件
8.8 小結
第9章 lucene高級擴展
9.1 鏈式過濾器
9.2 使用berkeley db存儲索引
9.3 wordnet同義詞
9.3.1 建立同義詞索引
9.3.2 將wordnet同義詞鏈接到分析器中
9.4 基於內存的快速索引
9.5 xml queryparser:超齣“one box”的搜索接口
9.5.1 使用xmlqueryparser
9.5.2 擴展xml查詢語法
9.6 外圍查詢語言
9.7 spatial lucene
9.7.1 索引空間數據
9.7.2 搜索空間數據
9.7.3 spatial lucene的性能特點
9.8 遠程進行多索引搜索
9.9 靈活的queryparser
9.10 其他內容
9.11 小結
第10章 其他編程語言使用lucene
10.1 移植入門
10.1.1 移植取捨
10.1.2 選擇閤適的移植版本
10.2 clucene(c++)
10.2.1 移植目的
10.2.2 api和索引兼容
10.2.3 支持的平颱
10.2.4 當前情況以及未來展望
10.3 lucene.net(c#和其他.net編程語言)
10.3.1 api兼容
10.3.2 索引兼容
10.4 kinosearch和lucy(perl)
10.4.1 kinosearch
10.4.2 lucy
10.4.3 其他perl選項
10.5 ferret(ruby)
10.6 php
10.6.1 zend framework
10.6.2 php bridge
10.7 pylucene(python)
10.7.1 api兼容
10.7.2 其他python選項
10.8 solr(包含多種編程語言)
10.9 小結
第11章 lucene管理和性能調優
11.1 性能調優
11.1.1 簡單的性能調優步驟
11.1.2 測試方法
11.1.3 索引-搜索時延調優
11.1.4 索引操作吞吐量調優
11.1.5 搜索時延和搜索吞吐量調優
11.2 多綫程和並行處理
11.2.1 使用多綫程進行索引操作
11.2.2 使用多綫程進行搜索操作
11.3 資源消耗管理
11.3.1 磁盤空間管理
11.3.2 文件描述符管理
11.3.3 內存管理
11.4 熱備份索引
11.4.1 創建索引備份
11.4.2 恢復索引
11.5 常見錯誤
11.5.1 索引損壞
11.5.2 修復索引
11.6 小結
第3部分 案例分析
第12章 案例分析1:krugle
12.1 krugle介紹
12.2 應用架構
12.3 搜索性能
12.4 源代碼解析
12.5 子串搜索
12.6 查詢vs搜索
12.7 改進空間
12.7.1 fieldcache內存使用
12.7.2 閤並索引
12.8 小結
第13章 案例分析2:siren
13.1 siren介紹
13.2 siren優勢
13.2.1 通過所有域進行搜索
13.2.2 一種高效詞典
13.2.3 可變域
13.2.4 對多值域的高效處理
13.3 使用siren索引實體
13.3.1 數據模型
13.3.2 實現問題
13.3.3 索引概要
13.3.4 索引前的數據準備
13.4 使用siren搜索實體
13.4.1 搜索內容
13.4.2 根據單元限製搜索範圍
13.4.3 將單元閤並成元組
13.4.4 針對實體描述進行查詢
13.5 在solr中集成siren
13.6 benchmark
13.7 小結
第14章 案例分析3:linkedin
14.1 使用bobo browse進行分組搜索
14.1.1 bobo browse的設計
Lucene實戰(第2版) 下載 mobi epub pdf txt 電子書 格式


Lucene實戰(第2版) mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

Lucene實戰(第2版) 下載 mobi pdf epub txt 電子書 格式 2024

Lucene實戰(第2版) 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

很不錯!在這買劃算多瞭,快遞也很及時,太好瞭

評分

真的很好,給我很多啓發,贊!!!!!!!!!!!!!!!!!!!!11

評分

索然不深入,不夠神速,但是還是挺全麵的。。。。。

評分

不錯,正在研究中,

評分

這本書之前看過同事的,翻譯的很差,最好對照著英文版電子書看,版本也太老瞭

評分

書不錯,就是版本老瞭些!

評分

盜版好坑好坑,灌灌灌灌灌灌灌灌灌灌

評分

將就

評分

東西都比較新,比較舊但是也算經典吧

類似圖書 點擊查看全場最低價

Lucene實戰(第2版) mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.qciss.net All Rights Reserved. 圖書大百科 版權所有