最近十一年香港最具教育競爭力中學/小學/幼稚園50強完整版榜單： 2024｜ 2023｜2022｜ 2021/20｜2019｜2018｜2017｜2016｜2015｜2014｜2013	教育競爭力評比體系說明
	校風評比體系說明

高級搜索

熱門搜索： 2024/25香港最具教育競爭力中學/小學/幼稚園排名選校指南

登入 | 註冊

首頁 :: 計算機與互聯網 :: 編程語言與程序設計 :: 自己動手寫網絡爬蟲（附光盤）

您的購物車是空的

圖書分類

• 英文原版書
Arts & Photography（藝術與攝影）Biographies & Memoirs（傳記與自傳）Business & Investing（商業與投資）Children's Books（兒童圖書）Comics & Graphic Novels（動漫與繪畫小說）Computers & Internet（計算機與網絡）Cooking, Food & Wine（烹飪，食品與酒類）ELT & Standard Test（英語學習與標準考試）Entertainment（休閒娛樂）Health, Mind & Body（身心健康）History（歷史）Home & Garden（家居與園藝）Law（法律）Literature & Fiction（文學與虛構類）Medicine（醫學）Mystery & Thrillers（神秘與驚悚）Nonfiction（非虛構類）Outdoors & Nature（戶外與自然）Parenting & Families（養育與家庭）Professional & Technical（專業與技術類）Reference（參考書）Religion & Spirituality（宗教與精神生活）Romance（浪漫小說）Science Fiction&Fantasy（科幻文學與玄幻）Science（科學）Self-Help（勵志自助）Sheet Music & Scores（活頁樂譜與樂譜）Sports（運動）Teens（青少年讀物）Travel（旅遊）China Interest（中國主題）Audio Books（有聲讀物）Others（其他）
• 繁體書
文學/小說藝術/設計/收藏繪畫/書法動漫/繪本攝影旅遊/人文居家生活裝飾裝修娛樂時尚美容瘦身生活DIY 美食與酒婚戀兩性家庭育兒健身保健台灣小說四書五經古典文學詩詞曲賦散文隨筆少兒經濟管理自然科學科技/工業/建築文化/學術心理勵志其他圖書
• 教育與考試
教育競爭力排名指南漢語/小語種考試 MBA/MPA/MPACC 大學英語英語考試計算機考試建築類考試醫學類考試
• 小說
中國當代小說中國近現代小說中國古典小說四大名著網絡小說外國小說偵探/懸疑/推理驚悚/恐怖魔幻/奇幻/玄幻科幻小說武俠軍事情感/家庭/婚姻社會都市鄉土職場財經官場曆史影視小說作品集世界名著
• 文學
散文/隨筆/書信詩歌詞曲中國文學外國文學名家作品兒童文學作品集紀實文學民間文學影視文學戲劇曲藝文學理論文學史文學評論與研究
• 青春文學
校園愛情/情感叛逆/成長懸疑/驚悚娛樂/偶像爆笑/無厘頭玄幻/新武俠/魔幻/科幻大陸原創韓國青春文學其他國外青春文學
• 傳記
人物合集建築師/設計師自傳社會百相領袖首腦歷代帝王政治人物財經人物宗教人物軍事人物歷史人物女性人物文學家藝術家學者科學家文娛明星體壇之星姓氏譜系家族研究與傳記
• 藝術
動畫藝術理論攝影繪畫雕塑書法篆刻設計舞蹈工藝美術音樂影視藝術舞台藝術戲曲民間藝術建築藝術藝術類考試收藏/鑑賞
• 少兒
0-2歲 11-14歲 3-6歲 7-10歲動漫/卡通傳統文化兒童教育兒童文學幼兒啓蒙手工/遊戲入園準備音樂/舞蹈智力開發科普/百科勵志/成長少兒英語笑話/幽默繪本美術/書法
• 經濟
會計、審計經典著作世界經濟中國經濟經濟學理論行業經濟經濟體制與改革貿易經濟經濟計劃與管理財政稅收世界各國經濟概況工業經濟工具書通俗讀物
• 金融與投資
投資國際金融期貨各國金融銀行股票中國金融銀行證券貨幣銀行學基金信用管理與信貸保險金融市場與管理個人理財金融理論企業併購
• 管理
MBA與工商管理人力資源管理企業與企業家企業管理與培訓供應鏈管理商務實務市場營銷戰略管理生産與運作管理電子商務管理信息系統管理學管理工具書財務管理通俗讀物項目管理領導學
• 勵志/成功
人生哲學成功學心靈雞湯性格與習慣智力與謀略情商/情緒管理財商/財富智慧人在職場人際交往處世學文明禮儀口才/演講/辯論青少年勵志出國/留學智慧格言勵志小品男性勵志女性勵志名人勵志勵志經典著作自我完善個人形象大師談勵志自我調節行業成功指南
• 生活
烹饪、美食與酒婚戀與兩性手工DIY 美容護膚彩妝/美發/美甲服飾搭配減肥瘦身時尚娛樂風水/星座/起名/占蔔益智遊戲/思維訓練
• 健康與保健
上班族保健兩性健康中老年健康養生五官護理孕産婦保健家庭保健常見病預防和治療心理健康急救常識瑜伽/美體嬰幼兒保健運動健身保健食譜中醫保健
• 家庭與育兒
孕産知識家教理论家教方法素質教育心理疏導养育男孩养育女孩育兒/親子母嬰餵養/護理胎教/早教婚姻
• 旅游/地图
旅遊隨筆旅遊攝影國內遊戶外探險國外遊旅遊地圖自助遊導遊必備旅遊指南明信片熱點遊主題旅遊旅遊理論與實務旅遊語言學習掛圖/摺疊圖
• 家居
家裝家飾居家安全家庭園藝寵物愛車一族生活指南收藏鑑賞
• 動漫幽默
大陸漫畫港台漫畫日韓漫畫歐美漫畫世界經典漫畫集小說/名著漫畫版動漫學堂幽默/笑話集其他國外漫畫
• 歷史
歷史熱點通俗說史逸聞野史風俗習慣中國史世界史史學理論歷史研究與評論歷史工具書史家名著民族史志地方史志文物考古
• 哲學
伊斯蘭教經典著作中國哲學東方哲學西方哲學哲學理論政治哲學法哲學宗教哲學語言哲學馬克思哲學比較哲學科學哲學哲學流派思維科學美學邏輯學倫理學名家作品及研究哲學工具書
• 國學古籍
国学名家线装书經典著作書目辭典古籍善本影印本四庫全書/經史子集國學普及讀物
• 政治/軍事
政治經典著作世界政治中國共產黨中國政治黨政讀物各國共產黨各國政治外交、國際關係政治熱點政治理論公共管理政治考試與教材馬克思主義理論經典軍事著作中國軍事世界軍事軍事理論軍事技術戰略戰術戰役武器裝備反恐軍事教材軍事文學軍事史
• 法律
經典著作理論法學法律史刑法司法制度司法案例與司法商法國家法、憲法外國法律與港澳台法律民法法學文集法律法規法律工具書法律教材與法律法律文書寫作法律普及讀物法律期刊經濟法行政法國際法司法鑒定犯罪學刑事偵查學法醫學訴訟法網絡法律法規法律實務
• 宗教
宗教普及读物宗教經典著作佛教原典/佛教研究著作佛教名家作品藏傳佛教術數/命理基督教宗教藝術天主教宗教理論與概況猶太教宗教神話與傳說道教伊斯蘭教其他宗教
• 心理學
經典著作大衆心理學社會心理學人格心理學人類心理學發生心理學變態/病態心理學應用心理學心理健康青少年心理輔導心理學理論心理學研究方法心理學通俗讀物心理過程與心理狀態生理心理學
• 文化
文化理論文化史方針政策及其闡述文化評述文化研究文化産業/市場地域文化文化專題研究傳統文化民俗文化民族文化文化刊物世界各國文化
• 社會科學
人口學人才學人類學民族學社會結構和社會關系社會生活與社會問題社會調查社會保障社會學社會科學文獻檢索社會科學理論公共關系社區統計學
• 科技
電子與通信電工電氣機械、儀表工業能源與動力工程金屬學與金屬工藝自動化技術汽車與車輛交通運輸航空、航天一般工業技術原子能技術礦業工程冶金工業石油、天然氣工業化學工業輕工業、手工業武器工業水利水電畜牧業、養殖業水産、漁業農業林業園林園藝動物醫學食品安全工業技術理論
• 工程
電力工程土木工程電子工程化學工程冶金工程生物工程機械工程能源與動力工程車輛工程儀表工程材料工程礦業工程水利水電工程環境工程交通工程
• 建築
園林景觀土力學、地基基礎工程城鄉規劃/市政工程室內設計/裝潢裝修建築工具書工與監理建築制圖建築勘測建築史建築基礎科學建築工程經濟與管理建築施工與機械建築結構建築材料建築藝術建築設計房地産開發管理物業管理房屋建築設備法律法規標準/規範建築經濟
• 醫學
醫學理論與研究預防醫學、衛生學中國醫學基礎醫學臨床醫學護理學內科學外科學婦產科學兒科學腫瘤學神經病學與精神病學皮膚病學與性病學耳鼻咽喉科學眼科學口腔科學民族醫學特種醫學藥學動物醫學急診學醫學文獻醫學/藥學考試醫療器械及使用醫院管理
• 自然與科學
地質學安全科學測繪學自然科學叢書、文集、連續性出版物自然科學文獻檢索自然科學總論非線性科學科普讀物數學力學物理學化學天文學地球科學大氣科學生物科學神秘現象/自然探秘晶體學海洋學地理學環境科學
• 計算機與互聯網
編程語言與程序設計軟件工程及軟件方法學數據庫操作系統網絡與通信辦公軟件圖形圖像/視頻網頁制作電子商務 IT服務管理數碼産品攻略專用軟件考試認證遊戲硬件與維護單片機與嵌入式計算機工具書計算機期刊輔助設計與工程信息系統計算機理論、基礎知識計算機安全計算機組織與體系結構人工智能中文信息處理計算機控制與仿真
• 體育/運動
太極/武術/氣功棋牌跆拳道/拳擊球類運動電子競技休閒運動水上運動極限運動田徑/體操其它運動體育理論與教學運動會奧林匹克規則/裁判
• 外語學習
英語讀物普及性英語學習英語口語英語詞彙英語專項訓練職業/行業英語雅思IELTS 托福TOEFL 詞典與工具書托業TOEIC 日語法語劍橋商務英語考試BEC 德語韓語 GRE/GMAT 西班牙語意大利語俄羅斯語其他小語種對外漢語留學指南少兒英語
• 新聞出版
會展信息與傳播理論編輯出版博物館學/事業圖書館學/事業廣播、電視新聞學/事業檔案學與檔案事業群衆文化情報學與情報工作
• 語言文字
語言學演講與口才漢語字詞典工具書漢語教學對外漢語教學漢語寫作與修辭漢語詞彙(訓诂學)漢語語音語法速記盲文手勢語漢語方言少數民族語言國際輔助語
• 工具書
名錄/目錄/黃頁字典词典醫學曆史地理哲學宗教外國語社會科學工業技術年譜、年表/年政治軍事文化社科教育文學鑒賞辭典文摘索引萬年曆標准漢語語言法律環境與安全百科全書科學與自然經濟管理藝術辭典計算機
其他商品
• 套裝書
文學小說經管勵志生活旅遊文化教育少兒動漫/連環畫社會科學政治法律科學技術計算機藝術古籍醫療衛生
• 辦公文具
訂書機名片冊打孔機號碼機鐵書立板夾/報告夾卷尺票夾文件欄/文件盤印泥筆座回形針金屬夾子膠帶訂書針牛皮筋圖釘文件夾/文件袋檔案袋/檔案盒資料冊索引紙/分類頁拉鏈袋 U盤
• 學生文具
削筆機橡皮膠水尺簽字筆圓珠筆中性筆白板筆記號筆螢光筆水彩筆鉛筆便籤本冊標籤膠裝本螺旋裝訂本皮面本活頁本相冊證書本冊內芯彩筆素描紙速寫本書包筆袋圓規彩泥
• 汽車用品
胎壓計擦車巾海綿汽車裝飾布藝防滑墊真皮鑰匙包
• 母嬰兒童用品
奶嘴奶瓶吸奶器暖奶/消毒餐具水具牙膠/安撫輔助用品嬰兒服嬰兒襪安全鎖防撞條包/背嬰帶

新進商品

2024/25全港445所中學教育競爭力排名及校風排行選校指南
HK$158.00

2024/25全港521所小學教育競爭力排名及校風排行選校指南
HK$158.00

2024/25全港1031所幼稚園教育競爭力排名及校風排行選校指南
HK$158.00

2023/24全港447所中學教育競爭力排名及校風排行選校指南
HK$158.00

2023/24全港525所小學教育競爭力排名及校風排行選校指南
HK$158.00

2023/24全港1043所幼稚園教育競爭力排名及校風排行選校指南
HK$158.00

2024/25全港445所中學教育競爭力排名及校風排行選校指南
HK$158.00

2024/25全港521所小學教育競爭力排名及校風排行選校指南
HK$158.00

2024/25全港1031所幼稚園教育競爭力排名及校風排行選校指南
HK$158.00

2023/24全港447所中學教育競爭力排名及校風排行選校指南
HK$158.00

2023/24全港525所小學教育競爭力排名及校風排行選校指南
HK$158.00

2023/24全港1043所幼稚園教育競爭力排名及校風排行選校指南
HK$158.00

聯繫客服

電郵：cs@hkpep.com

辦工時間：星期一至五(8:30am-18:00pm)

放大圖像

自己動手寫網絡爬蟲（附光盤）

作者：羅剛，王振東著
出版社: 清華大學出版社
出版時間：2010-10-01
版次：1

商品編號: 10400758

頁數：346

印刷時間：2010-10-01

HK$66.80 (速遞費用須知)
購買額滿HK$158免運費
免郵費優惠僅限香港、澳门、
台灣及中國大陸

購買數量：

內容簡介

《自己動手寫網絡爬蟲（附光盤）》介紹了網絡爬蟲開發中的關鍵問題與java實現。主要包括從互聯網獲取信息與提取信息和對web信息挖掘等內容。《自己動手寫網絡爬蟲（附光盤）》在介紹基本原理的同時注重輔以具體代碼實現來幫助讀者加深理解，書中部分代碼甚至可以直接使用。《自己動手寫網絡爬蟲（附光盤）》適用於有java程序設計基礎的開發人員。同時也可以作為計算機相關專業本科生或研究生的參考教材。

第1篇自己動手抓取數據
第1章全面剖析網絡爬蟲
1.1 抓取網頁
1.1.1 深入理解URL
1.1.2 通過指定的URL抓取網頁內容
1.1.3 Java網頁抓取示例
1.1.4 處理HTTP狀態碼
1.2 寬度優先爬蟲和帶偏好的爬蟲
1.2.1 圖的寬度優先遍歷
1.2.2 寬度優先遍歷互聯網
1.2.3 Java寬度優先爬蟲示例
1.2.4 帶偏好的爬蟲
1.2.5 Java帶偏好的爬蟲示例
1.3 設計爬蟲隊列
1.3.1 爬蟲隊列
1.3.2 使用Berkeley DB構建爬蟲隊列
1.3.3 使用Berkeley DB構建爬蟲隊列示例
1.3.4 使用布隆過濾器構建Visited表
1.3.5 詳解Heritrix爬蟲隊列
1.4 設計爬蟲架構
1.4.1 爬蟲架構
1.4.2 設計並行爬蟲架構
1.4.3 詳解Heritrix爬蟲架構
1.5 使用多線程技術提升爬蟲性能
1.5.1 詳解Java多線程
1.5.2 爬蟲中的多線程
1.5.3 一個簡單的多線程爬蟲實現
1.5.4 詳解Heritrix多線程結構
1.6 本章小結

第2章分佈式爬蟲
2.1 設計分佈式爬蟲
2.1.1 分佈式與雲計算
2.1.2 分佈式與雲計算技術在爬蟲中的應用——淺析Google的雲計算架構
2.2 分佈式存儲
2.2.1 從Ralation_DB到key/value存儲
2.2.2 Consistent Hash算法
2.2.3 Consistent Hash代碼實現
2.3 Google的成功之道——GFS
2.3.1 GFS詳解
2.3.2 開源GFS——HDFS
2.4 Google網頁存儲秘訣——BigTable
2.4.1 詳解BigTable
2.4.2 開源BigTable——HBase
2.5 Google的成功之道——MapReduce算法
2.5.1 詳解MapReduce算法
2.5.2 MapReduce容錯處理
2.5.3 MapReduce實現架構
2.5.4 Hadoop中的MapReduce簡介
2.5.5 wordCount例子的實現
2.6 Nutch中的分佈式
2.6.1 Nutch爬蟲詳解
2.6.2 Nutch中的分佈式
2.7 本章小結

第3章爬蟲的「方方面面」
3.1 爬蟲中的「黑洞」
3.2 限定爬蟲和主題爬蟲
3.2.1 理解主題爬蟲
3.2.2 Java主題爬蟲
3.2.3 理解限定爬蟲
3.2.4 Java限定爬蟲示例
3.3 有「道德」的爬蟲
3.4 本章小結

第2篇自己動手抽取Web內容
第4章處理HTML頁面
4.1 征服正則表達式
4.1.1 學習正則表達式
4.1.2 Java正則表達式
4.2 抽取HTML正文
4.2.1 瞭解HtmlParser
4.2.2 使用正則表達式抽取示例
4.3 抽取正文
4.4 從JavaScript中抽取信息
4.4.1 JavaScript抽取方法
4.4.2 JavaScript抽取示例
4.5 本章小結

第5章非HTML正文抽取
5.1 抽取PDF文件
5.1.1 學習PDFBox
5.1.2 使用PDFBox抽取示例
5.1.3 提取PDF文件標題
5.1.4 處理PDF格式的公文
5.2 抽取Office文檔
5.2.1 學習POI
5.2.2 使用POI抽取Word示例
5.2.3 使用POI抽取PPT
5.2.4 使用POI抽取Excel示例
5.3 抽取RTF
5.3.1 開源RTF文件解析器
5.3.2 實現一個RTF文件解析器
5.3.3 解析RTF示例
5.4 本章小結

第6章多媒體抽取
6.1 抽取視頻
6.1.1 抽取視頻關鍵幀
6.1.2 Java視頻處理框架
6.1.3 Java視頻抽取示例
6.2 音頻抽取
6.2.1 抽取音頻
6.2.2 學習Java音頻抽取技術
6.3 本章小結

第7章去掉網頁中的「噪聲」
7.1 噪聲對網頁的影響
7.2 利用「統計學」消除「噪聲」
7.2.1 網站風格樹
7.2.2 統計學去噪Java實現
7.3 利用「視覺」消除「噪聲」
7.3.1 視覺與"噪聲"
7.3.2 視覺去噪Java實現
7.4 本章小結

第3篇自己動手挖掘Web數據
第8章分析Web圖
8.1 存儲Web「圖」
8.2 利用Web「圖」分析鏈接
8.3 Google的秘密——PageRank
8.3.1 深入理解PageRank算法
8.3.2 PageRank算法的Java實現
8.3.3 應用PageRank進行鏈接分析
8.4 PageRank 的兄弟HITS
8.4.1 深入理解HITS算法
8.4.2 HITS算法的Java實現
8.4.3 應用HITS進行鏈接分析
8.5 PageRank與HITS的比較
8.6 本章小結

第9章去掉重複的「文檔」
9.1 何為「重複」的文檔
9.2 去除「重複」文檔——排重
9.3 利用「語義指紋」排重
9.3.1 理解「語義指紋」
9.3.2 語義指紋排重的Java實現
9.4 SimHash排重
9.4.1 理解SimHash
9.4.2 SimHash排重的Java實現
9.5 分佈式文檔排重
9.6 本章小結

第10章分類與聚類的應用
10.1 網頁分類
10.1.1 收集語料庫
10.1.2 選取網頁的「特徵」
10.1.3 使用支持向量機進行網頁分類
10.1.4 利用URL地址進行網頁分類
10.1.5 使用AdaBoost進行網頁分類
10.2 網頁聚類
10.2.1 深入理解DBScan算法
10.2.2 使用DBScan算法聚類實例
10.3 本章小結

繼續購買: 購買您最近浏覽過的商品的顧客同時購買如下商品

清華大學計算機系列教材：80x86彙編語言程序設計
HK$75.00

Java程序員之旅：JSP開發技術詳解（附DVD-ROM光盤1張）
HK$82.90

Java程序員之旅：Eclipse開發技術詳解（附DVD-ROM光盤1張）
HK$82.90

國家「十一五」高職高專計算機應用型規劃教材‧C語言程序設計：基礎與項目實訓
HK$53.10

國家「十一」高等院校計算機應用型規劃教材：程序設計基礎（基於C語言）習題解答、上機指導、試題精選
HK$46.10

21世紀高職高專規劃教材‧計算機專業教育系列：Java面向對象程序設計
HK$55.90

J2ME MIDP1.0/2.0無線設備編程指南
HK$63.90

面向21世紀全國高職高專信息技術類規劃教材：Visual Basic6.0程序設計
HK$61.80

購物指南

付運方式

付款方式

售後服務

其它

地址：香港灣仔港灣道18號中環廣場35層電話：(852) 2824 8527 傳真：(852) 2593 1222
Address : 35/F Central Plaza, 18 Harbour Road, Wanchai, Hong Kong. Tel:(852) 2824 8527 Fax:(852) 2593 1222
Copyright (C) HKPEP.com 1999-2021, All Rights Reserved.
聯繫客服: cs@hkpep.com 辦工時間：星期一至五(8:30am-18:00pm)

計算機與互聯網