官术网_书友最值得收藏!

實戰(zhàn)Python網(wǎng)絡爬蟲
會員

本書從原理到實踐,循序漸進地講述了使用Python開發(fā)網(wǎng)絡爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰(zhàn)篇和爬蟲框架篇三部分。基礎篇主要介紹了編寫網(wǎng)絡爬蟲所需的基礎知識,包括網(wǎng)站分析、數(shù)據(jù)抓取、數(shù)據(jù)清洗和數(shù)據(jù)入庫。網(wǎng)站分析講述如何使用Chrome和Fiddler抓包工具對網(wǎng)站做全面分析;數(shù)據(jù)抓取介紹了Python爬蟲模塊Urllib和Requests的基礎知識;數(shù)據(jù)清洗主要介紹字符串操作、正則和BeautifulSoup的使用;數(shù)據(jù)入庫講述了MySQL和MongoDB的操作,通過ORM框架SQLAlchemy實現(xiàn)數(shù)據(jù)持久化,進行企業(yè)級開發(fā)。實戰(zhàn)篇深入講解了分布式爬蟲、爬蟲軟件的開發(fā)、12306搶票程序和微博爬取等。框架篇主要講述流行的爬蟲框架Scrapy,并以Scrapy與Selenium、Splash、Redis結合的項目案例,讓讀者深層次了解Scrapy的使用。此外,本書還介紹了爬蟲的上線部署、如何自己動手開發(fā)一款爬蟲框架、反爬蟲技術的解決方案等內容。本書使用Python3.X編寫,技術先進,項目豐富,適合欲從事爬蟲工程師和數(shù)據(jù)分析師崗位的初學者、大學生和研究生使用,也很適合有一些網(wǎng)絡爬蟲編寫經(jīng)驗,但希望更加全面、深入理解Python爬蟲的開發(fā)人員使用。

黃永祥 ·程序設計 ·16.2萬字

機器學習實踐指南:案例應用解析
會員

《機器學習實踐指南:案例應用解析》是機器學習及數(shù)據(jù)分析領域不可多得的一本著作,也是為數(shù)不多的既有大量實踐應用案例又包含算法理論剖析的著作,作者針對機器學習算法既抽象復雜又涉及多門數(shù)學學科的特點,力求理論聯(lián)系實際,始終以算法應用為主線,由淺入深以全新的角度詮釋機器學習。全書分為準備篇、基礎篇、統(tǒng)計分析實戰(zhàn)篇和機器學習實戰(zhàn)篇。準備篇介紹了機器學習的發(fā)展及應用前景以及常用科學計算平臺,主要包括統(tǒng)計分析語言r、機器學習模塊mlpy和neurolab、科學計算平臺numpy、圖像識別軟件包opencv、網(wǎng)頁分析beautifulsoup等軟件的安裝與配置。基礎篇先對數(shù)學基礎及其在機器學習領域的應用進行講述,同時推薦配套學習的數(shù)學書籍,然后運用實例說明計算平臺的使用,以python和r為實現(xiàn)語言,重點講解了圖像算法、信息隱藏、最小二乘法擬合、因子頻率分析、歐氏距離等,告訴讀者如何使用計算平臺完成工程應用。最后,通過大量統(tǒng)計分析和機器學習案例提供實踐指南,首先講解回歸分析、區(qū)間分布、數(shù)據(jù)圖形化、分布趨勢、正態(tài)分布、分布擬合等數(shù)據(jù)分析基礎,然后講解神經(jīng)網(wǎng)絡、統(tǒng)計算法、歐氏距離、余弦相似度、線性與非線性回歸、數(shù)據(jù)擬合、線性濾波、圖像識別、人臉辨識、網(wǎng)頁分類等機器學習算法。此書可供算法工程師、IT專業(yè)人員以及機器學習愛好者參考使用。

麥好 ·人工智能 ·13.3萬字

QQ閱讀手機版

主站蜘蛛池模板: 汕头市| 阿鲁科尔沁旗| 盐边县| 辉南县| 长岛县| 潜山县| 晋江市| 南乐县| 晋江市| 大名县| 普洱| 马关县| 金乡县| 嘉鱼县| 精河县| 榆林市| 辰溪县| 安徽省| 彭阳县| 宜城市| 天镇县| 和平县| 敖汉旗| 织金县| 灌南县| 丁青县| 沧州市| 兴文县| 渭源县| 民勤县| 龙口市| 南华县| 镇原县| 淳化县| 视频| 新野县| 平舆县| 化州市| 西畴县| 璧山县| 开远市|