Python爬蟲需要學些什麼？

1樓：凌喭

b站可以看看尹成的課，其實說簡單也簡單就是 requests，selenium。xpah re scrapy mongodb redis 在就是資料清洗視覺化之類的，要是0基礎慢慢來吧，

2樓：MeetUp

建議在學習目標不明確之前，先了解使用Python爬蟲的大致過程，然後針對每個過程中涉及的知識點選擇性學習即可。

Python爬蟲需要學習那些東西？

3樓：huifer

http相關知識

模擬請求

資料處理

網頁解析

介面發現

結構化資料

非結構化資料

庫requests

scrapy

...反爬蟲

IP驗證碼

持久化mysql

mongodb

爬蟲速度多執行緒

4樓：影子

想要做Python爬蟲，必須先要了解Python，linux是個作業系統，widows也是個作業系統。不過程式基本都是在Linux下開發的執行的，當然也有在Windows下開發，比較少而已，所以也得要了解Linux作業系統。

其次，爬蟲的資料需要儲存，這時就要使用資料庫，也得要了解資料庫的知識。當然也可以不用資料庫，將爬取的資料存到本地檔案，這樣的操作比較少，適合自己玩玩

學PyThon網路爬蟲能找到好的工作嗎？

韋瑋可以，但是看掌握的程度。目前爬蟲越來越多地被用於資料採集中，比如做一些資料分析機器學習專案的時候，需要源資料，如果這些源資料從其他企業購買，成本會比較大，而且後續維護也不太方便。所以現在很多大資料企業金融企業都會有專門的爬蟲崗位，負責進行資料的採集工作。事實上，爬蟲本身不難，但是爬蟲的反爬...

python爬蟲基礎學完了，我真的能找到一份工作嗎？

挺難的，python基礎學起來快，爬蟲基礎學起來也快，入門簡單，深入難，想找一份好工作更難。最重要的是面向監獄程式設計不是跟你說著玩的，是來真的。我也在看前端了，不想搞爬蟲了我來翻譯下你的問題 1 我只會一招，就乾脆抹黑走到底了 2 反正遇到難搞的打不過就跑唄 3 聽說深圳人傻錢多，我帶著尚方寶劍...

python爬蟲如何斷點繼續抓取？

發源地大資料使用資料庫或者寫檔案，建立一個佇列。資料庫如果安裝不方便的話可以寫兩個檔案，一個記錄抓取完成的，一個記錄任務。不過每次抓取讀取檔案一次比較麻煩而已張可韓你需要入門資料儲存和管理。我記得Python 有可以把dictionary 序列化的函式，你只需要在自己的爬蟲裡把進度和待獲取的網...

python爬蟲如何利用多執行緒？

zhangxiaoyang 初心是想爬的更快，但多執行緒多程序並不能從根本上解決問題，更好的姿勢是非同步，具體實現可以基於協程，也可以實現自己的非同步抓取框架，懶得做也有現成的，比如Scrapy。相信題主更關心的是，什麼是非同步，為什麼非同步好用，請閱讀下面的小故事。故事時間鏡頭一有一個快遞公...

開發python網路爬蟲需要哪些第三方庫？

無痕 requests庫，這是請求URL的庫，好用，之前用的urllib庫，但不如requests庫好用 BeautifulSoup或lxml，這是解析網頁的庫re，正規表示式的庫如果需要處理或儲存資料到Excel的話推薦pandas庫Python還有專門的爬蟲框架，如Scrapy，PySpide...