後端渲染容易爬蟲,前後端分離為什麼不易爬蟲?

時間 2021-05-30 03:55:24

1樓:

如果只是普通想竊取資料,針對某個站點的爬蟲。抓介面和抓html沒區別,怎麼有後端渲染就容易被爬,前後端分離就不容易被爬的說法呢

2樓:李元秋

需要爬蟲能夠解析js

解析js需要付出比原來數倍的算力,以及數倍時間。

全部爬蟲都啟用解析js就會導致爬蟲效率降低,付出更高的運算成本。

3樓:CoatCoat

而你說的爬蟲獲取資料,這個更和你是後端渲染還是前後端分離還是什麼前端渲染沒關係了,至於某些回答說的 JS,確是除了JS混淆這種加密的,要些手段才能破解,至於其他的JS,很多語言都有方法執行,不用說什麼python、PHP、Golang等了,只是時間問題而已。

就我目前見過的爬蟲能拿到的資料:

1、直接顯示在頁面的,比如教育機構常的貓撲top1002、動態載入的,這個很多種,有AJAX、Restfull 等的,通常稱作API,還有JS動態顯示的

3、直接加密傳輸的,像古老的flash,這個也可以用來傳輸

4樓:陳龍

看這幾頁ppt就理解了:

前端渲染,第一次請求只能獲取靜態HTML模板,不包含資料內容。後續請求通過AJAX方式獲取JSON資料,但是搜尋引擎不允許執行JSP,也就不能傳送AJAX請求。

伺服器端渲染,每次都返回包含業務資料的HTML。內容和HTML都有了。

雖然Google可以索引前端渲染的HTML,但是還不夠完美。而且其他搜尋引擎也做不到!

slideshare.net/MobileMo

5樓:ssthouse

簡單的說是因為js執行的問題。

前端渲染的頁面(html中的節點)是全部由js在客戶端建立的。也就是說瀏覽器初始拿到js、css、html時,頁面中是沒有內容的。

後端渲染傳遞給瀏覽器的是有內容的html。

爬蟲預設是不會執行頁面的js 的,也就是說爬蟲無法對前端渲染的頁面爬去有效資訊。

到底什麼是前後端分離?

張三 我要噴死那些張口就來 前後端分離占用過多人力資源 我們全棧攻城獅不需要前後端分離 的沙雕。沙雕,說你呢!分離,是技術架構層面的事,你全棧就不能同時寫前端和後台了?會 PHP 了不起了?會 C 語言了不起了?哇,你真厲害,一門語言打天下,全棧呢。你們家在廁所睡覺,在床上拉屎嗎? 劉錦潤 從客戶端...

管理系統適合前後端分離嗎?

樓上回答的大佬們,做管理系統有考慮過頁面元素級別的許可權控制問題嗎,把元素全載入出來然後隱藏挨個按許可權顯示,這麼低端的障眼法能阻止黑客收集並針對url進行攻擊?別跟我說後台也有許可權機制給方法加鎖,起碼你給人機會了不是麼? melin 如果前段和後端乙個人開發,就沒必要,換增加麻煩,如果不同開發,...

前後端分離架構設計(許可權模型)

留學助攻Journey 英國一般都是看加權均分,如果你的算術均分要高一點的話,建議去學校開乙個均分證明,不要表明是算數還是加權,就直接寫均分證明。看到題主說學校不給開,這種情況一般可以軟磨硬泡一下,畢竟這個是關係到你之後發展的一件大事,學校也不可能這麼絕情,多說說好話,一般能給你開的,實在不行你問問...