說來也怪,近關(guān)于刷點(diǎn)擊相關(guān)的話題出現(xiàn)在各種群里,恰巧,我之前用python寫過一個(gè)點(diǎn)擊器的Demo,后一次花了1-2天測(cè)試幾個(gè)排在第二、三頁的詞,大部分都跑到了先進(jìn)頁,也不知道是點(diǎn)上去的還是自然上去的......但是下拉框確實(shí)是刷出來了,之前在百度搜“gogo”的時(shí)候,下拉框是出現(xiàn)了我的網(wǎng)名“GoGo闖”的。
雖然沒有專門做這個(gè),也沒有再深入研究,但當(dāng)時(shí)寫點(diǎn)擊器的過程還是可以扯一扯。
先說為何要刷點(diǎn)擊,先解釋下,之所以有刷點(diǎn)擊的需求,是因?yàn)樵谒阉饕嬷?,一個(gè)網(wǎng)頁的點(diǎn)擊率是影響該網(wǎng)頁在搜索結(jié)果中排序的因素之一,且這個(gè)因素相對(duì)其他因素更容易控制一些,所以肯定有人希望人為控制這個(gè)因素來提高網(wǎng)頁在搜索引擎中的排名。
于是當(dāng)時(shí)下載了幾個(gè)點(diǎn)擊軟件瞅了瞅,這些軟件大多分掛機(jī)部分和點(diǎn)擊部分。掛機(jī)部分把軟件下載到本地,然后控制本地瀏覽器去點(diǎn)擊別人指定關(guān)鍵詞對(duì)應(yīng)的網(wǎng)頁,點(diǎn)擊一次給予一定的積分;點(diǎn)擊部分就是你設(shè)置要?jiǎng)e人點(diǎn)擊的網(wǎng)頁,那些正在掛機(jī)的機(jī)子就會(huì)點(diǎn)擊這個(gè)詞,被點(diǎn)擊一次扣除一定的積分。所以想要獲得點(diǎn)擊,就要有積分,想要有積分就要多多掛機(jī)去點(diǎn)別人的詞,依此循環(huán)。
這些點(diǎn)擊均來自不同用戶的瀏覽器觸發(fā),看起來都是真實(shí)的點(diǎn)擊。照此看,只要能控制瀏覽器并用不同的IP進(jìn)行符合用戶行為規(guī)律的點(diǎn)擊,就可以實(shí)現(xiàn)那些點(diǎn)擊軟件的功能。
所以用python的selenium來控制本地瀏覽器,每點(diǎn)擊一次,清空cookie、關(guān)閉瀏覽器、切換IP、切換UA,再次點(diǎn)擊,且每一個(gè)步驟包含多種策略,使之更加符合用戶的行為,而不是機(jī)器的行為。
ps:selenium是調(diào)用本地瀏覽器,執(zhí)行的時(shí)候?yàn)g覽器窗口一會(huì)開一會(huì)關(guān),是沒法干別的活的,要像類似后臺(tái)運(yùn)行,還需要phantomjs,調(diào)用瀏覽器內(nèi)核(可以理解為使用瀏覽器,但不打開瀏覽器窗口)來訪問。但有時(shí),本地瀏覽器定位指定元素的xpath路徑,換了phantomjs是定位不到的,通常本地瀏覽器換個(gè)版本就行了,或者換另一個(gè)本地瀏覽器試下~~
先說IP。要專門搞這個(gè),那肯定要有大量的IP資源,要模擬百度用戶點(diǎn)擊,首先IP得是全國范圍的、在不同的頻段,且IP以往在搜索引擎中的行為是正常的。所以搞了幾臺(tái)能支持全國adsl撥號(hào)的機(jī)子,點(diǎn)一次,斷線重連換ip。
再說一下點(diǎn)擊行為。提前查了一些詞的排名,挑了一些排在第2、3頁的網(wǎng)頁作為要點(diǎn)擊的網(wǎng)頁。正常用戶的在搜索引擎的瀏覽行為,是先點(diǎn)擊搜索結(jié)果先進(jìn)頁的幾個(gè)網(wǎng)頁,沒找到滿意的,在“下一頁”,點(diǎn)擊2、3頁的結(jié)果,找到滿意的結(jié)果后,關(guān)閉網(wǎng)頁,退出搜索引擎。
所以,個(gè)人覺得,把要刷的網(wǎng)頁,作為后一次點(diǎn)擊,搜索引擎可能會(huì)認(rèn)為,這個(gè)網(wǎng)頁在一定概率上是用戶想要的結(jié)果,滿意了,所以退出搜索引擎,會(huì)先提高在結(jié)果中的排序,在根據(jù)該頁面后續(xù)的點(diǎn)擊頻率/后一次點(diǎn)擊,決定是否長時(shí)間留在先進(jìn)頁。
所以我把整個(gè)程序的點(diǎn)擊行為設(shè)置為:先找到目標(biāo)網(wǎng)頁的具體位置,在隨機(jī)點(diǎn)擊前面的幾個(gè)網(wǎng)頁,分別停留一段時(shí)間,后在點(diǎn)擊目標(biāo)網(wǎng)頁,然后退出搜索引擎。
再說下防止搜索引擎識(shí)別假點(diǎn)擊(以下是我拍腦門的)。在單個(gè)點(diǎn)擊上,符合大多用的點(diǎn)擊行為,也就是上面說的,否則上來直接點(diǎn)擊第二頁的結(jié)果這太假了。在所有點(diǎn)擊上,各種用戶屬性的比例是正常的,這里指用戶IP地理位置的比例、瀏覽器的比例、操作系統(tǒng)的比例、被點(diǎn)擊次數(shù)與關(guān)鍵詞搜索量的比例......
比如移動(dòng)搜索,假設(shè)Android和IOS比例為1:1,而刷的頁面全部設(shè)置的IOS訪問,這就算比例不正常。其他的屬性都以此類推。
期間還發(fā)現(xiàn)了一個(gè)情況,如果是在PC端控制瀏覽器點(diǎn)擊,且刷的是wap頁面,那么百度統(tǒng)計(jì)記錄的屏幕分辨率是PC的分辨率,這個(gè)特征是很明顯的,但暫時(shí)沒有找到偽裝移動(dòng)屏幕分辨率的辦法。
另外,如果用市面上的點(diǎn)擊軟件去刷,可能基本沒有效果。因?yàn)橐粋€(gè)軟件,刷點(diǎn)擊所用的IP總是來自于固定范圍的一些用戶(既經(jīng)常使用掛機(jī)軟件的那些用戶),一方面搜索引擎會(huì)容易的獲取這些用戶的IP并加黑,另一方面,很多這種軟件出于投入產(chǎn)出比的考慮,取消掛機(jī)給積分的措施,而改用充值給積分的方式快速撈錢,所以來自真實(shí)用戶的IP會(huì)越來越少。
也跟一個(gè)做點(diǎn)擊的人請(qǐng)教過IP獲取的問題,但他原來是做IDC的,從來不知道缺IP是一種什么樣的體驗(yàn) -_-!
要是一個(gè)企業(yè)站,想把某幾個(gè)有商業(yè)價(jià)值的詞做上去,刷一刷我覺得還是可以的。要是有品牌負(fù)面信息壓制的需求,想把無負(fù)面信息的網(wǎng)頁搞上來,刷一刷我覺得還是可以的。但一個(gè)上稍有些規(guī)模的站在搞這個(gè),個(gè)人覺得就有些丟西瓜撿芝麻了,分不清哪個(gè)是西瓜,哪個(gè)是芝麻的感覺了。好好做內(nèi)容,好好做結(jié)構(gòu),才是西瓜。