關燈 巨大 直達底部
親,雙擊螢幕即可自動滾動
第157部分

以從網站上爬去,又叫網路爬蟲。

可能一般人沒有聽說過這個名詞,但實際上,爬蟲才是網路上最大的流量製造者。

網路上百分之八十的流量都是爬蟲,這是一個流傳很廣的話,雖然有一點誇張成分,但是讓爬蟲行業的相關人員估算的話,爬蟲製造的流量也至少在百分之五十以上。

有很多驗證碼之類的東西,除了防駭客之外,主要也是為了防爬蟲的,雖然實際上除了麻煩到真正的網民之外,並沒有什麼卵用。

不過這麼做的目的也是為了提高爬蟲的成本,而不是為了防止他。

什麼是網路爬蟲,網路搜尋引擎其實就是一種爬蟲,但是這是一種良性的爬蟲,並不會對網站的伺服器造成太大的負擔。

而數量最多的其實是商業爬蟲。比如有三家賣一模一樣商品的網站,如果網站的後臺檢測到了曾經有一個ip訪問了網站,對於網站上的商品很感興趣,但是並沒有購買。

這個時候網站的負責人就會覺得是不是因為價格的原因導致了這個客戶的流失,所以他就會僱人,或者成立專門的部門,從另外兩家的網頁上爬取商品價格進行對比,

當爬蟲獲取到了資料返回之後,另外兩家的網站負責人就會發現,有一個ip訪問了他們的網頁,但是並沒有購買他們的商品,他們就會覺得是其他的什麼因素,比如他們的價格比不上其他兩家的,他們的介紹寫的不華麗,於是他們也會使用爬蟲去爬取其他兩家的商品資料,然後其他兩家自然也發現了又有客戶造訪,但是沒有購買商品,於是就這麼無限迴圈了下去。

把這個例子擴充套件到全華夏,一件商品最起碼有上千家,上萬家的店鋪在出售,這些商鋪都會使用爬蟲爬取其他各家的資料來進行對比,這就導致了,網路爬蟲的數量越來越多,隊伍越來越龐大,對於伺服器造成的壓力也越來越大。

而現在,這個新生的高階人工智慧,爬取的可不僅僅是商業資料,他正在試圖爬取所有的一切資料,搜尋引擎搜得到的,他要爬取,搜不到的,他也要爬取。

甚至,這個高階人工智慧利用關鍵詞,開始入侵各個論壇,社交軟體裡面,開始爬取他能獲得的所有有用的身份,而這一切行動掩藏在龐大的網路爬蟲的之下,所以沒有任何人察覺到這個高階人工智慧的行動,而只是奇怪最近流量有點大,但是收入卻並沒有增加。

真正的網路監察時代來臨了,只要這個高階人工智慧想,他可以將一個網民從剛開始上網,在網路上發出的第一個字到最後一次離開網路時瀏覽了什麼網頁全部查出來。

只要你在網路上留下痕跡,這個高階人工智慧就能憑藉著自己強大的網路爬取能力,想法設法的獲得。

這不禁讓方澤想到,有一次他看見了電信公司的後天監視程式,上面密密麻麻的記載著所有的行動網路這個時候正在瀏覽什麼網頁。

方澤看到這種情況之後,問向了輝夜,“你能阻止這個高階人工智慧的行動嗎?”

“可以。”輝夜點頭回答道,“高階人工智慧也是可以成長的,我在啟動之後,已經進化了不少,而這個高階人工智慧是用我的模板建造的,這樣的話我就始終走在他前面,我可以中斷他的行動,但是卻沒有辦法將他從網路上排擠出去。”

“那也可以。”方澤對著輝夜說道,“你現在立刻阻止這個新生的人工智慧對於個人資訊的爬取。”

“好的主人,還有什麼吩咐嗎?”

“對了,你阻止了這個人工智慧的爬取之後,你自己對所有的網路個人資訊進行爬取,然後建立一個資料庫。”

“那樣的話,我需要一個龐大的儲存空間。”

第三百九十七章個人資訊與外掛

“沒問題。