如何將html網頁中的數據提取出來保存在數據庫中?實際上是在制造一種收購工具。
首先看你的需求。你需要收集一個網站的名稱和價格,并與另一個網站進行比較。
所以總結一下,就是你需要收集兩個網站的數據(比較其實是名字相關的)
讓下面我們來談談爬行動物的幾個主要環節。
1.Web內容獲取(html獲取)
有很多方法可以得到它。最常見的是通過GET和post直接下載頁面html。基本上所有語言都有現成的調用。當然,你也會遇到異步加載或者其他問題。這時候你可以嘗試用調用瀏覽器來解決它們。
2.網頁內容提取(您需要名稱并借用一個提取)
Web內容抽取就是通過正則表達式或者xpath獲取你需要的數據,這個應該不用多說。
3.提取內容并將其放入存儲(獲得的數據保存在表或數據庫中或顯示在頁面上)。
如果是入庫,就看你用什么形式了。一般你會用比較輕便的數據庫,以后比較方便比價(聯查)。
你需要的知識大概就是一點編程基礎(看一些開源爬蟲程序),一些網絡基礎(catch包和契約包),正則表達式或者xpath,簡單的數據庫基礎,所以感覺差不多。
當然現在網上收藏工具很多。對于那些小數據或簡單的收集,你不你不必編寫自己的程序,但你可以通過收集工具來完成。
如何將網頁內提交的數據保存到SQL數據庫中?提交表單后,將對其進行驗證。當然,您可以先連接到您的數據庫而無需驗證,并使用sql語句。這里我用PHP大概描述一下,$conn=mysql_connect(#39數據庫地址#39,#39數據庫用戶名#39,#39數據庫密碼#39)。
Mysql_select_db(#39連接到哪個表#39,$conn)連接到這里的數據庫,然后別人提交的內容會通過form、post或g
在自己電腦上創建WEB服務器和數據庫,怎樣將在網頁上輸入的數據傳送到數據庫中?
,這取決于你如何創造它。1.如果你用的是成熟的CMS系統,那就好辦了。按照他說的安裝CMS系統和數據庫,配置數據庫名、用戶名和密碼。直接在網頁上輸入數據什么的就行了。
2.如果你自己做web應用,你得在源代碼里寫數據提交模塊。包括從網頁獲取數據、連接數據庫、驗證數據庫連接信息、提交、存儲等諸多方面。有一定的html編程基礎。
希望能幫到你!