Python爬蟲程式設計思想(49):Beautiful Soup環境搭建
目錄
1. Beautiful Soup簡介
2. 安裝Beautiful Soup
1. Beautiful Soup簡介
Beautiful Soup是一個強大的基於Python語言的XML和HTML解析庫,可以用它來方便地從網頁中提取資料,那麼Beautiful Soup到底有什麼功能呢?先看一段對Beautiful Soup的標準解釋。
Beautiful Soup提供了一些簡單的函式來處理導航、搜尋、修改分析樹等功能。它是一個工具箱,通過解析文件為使用者提供需要抓取的資料,由於Beautiful Soup非常簡單,所以可以用非常少的程式碼寫出一個完整的HTML分析程式,再加上requests庫,可以寫出非常簡潔且強大的爬蟲應用。
Beautiful Soup自動將輸入的文件轉換為Unicode編碼,輸出文件轉換為UTF-8編碼,所以在使用Beautiful Soup的過程中並不需要考慮編碼問題,除非文件沒有指定編碼方式,這時只需要指出輸入文件的編碼方式即可。
「其他文章」
- Python爬蟲程式設計思想(102):使用Selenium改變節點的屬性值
- Python爬蟲程式設計思想(64): 在pyquery中使用CSS選擇器
- Python爬蟲程式設計思想(54):使用Beautiful Soup選擇兄弟節點
- Python爬蟲程式設計思想(49):Beautiful Soup環境搭建
- Python爬蟲程式設計思想(46):使用Chrome驗證XPath
- Python爬蟲程式設計思想(34):使用findall和finditer查詢每一次出現的位置
- 今天是七夕節、用100行CSS程式碼下一場流星雨、許一個願、來一場美麗的邂逅
- 你絕對想不到的鴻蒙服務卡片新玩法,專治頸椎!
- Python爬蟲程式設計思想(14):網路爬蟲中的異常處理
- Python爬蟲程式設計思想(9):用urllib處理請求超時
- 鴻蒙最新IDE(DevEco Studio)絕密檔案大揭祕,絕對有你不知道的東西!
- 女朋友今年想要特別的禮物,來塊鴻蒙(HarmonyOS)運動表如何!順便教女朋友開發鴻蒙App,結果卻掉...
- 臥槽,好強大的魔法,竟能讓Python支援方法過載
- Python程式設計思想(33):異常類與多異常捕獲
- Python程式設計思想(31):列舉型別深度詳解
- Python程式設計思想(32):異常處理中的try…except
- Python程式設計思想(26):成員變數
- Python程式設計思想(25):方法詳解
- Python程式設計思想(12):for-in迴圈
- 用Linux感覺低效嗎?來看看這幾個技巧!