Kerwen Blog

Stay Hungry Stay Foolish

BeautifulSoup 笔记

安装 1 $ pip install beautifulsoup4 import 1 from bs4 import BeautifulSoup 格式化html 1 2 soup = BeautifulSoup(html_doc) print(soup.prettify()) 获取所有文字内容: 1 print(soup.get_text()) Beautiful ...

Python 错误信息

错误1: 1 2 3 4 5 import urllib.request response=urllib.request.urlopen("http://www.baidu.com/") html = response.read() html=html.decode('UTF-8') print(html) 在print时报以下错误: 1 UnicodeEncodeError: 'c...

Python 爬虫入门笔记

基础介绍 抓取网页的过程其实和读者平时使用IE浏览器浏览网页的道理是一样的。 比如说你在浏览器的地址栏中输入 www.baidu.com 这个地址。 打开网页的过程其实就是浏览器作为一个浏览的“客户端”,向服务器端发送了 一次请求,把服务器端的文件“抓”到本地,再进行解释、展现。 HTML是一种标记语言,用标签标记内容并加以解析和区分。 浏览器的功能是将获取到的HTML...

Python写网络爬虫笔记

介绍 参考资料: http://blog.csdn.net/column/details/why-bug.html

PyQt 入门介绍

介绍 PyQt是一个创建GUI应用程序的工具包。它是Python编程语言和Qt库的成功融合。它有超过300类,将近6000个函数和方法。它是一个多平台的工具包,可以运行在所有主要操作系统上,包括UNIX,Windows和Mac。 PyQt采用双许可证,开发人员可以选择GPL和商业许可。在此之前,GPL的版本只能用在Unix上,从PyQt的版本4开始,GPL许可证可用于所有支持的平台。 P...

Python GUI 编程各种实现的对比

从 Python 语言的诞生之日起,就有许多优秀的 GUI 工具集整合到 Python 当中,这些优秀的 GUI 工具集,使得 Python 也可以在图形界面编程领域当中大展身手,由于 Python 的流行,许多应用程序都是由 Python 结合那些优秀的 GUI 工具集编写的。下面分别介绍 Python GUI 编程的各种实现,下面的许多内容都是来自维基百科,这里就当做是一个没有技术色彩的...

Clear Case 常用操作

Merge Merge文件 在一个branch创建的文件Merge到另一个branch You have to merge the parent directory first, so that the file shows up in the directory in the destination branch. At this point the new file will ha...

Python学习笔记

Python入门教程, 提供了很多的实例,但是基于Python2.0 的, 目前Python已经更新到Python3.5,里面的一些函数(如Print)已经不一样了。 笨办法学Python 编码注释: 1 # -*- coding:utf-8 -*- print print带参数输出 1 2 3 4 int1=30 int2=20 str1="test" print("int1...

Python3 读取中文

Python在读取带有中文的文本时,经常会报以下错误: 1 UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position xx: illegal multibyte sequence 去网上查找相关资料,发现很多解决方案都是在用 decode, encode方式,但测试发现对Python3不适用。 这也是Pytho...

Notepad++配置Python开发环境

安装Python 我选择了32位的2.7版本。https://www.python.org/ftp/python/2.7.8/python-2.7.8.msi 安装的时候可以修改安装路径到D盘,然后注意一点是可以将最后一项“配置环境变量”勾选上(默认是不选择的),这样就不用手动配置环境变量了。 配置Notepad++ Notepad++ ->”运行”菜单->...