-
Python爬虫报错:(Caused by SSLError(SSLEOFError(8, ‘EOF occurred in violation of protocol (_ssl.c:1129)’)))解决
今天在写爬虫的时候遇到一个错误,即: requests.exceptions.SSLError: HTTPSConnectionPool(host='httpbin.org', port=443): Max retries exceeded with url: /get (Caused by SSLError(SSLEOFError(8, 'EOF occurred …...
塵風- 0
- 0
- 17k
-
python模块requests参数stream
使用python requests模块下载大文件时,建议使用strea模式. 默认情况下是false,他会立即开始下载文件并存放到内存当中,倘若文件过大就会导致内存不足的情况. 当把get函数的stream参数设置成True时,它不会立即开始下载,当你使用iter_content或iter_lines遍历内容或访问内容属性时才开始下载。需要注意一点:文件没有下载之前,它也需要保持连接。 iter_…...
塵風- 0
- 0
- 740
-
使用Python检查提取网站死链
网站死链会影响我们的用户体验和搜索引擎对我们站点的评分(尤其是网站存在已经被做成赌博、色情网站的链接,影响很大),但是网站运营时长长了,就难免会有这样的问题,所以我们可以考虑定期的处理下,我之前分享过一些WordPress死链、外部链接处理的文章,如果你是使用WordPress,就可以直接参考下述的文章去解决: WordPress去除文章失效链接 WordPress文章外部链接清除 WordPre…...
塵風- 0
- 0
- 547
-
在Python中打开文件使用utf-8-sig和utf-8的区别
今天在使用Python读取CSV文件的时候,出现了一个KeyError的错误的,这个错误提示很明显,就是没有对应的列名,但是经过检查我的CSV文件中是有对应的列名的呀,然后编码格式我也检查了,这个时候我就想先打印列名看下,打印后就看出问题了。 问题原因 假设通过Excel打开我的CSV文件,列名是:列名1、列名2... 但是打印出的结果是如下: ['\ufeff列名1', …...
塵風- 0
- 0
- 724
-
Pycharm如何选中多行编辑
Pycharm如何选中多行编辑: 快捷键 同时选中多行快捷键:ctrl + shift +alt +点击鼠标左键 操作流程 按住后可以在任意需要的位置增加光标 然后就可以松开,进行下一步操作: 如果是同时操作(如光标在代码之间移动),则 ctrl + 上下左右键 如果是同时选中光标附近的代码,则 ctrl + shift + 上下左右键 如下图,我们选中的行前面都会有光标闪烁显示: 然后就可以对这…...
塵風- 0
- 0
- 1k
-
Python使用 pytesseract 进行图片识别
在编写爬虫的时候,如果遇见参数图片化的情况的(例如登录验证码),就需要对图片验证码进行识别,我们就可以使用pytesseract。 pytesseract简介 pytesseract是一款用于光学字符识别(OCR)的python工具,即从图片中识别出和“读取”其中嵌入的文字。 底层使用的是Google的Tesseract-OCR 引擎(Tesseract是一个开源文本识别 (OCR) 引擎(注意:…...
塵風- 0
- 0
- 2.3k
-
PyCharm破解教程(2023.3最新版本)
PyCharm破解教程(2023.3最新版本)分享,之前分享的:PyCharm破解教程(简单长期稳定)测试的破解是2021版本的,我已经有一段时间没用了,现在都是用这个,下面就开始分享: 准备工作 下载安装pycharm的详细过程请你看:Pycharm安装教程(非常详细) Windows电脑安装Python解释器请你看:Windows python安装教程(超详细) 激活工具 把下面的激活工具下载…...
塵風- 0
- 11
- 2.3k
-
Python glob模块和主要方法
概述 glob是python自己带的一个文件操作相关模块,查找文件目录和文件,类似于Windows下的文件搜索。 glob模块会将查找到的文件目录或文件的搜索结果返回到一个列表中。 支持的通配符: 支持:*,?,[],这三个通配符 *代表匹配0个或多个字符?代表匹配任意一个字符[]匹配指定范围内的字符如:[0-9]匹配所有数字[a-z]匹配所有字母[1,2,3]仅匹配1,2,3三个数字[!1,2,…...
塵風- 0
- 0
- 1.8k
-
Python pip命令大全
Python pip 使用命令大全分享 官方文档 地址:https://docs.python.org/3/installing/index.html 命令大全 安装模块 pip install 模块名 通常,如果已经安装了模块,再次安装 它再次不会有任何效果。如需要升级 请使用升级命令。 不加版本号 默认安装模块当前最新版本。 安装指定版本 pip install 模块名==1.xx 指定源安装…...
塵風- 0
- 0
- 381
-
Python 字典判断键是否存在
Python 字典判断键是否存在可以使用has_key()方法、 __contains__(key)方法、in 操作符。下面是详细介绍和实例代码: has_key()方法 Python 字典(Dictionary) has_key() 函数用于判断键是否存在于字典中,如果键在字典 dict 里返回 true,否则返回 false。 注意:Python 3.X 不支持该方法。 语法 has_key(…...
塵風- 0
- 0
- 1.5k
-
Python模块requests参数verify – SSL证书认证
Python模块requests参数verify - SSL证书认证 requests模块中verify关键词参数用于控制是否开启SSL证书认证,requests在请求HTTPS链接时,默认是开启SSL证书认证的,即请求中verify参数默认为True(verify=True)。 关闭SSL证书认证 如果要关闭SSL证书认证,我们可以把verify参数设置False即可,例如: # -*- cod…...
塵風- 0
- 0
- 867
-
Python Counter()函数介绍 – 统计值出现的次数
Python Counter()函数介绍 Counter()函数 是collections模块(Python标准库中的一个模块)中的里面的一个类,作用是计算出字符串或者列表等中不同元素出现的个数,返回值可以理解为一个字典,所以对传回来的统计结果的操作都可以当作对字典的操作(Counter类继承dict类,所以它能使用dict类里面的方法) Note: 字符串还有一个内置的count(),只能统计字…...
塵風- 0
- 0
- 3.4k
-
Windows下将Pycharm终端更改为PowerShell
Windows下将Pycharm终端更改为PowerShell:我们都知道power shell不管是从功能上还是性能上都要比CMD要强大得多,我们安装了power shell后,可以将pycharm编辑器中的默认终端切换为power shell,方便我们的使用。 更改流程 1:找到power shell路径 先搜索到我们的power shell,右键,然后选择打开文件位置 打开是几个快捷键:我们…...
塵風- 0
- 0
- 2.1k
-
HTTP请求头字段Sec-Fetch-Dest介绍
Sec-Fetch-Dest是一个用于HTTP请求头的字段 (全名应该是"Security Fetch Destination",意思是安全获取目标) ,用于指示浏览器请求的目标资源类型以及请求的目的和处理方式。该字段通常由浏览器自动生成,并在发送请求时包含在HTTP请求中。它有助于服务器和浏览器之间更好地理解请求的目的和处理方式。 Sec-Fetch-Dest字段值 Sec-…...
塵風- 0
- 0
- 2k
-
Python 将字符串转为字典
Python 将字符串转为字典可以使用ast模块中的literal_eval方法或者是json模块、eval方法。下面分享下这三种方法的示例代码: 注:虽然上面列举了三个在Python中可以实现将字符串转为字典的方法,但是推荐使用ast模块中的literal_eval方法进行,具体的原因会在下述说明,下面是详细的代码: 通过 json 来转换 我们可以直接使用json模块中的loads函数对字符串…...
塵風- 0
- 0
- 674
-
百度已收录404链接自动提取软件+使用教程-免费
软件介绍 现在有非常多的网站被黑然后搜索被搜索引擎收录了色情赌博一类的垃圾信息,我们站点被黑处理完成后把这些垃圾信息链接设置为404就需要对这些已经收录的链接进行提取,然后提交到百度资源平台删除,但是对于大部分没有技术基础的小伙伴来说,都只能一个个手动去复制,这样太过于麻烦了,所有开发了这个软件分享给大家。 关于处理流程的教程,我之前也分享了相关文章,如果你有需要,也可以查看: 网站被黑,被搜索引…...
塵風- 0
- 6
- 993
-
python错误: Object of type * is not JSON serializable解决
Object of type * is not JSON serializable错误是我在写爬虫的时候遇到的一个问题 引起函数 json.dumps()函数引起的 在处理数据的时候使用json.dumps()函数将dict(字典)数据类型转化为json数据的时候,促发了这个错误。 原因: 原因是转化的dict(字典)数据中有value数据没处理好,字典的值中包含了generator、byte(字…...
塵風- 0
- 0
- 6k
-
Python selenium 报错: DeprecationWarning: executable_path has been deprecated, please pass in a Service object *…解决
错误描述: DeprecationWarning: executable_path has been deprecated, please pass in a Service object 触发原因 DeprecationWarning 类型的警告错误:大多是属于版本已经更新,所使用的方法已经过时。 之所以出现这样的错误 是因为executable_path 被重构到了 Service 函数里,W…...
塵風- 0
- 0
- 2.8k
-
PyCharm中文指南、教程-百度云免费
今天分享的PyCharm中文文档的相关资源,有相关接触的可以考虑收藏,熟悉编辑器可以有效的帮助我们提高我们的编程效率,在方便新手学习使用的同时在使用中遇到各种Pycharm编辑器相关问题,可以查找帮助解决,以备不时之需! PyCharm是什么,这里就不扯了,点进这里来的我想到都知道PyCharm是什么,文章下面也有一点网上复制过来的pycharm简介,之前也分享过:Pycharm安装详细教程(非常…...
塵風- 0
- 0
- 2.1k
-
Python爬虫:设置随机User-Agent模块fake-useragent
Python爬虫:设置随机User-Agent模块fake-useragent介绍和使用。 模块简介 GitHub地址 https://github.com/hellysmile/fake-useragent UA数据来源 目前1.5x的版本我看GitHub介绍数据是从 https://user-agents.net/ 下载的。下面的使用的部分示例是1.2或者1.3版本新增的功…...
塵風- 0
- 0
- 3.3k














