热门标签
使用Python检查URL是否由谷歌索引
如何检查URL是否被谷歌使用Python索引谷歌搜索控制台可以帮助您识别您的网站索引网页,但如何识别那些不是 专栏作家Paul Shapiro有这样一个Python剧本。
有三个有机搜索的主要组成部分:爬行,索引和排名。当谷歌和其他搜索引擎找到你网站时,它会抓取找到的所有链接。然后,它找到的信息被输入到搜索引擎索引中,在索引中,不同的因素决定了对特定搜索查询按什么顺序对哪些页面进行爬网。
作为SEO,我们将把精力集中在排名的组件上,但如果我们能够对您网站上的网页进行爬网和索引,搜索引擎将不会,您也不会收到谷歌的任何流量。显然,为了确保你的网站被正确地爬网和索引,搜索引擎是搜索引擎的重要组成部分。
但如何判断你的网站是否正常呢 如果您有机会转到谷歌搜索控制台,它会告诉您XML网站地图中包含了多少页,以及索引了多少页。不幸的是,它不足以告诉你哪些页面是gt;没有索引。
确保URL已被谷歌索引
为了确保个人的URL已被谷歌索引,我们可以使用“URL”;信息:现状;搜索运算符,如下所示:
信息:http://searchengineland.com/google-downplays-google-algorithm-ranking-update-normal-fluctuations-(258923)周
如果是URL索引,结果会显示URL:判断网页是否是谷歌索引信息运算符
但是,如果不包括URL,谷歌将返回一个错误,表示“否”,URL信息:谷歌如果页面未被PythonURL批量检查指示器状态引用,则返回结果
既然我们知道如何检查,如果aURL被索引,你可能想知道你如何能做这样一个集体。您可以让1000名员工对每个问题进行检查—或者,如果您愿意,您可以使用我的Python解决方案:
使用上面的Python脚本确保已安装Python3。您还将安装beautifulsoup图书馆。为此,请打开终端或命令提示符并执行:
pip安装beautifulsoup4
然后你可以下载脚本到你的电脑上。在与脚本相同的文件夹中,创建文本文件的URL列表,将每个URL列在脚本文件的单独一行Python目录结构上
现在你的脚本已经准备好了,我们需要构建Tor以作为我们的自由代理运行。在Windows中,下载Torexpert bundle。将zip文件夹解压缩到本地目录并运行Tor。执行。随时**小化窗口Tor专家截图
接下来,我们需要安装Polipo、运行Tor和HTTP代理。下载**新的Windows二进制文件(将命名为“0Polipo-1.x.x.x-win32。ziprdquo;)然后解压缩到一个文件夹。
在Polipo文件夹中,创建一个文本文件(例如:configuration)。Txt),内容如下:
socksparentproxy=ldquo;本地:9050quotsocksproxytype = SOCKS5diskcacheroot =ldquo;rdquo;Disablelocalinterface=真
打开命令提示符并浏览到Polipo目录。
运行以下命令:
Polipo.Exe C config.txt运行Tor配置Polipo
此时,我们准备运行实际的Python脚本:
Pythonindexchecker.pyPython脚本配置
脚本提示您指定要检查的每个URL之间等待的秒数。
它还提示您输入文件名(不带扩展名的文件)以将结果输出到CSV。
**后,它需要包含检查列表的文本文件的文件名URL。
输入此信息以运行脚本。
**终结果将是一个CSV文件,可以轻松打开Excel以指定索引页是否正确。输出CSV显示URL索引或否
如果在脚本谷歌中似乎不起作用,则可以插入该插件。在这种情况下,可以随时通过修改后的脚本使用您自己的代理服务:
代理={“httpsrdquo;:ldquo;https://本地:8123,quohttpsrdquo;:ldquo;小时ttp://local: 8123}
结论谷歌索引哪些页面是SEO成功的关键。如果您的网页不在谷歌数据库中,则无法从谷歌获取流量!不幸的是,谷歌很难确定网站指数URL。但只要一点点努力和以上Python脚本,我们就能解决这个问题。
网站内部结构优化,网站如何发布优质产品内容
http://www.ytdns.net/jianzhanzhishi/526.html 使用Python检查URL是否由谷歌索引