开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

当我试图从登录表单后面抓取文本时，为什么会出现[]？

当你试图从登录表单后面抓取文本时出现"[]"，可能有以下几个原因：

定位问题：在抓取文本之前，首先需要确定要抓取的元素的正确位置。可能是因为没有正确定位到目标元素，或者目标元素的位置发生了变化导致无法抓取到文本。可以通过查看HTML代码或者使用开发者工具来确认元素的位置。
动态加载问题：有些网页内容是通过Ajax或JavaScript动态加载的，可能在页面刚加载时并没有出现目标文本。你可以尝试等待一段时间，或者使用相关的工具或库来处理动态加载内容。
权限问题：如果目标文本位于需要登录才能访问的页面上，可能是因为你没有进行正确的登录导致无法获取到文本。确保你已经成功登录并具有访问目标页面的权限。
安全机制：有些网站为了防止恶意抓取或爬虫，会设置一些安全机制，如验证码、反爬虫策略等。这些机制可能会导致你无法直接抓取文本。你可以尝试使用相关的工具或库来绕过这些安全机制。

总结起来，导致从登录表单后面抓取文本出现"[]"的原因可能包括定位问题、动态加载问题、权限问题和安全机制等。针对具体情况，可以结合使用前端开发、后端开发、软件测试、网络安全等相关知识和技术进行调试和解决。

相关搜索:当我试图从入口对象获取文本时，为什么会出现这个错误: CustomClass实例没有' entry‘属性？当我从onsubmit返回false时,为什么我的HTML表单仍然会提交？当我试图在用户的日历上创建订阅时，为什么会从图形api得到禁止的响应？为什么当我把flex-grow= 1从文本中移开时，图片(来自fontawesome)会从文本中移开？当我在文本框中键入内容时，为什么会从文本框中删除字符？服务器子账号 fip服务器负载均衡主备防盗报警系列服务器安全组

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

独家 | 手把手教你如何用Python从PDF文件中导出数据（附链接）

有很多时候你会想用Python从PDF中提取数据，然后将其导出成其他格式。不幸的是，并没有多少Python包可以很好的执行这部分工作。在这篇贴子中，我们将探讨多个不同的Python包，并学习如何从PDF中提取某些图片。尽管在Python中没有一个完整的解决方案，你还是应该能够运用这里的技能开始上手。提取出想要的数据之后，我们还将研究如何将数据导出成其他格式。

03

某吧爬虫第一步

爬虫很多，可以试着自己整一个。三言两语，走出第一步。首先浏览器打开某吧登录页面 http://www.******.com/member.php?mod=logging&action=login

02

Python爬虫入门这一篇就够了

所谓爬虫，就是按照一定的规则，自动的从网络中抓取信息的程序或者脚本。万维网就像一个巨大的蜘蛛网，我们的爬虫就是上面的一个蜘蛛，不断的去抓取我们需要的信息。

01

Python爬虫入门这一篇就够了「建议收藏」

所谓爬虫，就是按照一定的规则，自动的从网络中抓取信息的程序或者脚本。万维网就像一个巨大的蜘蛛网，我们的爬虫就是上面的一个蜘蛛，不断的去抓取我们需要的信息。

01

PHP抓取采集类snoopy

snoopy是一个php类，用来模仿web浏览器的功能，它能完成获取网页内容和发送表单的任务。官方网站 http://snoopy.sourceforge.net/ Snoopy的一些功能特点：抓取网页的内容 fetch() 抓取网页的文本内容 (去除HTML标签) fetchtext() 抓取网页的链接，表单 fetchlinks() fetchform() 支持代理主机支持基本的用户名/密码验证支持设置 user_agent, referer(来路), cookies 和 header conte

08

php使用Snoopy类

这是为了抓取网页的内容而使用的方法。$URI参数是被抓取网页的URL地址。抓取的结果被存储在 $this->results 中。

03

火车头采集器在线发布模块制作教程视频_火车头采集器收费与免费的区别

在线发布模块，就是采集器通过网站后台，发布文章，也就是说，把你手动在网站后台发布文章的整个过程包含登录网站后台，选择栏目，到后面的发布文章，这些步骤写到采集器里面，就是在

01

《Learning Scrapy》（中文版）第5章快速构建爬虫一个具有登录功能的爬虫使用JSON APIs和AJAX页面的爬虫在响应间传递参数一个加速30倍的项目爬虫可以抓取Excel文件的爬虫总结

第3章中，我们学习了如何从网页提取信息并存储到Items中。大多数情况都可以用这一章的知识处理。本章，我们要进一步学习抓取流程UR2IM中两个R，Request和Response。一个具有登录功能的爬虫你常常需要从具有登录机制的网站抓取数据。多数时候，网站要你提供用户名和密码才能登录。我们的例子，你可以在http://web:9312/dynamic或http://localhost:9312/dynamic找到。用用户名“user”、密码“pass”登录之后，你会进入一个有三条房产链接的网页。现在的问

08

snoopy（强大的PHP采集类）详细介绍

Snoopy是一个php类，用来模拟浏览器的功能，可以获取网页内容，发送表单，可以用来开发一些采集程序和小偷程序，本文章详细介绍snoopy的使用教程。

02

2.3K Star开源一个轻量级的Windows OCR 工具,启动速度快,可离线使用,【绝对好东西】

05

Qt 单行文本控件 QLineEdit

QLineEdit 控件内容不是很多，如设置为密码显示模式、设置边距、设置匹配列表等等。没有什么特别特殊的功能，我们将所有代码先写进来，然后一点一点的说具体都起到了什么作用。

02

玩大数据一定用得到的18款Java开源Web爬虫

网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

04

Chrome，yyds！

相信在座大部分从事软件开发工作的同学都与我一样，每天在 PC 端上使用最多的几类产品，无非是浏览器、代码编辑器与命令行终端。

03

Python 图形化界面基础篇：添加文本框（ Entry ）到 Tkinter 窗口

在 Python 图形化界面基础篇的本篇文章中，我们将聚焦于 Tkinter 中如何添加文本框（ Entry ）。文本框是一种常见的 GUI 元素，用于接收用户输入的文本信息。无论是创建登录界面、搜索框还是数据输入表单，文本框都是不可或缺的。在这篇文章中，我们将详细解释如何在 Tkinter 窗口中添加文本框，以及如何获取和处理用户输入的文本信息。

04

无代码Web UI自动化工具Automa初体验

今天得空看了看论坛，发现有人在推广一个Chrome浏览器上的Web UI自动化工具，定位是做自动化简单重复性任务。

01

深入使用探讨 PuppeteerSharp 抓取 LinkedIn 页面的步骤

LinkedIn是全球最大的职业社交平台之一，拥有大量的用户和企业信息。用户可以在上面建立个人职业资料、与其他用户建立联系、分享职业经验和获取行业动态。由于其庞大的用户群体和丰富的数据资源，开发者们对于获取LinkedIn数据的需求日益增长。

02

Java Web之Servlet获取表单值

Java Web开发中，最常用的就是在后台获取前台的参数，经典的案例就是 JSP 表单传值到后台的 Servlet，然后在 doGet 或者 doPost 中获取，这里把常用参数获取总结一下一个典型的jsp表单如下 <form action="WorldServlet" method="post" enctype="multipart/form-data"> 用户名:<input type="text" name="username"/>
密码:<input ty

04

🧭 Web Scraper 学习导航

日常学习工作中，我们多多少少都会遇到一些数据爬取的需求，比如说写论文时要收集相关课题下的论文列表，运营活动时收集用户评价，竞品分析时收集友商数据。

04

SEO技巧汇集

每个人都喜欢好用的技巧，对吗？这里有55个用于搜索引擎优化的小技巧，甚至你的老妈用起来都易如反掌。哦，不是我的老妈，但你明白我的意思。这意味着网页设计师和SEO新手中大部分人都能迅速上手，没有任何困难。

02

前端基础-Ajax简介

我们平常上网，不管是注册账号，还是浏览网页，其本质就是通过客户端向服务器发送请求，服务器接到请求后返回处理后的数据给客户端；在我们之前学习代码中，向服务器提交数据典型的应用是就是 form 表单，其中的 action 就是我们提交数据的服务器端地址；

02

要找房，先用Python做个爬虫看看

再过几个月我就得离开我租的公寓去找一个新的了。尽管这段经历可能会很痛苦，特别是在房地产泡沫即将出现时，我决定将其作为提高Python技能的另一种激励！当一切完成时，我想做到两件事:

03

TextGrabber重大更新，识别文字并实时离线翻译，支持中文

当你想用机器翻译时，也许会立刻打开谷歌翻译。但是，尽管经过多年的开发和技术收购，它仍然存在诸多问题。例如，如果你在陌生国家没有互联网连接，并且未提前下载该语言，会发生什么情况？而从图像翻译文本的方法更是缓慢。

04

python和php哪个更适合写爬虫

相比与其他静态编程语言，如java，c#，C++，python抓取网页文档的接口更简洁；相比其他动态脚本语言，如perl，shell，python的urllib2包提供了较为完整的访问网页文档的API。（当然ruby也是很好的选择）

01

从编程小白到全栈开发：数据 (1)

有些事情时刻都在发生，但是我们通常很少意识到它们的存在。比如，当我们使用网页或移动应用的时候，其实在不断的产生着数据：注册一个网站或app的账号、发一条微博、写一篇简书文章、提一个知乎问题、亦或是给别人点了一个赞，甚至，只是你的鼠标或手指在界面上随意的滑来点去的。这些数据都可能被通过网络发送到网站或app的服务端，被存储起来以供后续的处理和使用。

03

Java之Reader：解析字符流，读取文件内容不再是难事！

今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。

VBA登录抓取网络数据

受限在网页上右击查看网页源代码，按Ctrl+F搜索form表单，找到post的网址（或者自身就是post的网址），然后找到账号和密码的name，用来做VBA里Send的Data，这样登录完就可以直接post数据获取网址获取网页数据了，这里举例代码最后是返回文本，可以用left和right配合instr、invinstr、len等反复截取文本，或者直接用正则表达式。 Set http = CreateObject("Msxml2.ServerXMLHTTP") http.Open "post", "登录网址

04

解决SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xa3 in position

在Python编程过程中，我们有时会遇到SyntaxError错误，特别是在处理文本数据时。其中一个常见的SyntaxError错误是(unicode error) 'utf-8' codec can't decode byte 0xa3 in position 15: invalid start。这个错误表示Python无法解码特定字节。这篇博客将为你介绍这个错误的原因，并提供一些可能的解决方案。

01

一篇文学会商用可编辑问卷表单制作【iVX 十二】

在 iVX 快速教程中，我们使用一个公共表单项目作为 WebApp 应用的演示说明。公共表单项目可以用于企业内部或一个问卷公共平台做问卷调查，用户可以自由的设置表单元素以及样式，并且可以手动设置表单结束下载填写问卷后的调查数据。

03

scrapy实战|模拟登录人人网实战

前面我们学习了scrapy并且实战了爬取当当网的数据，相信大家对scrapy的基本操作还是掌握的OK的了，如果没看前面文章的朋友可以去看一看。今天我们继续深入一下scrapy框架，用scrapy框架来登录人人网。

02

什么是ios？

<input placeholder="搜索" type="search" />

01

session与cookie会话机制总结

PHP session 与 cookie 区别 session 与 cookie 是什么? session 与 cookie 属于一种会话控制技术.常用在身份识别，登录验证，数据传输等.举个例子，就像

01

Python爬虫之基本原理

网络爬虫（Web crawler），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，它们被广泛用于互联网搜索引擎或其他类似网站，可以自动采集所有其能够访问到的页面内容，以获取或更新这些网站的内容和检索方式。从功能上来讲，爬虫一般分为数据采集，处理，储存三个部分。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂，需要根据一定的网页分析算法过滤与主题无关的链接，保留有用的链接并将其放入等待抓取的URL队列。然后，它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL，并重复上述过程，直到达到系统的某一条件时停止。另外，所有被爬虫抓取的网页将会被系统存贮，进行一定的分析、过滤，并建立索引，以便之后的查询和检索；对于聚焦爬虫来说，这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。

03

Flask 入门系列教程（四）

在 WEB 应用当中，表单是和用户交互的最常见的方式之一，学习好表单，是非常重要的，用户登录注册、撰写文章等等操作都离不开表单的功能。表单的处理并不简单，除了要创建表单，还需要做相关的验证，还有错误提示等等。这些操作如果都从头开始编写，那么就太复杂了，不过幸运的是，我们有强大的 WTForms 帮助我们解决。

03

Adobe宣布了其人工智能平台Adobe Sensei的新功能

Adobe Sensei是Adobe公司推出的一个基于深度学习和机器学习的人工智能平台，可以应用在Photoshop、lightroom等软件中登录，登录后Adobe Sensei可以帮助设计师辅助修

06

使用vba做一个正则表达式提取文本工具

测试中经常会遇到对数据的处理，比如我要删除某些特定数据，数据源是从网页请求中抓取，这时候可能复制下来一大堆内容，其中我们只需要特定的某些部分，笔者通常做法是拷贝到notepad++中处理，结合RegTester工具，但是RegTest需要导出匹配数据，不能直接拷贝，稍微麻烦了一点点......于是想用vba写一个正则表达式提取工具好了，又不花时间。（晕，刚想起来其实会有在线工具的，比如：http://tool.oschina.net/regex/），虽然找到了在线工具，还是说一下自己做的这个吧~~~

03

【技能】Python爬虫和情感分析简介

这篇短文的目的是分享我这几天里从头开始学习Python爬虫技术的经验，并展示对爬取的文本进行情感分析(文本分类)的一些挖掘结果。不同于其他专注爬虫技术的介绍，这里首先阐述爬取网络数据动机，接着以豆瓣影评为例介绍文本数据的爬取，最后使用文本分类的技术以一种机器学习的方式进行情感分析。由于内容覆盖面巨大，无法详细道尽，这篇文章旨在给那些对相关领域只有少量或者没有接触的人一个认知的窗口，希望激发读者自行探索的兴趣。以下的样本代码用Pyhton写成，主要使用了scrapy， sklearn两个库。所以，什么

04

OCR Tool PRO Mac(OCR光学字符识别)

如何提取图片中的文字？推荐这款OCR光学字符识别工具OCR Tool PRO，以卓越的准确性和速度从图像和 PDF 中提取文本。抓取图像 + PDF + 抓取屏幕区域 + 从 iPhone/iPad 捕获图像 + 设置 + OCR + 将文本复制到剪贴板 + 使用文本文件和 PDF 导出！

02

session与cookie详解

session与cookie是什么? session与cookie属于一种会话控制技术.常用在身份识别，登录验证，数据传输等.举个例子，就像我们去超市买东西结账的时候，我们要拿出我们的会员卡才会获取优

02

如何利用Selenium实现数据抓取

网络数据抓取在当今信息时代具有重要意义，而Python作为一种强大的编程语言，拥有丰富的库和工具来实现网络数据的抓取和处理。本教程将重点介绍如何使用Selenium这一强大的工具来进行网络数据抓取，帮助读者更好地理解和掌握Python爬虫技术。

01

如何ASP.NET Core Razor中处理Ajax请求

在ASP.NET Core Razor(以下简称Razor)刚出来的时候,看了一下官方的文档,一直没怎么用过。今天闲来无事,准备用Rozor做个项目熟练下,结果写第一个页面就卡住了。。折腾半天才搞好,下面给大家分享下解决方案。先来给大家简单介绍下Razor Razor Pages是ASP.NET Core的一项新功能，可以使编页面的编程方案更简单，更高效。Razor页面使用处理程序方法来处理传入的HTTP请求（GET / POST / PUT / Delete）。这些类似于ASP.NET MVC或WEB

09

表单文本框的使用(一) 选择文本

input和textarea都会在value属性保存自己的内容，可设置和读取文本框的值。在textarea中设置value属性无效

02

钓鱼网站检测【机器学习】

本文介绍如何使用机器学习技术检测一个URL是否是钓鱼网站，内容包括数据抓取、特征选择和模型训练等。

04

论如何优雅的将自己的服务接入学校的 CAS 统一认证系统

前几天跟同学聊起一个希望建立校友交流论坛的想法，讨论之中有人表示如果能用学校的统一认证系统登录的话，就可以大大简化注册门槛。于是我开始研究学校的统一认证系统起来……

07

filereaderror_InputStreamReader

在使用字符流读取文本文件时（且不使用包装流时），有两种类提供读取文件方法，分别是InputStreamReader和FileReader，后者为前者子类。

02

Python爬虫自学系列（四）

上一篇讲的是爬虫中的缓存，相对来说比较难一点，而且不是直接面向网页的，所以可能会比较无聊一点吧。

01

Qt Style Sheet实践（四）：行文本编辑框QLineEdit及自动补全

导读行文本输入框在用于界面的文本输入，在WEB登录表单中应用广泛。一般行文本编辑框可定制性较高，既可以当作密码输入框，又可以作为文本过滤器。QLineEdit本身使用方法也很简单，无需过多的设置就能进行使用。于是这篇博文主要讲解如何对行文本编辑框QLineEdit进行定制。基本定制为了简化工作，还是如同前面所说的，直接用Qt Designer拖一个QLineEdit进行编辑。代码部分不太多： ui.lineEdit->setPlaceholderText(QStringLite

08

bootstrap+django搭建防跨站点攻击登陆系统

1.登录：分为get与post两种情况，post即为提交请求，此时进行数据验证，使用django自带的抽象authentication类，使用login和logout类进行登入与登出。

02

原生js获得八种方式,事件操作

08.17自我总结关于js 一.原生js获得八种方式通过ID获取（getElementById）通过name属性（getElementsByName）通过标签名（getElementsByTagName）通过类名（getElementsByClassName）通过选择器获取一个元素（querySelector）通过选择器获取一组元素（querySelectorAll）获取html的方法（document.documentElement） document.documentElement是专门

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭