Scrapy
是一个用于爬取网站数据的Python
框架,它基于Twisted
异步网络库。以下是使用Scrapy
创建爬虫的基本步骤:
xpathnote
XPath(XML Path Language)是一种用于在 XML 文档中定位和选择数据的查询语言。以下是一些常用的 XPath 语法和示例:
选择元素:
/element
:选择根元素下名为 “element” 的元素。//element
:选择文档中所有名为 “element” 的元素。
选择属性:
/element/@attribute
:选择根元素下名为 “element” 的元素的 “attribute” 属性。//element/@attribute
:选择文档中所有名为 “element” 的元素的 “attribute” 属性。
xmlnote
在 XML 中,一些字符拥有特殊的意义。
如果您把字符 “<” 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。
在 XML 中,有 5 个预定义的实体引用:
< <
> >(合法但请这么用)
& &
' '
" "
xpath
javacommand
IntelliJ IDEA提供了许多常用的代码模板快捷键,以帮助程序员更快地编写代码。
以下是一些常用的代码模板快捷键和相应的功能:
psvm
:生成主函数(public static void main(String[] args))。sout
:生成System.out.println()
语句。soutv
:生成System.out.println(variable)
,其中variable
是光标所在位置的变量。
java编码错误
跟着黑马程序员敲javacode的时候出现了一个编译错误,这里记录一下
ScannerTest.java源代码:
import java.util.Scanner;
public class ScannerTest{
public static void main(String[] args) {
Scanner var = new Scanner(System.in);
System.out.println("输入两个数字:");
int a = var.nextInt();
int b = var.nextInt();
int c= a+b;
System.out.println(c);
var.close();
}
}
cmd javac时报错:
ScannerTest.java:1: 错误: 需要 class、interface、enum 或 record
锘縤mport java.util.Scanner;
httpnote
attach一段对http的科学解释:
HTTP(Hypertext Transfer Protocol)是一种用于在计算机之间传输超文本(Hypertext)文档的应用层协议。它是构建在TCP(Transmission Control Protocol)之上的协议,用于实现在Web上的数据传输。HTTP是Web的基础,它定义了客户端和服务器之间的通信规则,使我们能够在浏览器中浏览网页、发送和接收数据等。
主要定义的事情就是:
client–>(user agent用户代理/proxy代理)发送请求–>server
client<–(user agent用户代理/proxy代理)发送请求<–server
基本介绍
dos
dos命令
jsnote
在学php表单验证的时候看见了一长串乱码(准确来说不是乱码,是我看不懂)
/\b(?:(?:https?|ftp):\/\/|www\.)[-a-z0-9+&@#\/%?=~|!:,.;]*[-a-z0-9+&@#\/%=~|]/i
然后搜索才发现这是js里的正则表达式的内容,囫囵吞枣果然不行,所以稍微记一下,做个纪念
cssnote
这里记录一些css笔记,因为本人记不住