scrapy项目启动

发表于 2023-12-28 分类于爬虫
本文字数： 279 阅读时长 ≈ 1 分钟

Scrapy是一个用于爬取网站数据的Python框架，它基于Twisted异步网络库。以下是使用Scrapy创建爬虫的基本步骤：

阅读全文 »

xpathnote

发表于 2023-11-07 分类于爬虫
本文字数： 464 阅读时长 ≈ 2 分钟

XPath（XML Path Language）是一种用于在 XML 文档中定位和选择数据的查询语言。以下是一些常用的 XPath 语法和示例：

选择元素：
- /element：选择根元素下名为 “element” 的元素。
- //element：选择文档中所有名为 “element” 的元素。
选择属性：
- /element/@attribute：选择根元素下名为 “element” 的元素的 “attribute” 属性。
- //element/@attribute：选择文档中所有名为 “element” 的元素的 “attribute” 属性。
  阅读全文 »

xmlnote

发表于 2023-11-02 更新于 2023-11-07 分类于爬虫
本文字数： 81 阅读时长 ≈ 1 分钟

在 XML 中，一些字符拥有特殊的意义。

如果您把字符 “<” 放在 XML 元素中，会发生错误，这是因为解析器会把它当作新元素的开始。

在 XML 中，有 5 个预定义的实体引用：

&lt;	<	
&gt;	>(合法但请这么用)
&amp;	&	
&apos;	'	
&quot;	"

xpath

xpath常用语法

javacommand

发表于 2023-10-31 更新于 2023-11-07 分类于 java
本文字数： 316 阅读时长 ≈ 1 分钟

IntelliJ IDEA提供了许多常用的代码模板快捷键，以帮助程序员更快地编写代码。
以下是一些常用的代码模板快捷键和相应的功能：

psvm：生成主函数（public static void main(String[] args)）。
sout：生成System.out.println()语句。
soutv：生成System.out.println(variable)，其中variable是光标所在位置的变量。

阅读全文 »

java编码错误

发表于 2023-10-17 更新于 2023-11-07 分类于 java
本文字数： 279 阅读时长 ≈ 1 分钟

跟着黑马程序员敲javacode的时候出现了一个编译错误,这里记录一下

ScannerTest.java源代码:

import java.util.Scanner;
public class ScannerTest{

    public static void main(String[] args) {   
   
        Scanner var = new Scanner(System.in);
        System.out.println("输入两个数字:");
        int a = var.nextInt();
        int b = var.nextInt();
        int c= a+b; 
        System.out.println(c);
        var.close();
    }
}

cmd javac时报错:

ScannerTest.java:1: 错误: 需要 class、interface、enum 或 record
锘縤mport java.util.Scanner;

阅读全文 »

httpnote

发表于 2023-10-15 更新于 2023-11-07 分类于 net
本文字数： 1.1k 阅读时长 ≈ 4 分钟

attach一段对http的科学解释:

HTTP（Hypertext Transfer Protocol）是一种用于在计算机之间传输超文本（Hypertext）文档的应用层协议。它是构建在TCP（Transmission Control Protocol）之上的协议，用于实现在Web上的数据传输。HTTP是Web的基础，它定义了客户端和服务器之间的通信规则，使我们能够在浏览器中浏览网页、发送和接收数据等。

主要定义的事情就是:
client–>(user agent用户代理/proxy代理)发送请求–>server
client<–(user agent用户代理/proxy代理)发送请求<–server

基本介绍

阅读全文 »

dos

发表于 2023-08-01 更新于 2023-11-07 分类于 cmd
本文字数： 58 阅读时长 ≈ 1 分钟

dos命令

阅读全文 »

jsnote

发表于 2023-07-25 更新于 2023-11-07 分类于 hcj
本文字数： 483 阅读时长 ≈ 2 分钟

在学php表单验证的时候看见了一长串乱码（准确来说不是乱码，是我看不懂）

/\b(?:(?:https?|ftp):\/\/|www\.)[-a-z0-9+&@#\/%?=~|!:,.;]*[-a-z0-9+&@#\/%=~|]/i

然后搜索才发现这是js里的正则表达式的内容，囫囵吞枣果然不行，所以稍微记一下，做个纪念

阅读全文 »

cssnote

发表于 2023-07-11 更新于 2023-11-07 分类于 hcj
本文字数： 84 阅读时长 ≈ 1 分钟

这里记录一些css笔记，因为本人记不住

阅读全文 »

hello

发表于 2023-07-11 分类于 nonsense
本文字数： 33 阅读时长 ≈ 1 分钟

Hello

welcome to sm1ld’s blog

This is a blog that took me about eight hours to build. I wish I can learn more and achieve my goal as soon as possible.