# curl 利用URL规则在命令行下工作的文件传输工具。**curl命令** 是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具。作为一款强力工具,curl支持包括HTTP、HTTPS、ftp等众多协议,还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。做网页处理流程和数据检索自动化,curl可以祝一臂之力。 ## 语法 ```bash curl [选项][参数] ``` ## 选项 | -a/—append | 上传文件时,附加到目标文件 | | -------------------------------------- | --------------------------------------------------------- | | -A/—user-agent | 设置用户代理发送给服务器 | | -anyauth | 可以使用“任何”身份验证方法 | | -b/—cookie | cookie字符串或文件读取位置 | | —basic | 使用HTTP基本验证 | | -B/—use-ascii | 使用ASCII /文本传输 | | -c/—cookie-jar | 操作结束后把cookie写入到这个文件中 | | -C/—continue-at | 断点续传 | | -d/—data | HTTP POST方式传送数据 | | —data-ascii | 以ascii的方式post数据 | | —data-binary | 以二进制的方式post数据 | | —negotiate | 使用HTTP身份验证 | | —digest | 使用数字身份验证 | | —disable-eprt | 禁止使用EPRT或LPRT | | —disable-epsv | 禁止使用EPSV | | -D/—dump-header | 把header信息写入到该文件中 | | —egd-file | 为随机数据(SSL)设置EGD socket路径 | | —tcp-nodelay | 使用TCP_NODELAY选项 | | -e/—referer | 来源网址 | | -E/—cert | 客户端证书文件和密码 (SSL) | | —cert-type | 证书文件类型 (DER/PEM/ENG) (SSL) | | —key | 私钥文件名 (SSL) | | —key-type | 私钥文件类型 (DER/PEM/ENG) (SSL) | | —pass | 私钥密码 (SSL) | | —engine | 加密引擎使用 (SSL). “—engine list” for list | | —cacert | CA证书 (SSL) | | —capath | CA目录 (made using c_rehash) to verify peer against (SSL) | | —ciphers | SSL密码 | | —compressed | 要求返回是压缩的形势 (using deflate or gzip) | | —connect-timeout | 设置最大请求时间 | | —create-dirs | 建立本地目录的目录层次结构 | | —crlf | 上传是把LF转变成CRLF | | -f/—fail | 连接失败时不显示http错误 | | —ftp-create-dirs | 如果远程目录不存在,创建远程目录 | | —ftp-method [multicwd/nocwd/singlecwd] | 控制CWD的使用 | | —ftp-pasv | 使用 PASV/EPSV 代替端口 | | —ftp-skip-pasv-ip | 使用PASV的时候,忽略该IP地址 | | —ftp-ssl | 尝试用 SSL/TLS 来进行ftp数据传输 | | —ftp-ssl-reqd | 要求用 SSL/TLS 来进行ftp数据传输 | | -F/—form | 模拟http表单提交数据 | | —form-string | 模拟http表单提交数据 | | -g/—globoff | 禁用网址序列和范围使用{}和[] | | -G/—get | 以get的方式来发送数据 | | -H/—header | 自定义头信息传递给服务器 | | —ignore-content-length | 忽略的HTTP头信息的长度 | | -i/—include | 输出时包括protocol头信息 | | -I/—head | 只显示请求头信息 | | -j/—junk-session-cookies | 读取文件进忽略session cookie | | —interface | 使用指定网络接口/地址 | | —krb4 | 使用指定安全级别的krb4 | | -k/—insecure | 允许不使用证书到SSL站点 | | -K/—config | 指定的配置文件读取 | | -l/—list-only | 列出ftp目录下的文件名称 | | —limit-rate | 设置传输速度 | | —local-port | 强制使用本地端口号 | | -m/—max-time | 设置最大传输时间 | | —max-redirs | 设置最大读取的目录数 | | —max-filesize | 设置最大下载的文件总量 | | -M/—manual | 显示全手动 | | -n/—netrc | 从netrc文件中读取用户名和密码 | | —netrc-optional | 使用 .netrc 或者 URL来覆盖-n | | —ntlm | 使用 HTTP NTLM 身份验证 | | -N/—no-buffer | 禁用缓冲输出 | | -o/—output | 把输出写到该文件中 | | -O/—remote-name | 把输出写到该文件中,保留远程文件的文件名 | | -p/—proxytunnel | 使用HTTP代理 | | —proxy-anyauth | 选择任一代理身份验证方法 | | —proxy-basic | 在代理上使用基本身份验证 | | —proxy-digest | 在代理上使用数字身份验证 | | —proxy-ntlm | 在代理上使用ntlm身份验证 | | -P/—ftp-port | 使用端口地址,而不是使用PASV | | -q | 作为第一个参数,关闭 .curlrc | | -Q/—quote | 文件传输前,发送命令到服务器 | | -r/—range | 检索来自HTTP/1.1或FTP服务器字节范围 | | —range-file | 读取(SSL)的随机文件 | | -R/—remote-time | 在本地生成文件时,保留远程文件时间 | | —retry | 传输出现问题时,重试的次数 | | —retry-delay | 传输出现问题时,设置重试间隔时间 | | —retry-max-time | 传输出现问题时,设置最大重试时间 | | -s/—silent | 静默模式。不输出任何东西 | | -S/—show-error | 显示错误 | | —socks4 | 用socks4代理给定主机和端口 | | —socks5 | 用socks5代理给定主机和端口 | | —stderr | | | -t/—telnet-option | Telnet选项设置 | | —trace | 对指定文件进行debug | | —trace-ascii | Like —跟踪但没有hex输出 | | —trace-time | 跟踪/详细输出时,添加时间戳 | | -T/—upload-file | 上传文件 | | —url | Spet URL to work with | | -u/—user | 设置服务器的用户和密码 | | -U/—proxy-user | 设置代理用户名和密码 | | -w/—write-out [format] | 什么输出完成后 | | -x/—proxy | 在给定的端口上使用HTTP代理 | | -X/—request | 指定什么命令 | | -y/—speed-time | 放弃限速所要的时间,默认为30 | | -Y/—speed-limit | 停止传输速度的限制,速度时间 | ## 实例 **文件下载** curl命令可以用来执行下载、发送各种HTTP请求,指定HTTP头部等操作。如果系统没有curl可以使用`yum install curl`安装,也可以下载安装。curl是将下载文件输出到stdout,将进度信息输出到stderr,不显示进度信息使用`--silent`选项。 ```bash curl URL --silent ``` 这条命令是将下载文件输出到终端,所有下载的数据都被写入到stdout。 使用选项`-O`将下载的数据写入到文件,必须使用文件的绝对地址: ```bash curl http://example.com/text.iso --silent -O ``` 选项`-o`将下载数据写入到指定名称的文件中,并使用`--progress`显示进度条: ```bash curl http://example.com/test.iso -o filename.iso --progress ######################################### 100.0% ``` **不输出错误和进度信息** `-s` 参数将不输出错误和进度信息。 ```bash curl -s https://www.example.com # 上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。 ``` 如果想让 curl 不产生任何输出,可以使用下面的命令。 ```bash curl -s -o /dev/null https://google.com ``` **断点续传** curl能够从特定的文件偏移处继续下载,它可以通过指定一个便宜量来下载部分文件: ```bash curl URL/File -C 偏移量 #偏移量是以字节为单位的整数,如果让curl自动推断出正确的续传位置使用-C -: curl -C -URL ``` **使用curl设置参照页字符串** 参照页是位于HTTP头部中的一个字符串,用来表示用户是从哪个页面到达当前页面的,如果用户点击网页A中的某个连接,那么用户就会跳转到B网页,网页B头部的参照页字符串就包含网页A的URL。 使用`--referer`选项指定参照页字符串: ```bash curl --referer http://www.google.com http://wangchujiang.com ``` **用curl设置用户代理字符串** 有些网站访问会提示只能使用IE浏览器来访问,这是因为这些网站设置了检查用户代理,可以使用curl把用户代理设置为IE,这样就可以访问了。使用`--user-agent`或者`-A`选项: ```bash curl URL --user-agent "Mozilla/5.0" curl URL -A "Mozilla/5.0" ``` 其他HTTP头部信息也可以使用curl来发送,使用`-H`“头部信息” 传递多个头部信息,例如: ```bash curl -H "Host:wangchujiang.com" -H "accept-language:zh-cn" URL ``` **curl的带宽控制和下载配额** 使用`--limit-rate`限制curl的下载速度: ```bash curl URL --limit-rate 50k ``` 命令中用k(千字节)和m(兆字节)指定下载速度限制。 使用`--max-filesize`指定可下载的最大文件大小: ```bash curl URL --max-filesize bytes ``` 如果文件大小超出限制,命令则返回一个非0退出码,如果命令正常则返回0。 ```bash curl --limit-rate 200k https://example.com # 上面命令将带宽限制在每秒 200K 字节。 ``` **用curl进行认证** 使用curl选项 -u 可以完成HTTP或者FTP的认证,可以指定密码,也可以不指定密码在后续操作中输入密码: ```bash curl -u user:pwd http://wangchujiang.com curl -u user http://wangchujiang.com ``` **只打印响应头部信息** 通过`-I`或者`-head`可以只打印出HTTP头部信息: ```bash ```