Shell Learning
Back to all courses
Shell Learning
6 modules · 14 lessons
Welcome to the Shell training ground!
In today’s world of beautiful graphical interfaces, you might wonder why we still need to learn the command line. The answer is simple: the shell is one of the most powerful tools a developer can master. It allows you to automate tasks, manage files efficiently, and access tools that don’t have graphical interfaces.
This course is designed to bridge the gap in shell usage and help you become a more efficient and confident developer. We’ll cover the fundamentals that will serve you throughout your programming journey, from basic navigation to advanced piping and package management.
We’ll only cover the basics of shell usage - but these basics are enough to cover most of your needs from now through your sophomore year. The shell is a very powerful and complex tool with much more to explore. More importantly, we hope Shell Dojo will help you stay calm when encountering problems in the future, understand how the shell works, and know how to consult documentation and find solutions.
There are 6 modules, click the buttons below or the table of contents to navigate between them.
Intro
Welcome to Shell
Welcome to the Shell learning journey! Before diving into the powerful features of the command line, we'll introduce you to what the shell is and why it matters.
In this module, you will learn the fundamental concepts of the shell, understand why command-line interfaces are still relevant in the modern era, and get familiar with the basic structure of how we'll be learning throughout this course.
在图形界面尚不普及的年代, 人们通过我们称之为 命令行(command line) 的文本界面与计算机交互. 用户输入命令, 这些命令会先由 shell 解释, 然后再转发给底层操作系统.
你可能会好奇: 在 GUI (图形化界面)已经如此普及的今天, 我们为什么还需要学习 shell?
首先, 作为计算机专业的学生, 我们经常需要使用只能通过命令行访问的底层工具. 其次, GUI 往往在批量、自动化任务上不如 CLI 高效, 这就是为什么资深用户更偏爱 CLI(命令行界面)工具的原因.
对许多开发者来说, shell 是一门艺术. 掌握 shell 的使用将显著提升你的效率, 并加深你对计算机系统的理解. 这正是我们开发这门速成课程的原因:
弥合 shell 使用上的差距, 帮助你成为一名更高效更自信的开发者.
在本教程中, 你将学到:
- 文件的读写及权限管理
- 命令行的基本操作
- 管道与相关操作
- 软件包及其管理
当然, shell 的极限远不止这些,更多的操作空间留给诸位自己探索.
本教程将会以关卡的形式展现,当你学习新的 shell 使用技巧或者 CLI 工具后,你需要运用所学的内容去解决挑战,它可能是打开某个已知的文件,亦或是正确地执行某些命令.最后,你会获得 flag, 它长这个样子:
flag{...}
plaintext将它复制到浏览器下方的 “标志” 位置以解锁下一关.
有些关卡有全屏的教程 (就像你现在在阅读的这个); 它会在你登录时自动打开. 如果你不小心退出了, 可以通过运行 /challenge/tutorial
命令重新进入.
在这个入门关卡里, 你的 flag 是:
[flag]
plaintext祝一切顺利, 愿 shell 常伴你左右.
终端的快捷键很多, 虽然你不需要掌握一切快捷键, 但适当使用它们能让你的操作更加顺滑. 在这一个挑战中, 我们会列举终端中常见的快捷键和杂项指令, 帮助你在 Shell Dojo 中获得更好的体验.
⚠️ 由于技术限制, 我们在网站上无法复刻所有终端里的操作. 在不一样的地方我们也会标出, 以免你感到困惑.
🚨 因此, 我们更建议你打开一个 WSL 试试看.
网页上的复制粘贴#
在网页上, 当我们左键拖拽选中一段文字时, 这段文字会自动复制到剪贴板. 你可以用 Ctrl+Shift+V
粘贴. 注意不要使用 Ctrl+V
, 因为它会在终端里输入一个特殊字符.
清屏#
clear
: 当你的终端被输出刷屏时, 你可以输入clear
清屏. 🚨 这个功能希望大家掌握!
在 Windows CMD 中, 这个指令叫做
cls
(Clear Screen).
常用编辑/导航快捷键(Readline, bash/zsh 通用)#
- Ctrl+U: 删除光标到行首
- Ctrl+W: 删除光标前一个词
- Ctrl+L: 清屏 (和
clear
不一样的是, 终端的历史还在. 你可以向上滚动滚轮查看) - Alt+B / Alt+F: 以“词”为单位后退/前进 (很多终端里可以用
Ctrl + ←/→
实现) - Ctrl+Shift+C/V: 复制/粘贴 (很多时候右键也可以复制粘贴, 但是这个因终端而异)
⚠️ 由于技术限制, 网页上无法使用这些指令. 请在 WSL 中尝试.
历史搜索与自动补全#
- 上/下方向键: 历史命令上一条/下一条
- Ctrl+R: 反向增量搜索历史 (重复按继续匹配)
- Ctrl+G: 退出历史搜索
- Tab: 自动补全 (文件名, 命令名等) 🚨 这个功能非常重要! 希望大家多使用.
进程与控制#
- Ctrl+C: 发送 SIGINT, 也就是强制中断当前运行的进程
🚨 这个指令非常重要! 你可以用它来中断一个运行时间过长的命令, 或者一个进入死循环的程序.
以上就是常见的快捷键和杂项指令. 希望你能多加练习, 以提升你的效率!
[flag]
plaintextNavigation
Snooping Around
Now that you understand what the shell is, it's time to learn how to navigate through your file system. This module will teach you the fundamental skills of moving around directories and manipulating files and folders from the command line.
You'll learn how to read and explore your file system, how to create and organize directories, and how to create and modify files. These navigation and file manipulation skills form the foundation of all command-line work.
在 Linux 中有一个很基本的观点: 一切皆文件 (Everything is a file). 掌握了文件系统的操作, 在 Shell 中就有了立足之地.
因此大部分教授 Shell 技巧的教程都会从浏览文件系统开始, 本教程也不例外.
作为文件系统的第一节, 本节会介绍 pwd
, ls
, cd
命令.
pwd: 显示当前工作目录#
每时每刻, 某个 Shell 中的用户都有一个位置. 我们将其称为当前工作目录 (CWD, Current Working Directory), 表示 “你现在在哪里”. 我们可以用 pwd
(Print Working Directory) 命令显示它.
在终端输入:
pwd
plaintext输出: /home/hacker
, 这意味着你现在的工作目录是 /home/hacker
.
值得一提的是, 这里的路径通常以 /...
的形态出现. 在 Linux 中, /
是一个特殊的目录, 它是所有文件和文件夹的根目录 (Root Directory).
我们从根目录开始, 先进入 home
文件夹, 再进入 hacker
文件夹, 这样就到达了 /home/hacker
. 这样的路径被称为绝对路径.
你可以将绝对路径想象成 Windows 资源管理器上方显示的那一串路径. 和 Windows 不同的是, Linux 的路径分隔符是 /
, 而不是 \
.
ls: 列出目录内容#
命令 ls
(List) 可以用来告诉你 “某个目录里都有什么东西”. 它接受一个路径参数, 输出该路径对应文件夹内的内容. 比如, 你如果想要看根目录下的所有文件和文件夹, 你可以输入:
ls /
plaintext这个路径参数是可选的. 如果不写路径, ls
会默认列出当前工作目录的内容.
ls
这个命令有很多参数, 这里列举几个常用的:
-a
: 显示所有文件, 包括隐藏文件 (以.
开头的文件)-l
: 以长列表的形式显示文件的详细信息 (权限, 所有者, 大小, 修改时间等)
打开 wsl, 试试运行 ls -al
. 你看到了什么?
你会发现, 在所有文件夹里有两个特殊的 “文件” .
和 ..
出现在列表中. 它们分别表示当前目录和上一级目录.
例如, 你可以使用 ls ..
来查看上一级目录的内容, 用 ./main
来指示当前目录下的 main
文件.
事实上, 作为路径, 不加任何前缀的
main
很多时候也能指示当前目录的main
文件. 但是在某些情况下, 比如你想要执行当前目录下的main
文件时, 你必须要在终端中输入./main
才能成功执行. 在大多数 shell 的默认设置中,PATH
不包含当前目录.
; 因此执行当前目录下的可执行文件需要显式写./main
, 否则会得到command not found
.
cd: 切换目录#
如果我们需要改变自己的当前位置, 我们需要 cd
(Change Directory) 命令.
cd
命令接受一个路径参数. 如果该路径存在, 那么你的当前工作目录就会被切换到你输入的路径. 如果你直接输入 cd
而不带任何参数, 那么你的工作目录会被切换到你的主目录 (Home Directory).
主目录通常位于 /home/用户名
下, 代表着某个用户的个人空间. 你可以把它想象成 Windows 系统中的 “C:\Users\用户名”. 一般我们会将所有自己的文件都放在主目录下.
你在终端左侧提示栏中看到的 ~
符号, 就是主目录的简写. cd
、cd ~
和 cd /home/用户名
是等价的.
~ $ ls
file-1 folder-1 folder-2
~ $ cd folder-1
~/folder-1 $ pwd
/home/用户名/folder-1
~/folder-1 $ cd ../folder-2
~/folder-2 $ pwd
/home/用户名/folder-2
plaintext在上一个任务中, 你学习了如何在文件系统中导航. 从这个挑战开始, 你会学到如何对于文件系统作出改变.
touch: 创建空文件#
~ $ touch fish
touch: cannot touch 'fish': Permission denied
plaintext在 Linux 中, touch
命令用于创建空文件. 因此, touch fish
不是摸鱼, 而是在当前目录创建一个名为 fish
的空文件. 当然, 若文件已经存在, 它并不会被复写, 而是更新已有文件的修改时间戳.
你可以用 ls
来验证文件是否创建成功.
~ $ ls
some-file
~ $ touch fish
~ $ ls
fish some-file
plaintextnano: 命令行中的文本编辑器#
touch
很好, 但是除了在脚本中我们并不怎么用到它. 为什么呢? 因为我们创建文件通常是想在文件中写点东西, 而使用重定向等手段 (之后会讲到) 来写文件并不方便.
-
有没有什么软件可以在命令行中方便地编辑文本呢?
-
有的, 你可以使用
nano
.
nano
是一款以命令行界面为基础的文本编辑器. 它非常轻量, 易于上手, 是 Linux 系统中最常见的文本编辑器之一. 你的 WSL 系统中也自带了 nano
.
使用 nano
只需要在终端输入 nano <filename>
即可. 如果 <filename>
对应的文件不存在, nano
会自动帮你创建一个新文件. 那你可能会想, 既然 nano
可以创建文件, 那 touch
还有什么用呢?
touch
并不鸡肋——在脚本里批量创建空文件、确保文件存在或仅更新时间戳时非常实用; 编辑器“新建文件”的行为需你手动保存且遇到只读目录会失败.
nano
有不少快捷键; 你可以在屏幕的底部看到它们. ^
代表 Ctrl
键. 常用操作有:
Ctrl + O
: 保存文件 (O 代表 Output)Ctrl + X
: 退出nano
(X 代表 eXit)
在上一关卡中,你学会了如何利用 pwd
, ls
, cd
浏览文件系统. 你也学会了使用 touch
和 nano
创建和编辑文件.
那么在本关卡中,你将会学习到如何利用 shell
对文件系统进行编辑.
mkdir
命令可以让你创建一个文件夹,或者说是创建新的目录.
你在终端输入:
mkdir my_folder
mkdir -p parent_folder/child_folder
plaintext通过 -p 参数的不同, 你可以选择创建单个文件夹或者创建多级目录.
cp
命令可以复制你的文件或目录,帮你轻松搞定备份和分发任务.
更重要的是, 源文件在命令后依旧存在.
你在终端输入:
cp file.txt backup.txt
plaintext这会把 file.txt
复制成 backup.txt
.
复制整个文件夹? 加个 -r
参数就行:
cp -r my_folder my_folder_copy
plaintextTIP
-r
代表递归 (recursive), 也就是复制文件夹内的所有内容, 包括子文件夹和文件.
与复制不同, mv
的移动命令表现的更像剪切, 它可以把你的文件从源文件移到目标位置.
改名如何呢? 自然是可以的. 这相当于 Windows 系统中的重命名.
mv file.txt file_only.txt
plaintext也可以将文件移到某个指定路径.
mv file_only.txt /home/user/target_dir
plaintext这个操作等价于: mv file_only.txt /home/user/target_dir/file_only.txt
(当目标是已存在的目录时).
有复制和移动, 也就有删除命令.
rm
命令可以删除你的文件或目录.
在终端输入:
rm file_backup.txt
rm -r my_folder_backup
plaintext这些一般就可以实现文件和文件夹的删除, 但是如果遇到一些只读权限或者比较难以删除的文件夹, 可以采用更为暴力的强制删除:
rm -rf temp/
plaintext⚠️ 警告:
rm -rf
具有不可逆风险; 务必确认路径无误.
Commands
Commanding Commands
With navigation skills under your belt, it's time to dive deeper into understanding how commands actually work. This module will teach you about command structure, options, arguments, and how to get help when you need it.
You'll learn the anatomy of shell commands, discover how to find and use more advanced commands, and understand the shell environment itself including variables and configuration. This knowledge will make you much more effective at using any command-line tool.
在上一关卡中, 我们逐步试图贯彻的观念是: 文件构成了 linux 的系统的核心. 你学会了如何查看文件系统, 如何在文件系统中执行读写操作; 在本关卡中, 我们将会展示 linux 中最为精华的部分之一: 命令行与指令. 我们希望通过这一关卡, 你能够理解 Shell 中何为指令, 何为环境变量, 并借此掌握 command 的调用以及如何定制你的 Shell 环境.
前排提醒: 这一整个章节可能会略微有点困难😈. 如果遇到问题, 请不要气馁. 如果有你认为没有全部掌握的内容, 阅读后续章节, 增强对于 Shell 的理解, 然后再回过头来看看.
调用指令#
在 Shell 中, 你可以通过输入指令来操作系统, 就像你在上一个章节使用 ls
命令来列出文件和目录一样.
command-name arg1 arg2 ...
plaintext在上面的语法中, command-name
是你想要执行的指令的名称, 后面的 arg1
, arg2
等是传递给该指令的参数.
如果参数中含有空格, 你可以使用引号将其括起来, 例如 "arg with spaces"
, 或者使用反斜杠 \
来转义空格 arg\ with\ spaces
. 在有特殊字符(如 *
, ?
, $
)时, 引号也能避免被 shell 提前解释.
举一个例子: 在 Shell 中, 你可以使用 echo
指令来打印文本到终端. 例如:
echo "Hello, World!"
plaintext这条指令会输出 Hello, World!
到终端. 其中, echo
是指令名称, "Hello, World!"
是传递给 echo
指令的参数.
很多指令都有自己的选项, 这些选项通常以 -
或 --
开头, 用于修改指令的行为. 大家已经看到, ls
指令的 -l
选项用于以长格式显示文件和目录的信息:
ls -l
plaintext有时, 选项可以接纳参数, 例如 head -n 10
用于显示文件的前 10 行.
-h
或者 --help
选项通常用于获取指令的帮助信息. 例如, 你可以运行以下命令来查看 ls
指令的帮助信息:
ls --help
plaintext面对一个你不熟悉的指令, 你总是可以尝试运行 指令名 --help
来查看该指令的用法和可用选项. 通常, 这会打印出该指令的用法说明, 包括可用的选项和参数.
有些指令会有手册页, 你可以使用 man 指令名
来查看该指令的手册页, 获取更详细的信息. 同样的, 你可以用 man ls
来查看 ls
指令的手册页.
Better yet, 你可以使用更加现代化的 tldr 指令名
来获取该指令的简明用法示例. 这往往比 man
更加易读和实用.
tldr
指令是一个社区驱动的项目, 需要你手动进行安装:sudo apt install tldr && tldr --update
.apt
的使用会在后续章节中介绍.
指令和可执行文件 (Executable)#
你是否在 Linux 上编译过代码? 它的输出是一个二进制文件, 在这里我们称之为程序 (Binary) 或可执行文件 (Executable). 你可以通过在终端中输入程序的名称来运行它. 例如, 如果你编译了一个名为 hello
的程序, 你可以通过输入其相对或绝对路径, 如 ./hello
来运行它.
$ g++ hello.cpp -o hello
$ ls
hello.cpp hello
$ ./hello
Hello, World!
bash事实上: 在 Linux 中, 许多常用的命令行工具 (如 ls
, cat
, echo
等) 都是可执行文件. 你可以通过 which
命令来查看它们的路径:
$ which cat
/usr/bin/cat
bash于是, 你也可以通过输入完整路径来运行它们: /usr/bin/cat file
和直接输入 cat file
是一样的.
还有一个指令
whereis
. 它基于索引数据库搜索更多位置(可执行、源码、man 手册), 并返回一系列相关文件; 当你希望寻找多版本或定位 man 源时有用. 与which
不同,which
仅报告按PATH
解析的第一个命令路径.
PATH 环境变量#
于是, 你满怀期待地输入 hello
来运行你的程序, 但是 shell 却告诉你 command not found
. 这是为什么呢?
在 Linux 中, 当你输入一个命令时, shell 会在一系列预定义的目录中查找该命令对应的可执行文件. 这些目录存储在一个名为 PATH
的环境变量中. 你可以通过以下命令查看当前的 PATH
:
echo $PATH
bashPATH 中的每一个目录都是用冒号 :
分隔的.
需要注意的是, 这里的 PATH 是全大写的. Linux 中的变量名 区分大小写. 根据惯例, 所有环境变量都使用大写字母.
命令里 PATH 前的
$
符号表示你想要获取该变量的值. 在 Linux 中, 你可以用VAR=value
来设置变量, 用$VAR
来获取变量的值.
如果你的程序所在的目录不在 PATH
中, shell 就找不到它, 因此会提示 command not found
. 你可以通过在当前 shell 中临时修改 PATH
来解决这个问题(仅对当前会话有效).
export PATH=/path/to/your/program:$PATH
bash关于 export
关键词, 其他环境变量以及其作用, 我们会在后续挑战中做更详细的介绍.
到目前为止, 你已经学会了 shell 的基础使用. 现在, 是时候让它成为真正属于你的了.
程序员都喜欢可定制化的东西, 就像你可能会花几个小时来选择 VS Code 的颜色主题和图标, 或者用 Wallpaper Engine 寻找完美的壁纸. shell 也不例外.
你有没有见过开发者那炫酷多彩的终端? 或者你是否好奇过他们是如何输入两个字母的命令就能神奇地运行一长串命令的? 这不是魔法, 你也可以做到!
在这个挑战中, 你将学会:
-
如何创建节省时间的快捷方式, 它叫做别名(aliases)
-
理解你的 shell 如何使用环境变量来”记住”设置
-
最重要的是, 将你的终端转变为一个个性化的工作空间.
什么是 Shell?#
你正在交互的程序叫做 shell. 它是一个命令行解释器, 将你的命令转换为操作系统可以执行的操作. 有许多不同的 shell, 每个都有自己的特色.
你最常遇到的有:
-
bash: 经典的 shell, 也是大多数 Linux 系统的默认 shell.
-
zsh: 现代化、高度可扩展的 shell. 现在是 macOS 的默认 shell.
-
fish: 专注于从一开始就用户友好的 shell. 它具有语法高亮和”自动建议”等功能, 无需配置.
要找出你正在使用哪个 shell, 运行以下命令. 它读取一个特殊变量, 该变量存储了你的 shell 程序路径.
echo $SHELL
bash你可能会疑惑什么是 echo, 什么是 $SHELL? 别担心, 我们很快就会讲到 $SHELL
部分. 现在只需要知道 echo
是一个在终端打印文本的命令.
Shell 的记忆#
在我们进入定制化
部分之前, 我们需要理解 shell 是如何在每次你打开新终端时记住你的设置. 并且, 在哪里可以找到这些设置.
它从位于你的主目录(~/)中的一个特殊脚本读取. 对于 bash, ~/.bashrc
; 对于 zsh, 读取 ~/.zshrc
.
这些只是纯文本文件, 每次启动新的 shell 会话时都会运行. 你可以用任何文本编辑器编辑它们来添加你自己的选项.
Recap: 以点(.)开头的文件是隐藏的. 要查看它们, 你必须在 ls 命令中使用
-a
(all)标志:ls -a ~
你通常会在 .bashrc
或 .zshrc
文件中看到大约 100 行代码. 不要被文件大小吓到. 其中大部分是注释(以 #
开头的行), 解释每个部分的作用.
在这个课程中, 我们将重点关注这两个主要概念:
-
别名(Aliases): 这是你的个人快捷方式.
-
环境变量: 这是你的 shell 的记忆.
别名(Aliases)#
别名是你给较长命令起的快捷方式或昵称. 语法是 alias name="command"
.
这里有一些极其有用的例子:
alias ll="ls -laH"
alias ..="cd .."
bash要创建别名, 你只需在 shell 中输入它. 但是, 它只在当前会话中存在. 请你务必记住: 要让某个设置永久生效, 你必须将命令添加到你的 shell 配置文件(~/.bashrc 或 ~/.zshrc)中. 只需用文本编辑器打开它, 在底部添加你的别名.
编辑配置文件后, 你需要告诉 shell 重新读取它. 你可以通过关闭并重新打开终端, 或者使用 source 命令来做到这一点:
# 对于 bash 用户
source ~/.bashrc
# 对于 zsh 用户
source ~/.zshrc
bash环境变量#
环境变量是一个命名的值, 可以影响运行进程的行为方式. 把它们想象成程序可以读取以获取信息的系统级设置. 按照惯例, 它们的名称都是大写的.
这里有一些最重要的:
-
$SHELL
: 你当前 shell 程序的路径. -
$HOME
: 你主目录的绝对路径. -
$USER
: 你当前的用户名. -
$PATH
: 一个用 ’:’ 分隔的目录列表, shell 在这些目录中按顺序查找可执行程序(从左到右). 例如, 如果你的 PATH 中有/usr/local/bin
, 当你在终端中输入python
时, shell 会在/usr/local/bin
中查找名为python
的可执行文件.
btw, Windows 也有环境变量, 你是否设置过 %PATH% 变量(在系统属性 -> 环境变量中编辑的那个)?
要查看所有环境变量, 使用 env
命令.
env
bash要查看特定变量的值, 在变量名前加上美元符号 $
使用 echo
. $
告诉 shell “给我这个变量的值”.
# 查看 HOME 变量
echo $HOME
# 查看你的用户名
echo $USER
bash现在你可以理解为什么之前 echo $SHELL
是什么了.
你可以使用 export 命令创建自己的环境变量. 这使得变量对你从该 shell 运行的任何其他程序都可用.
export GREETING="Hello, World!"
echo $GREETING
bash就像 alias
一样, 如果你希望你的变量是永久的, 你必须将 export 行添加到你的 ~/.bashrc 或 ~/.zshrc 文件中.
当然, 你也可以不加 export
, 那么有什么区别呢? export
告诉 shell 这个变量对从该 shell 启动的任何子进程都是可用的. 如果你不使用 export
, 变量只在当前 shell 会话中可用.
定制化#
好的, 让我们回到激动人心的部分: 定制化!
shell 可以通过许多方式定制, 从改变颜色到添加功能. 对我来说, 如果你想复制一个炫酷终端的外观, 最简单的方法是使用像 Oh My Zsh(当然, 你需要先安装zsh, 我们简称为 omz
)这样的框架, 或者使用开箱即用就可定制的 fish.
有很多很棒的 omz
主题和插件可供选择. 你可以在 Oh My Zsh Themes ↗ 页面找到它们.
我个人也在使用 omz
配合 powerlevel10k
主题. 对于插件, 我使用 zsh-autosuggestions
和 zsh-syntax-highlighting
, 以及 git
和 copyfile
插件.
去 Google 一下, 自己设置一下吧! 这能让你每次打开终端时都感到兴奋.
那么定制化是如何工作的? 这是魔法吗? 完全不是! 这完全建立在你刚学到的东西之上: 你的 .zshrc
文件和环境变量.
当你安装像 Oh My Zsh 这样的框架时, 它本质上接管了你的 ~/.zshrc
文件. 它用一个新的文件替换它, 这个新文件充当所有功能的控制面板. 让我们看看使用 Oh My Zsh 时你的 ~/.zshrc
文件是什么样的(删减过):
export ZSH="/Users/your_username/.oh-my-zsh"
ZSH_THEME="powerlevel10k/powerlevel10k"
plugins=(git copyfile)
source $ZSH/oh-my-zsh.sh
bash现在你都可以理解它们了! export
命令设置环境变量, 告诉 shell 这个 omz 在哪里. ZSH_THEME
变量指定要使用的主题, plugins
数组列出要加载的插件. 最后, source
命令运行主要的 Oh My Zsh 脚本, 它读取所有这些设置并应用它们.
Pipes
A Piper's Dream
One of the most powerful features of the shell is the ability to chain commands together and redirect data streams. This module will teach you how to harness this power to create sophisticated command pipelines.
You'll learn about input and output streams, how to redirect data to and from files, and how to pipe the output of one command into another. These techniques are what make the command line such a powerful tool for automation and data processing.
在这个章节中, 我们会简单接触 Shell 中最有用的一项技术: 管道 (pipe) 技术.
而在学习管道之前, 我们需要了解一些常用的命令, 让我们可以做简单的文件/输入输出转发和文本处理.
cat#
之前我们讲到了可以使用文本编辑器打开一个文件, 并查看它的内容. 然而呢, 如果仅仅只是要看一眼文件的内容, 其实不必大动干戈, 而且有很多命令可以帮我们完成这件事情.
打印文件内容, 无非就是将文件输出到终端上; 最常用的命令是 cat
.
cat
不是猫, cat
是 “concatenate files and print on the standard output” 的缩写, 中文翻译“将文件拼接并输出到标准输出”; 不过我们暂时可以把它理解成“把文件内容打印到屏幕上”.
你可以这么使用:
# 查看单个文件内容
cat file1.txt
# 拼接文件内容
cat file1.txt file2.txt > combined.txt
plaintextgrep#
当文件较短的时候, 直接用 cat
就能看清楚文件内容了. 但是如果文件很长, 比如系统日志, 你可能就需要一些更高级的工具来帮你分页、过滤和查找你想要的信息.
查看超长文件时, 建议先用
less file
分页查看, 或者head
/tail
抽样; 直接cat
可能会刷屏. 我们不要求你掌握他们, 留个印象知道他们的存在即可.
我们可以使用 nano
这种文本编辑器来打开文件, 然后用搜索功能查找关键词, 但是这种办法是交互式的, 也就是说没有办法“自动化”. 所以我们就需要一个可脚本化的关键词查询命令, 也就是 grep
.
grep
的名字来源于上古时期的文本编辑器 ed
中的命令 g/re/p
(globally search a regular expression and print). 所以它的工作就是查找匹配所有满足条件的行并把它们打印出来. 语法是先加待搜索的单词, 再跟上文件名, 比如:
$ cat file.txt
Hello World!
Hello grep!
Hello cat!
$ grep "grep" file.txt
Hello grep!
bashgrep
还有一些常用的选项, 比如:
# 查找文件中包含 "error" 的行
grep "error" logfile.txt
# 忽略大小写匹配
grep -i "error" logfile.txt
# 显示匹配的次数
grep -c "error" logfile.txt
plaintext其实 cat
, grep
本身与重定向没有太大的关系; 但是它的模式匹配与筛选作用是无可替代的. 等我们学习了重定向和管道之后, 它们的作用就能发挥得淋漓尽致了.
在字符串搜索上, Shell 有个更加强大的工具
awk
和sed
, 但是使用方式比较复杂. 日常使用不妨使用python
(
在 Linux 中, “一切皆文件”的哲学意味着命令的输入和输出被视为可以重定向的流. 这一强大的概念使你能控制命令从哪里获取输入, 以及将输出发送到哪里.
让我用清晰的示例来告诉你探索重定向的工作原理.
输出重定向 (>)#
>
符号将标准输出重定向到文件. 输出不会显示在屏幕上, 而是保存到文件中.
还记得
pwd
命令吗?它显示当前目录.
pwd # 在屏幕上显示当前目录
pwd > my_location.txt # 将输出保存到文件
cat my_location.txt # 查看文件内容
bash⚠️ 警告: 使用
>
会覆盖任何现有的文件内容!请小心.
追加输出 (>>)#
要向文件中添加内容而不覆盖它, 请使用 >>
:
echo "First Line" > notes.txt # 创建/覆盖文件
echo "Second Line" >> notes.txt # 向文件添加新行
cat notes.txt # 显示两行内容
bash思考: 上方
notes.txt
文件中现在有几行?是什么?答案是两行, 分别是 “First Line” 和 “Second Line”.
输入重定向 (<)#
就像可以将输出重定向到文件一样, 你也可以使用文件作为命令的输入, 还是拿上面我们已经创建的 notes.txt
文件为例:
# 使用该文件作为 cat 命令的输入
cat < notes.txt
bash这个命令会显示 notes.txt
的内容, 就像直接运行 cat notes.txt
一样.
理解流类型#
这一个章节我们不作要求, 但是了解这些内容会帮助你更好地理解重定向. 也会让你的代码 debug 过程更轻松.
Linux 有三个标准流:
- 标准输入 (stdin) - 流描述符 0
- 标准输出 (stdout) - 流描述符 1
- 标准错误 (stderr) - 流描述符 2
你们可能还没有听说过这三个流, 但是你们事实上肯定已经在使用 stdin
和 stdout
了. cin
就是从 stdin
读取输入, 而 cout
则将输出发送到 stdout
. 更多关于流的知识, 请期待翁阿姨这个学期讲解输入输出的内容.
你可以分别重定向每个流:
# 仅重定向标准输出
ls -l > file_list.txt
# 仅重定向 stderr 消息
./bookstore 2> errors.txt
# 将标准输出和错误消息分别重定向到不同的文件
./bookstore > output.txt 2> errors.txt
bash高级重定向#
这一章节我们也不作要求.
要将标准输出和错误同时重定向到同一个文件, 可以使用 2>&1
:
./bookstore > combined.txt 2>&1
bash你可能在想 “这都是啥?” 2>&1 的意思是: 把 stderr
重定向到 stdout
的位置, 然后 stdout
再被重定向到 combined.txt
. 所以最终两个流都会进入同一个文件.
那你可能又会问 “上述命令为什么不写成这样: ./bookstore 2>&1 > combined.txt # 这样写不对!
”
顺序很重要! 上面错误的命令会先把 stderr
重定向到 当前的 stdout
(通常是屏幕), 然后再把 stdout
重定向到文件. 所以最终 stderr
仍然会显示在屏幕上, 而不是进入文件. 所以说应当先重定向 stdout
到文件, 然后再把 stderr
重定向到 stdout
. 事实上, 现代的 Bash 版本允许你使用更简洁的 &>
来实现同样的效果:
./bookstore &> combined.txt
bash重定向到 /dev/null#
当你想完全丢弃输出时, 可以重定向到 null:
# 丢弃 stderr 输出
./bookstore 2> /dev/null
# 丢弃所有输出
./bookstore &> /dev/null
bash上一章节我们学习了怎么将命令的输出重定向到文件中. 现在我们来学习另一个非常强大的功能: 管道(Pipes).
管道符(|
)是 Linux Shell 中非常强大的功能. 它可以把一个命令的输出直接传递给另一个命令作为输入.
基本语法#
命令A | 命令B
plaintext这会把 命令A
的标准输出传递给 命令B
的标准输入. 让我们来看一个简单的例子:
echo 'Hello World!' | cat
plaintext它应当输出 Hello World!
.
这里发生了什么:
echo 'Hello World!'
输出 “Hello World!”- 管道符
|
把这个输出传递给cat
cat
显示输入内容, 结果就是 “Hello World!”
在前一章节中我们提了一嘴 Linux 中有三种标准流: 标准输入 (stdin)、标准输出 (stdout) 和标准错误 (stderr). 管道符就是把前一个命令的标准输出连接到后一个命令的标准输入.
那你们可能会想“我要这个管道符它有何用?”接下来我们会通过一些实用的例子来展示管道的强大之处.
ps -A | grep bash
plaintextps -A
列出所有正在运行的进程(你们不需要掌握它), grep bash
过滤出包含 “bash” 的行. 这是极有用的, 因为你电脑中可能运行这成千上万的进程. 如果你只想看和 bash 相关的进程, 管道就能帮你实现.
多重管道组合#
你可以把多个命令串联起来:
cat /var/log/syslog | grep ERROR | wc -l
plaintext这里发生了什么:
cat /var/log/syslog
读取系统日志文件内容.grep ERROR
过滤出包含 “ERROR” 的行.wc -l
统计这些行的数量.
这会统计系统日志中包含 “ERROR” 的行数. 类似的, 你也可以将其用作你代码的调试, 在你们这学期会写到的 bookstore
项目中, 快速定位到你问题, 让你的 debug 过程更高效.
Permissions
Perceiving Permissions
Understanding file permissions is crucial for system security and proper file management. This module will teach you about users, groups, and the permission system that controls who can read, write, and execute files.
You'll learn how to read permission strings, how to change file permissions, and understand the concepts of file ownership. This knowledge is essential for managing your own files and collaborating with others on shared systems.
Linux 是一个多用户系统, 这意味着它内置了一套规则来防止文件被不该访问或修改的人读取或改动. 本课将帮助你理解并控制这些规则.
用户和用户组#
在 Linux 中, 一切都归属于某个用户. 每个文件、每个进程(正在运行的程序)都关联到一个特定的用户账户, 系统据此“记账”.
用户 (user): 一个独立的账户. 当你登录时, 你是以特定用户的身份行动. 最强大的用户称为 root(或超级用户), 它对整个系统拥有几乎不受限制的访问能力.
用户组 (group): 用户的集合. 用户组使得同时管理多个用户的权限变得容易. 一个常见例子是用于网页服务的 www-data
组, 你不希望每个普通用户都能改网站文件; 同样, 也不希望 Nginx、Caddy 等服务进程访问你的私人文件. 这篇文章有更详细的说明 ↗.
你可以使用 whoami
命令查看你是谁.
whoami
bashrwx
权限#
在之前的课程中, 你已经学习了 ls -la
命令, 其中 -l
参数显示文件的详细信息, 包括它们的权限. 你可能看到像这样的内容:
total 96
drwxr-x--- 119 theunknownthing staff 3.7K Sep 15 16:09 ..
drwxr-xr-x 8 theunknownthing staff 256B Sep 15 16:00 contents
drwxr-xr-x 15 theunknownthing staff 480B Sep 15 15:59 .git
-rw-r--r-- 1 theunknownthing staff 1.1K Sep 9 20:58 README.md
...
bash看到 drwxr-xr-x
部分了吗?这就是显示权限的地方.
让我首先解释这些字符的含义. 有三种基本权限:
-
读取 (r): 查看文件内容或列出目录内容的能力.
-
写入 (w): 更改或删除文件, 或在目录内创建/删除文件的能力.
-
执行 (x): 运行文件(如果它是程序或脚本)或进入目录(
cd
进入)的能力.
第一个字符表示文件类型: d
表示目录, -
表示普通文件, l
表示符号链接, 以及其他字符表示特殊文件类型.
所以, 在 drwxr-xr-x 15 theunknownthing staff 480B Sep 15 15:59 .git
中:
-
d
表示这是一个目录. -
然后你可以看到恰好 9 个字符, 分为三组, 每组三个.
前 3 个字符 (
rwx
) 是所有者的权限. 这里,rwx
意味着所有者可以读取、写入和执行. 此文件的所有者是theunknownthing
.中间 3 个字符 (
r-x
) 是用户组的权限. 这里,r-x
意味着用户组可以读取和执行, 但不能写入. 此文件的用户组是staff
.最后 3 个字符 (
r-x
) 是其他人(其余所有人)的权限. 同样,r-x
意味着他们可以读取和执行, 但不能写入.
为了加深理解, 让我们看另一个例子: -rw-r--r-- 1 theunknownthing staff 1.1K Sep 9 20:58 README.md
在看下一页的答案之前, 请先自己解读一下. 思考:
- 这是什么类型的文件?
- 所有者拥有什么权限?为什么所有者没有执行权限?
- 用户组拥有什么权限?
- 其他人拥有什么权限?
第一个字符是 -
, 表示这是一个普通文件.
所有者拥有 rw-
权限, 意味着他们可以读取和写入文件, 但不能执行它(这很明显, 因为它是一个Markdown文本, 你不能运行它).
Tips: 并非所有文本文件都“不能执行”, 而是“默认没有执行位”. 若它是脚本并设置了执行位且有正确的 shebang(例如 #!/usr/bin/env bash), 可直接执行; 即使没有执行位, 也可用解释器显式运行, 例如 bash script.sh 需要脚本具备读权限. 了解 shebang, 请参阅这里 ↗. 不过, 我不要求你现在掌握它.
用户组拥有 r--
权限, 意味着 staff
组中的用户可以查看文件内容, 但不能修改或执行它.
其他人也拥有 r--
权限, 意味着他们也只能读取文件.
使用 chmod
更改权限#
chmod(change mode)命令用于更改文件的权限. 你可以通过两种常见方式来做这件事: 符号表示法或八进制表示法.
我们首先学习符号表示法, 这种方式更直观.
这种方法使用字母(u
表示 user(所有者), g
表示 group, o
表示 others, a
表示 all)和符号(+ 添加, - 删除, = 设置)来修改权限.
# 为owner添加执行权限
chmod u+x script.sh
# 设置others的权限为只读
chmod o=r README.md
# 移除除owner外所有人的读取权限, 这里 `go` 表示 `g` 和 `o`
chmod go-r README.md
# 移除groups的所有权限
chmod g= script.sh
bash八进制表示法#
这种方法使用数字来表示每个类别的权限. 这有点像二进制! r = 4, w = 2, x = 1
. 你可以将想要的权限对应的数字相加.
数字 | 权限 | 含义 |
---|---|---|
7 | rwx | 读、写和执行, 4+2+1 |
6 | rw- | 读和写, 2+4 |
5 | r-x | 读和执行, 4+1 |
4 | r— | 只读, 4 |
0 | --- | 无权限, 0 |
使用八进制表示法的 chmod
命令使用一个 3 位数字, 分别代表用户、组和其他人的权限(按此顺序). 要设置权限为 rwxr-xr-x(用户可以做任何事; 组和其他人可以读取和执行), 你将使用数字 755.
chmod 755 script.sh
bash这将为所有者设置 7(rwx), 为组设置 5(r-x), 为其他人设置 5(r-x).
使用 sudo
获取超级用户权限#
当你需要执行一些你的普通用户账户无权执行的操作时, 例如安装软件或编辑系统配置文件, 会发生什么?
apt update
bash你会得到错误:
Reading package lists... Done
E: Could not open lock file /var/lib/apt/lists/lock - open (13: Permission denied)
E: Unable to lock directory /var/lib/apt/lists/
W: Problem unlinking the file /var/cache/apt/pkgcache.bin - RemoveCaches (13: Permission denied)
W: Problem unlinking the file /var/cache/apt/srcpkgcache.bin - RemoveCaches (13: Permission denied)
bash为此, 你需要管理员权限. sudo 命令让你以超级用户(root)身份执行单个命令.
sudo apt update
bash🈲 root 用户可以做任何事, 包括意外删除你的整个系统. 在使用 sudo 运行任何命令前请仔细检查. 你可能见过一些梗图让你执行
sudo rm -rf /*
. 别做! 我不会来帮你恢复系统的!
如果你想亲自登录 root 用户, 可以使用 su
命令(substitute user, 替换用户).
sudo su
bash这相当于用 sudo
以提权方式运行 su
; 在不带参数时, su
默认切到 root.
Tips: 直接运行 su(不带 sudo)默认会询问“目标用户的密码”(通常是 root 的密码). 在 Ubuntu 上, root 账户默认可能被锁定, 此时 su 不可用, 但 sudo su 会要求你输入当前用户的密码(前提是你在 sudoers 中).
当然, su
不仅限于切换到 root. 如果你知道其密码, 你可以切换到任何用户.
su some_username
bash如果你知道他们的密码, 或者如果你当前的用户拥有比该用户更高的权限, 这将切换到 some_username
. 所以从 root 切换到任何用户不需要该用户的密码.
Packages
Super Cow Powers
The final piece of essential shell knowledge is understanding how to install and manage software packages. This module will introduce you to package managers and how they help you keep your system up to date.
You'll learn how to search for, install, and manage software packages using command-line package managers. You'll also learn about package repositories and mirrors, which can help you get faster and more reliable access to software.
到目前为止, 你已经学会了使用 shell 的主要功能.
你知道在 shell 下如何应用各种不同的软件与包, 但是这些包又从何而来?
于是乎在本关卡中, 我们将会接触 apt
和 mirror
的概念.
什么是包#
在计算机科学中, 你可以把包 (Package
) 理解为一个或者多个软件的集合, 以及它们需要依赖什么系统资源的信息.
在 Linux 系统中, 安装软件的方式通常是安装包.
包管理器#
一般来说, 所有的包都被由称作包管理器的系统所管理.
以常见的 Ubuntu
系统为例, 其默认包管理器为 apt
, 它极大地简化了软件的获取、安装、升级和移除过程:
你往往只需要一条简单命令如 sudo apt install firefox
即可完成软件安装.
不仅如此, 包管理器能够自动处理软件包之间复杂的依赖关系 (Dependencies
), 确保所需的所有库和组件都能被正确安装.
如果你想知道为什么这个章节叫做 Super Cow Powers, 那是因为
apt
的一个隐藏彩蛋. 你可以试试apt --help
读一读末尾, 或者运行apt moo
.
在你安装 wsl2
的早期, 你想必已经尝试了一些命令, 比如:
sudo apt install package # 安装包
sudo apt update # 更新包列表
sudo apt upgrade # 升级已安装的包
plaintext这些命令通常可以帮助你自动从对应软件包的仓库中下载. 这比在网上找安装包更加方便, 不是吗?
当然, 如果你从网站上下载了一个 .deb
文件, 你也可以使用 apt
来安装它.
sudo apt install ./path/to/package.deb
plaintext关于镜像源#
在上一个单元中, 你学习了使用 apt
来安装软件包.
但你有没有想过, 这些软件包是从哪里来的呢?
事实上,所有的软件包都存储在称为软件仓库 (Repository
) 的服务器上. 这些仓库通常由操作系统的维护者或第三方组织管理.
但是很多时候, 由于不可抗力因素, 在国内访问国外软件仓库源速度往往较慢.
为了显著提升下载速度, 我们强烈建议将系统的软件源替换为国内的镜像源(如 TUNA, USTCLUG, 阿里云).
它们与系统默认的软件源往往拥有相同的内容, 但拥有更高的传输速度.
事实上, 常见的软件安装包如
pip
,huggingface
,modelscope
等都是有镜像的, 各位可以自行查询.
更换镜像源#
一般来说, 在镜像网站上你能读到如何修改软件源的说明, 以清华镜像源为例, 你可以访问: https://mirrors.tuna.tsinghua.edu.cn/help/ubuntu/ ↗
-
将
ubuntu.sources
备份到同目录下的ubuntu.sources.bak
. -
修改
ubuntu.sources
, 在这个例子里你需要将其修改为:
Types: deb
URIs: https://mirrors.tuna.tsinghua.edu.cn/ubuntu
Suites: noble noble-updates noble-backports
Components: main restricted universe multiverse
Signed-By: /usr/share/keyrings/ubuntu-archive-keyring.gpg
# 以下安全更新软件源包含了官方源与镜像站配置,如有需要可自行修改注释切换
Types: deb
URIs: http://security.ubuntu.com/ubuntu/
Suites: noble-security
Components: main restricted universe multiverse
Signed-By: /usr/share/keyrings/ubuntu-archive-keyring.gpg
plaintext在完成这一步骤后, 你可以测试与 apt
相关的命令, 一般能够提速 100
倍甚至更高.
以上就是关于镜像源的内容. 如果你希望使用它提速, 可以在自己的 wsl 上做相关的配置. 祝您旅途愉快!
[flag]
plaintext