关于bash：使用xargs调用多个命令

Calling multiple commands with xargs

1	cat a.txt \| xargs -I % echo %

在上面的示例中，xargs将echo %作为命令参数。但是在某些情况下，我需要多个命令而不是一个来处理参数。例如：

1	cat a.txt \| xargs -I % {command1; command2; ... }

但是xargs不接受这种形式。我知道的一个解决方案是，我可以定义一个包装命令的函数，但这不是管道，我不喜欢它。还有其他解决方案吗？

相关讨论

1 2	cat a.txt \| xargs -d $' ' sh -c 'for arg do command1"$arg"; command2"$arg"; ...; done' _

...或者没有对猫的无用使用：

1 2	<a.txt xargs -d $' ' sh -c 'for arg do command1"$arg"; command2"$arg"; ...; done' _

要解释一些更好的观点：

出于安全原因，使用"$arg"代替%(并且xargs命令行中没有-I)是：在sh的命令行参数列表中传递数据，而不是将其替换为代码可以防止数据可能包含的内容(例如$(rm -rf ~)，以一个特别的恶意示例)作为代码执行。
类似地，-d $'
'的使用是GNU扩展，它导致xargs将输入文件的每一行都视为一个单独的数据项。要防止xargs尝试对读取的流进行类似于shell的解析(但不完全与shell兼容)，必须使用this或-0(期望使用NUL而不是换行符)。 (如果没有GNU xargs，则可以使用tr '
' '\0' to get line-oriented reading without -d)。
_是$0的占位符，因此xargs添加的其他数据值将变为$1并向前，这恰好是for循环迭代的默认值集。

相关讨论

对于不熟悉sh -c的用户-请注意，每个命令后的分号不是可选的，即使它是列表中的最后一个命令也是如此。
至少在我的配置中，首字母" {"后必须紧跟一个空格。结束的花括号前不需要空格，但是正如Sussman先生所指出的，您确实需要一个分号。
这个答案以前在command1和command2周围有花括号；后来我意识到它们不是必需的。
为了阐明以上有关分号的注释，在结束}之前需要使用分号：sh -c { command1; command2; } -- but its not required at the end of a command sequence that doesnt use braces: sh -c command1; command2`
@ A-B-B：使用&&而不是;可能很合适，但是减少执行转义的次数并不是一个很好的理由，因为它具有不同的语义。无论如何，您可能都将命令括在单引号中，因此它没有太大区别。
猫a.txt | xargs -I％sh -c command1; command2; ...非常好，除非输入内容包含shell注释字符＃(很可能是在文件列表中)，在这种情况下，仅执行第一条命令的一部分。
@KrazyGlew：为什么文件列表可能包含#个字符？ (当然可以。)
@KeithThompson：emacs创建名称包含#s的临时文件。请参阅emacswiki.org/emacs/AutoSave...。我可以发誓，许多其他工具也可以做类似的事情，但是谷歌搜索什么都找不到。 ...尽管在现代用法中，但在GUI中(如MacOS)，用户发现创建包含特殊字符(如空格，井号(＃)和许多其他形式的外壳标点符号)的文件非常容易。无法处理此类文件名通常是安全缺陷。
如果command1或command2本身包含或引号呢？
@prehawk：两种可能性。 (1)这是炫耀自己报价技巧的绝佳机会。 (2)将命令包装在shell脚本中。
@KeithThompson我正在学习xargs，因为我需要通过过滤多台计算机中的多个文件来找出一些问题。我编写了perl命令来做到这一点，并且命令总是在变化，因此我无法将其写入脚本。编写脚本意味着我需要每次都上传这些更改命令。
有人可以给这个用例吗？我一直尝试ls UsersfishemaDesktopProjectsBcore_clients579MLresults051116_resultsJF_intersect_gene*|xargs -I % sh -c head -n2; tail -n1;无济于事...
叹息在鱼类中不起作用。我喜欢外壳，但是bash中的某些东西确实有意义
如果您在传递给sh -c的字符串中的某个位置包含%字符，则容易产生安全漏洞：包含$(rm -rf ~)$(rm -rf ~)的文件名(这是常见的UNIX文件系统中包含在文件名中的完全合法的子字符串！)会给某人带来非常糟糕的一天。
没用的猫！好的！我以前曾经看过重定向的方式，但我从未真正内部化过所发生的事情。我认为使用该模式总是可以的吗？左尖括号，文件名，命令....？
@ToddWalton：是的，通常重定向可以出现在命令中的任何位置。例如，< etcmotd cat -n，cat < etcmotd -n和cat -n < etcmotd都是等效的。 (至少对于bash而言，但对于大多数shell似乎都是这种情况。)
@KeithThompson，您愿意接受显示不涉及命令注入漏洞的做法的编辑吗？
@CharlesDuffy：我相信无论我接受与否都会进行编辑。但是是的，尤其是在其合理明确的情况下。
@KeithThompson，当然可以应用，但是如果您不同意，我们可能会陷入编辑大战，那对任何人来说都不是一个好地方。无论如何，请让我知道您是否认为当前修订足够清晰或需要进一步的工作。
第二天或第二天，我会仔细研究一下。

使用GNU Parallel，您可以：

1	cat a.txt \| parallel 'command1 {}; command2 {}; ...; '

观看介绍性视频以了解更多信息：https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

相关讨论

这只是没有xargs或cat的另一种方法：

1
2
3
4
5

while read stuff; do
command1"$stuff"
command2"$stuff"
...
done < a.txt

相关讨论

您可以使用

1	cat file.txt \| xargs -i sh -c 'command {} \| command2 {} && command3 {}'

{} =文本文件中每一行的变量

相关讨论

我要做的一件事是将.bashrc / .profile添加到此函数：

1
2
3
4
5
6
7

function each() {
while read line; do
for f in"$@"; do
$f $line
done
done
}

然后你可以做

1	... \| each command1 command2"command3 has spaces"

它不如xargs或-exec冗长。您也可以修改该函数，以将读取值插入命令中的任意位置(如果需要)，从而将其插入每个命令。

我更喜欢允许空运行模式(没有| sh)的样式：

1	cat a.txt \| xargs -I % echo"command1; command2; ..." \| sh

也适用于管道：

1	cat a.txt \| xargs -I % echo"echo % \| cat" \| sh

相关讨论

晚会晚了。

我使用以下格式在迁移之前用数千个小文件压缩目录。如果您在命令中不需要单引号，则应该可以使用。

经过一些修改，我相信它将对某人有用。在Cygwin中测试(babun)

1	find . -maxdepth 1 ! -path . -type d -print0 \| xargs -0 -I @@ bash -c '{ tar caf"@@.tar.lzop""@@" && echo Completed compressing directory"@@" ; }'

find .在这里找到
-maxdepth 1不要进入子目录
! -path .排除。 /当前目录路径
-type d仅匹配目录
-print0用空字节分开输出 0
| xargs管道到xargs
-0输入为空分隔的字节
-I @@占位符为@@。用输入替换@@。
bash -c '...'运行Bash命令
{...}命令分组
&&仅在上一个命令成功退出(退出0)时执行下一个命令

最终;很重要，否则它将失败。

输出：

1
2
3

Completed compressing directory ./Directory1 with meta characters in it
Completed compressing directory ./Directory2 with meta characters in it
Completed compressing directory ./Directory3 with meta characters in it

2018年7月更新：

如果您喜欢黑客和游戏，这里有一些有趣的事情：

1
2
3
4
5
6
7
8
9

echo"a b c"> a.txt
echo"123">> a.txt
echo"###this is a comment">> a.txt
cat a.txt
myCommandWithDifferentQuotes=$(cat <<'EOF'
echo"command 1: $@"; echo 'will you do the fandango?'; echo"command 2: $@"; echo
EOF
)
< a.txt xargs -I @@ bash -c"$myCommandWithDifferentQuotes" -- @@

输出：

1
2
3
4
5
6
7
8
9
10
11

command 1: a b c
will you do the fandango?
command 2: a b c

command 1: 123
will you do the fandango?
command 2: 123

command 1: ###this is a comment
will you do the fandango?
command 2: ###this is a comment

说明：
-创建一个线性脚本并将其存储在变量中
-xargs读取a.txt并将其作为bash脚本执行
-@@确保每次通过整行
-将@@放在--之后可确保将@@用作bash命令的位置参数输入，而不是bash起始OPTION，即-c本身，这意味着run command

--是神奇的，它可以与许多其他东西一起使用，即ssh甚至kubectl

相关讨论

对我有用的另一种可能的解决方案是-

1	cat a.txt \| xargs bash -c 'command1 $@; command2 $@' bash

注意最后的" bash"-我假设它以argv [0]的形式传递给bash。如果没有使用此语法，则会丢失每个命令的第一个参数。可能是任何单词。

例：

1	cat a.txt \| xargs -n 5 bash -c 'echo -n `date +%Y%m%d-%H%M%S:` ; echo" data:" $@; echo"data again:" $@' bash

相关讨论

这似乎是最安全的版本。

1 2	tr '[ ]' '[\0]' < a.txt \| xargs -r0 /bin/bash -c 'command1"$@"; command2"$@";' ''

(可以删除-0并将tr替换为重定向(或者可以将文件替换为空分隔的文件)。它主要在此，因为我主要将xargs和find与输出)(这可能与不带-0扩展名的xargs版本有关)

这是安全的，因为args在执行时会将参数作为数组传递给Shell。当使用["$@"][1]获得所有外壳程序时，外壳程序(至少bash)会将它们作为未更改的数组传递给其他进程

如果使用...| xargs -r0 -I{} bash -c 'f="{}"; command"$f";' ''，则在字符串包含双引号的情况下分配将失败。对于使用-i或-i的每个变体，都是如此。 (由于将其替换为字符串，您始终可以通过在输入数据中插入意外字符(例如引号，反引号或美元符号)来注入命令)

如果这些命令一次只能使用一个参数：

1 2	tr '[ ]' '[\0]' < a.txt \| xargs -r0 -n1 /bin/bash -c 'command1"$@"; command2"$@";' ''

或使用较少的流程：

1 2	tr '[ ]' '[\0]' < a.txt \| xargs -r0 /bin/bash -c 'for f in"$@"; do command1"$f"; command2"$f"; done;' ''

如果您具有GNU xargs或另一个带有-P扩展名的文件，并且希望并行运行32个进程，则每个命令的每个参数不得超过10个：

1 2	tr '[ ]' '[\0]' < a.txt \| xargs -r0 -n10 -P32 /bin/bash -c 'command1"$@"; command2"$@";' ''

对于输入中的任何特殊字符，这应该是可靠的。 (如果输入为null分隔。)如果某些行包含换行符，则tr版本将获得一些无效的输入，但是对于换行符分隔的文件，这是不可避免的。

bash -c的空白第一个参数是由于以下原因：(来自bash手册页)(感谢@clacke)

1
2
3
4

-c If the -c option is present, then commands are read from the first non-option argument com‐
mand_string. If there are arguments after the command_string, the first argument is assigned to $0
and any remaining arguments are assigned to the positional parameters. The assignment to $0 sets
the name of the shell, which is used in warning and error messages.

相关讨论

我目前的BKM是

1	... \| xargs -n1 -I % perl -e 'system("echo 1 %"); system("echo 2 %");'

不幸的是，它使用了perl，它比bash不太可能被安装。但它处理的输入要多于可接受的答案。 (我欢迎不依赖perl的无处不在的版本。)

@KeithThompson的建议

1	... \| xargs -I % sh -c 'command1; command2; ...'

太好了-除非您在输入中输入了shell注释字符＃，否则第一个命令的一部分和第二个命令的所有部分都会被截断。

如果输入源于文件系统列表(例如ls或find)，并且您的编辑器创建名称为＃的临时文件，则哈希号＃很常见。

问题示例：

1
2
3
4
5

$ bash 1366 $> /bin/ls | cat
#Makefile#
#README#
Makefile
README

糟糕，这是问题所在：

1
2
3
4
5
6
7
8

$ bash 1367 $> ls | xargs -n1 -I % sh -i -c 'echo 1 %; echo 2 %'
1
1
1
1 Makefile
2 Makefile
1 README
2 README

嗯，这样更好：

1
2
3
4
5
6
7
8
9
10

$ bash 1368 $> ls | xargs -n1 -I % perl -e 'system("echo 1 %"); system("echo 2 %");'
1 #Makefile#
2 #Makefile#
1 #README#
2 #README#
1 Makefile
2 Makefile
1 README
2 README
$ bash 1369 $>

相关讨论