关于linux：rm，cp，mv命令的参数列表太长错误

Argument list too long error for rm, cp, mv commands

我在UNIX的目录下有几百个PDF。 PDF的名称非常长(大约60个字符)。

当我尝试使用以下命令一起删除所有PDF时：

1	rm -f *.pdf

我收到以下错误：

1	/bin/rm: cannot execute [Argument list too long]

这个错误的解决方案是什么？
是否还会对mv和cp命令发生此错误？如果是，如何解决这些命令？

相关讨论

发生这种情况的原因是因为bash实际上将星号扩展到每个匹配的文件，从而产生一个非常长的命令行。

试试这个：

1	find . -name"*.pdf" -print0 \| xargs -0 rm

警告：这是一个递归搜索，也会在子目录中找到(和删除)文件。只有在您确定不需要确认时，才能将-f添加到rm命令。

您可以执行以下操作以使命令非递归：

1	find . -maxdepth 1 -name"*.pdf" -print0 \| xargs -0 rm

另一种选择是使用find的-delete标志：

1	find . -name"*.pdf" -delete

相关讨论

这不会像rm -f * .pdf那样向rm发送完全相同的参数吗？ (或者，如果有子目录，甚至更多的参数。)
不，xargs专门拆分列表并在必要时发出几个命令。
请注意，这个以及另一个"查找"答案将从子目录中删除PDF文件，这与"rm * .pdf"的行为不同，尽管不清楚提问者究竟遵循了哪种行为。
实际上，这是一种递归搜索，与原始问题不同。我已经添加了警告 - 感谢您指出这种不一致。
@Dennis：如果我更换怎么办？确切的目录路径 - 它仍然会从所有子目录中删除pdf吗？
@BobbyJack：我想从当前的工作目录中删除pdf。不是来自所有子目录。对于这种情况，上述解决方案将如何修改？
@Dennis：您还可以使用您的解决方案为CP和MV命令提供示例吗？在哪里给目的地目录？
@NikunjChauhan我已经将find命令更新为仅在当前目录中工作(参见-maxdepth -1)。对于cp和mv，我会使用替代语法：find . -name"*.pdf" -maxdepth 1 -exec cp {} FOO - 这里的FOO是目的地。该命令每次都会重新运行cp，将{}替换为文件名。 mv的工作方式类似。
@Dennis：-maxdepth 1需要是路径之后的第一个参数。
从#bash频道："xargs(1)在读取非NUL分隔的输入时是危险的(破坏，可利用等)。如果你正在处理文件名，请使用find's -exec [command] {} +代替或-print0 | xargs -0我不关心可移植性，喜欢做不必要的额外工作。但是还不错的for循环。"
纠正(呃)：找到。 -maxdepth 1 -name"* .pdf"-print0 | xargs -0 rm
Find有一个-delete标志来删除它找到的文件，即使它没有，它仍然被认为是更好的做法，使用-exec来执行rm，而不是调用xargs(现在是3个进程和一个管道)而不是使用-delete的单个进程或使用-exec的2个进程。
@douardLopez ...但这是读取NULL分隔的输入。而整个dangerous (broken, exploitable, etc.)，是相当荒谬的。毫无疑问，使用xargs时应该小心，但它不是eval/evil。
如果我需要在sudo模式下删除文件怎么办？当我运行此代码时，我得到一个文件列表，说"权限被拒绝"
在Centos / bash上，这给出了相同的错误 - 参数列表太长了。
滑稽。当这件事发生在我身上时(因为我的目录中有超过100,000个空文件)，我只是反思地将它改成了一个奇特的循环。 c=1;l=$(ls | wc -l); for i in *; do rm $i; echo"[$c / $l] $i"; c=$((c + 1)); done
@scragar在-exec调用rm的情况下，进程数将是1 +文件数，尽管从这个进程的并发进程数可能是2(可能find会同时执行rm进程)。使用xargs的进程数将大幅减少到2 + n，其中n是一些数字进程少于文件数(比如文件数/ 10，尽管可能更多取决于路径的长度)。假设find直接删除，使用-delete应该是唯一可以调用的进程。
find . -maxdepth 1 -delete为我工作
在带有ext3文件系统的debian系统上，find对我来说没有解决方案。 Edouard Lopez提出的for循环解决方案简单，安全，解释良好并且可以在我的系统上运行。
还发现这种解决方案效率低下。请参阅for循环选项
最后一个工作就像一个魅力。真棒
@scragar使用find的-exec并不总是更好的练习，特别是在这种情况下("参数列表太长")。虽然使用-exec导致2个子进程并且没有管道(这听起来确实比3个进程和管道听起来要好得多)确实是最大的。正如@neuralmer指出的那样，并行处理的流程与完成工作的总流程数量差别很大。在速度方面，-delete> xargs> -exec，因为理智的xargs实现将args分解为批处理以减少子处理，而-exec == 1 arg每个进程。
......那就是说，我明白，对xargs的盲目信任并非没有令人难以置信的痛苦陷阱(特别是当涉及到rm时)所以如果你从安全而不是速度的角度来看这个，我和你们在一起方式。
很好的解决方案，但有没有办法显示删除进度？

TL;博士

这是对命令行参数大小的内核限制。请改用for循环。

问题的根源

这是一个与execve和ARG_MAX常量相关的系统问题。有很多关于这方面的文档(参见man execve，debian的wiki)。

基本上，扩展产生的命令(其参数)超过ARG_MAX限制。
在内核2.6.23上，限制设置为128 kB。这个常量已经增加，你可以通过执行以下方法获得它的值：

1 2	getconf ARG_MAX # 2097152 # on 3.5.0-40-generic

解决方案：使用for循环

在BashFAQ / 095上推荐使用for循环，除RAM /内存空间外没有限制：

1	for f in *.pdf; do rm"$f"; done

这也是一种可移植的方法，因为glob在shell中具有强大且一致的行为(POSIX规范的一部分)。

注意：正如一些评论所指出的那样，这确实更慢但更易于维护，因为它可以适应更复杂的情况，例如：人们想要做的不仅仅是一个动作。

解决方案：使用find

如果你坚持，你可以使用find，但实际上不使用xargs，因为它"在读取非NUL分隔的输入时是危险的(破坏，可利用等)"：

1	find . -maxdepth 1 -name '*.pdf' -delete

使用-maxdepth 1 ... -delete而不是-exec rm {} +允许find在不使用外部进程的情况下简单地执行所需的系统调用，因此更快(感谢@chepner注释)。

参考

我得到的"参数列表太长了"。如何以块的形式处理大型列表？ @wooledge
execve(2) - Linux手册页(搜索ARG_MAX);
错误：参数列表太长@ Debian的维基;
传递引用的参数时，为什么我会得到"/ bin / sh：参数列表太长"？ @SuperUser

相关讨论

find有一个-delete动作：

1	find . -maxdepth 1 -name '*.pdf' -delete

相关讨论

另一个答案是强制xargs批量处理命令。例如，一次delete文件100，cd进入目录并运行：

echo *.pdf | xargs -n 100 rm

相关讨论

或者您可以尝试：

1	find . -name '*.pdf' -exec rm -f {} \;

相关讨论

你可以试试这个：

1
2
3
4

for f in *.pdf
do
rm $f
done

编辑：
ThiefMaster的评论建议我不要向年轻的shell的jedis透露这种危险的做法，所以我会添加一个更"安全"的版本(为了保存某些人有"-rf .pdf"文件的东西)

1
2
3
4
5

echo"# Whooooo"> /tmp/dummy.sh
for f in '*.pdf'
do
echo"rm -i $f">> /tmp/dummy.sh
done

运行上面的内容后，只需打开你的收藏夹中的/tmp/dummy.sh文件即可。编辑并检查每一行的危险文件名，如果找到则将其评论出来。

然后复制工作目录中的dummy.sh脚本并运行它。

所有这些都是出于安全考虑

相关讨论

如果您尝试一次删除大量文件(我今天删除了485,000+的目录)，您可能会遇到此错误：

1	/bin/rm: Argument list too long.

问题是，当您键入类似rm -rf *的内容时，*将替换为每个匹配文件的列表，例如"rm -rf file1 file2 file3 file4"等等。有一个相对较小的内存缓冲区分配给存储这个参数列表，如果它被填满，shell将不会执行该程序。

为了解决这个问题，很多人会使用find命令查找每个文件并将它们逐个传递给"rm"命令，如下所示：

1	find . -type f -exec rm -v {} \;

我的问题是我需要删除500,000个文件，这需要花费太长时间。

我偶然发现了一种更快的删除文件的方式 -"find"命令内置了一个"-delete"标志！这是我最终使用的内容：

1	find . -type f -delete

使用这种方法，我以大约2000个文件/秒的速度删除文件 - 快得多！

您还可以在删除文件名时显示这些文件名：

1	find . -type f -print -delete

...甚至显示将删除多少文件，然后计算删除它们所需的时间：

1
2
3
4
5

root@devel# ls -1 | wc -l && time find . -type f -delete
100000
real 0m3.660s
user 0m0.036s
sys 0m0.552s

相关讨论

你可以用这个推荐

1	find -name"*.pdf" -delete

你可以使用bash数组：

1
2
3
4

files=(*.pdf)
for((I=0;I<${#files[@]};I+=1000)); do
rm -f"${files[@]:I:1000}"
done

这样，它将逐步擦除1000个文件。

相关讨论

rm命令具有可以同时删除的文件的限制。

您可以使用多次rm命令删除它们的一种可能性是基于您的文件模式，例如：

1
2
3
4
5

rm -f A*.pdf
rm -f B*.pdf
rm -f C*.pdf
...
rm -f *.pdf

您也可以通过find命令删除它们：

1	find . -name"*.pdf" -exec rm {} \;

相关讨论

如果它们是带空格或特殊字符的文件名，请使用：

1	find -maxdepth 1 -name '*.pdf' -exec rm"{}" \;

这句话用扩展名pdf(-name'* .pdf')搜索当前目录(-maxdepth 1)中的所有文件，然后删除每一个文件(-exec rm"{}")。

表达式{}替换文件的名称，"{}"将文件名设置为字符串，包括空格或特殊字符。

相关讨论

我很惊讶这里没有ulimit答案。每次我遇到这个问题，我都会在这里或这里结束。我知道这个解决方案有局限性，但ulimit -s 65536似乎经常为我做这个伎俩。

find . -type f -name '*xxx' -print -delete

相关讨论

在将表单源目录复制到目标时，我遇到了同样的问题

源目录有文件~3 lakcs

我使用选项-r的cp，它对我有用

cp -r abc / def /

它会将所有文件从abc复制到def，而不会过长地发出Argument列表的警告

相关讨论

我碰到了几次这个问题。许多解决方案将为需要删除的每个文件运行rm命令。这是非常低效的：

1	find . -name"*.pdf" -print0 \| xargs -0 rm -rf

我最后编写了一个python脚本，根据文件名中的前4个字符删除文件：

1
2
3
4
5
6
7
8
9
10
11
12

import os
filedir = '/tmp/' #The directory you wish to run rm on
filelist = (os.listdir(filedir)) #gets listing of all files in the specified dir
newlist = [] #Makes a blank list named newlist
for i in filelist:
if str((i)[:4]) not in newlist: #This makes sure that the elements are unique for newlist
newlist.append((i)[:4]) #This takes only the first 4 charcters of the folder/filename and appends it to newlist
for i in newlist:
if 'tmp' in i: #If statment to look for tmp in the filename/dirname
print ('Running command rm -rf '+str(filedir)+str(i)+'* : File Count: '+str(len(os.listdir(filedir)))) #Prints the command to be run and a total file count
os.system('rm -rf '+str(filedir)+str(i)+'*') #Actual shell command
print ('DONE')

这对我很有用。我能够在大约15分钟内清除文件夹中超过200万个临时文件。我从一点点代码中评论了tar，所以任何具有最小到没有python知识的人都可以操作这段代码。

还有一个：

1 2	cd /path/to/pdf printf"%s\0" *.[Pp][Dd][Ff] \| xargs -0 rm

printf是一个内置的shell，据我所知，它一直都是这样的。现在假设printf不是shell命令(但是内置命令)，它不会受到"argument list too long ..."致命错误的影响。

因此我们可以安全地将它与shell globbing模式(如*.[Pp][Dd][Ff])一起使用，然后我们通过xargs将其输出移植到remove(rm)命令，这样可以确保它在命令行中符合足够的文件名，使rm命令失败，这是一个shell命令。

printf中的\0用作文件名的空分隔符，然后由xargs命令处理，使用它(-0)作为分隔符，因此当有空格时rm不会失败或文件名中的其他特殊字符。

相关讨论

我发现对于非常大的文件列表(> 1e6)，这些答案太慢了。这是在python中使用并行处理的解决方案。我知道，我知道，这不是linux ......但这里没有其他工作。

(这节省了我几个小时)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

# delete files
import os as os
import glob
import multiprocessing as mp

directory = r'your/directory'
os.chdir(directory)

files_names = [i for i in glob.glob('*.{}'.format('pdf'))]

# report errors from pool

def callback_error(result):
print('error', result)

# delete file using system command
def delete_files(file_name):
os.system('rm -rf ' + file_name)

pool = mp.Pool(12)
# or use pool = mp.Pool(mp.cpu_count())

if __name__ == '__main__':
for file_name in files_names:
print(file_name)
pool.apply_async(delete_files,[file_name], error_callback=callback_error)

我只知道解决这个问题的方法。
我们的想法是将您拥有的pdf文件列表导出到文件中。然后将该文件拆分为几个部分。然后删除每个部分中列出的pdf文件。

1 2	ls \| grep .pdf > list.txt wc -l list.txt

wc -l计算list.txt包含的行数。当你知道它有多长时间时，你可以决定将它分成两半，四分之一。使用split -l命令
例如，将它分成600行。

1	split -l 600 list.txt

这将创建一个名为xaa，xab，xac等文件，具体取决于你如何拆分它。
现在将这些文件中的每个列表"导入"命令rm，使用：

1
2
3

rm $(<xaa)
rm $(<xab)
rm $(<xac)

对不起，我的英语不好。

相关讨论

试试这个如果你想删除30/90天以上(+)或者30/90( - )天以下的文件/文件夹，那么你可以使用下面的ex命令

例如：在90天文件/文件夹删除后90天排除上述，这意味着91,92 .... 100天

1	find <path> -type f -mtime +90 -exec rm -rf {} \;

例如：对于您想要删除的最新30天文件，请使用以下命令( - )

1	find <path> -type f -mtime -30 -exec rm -rf {} \;

如果你想要文件超过2天giz文件

1	find <path> -type f -mtime +2 -exec gzip {} \;

如果你只想看过去一个月的文件/文件夹。
例如：

1	find <path> -type f -mtime -30 -exec ls -lrt {} \;

超过30天以上才会列出文件/文件夹
例如：

1
2
3

find <path> -type f -mtime +30 -exec ls -lrt {} \;

find /opt/app/logs -type f -mtime +30 -exec ls -lrt {} \;

删除目录/path/to/dir_with_pdf_files/中的所有*.pdf

1
2
3

mkdir empty_dir # Create temp empty dir

rsync -avh --delete --include '*.pdf' empty_dir/ /path/to/dir_with_pdf_files/

使用通配符通过rsync删除特定文件可能是最快的解决方案，以防您拥有数百万个文件。它会照顾你得到的错误。

(可选步骤)：DRY RUN。检查将删除的内容而不删除。 `

1	rsync -avhn --delete --include '*.pdf' empty_dir/ /path/to/dir_with_pdf_files/

。
。
。

单击rsync提示和技巧以获取更多rsync黑客攻击

您可以创建临时文件夹，将要保留的所有文件和子文件夹移动到临时文件夹中，然后删除旧文件夹并将临时文件夹重命名为旧文件夹尝试此示例，直到您有信心实时执行：

1
2
3
4
5
6
7
8

mkdir testit
cd testit
mkdir big_folder tmp_folder
touch big_folder/file1.pdf
touch big_folder/file2.pdf
mv big_folder/file1,pdf tmp_folder/
rm -r big_folder
mv tmp_folder big_folder

rm -r big_folder将删除big_folder中的所有文件，无论多少。您必须非常小心，首先要保留所有要保留的文件/文件夹，在这种情况下，它是file1.pdf

如果您需要在删除大量文件时保持服务器或系统响应，则每个删除语句之间的sleep可能是一种很好的方法。

1
2
3
4
5

find . -name"*.pdf" -print0 | while read -d $'\0' file
do
rm"$file"
sleep 0.005 # Sleeps for 5ms, tweak as needed
done

相关讨论

当应用程序创建了数百万个无用的日志文件时，我遇到了类似的问题，这些文件填满了所有的inode。我使用"locate"，将所有文件"定位"到一个文本文件中，然后逐个删除它们。花了一段时间，但做了这个工作！

相关讨论

如果你有类似grep的问题，最简单的解决方案是踩一个目录并进行递归搜索。

而不是

1	grep"something" *

您可以使用：

1 2	cd .. grep"something" -R search_in_this_dir/

请注意，它也会递归搜索"search_in_this_dir"目录的子文件夹。

假设输入输入目录名称并输出输出目录名称。
然后你可以使用简单的循环来复制所有

1
2
3
4

for f in input/*
do
cp $f output
done

我遇到了同样的问题，一个文件夹充满了日复一日的临时图像，这个命令帮助我清除了文件夹

1	find . -name"*.png" -mtime +50 -exec rm {} \;

与其他命令的区别在于mtime参数，该参数仅包含超过X天的文件(在示例中为50天)

多次使用，减少每天执行的日期范围，我能够删除所有不必要的文件

使用GNU parallel(sudo apt install parallel)非常简单

它运行多线程命令，其中'{}'是传递的参数

例如。

ls /tmp/myfiles* | parallel 'rm {}'

相关讨论

删除前100个文件：

rm -rf'ls |头-100'

相关讨论

比使用xargs更安全的版本，也不是递归的：
<5233>

在这里过滤我们的目录有点不必要，因为'rm'无论如何都不会删除它，并且为了简单起见它可以删除，但为什么运行肯定会返回错误的东西？

相关讨论

以下选项对于此问题似乎很简单。我从其他一些帖子得到了这个信息，但它帮助了我。

1
2
3

for file in /usr/op/data/Software/temp/application/openpages-storage/*; do
cp"$file" /opt/sw/op-storage/
done

只需运行上面的一个命令就可以完成任务了。