关于shell：在文件中查找和替换并覆盖文件不起作用，它会清空文件

Find and replace in file and overwrite file doesn't work, it empties the file

我想通过命令行在HTML文件上运行查找和替换。

我的命令看起来像这样：

1	sed -e s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g index.html > index.html

当我运行它并在之后查看该文件时，它是空的。它删除了我的文件的内容。

当我再次恢复文件后运行它：

1	sed -e s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g index.html

stdout是文件的内容，已执行查找和替换。

为什么会这样？

相关讨论

当shell在命令行中看到> index.html时，它会打开文件index.html进行写入，擦除其以前的所有内容。

要解决此问题，您需要将-i选项传递给sed以进行内联更改并在原始文件执行更改之前创建原始文件的备份：

1	sed -i.bak s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g index.html

如果没有.bak，命令将在某些平台上失败，例如Mac OSX。

相关讨论

另一种有用的模式是：

1	sed -e 'script script' index.html > index.html.tmp && mv index.html.tmp index.html

这有很多相同的效果，不使用-i选项，另外意味着，如果sed脚本由于某种原因失败，输入文件不会被破坏。此外，如果编辑成功，则没有剩余的备份文件。这种习惯用法在Makefile中很有用。

相当多的seds都有-i选项，但不是全部; posix sed是一个没有的。因此，如果您的目标是可移植性，那么最好避免使用。

相关讨论

1	sed -i 's/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g' index.html

这会对文件index.html进行全局就地替换。引用字符串可以防止查询和替换中的空格问题。

使用sed的-i选项，例如

1	sed -i bak -e s/STRING_TO_REPLACE/REPLACE_WITH/g index.html

相关讨论

要更改多个文件(并将每个文件的备份保存为* .bak)：

1	perl -p -i -e"s/\\|/x/g" *

将获取目录中的所有文件，并将|替换为x
这被称为"Perl馅饼"(简单的馅饼)

相关讨论

您应该尝试使用选项-i进行就地编辑。

1	sed -i.bak"s#https.*\.com#$pub_url#g" MyHTMLFile.html

如果您要添加链接，请尝试此操作。按上述方式搜索URL(以https开头，此处以..com结尾)并将其替换为URL字符串。我在这里使用了变量$pub_url。 s此处表示搜索，g表示全局替换。

有用！

警告：这是一种危险的方法！它滥用了linux中的i / o缓冲区，并且具有缓冲的特定选项，它可以处理小文件。这是一个有趣的好奇心。但是不要将它用于真实的情况！

除了sed的-i选项
您可以使用tee实用程序。

来自man：

tee - read from standard input and write to standard output and files

所以，解决方案是：

1	sed s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g index.html \| tee \| tee index.html

- 这里重复tee以确保管道被缓冲。然后阻塞管道中的所有命令，直到它们获得一些输入为止。当上游命令将1个字节缓冲区(大小在某处定义)写入命令的输入时，管道中的每个命令都会启动。因此，最后一个命令tee index.html打开文件进行写入并因此将其清空，在上游管道完成并且输出位于管道内的缓冲区之后运行。

最有可能以下情况不起作用：

1	sed s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g index.html \| tee index.html

- 它将同时运行管道的两个命令而不会阻塞。 (不阻塞管道应该逐行传递字节而不是缓冲区缓冲区。与运行cat | sed s/bar/GGG/时相同。没有阻塞它更具交互性，通常只有2条命令的管道在没有缓冲和阻塞的情况下运行。更长的管道被缓冲。 )tee index.html将打开文件进行写入，它将被清空。但是，如果您始终打开缓冲，第二个版本也会起作用。

相关讨论

命令的问题

1	sed 'code' file > file

是的，在sed实际处理它之前，shell会截断file。结果，您得到一个空文件。

执行此操作的sed方法是使用-i进行编辑，如其他答案所示。但是，这并不总是你想要的。 -i将创建一个临时文件，然后用于替换原始文件。如果您的原始文件是链接(链接将被常规文件替换)，则会出现问题。如果需要保留链接，可以使用临时变量存储sed的输出，然后再将其写回文件，如下所示：

1	tmp=$(sed 'code' file); echo -n"$tmp"> file

更好的是，使用printf而不是echo，因为echo可能会在某些shell(例如破折号)中将\\处理为\：

1	tmp=$(sed 'code' file); printf"%s""$tmp"> file

相关讨论

ed回答：

1 2	printf"%s " '1,$s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g' w q \| ed index.html

为了重申codaddict的回答，shell首先处理重定向，擦除"input.html"文件，然后shell调用"sed"命令将其传递给现在为空的文件。

相关讨论

您可以在Ex模式下使用Vim：

1	ex -sc '%s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g\|x' index.html

%选择所有行

x保存并关闭

在充分尊重上述正确答案的情况下，这样的"干运行"脚本总是一个好主意，这样您就不会破坏文件并且必须从头开始。

只需让你的脚本将输出溢出到命令行而不是将其写入文件，例如，像这样：

1	sed -e s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g index.html

要么

1	less index.html \| sed -e s/STRING_TO_REPLACE/STRING_TO_REPLACE_IT/g

这样，您可以查看并检查命令的输出，而不会截断文件。

我正在寻找可以定义行范围并找到答案的选项。例如，我想从第36-57行将host1更改为host2。

1	sed '36,57 s/host1/host2/g' myfile.txt > myfile1.txt

您也可以使用gi选项忽略字符大小写。

1	sed '30,40 s/version/story/gi' myfile.txt > myfile1.txt