ack错过了结果(对比grep)

ack misses results (vs. grep)

我确定我对ack的文件/目录忽略默认值有些误解，但也许有人可以为我阐明一下：

1
2
3
4
5
6

mbuck$ grep logout -R app/views/
Binary file app/views/shared/._header.html.erb.bak.swp matches
Binary file app/views/shared/._header.html.erb.swp matches
app/views/shared/_header.html.erb.bak: <%= link_to logout_text, logout_path, { :title => logout_text, :class => 'login-menuitem' } %>
mbuck$ ack logout app/views/
mbuck$

而...

1
2
3
4
5

mbuck$ ack -u logout app/views/
Binary file app/views/shared/._header.html.erb.bak.swp matches
Binary file app/views/shared/._header.html.erb.swp matches
app/views/shared/_header.html.erb.bak
98:<%= link_to logout_text, logout_path, { :title => logout_text, :class => 'login-menuitem' } %>

简单地在没有选项的情况下调用ack无法在.bak文件中找到结果，但使用--unrestricted选项调用可以找到结果。据我所知，ack默认情况下不会忽略.bak文件。

UPDATE

感谢下面的有用评论，以下是我的~/.ackrc的新内容：

1 2	--type-add=ruby=.haml,.rake --type-add=css=.less

ack的特殊之处在于它没有要忽略的文件类型的黑名单，而是它将搜索的文件类型的白名单。

引用手册页：

With no file selections, ack-grep only searches files of types that it recognizes. If you have a file called foo.wango, and ack-grep doesn't know what a .wango file is, ack-grep won't search it.

(注意我使用Ubuntu，因为命名冲突，二进制文件被称为ack-grep)

ack --help-types将显示您的ack安装支持的类型列表。

相关讨论

如果您对ack将要搜索的文件感到困惑，只需添加-f选项即可。它将列出它找到的可搜索的所有文件。

相关讨论

ack --man说：

If you want ack to search every file,
even ones that it always ignores like
coredumps and backup files, use the
"?u" switch.

和

Why does ack ignore unknown files by
default? ack is designed by a
programmer, for programmers, for
searching large trees of code. Most
codebases have a lot files in them
which aren’t source files (like
compiled object files, source control
metadata, etc), and grep wastes a lot
of time searching through all of those
as well and returning matches from
those files.

That’s why ack’s behavior of not
searching things it doesn’t recognize
is one of its greatest strengths: the
speed you get from only searching the
things that you want to be looking at.

编辑：此外，如果您查看源代码，bak文件将被忽略。

相关讨论

从1973年开始，您可以使用简单的旧grep，而不是与ack进行摔跤。因为它使用明确列入黑名单的文件而不是白名单文件类型，所以它永远不会遗漏正确的结果。给定了几行配置(我在20世纪90年代在我的主目录'dotfiles'回购中创建)，grep实际上匹配或超过了许多ack声称的优势 - 特别是速度：当搜索同一组文件时，grep比ack快。

让我开心的grep配置在我的.bashrc中看起来像这样：

1
2
3
4
5
6
7
8
9
10
11
12
13

# Custom 'grep' behaviour
# Search recursively
# Ignore binary files
# Output in pretty colors
# Exclude a bunch of files and directories by name
# (this both prevents false positives, and speeds it up)
function grp {
grep -rI --color --exclude-dir=node_modules --exclude-dir=\.bzr --exclude-dir=\.git --exclude-dir=\.hg --exclude-dir=\.svn --exclude-dir=build --exclude-dir=dist --exclude-dir=.tox --exclude=tags"$@"
}

function grpy {
grp --include=*.py"$@"
}

要忽略的文件和目录的确切列表可能会有所不同：我主要是Python开发人员，这些设置对我有用。

添加子自定义也很容易，正如我为我的'grpy'所示，我用来grep Python源代码。

定义像这样的bash函数比设置GREP_OPTIONS更好，这将导致来自登录shell的grep的所有执行行为不同，包括由您运行的程序调用的那些。这些程序可能会对grep的意外不同行为进行调查。

我的新功能'grp'和'grpy'故意不影响'grep'，所以我仍然可以在任何需要的时候使用原始行为。

相关讨论

东盟地区论坛。我刚刚想到，如果你将上面的两行脚本重命名为'ack'，它可能会形成对ack项目源的下一次提交。
你的双行脚本不会处理用于检测文件类型的shebang行，也不会利用Perl的正则表达式引擎和--output标志，也不会在-1等一次点击时停止等等。你可能会不使用这些功能，但手动波"这个grep脚本与ack相同"是不公平的，因为它们不是。
嘿安迪我承认我夸大了喜剧效果的一点点，如果那是煽动性的，我道歉。但是我的方法直接受到了Ack自己的"优于grep"自我推销的启发，为了让grep看起来很糟糕，它无耻地歪曲并忽略了显着的细节。两个人可以参加那场比赛。如果'确认'真的更好，那么它应该有助于促进诚实的比较，而不是通过让人们放弃像grep这样完美的替代品来使用虚假陈述来破坏社区。
并没有像召唤时间那样煽动"大量浪费时间"(daniel.hahler.de/)我没有"歪曲"或"让grep看起来很糟糕"。如果我有，请指出我，以便我可以解决它。我希望人们尽可能使用最好的工具。很多次，包括SO，我告诉人们"在这种情况下不要使用ack，使用grep"。我只是为了比较：betterthangrep.com/more-tools。如果您输入re：该页面，我欢迎它。我不认为这是一款游戏。我只想挥动除了grep之外还有选项的标志。
好吧，我放弃了，我觉得我说的那些意思很糟糕。但我之所以如此脾气暴躁的原因在于，上次我读到它时，'betterthangrep'主页用于列出类似"使用ack而不是grep的10个理由"，这非常具有误导性，因为grep也做了很多事情在名单上。我看到这个名单现在标题为"使用ack的10个理由"，这有点安抚，但我仍然知道那些误解为"grep不能做的事情"的人。关于"更多工具"页面，我给出的反馈是它可以包括grep作为替代，也许有几个......
...行建议如何在.bashrc中配置包装函数来设置一些默认值，例如"-rI --color --exclude-dir = .git --exclude = tags"。当你提出"ack很快"这样的声明时，或许值得一提的是，正确配置为跳过相同的文件，grep(上次我测量它)实际上更快。谢谢你的合理，即使我是如此卑鄙。
你是否有时间/倾向为betterthangrep.com写一些东西，我可以变成一个页面，或至少在"更多工具"页面上的一节？我喜欢列表的想法"如果你想坚持使用grep，这里有你可以使用的调整。"网站回购是在github.com/petdance/betterthangrep，你可以分叉，或把它放到一个问题。或者哎呀，只要把我邮寄到andy-at-petdance.com，我就会接受。我可以使用你在上面评论中得到的内容，但我认为你可能会添加更多内容。
哦，好吧，我怎么能拒绝这么亲切的邀请呢？
我认为ack是一个好主意，但我认为如果使用grep进行搜索会更好，因为这是grep最擅长的，并且可以说比其他任何东西更快/更有效/更准确。也许你不应该如此专注于搜索方面，而是想办法对从grep获得的数据进行元分析？我正在收集ack有perl的扩展正则表达式，这似乎是很多人的吸引力？我想不出ack可以做的其他事情，grep不能做，不可否认，grep通常需要更多的配置和更长的线路。
超级用户的链接已损坏。
@AndyLester：我也发现ack的炒作非常令人讨厌(并且误导和混淆)。前面应该更清楚的是，ack比grep的主要优点是不需要明确指定要搜索的文件列表;我发现grep login **/*.py和ack --py login之间没有时间差异(例如) - 实际上，grep始终更快。鉴于主页上的炒作，这非常令人困惑。