在Bash中将字符串拆分为数组

Split string into an array in Bash

在bash脚本中，我希望将一行拆分为多个部分，并将它们存储在一个数组中。

行：

1	Paris, France, Europe

我想把它们放在这样的数组中：

1
2
3

array[0] = Paris
array[1] = France
array[2] = Europe

号

我想用简单的代码，命令的速度不重要。我该怎么做？

相关讨论

如何引用元素？
只需使用IFS=', '，就不必单独删除这些空间。测试：IFS=', ' read -a array <<<"Paris, France, Europe"; echo"${array[@]}"。
@LGN：请看我编辑过的答案。
@l0b0：谢谢。我不知道我在想什么。顺便说一下，我喜欢用declare -p array来测试输出。
@丹尼斯威廉姆森：不错的一个，加在.bash_history上。
如果我想使用多个分隔符，比如；，那该怎么办？
@RAM：在IFS的值中添加更多的字符。
阵列的长度如何？
奥古斯汀·里丁：我已经补充了一些信息。谢谢。
这似乎不尊重引用。例如，France, Europe,"Congo, The Democratic Republic of the"这将在刚果之后分裂。
@Yisraeldov:bash无法单独处理csv。它不能区分引号内的逗号和引号外的逗号。您需要使用一个能够理解csv的工具，例如高级语言中的lib，例如python中的csv模块。
感谢您提供这一酷代码。是否仍要将其放入函数中？当我这样做的时候，我会回应$arr[@]但是这样做的话，我可能会错过arr[x]可能是nul字符串的情况。
@Bittiot：你可能需要把这个问题作为一个单独的问题来问，这样你就可以包含更多关于你想做什么的细节。是的，您可以将其放入函数中。我不知道缺少数组元素是空字符串的情况是什么意思，因为没有要输出的内容。
如果用于标记化的字符串有通配符呢？例如，ifs='base*'
@Jayd：每个字符单独使用，而不是作为一个序列。星号只是另一个字符。
"$index ${array[index]}"应该是"$index ${array[$index]}"，不是吗？
@泰特里斯11：可以是任何一种方式。数组索引是一个算术上下文，通常不需要美元符号。
@caesarsol：把你的和IFS=', ' read -a array <<<"a, d r s, w"比较一下，在输入中逗号后加上空格。结果是相同的(没有创建空数组元素)，因为空间是特殊处理的。还可以比较输入，例如创建空元素的"a, d r s,,w"和不创建任何空元素的"a, d r s w"(在"s"和"w"之间有多个空格，这里不太清楚)。同时，我对你在2015年8月7日之前提到的IFS的特点进行了评论。
@丹尼斯威廉姆森认为，ifs也将按空格进行拆分：在我的示例中，d r s单词应该是单个数组元素。
@凯撒索：你第一句话中的IFS包括一个空格。declare -p array是显示数组元素(btw)的好方法。
如果我们有类似"/opt/test/dir"的字符串，并且希望使用"/"进行拆分，该怎么办？我尝试了ifs='/，但不起作用：(
@甘尼什：对我有用。你到底是怎么做的？你是怎么确定它不起作用的？这就是我用你的例子所做的：IFS='/' read -r -a array <<<"/opt/test/dir"; for d in"${array[@]}"; do echo"$d"; done。
@丹尼斯威廉姆森谢谢你的回复，这是我的错。我正在使用字符串"/opt/test/dir"并用"/"拆分。试图回显第0个元素，其中：p
很好的回答，谢谢。注意，如果有人使用bash<4.2，那么echo"$array[@]: -1:1}缺少初始{和结束"，应该是echo"${array[@]: -1:1}"。
@244AN：谢谢，修好了。
str="Paris, France, Europe, Los Angeles"; IFS=', ' read -r -a array <<<"$str"将作为注释拆分为array=([0]="Paris" [1]="France" [2]="Europe" [3]="Los" [4]="Angeles")。所以这只适用于没有空格的字段，因为IFS=', '是一组单独的字符，而不是字符串分隔符。
@如Caesarsol于2015年10月29日所述。我会在我的答案中添加信息。
知道这里出什么事了吗？s="a:b:c"; IFS=':' read -r -a array <<< $s; echo $array; echo ${array[1]}。预期产量a b ca，实际得到a b c。
@斯库博：我不知道你得到了什么，我得到了ab，这是我希望从你的代码中得到的，它说"打印数组的第一个元素；打印数组的第二个元素"。如果需要预期的输出：s="a:b:c"; IFS=':' read -r -a array <<<"$s"; echo"${array[@]}"; echo"${array[0]}"，原因是对数组的标量引用与数组的第一个元素相同，并且数组索引是基于零的。还要注意，你应该总是使用适当的报价(但这不是你的问题)。我不知道你是如何得到你展示的输出的…
…除非没有设置IFS=':'，否则输出为a:b:c。
嗯-不知道为什么我们得到不同的结果(可能是因为不同的外壳？我在sh和bash中得到了上面的错误，但在zsh中得到了zsh: bad option: -a，但你提出的解决方案对我有效。谢谢！
@丹尼斯威廉姆森，哦，我发现了区别。我需要引用WRAP "$s"来获得我所期望的行为。
@scubbo：复制并粘贴你在第一封邮件中发布的内容。我怀疑你发布的内容与你实际测试的内容不符。
imgur.com/a/4bi6z公司
@斯库博：好的，这是一个在bash 4.3中修复的bug。
知道了。谢谢！
可能是我见过的最邪恶的语言语法lol

这个问题的所有答案在某种程度上都是错误的。好的。

回答错误1好的。

1	IFS=', ' read -r -a array <<<"$string"

1：这是对$IFS的滥用。$IFS变量的值不作为单变量长度字符串分隔符，而是作为一组单字符串分隔符，其中read从输入行拆分的每个字段都可以由集合中的任何字符(本例中为逗号或空格)终止。好的。

实际上，对于真正的黏性者来说，$IFS的完整含义稍微复杂一些。从bash手册：好的。

The shell treats each character of IFS as a delimiter, and splits the results of the other expansions into words using these characters as field terminators. If IFS is unset, or its value is exactly , the default, then sequences of , , and at the beginning and end of the results of the previous expansions are ignored, and any sequence of IFS characters not at the beginning or end serves to delimit words. If IFS has a value other than the default, then sequences of the whitespace characters , , and are ignored at the beginning and end of the word, as long as the whitespace character is in the value of IFS (an IFS whitespace character). Any character in IFS that is not IFS whitespace, along with any adjacent IFS whitespace characters, delimits a field. A sequence of IFS whitespace characters is also treated as a delimiter. If the value of IFS is null, no word splitting occurs.

Ok.

号

基本上，对于$IFS的非默认非空值，字段可以用(1)一个或多个字符序列来分隔，这些字符都来自于"ifs whitespace characters"集合(也就是说，在$IFS中的任何位置都存在、和("newline"表示换行(lf))，或者(2)任何非"ifs whitese"在$IFS中出现的速度字符"以及在输入行中围绕它的任何"ifs空白字符"。好的。

对于OP，上一段中描述的第二个分离模式可能正是他想要的输入字符串，但我们可以非常确信我描述的第一个分离模式根本不正确。例如，如果他的输入字符串是'Los Angeles, United States, North America'呢？好的。

1 2	IFS=', ' read -ra a <<<'Los Angeles, United States, North America'; declare -p a; ## declare -a a=([0]="Los" [1]="Angeles" [2]="United" [3]="States" [4]="North" [5]="America")

2：如果你被连到使用这个解决方案与一个单一的字符separator(一个世纪的itself由逗号，这也与以下，没有空间或其他baggage)，如果value"的$string可变happens到含有任何LFS，然后read将停止处理它的第一次遭遇LF。"readbuiltin唯一的过程中每一行的invocation。这是真实的，即使你是piping或redirecting只输入 readstatement，我们做的是，在这个例子与睾丸mechanism和输入字符串，因此unprocessed也保证要失去了。"code，权力的readbuiltin腹部没有知识的数据流在其包含的指挥结构。＜P / S＞。

你可以argue这unlikely到原因的问题，但仍然， subtle危害，应该avoided如果可能。它也引起了由"事实上，readbuiltin实际上并levels两部：第一splitting输入到线，然后到的领域。由于"OP只想要一个水平的splitting，这usage之readbuiltin不适当的情况下，我们应该避免它。＜P / S＞。

3：非太明显了潜在的问题与解决方案，这是read总是drops的trailing领域，如果它是空的，虽然它preserves另有空字段。这里的演示：＜P / S＞。

1 2	string=', , a, , b, c, , , '; IFS=', ' read -ra a <<<"$string"; declare -p a; ## declare -a a=([0]="" [1]="" [2]="a" [3]="" [4]="b" [5]="c" [6]="" [7]="")

也许"OP不会在乎这一点，但它仍然是在限制的价值认识的意义。它的reduces robustness和generality"的解决方案。＜P / S＞。

这个问题可以通过solved appending虚拟trailing delimiter 输入字符串之前就到read饲养它，我将demonstrate以后。＜P / S＞。

错误的答案# 2 ＜P / S＞。

1
2
3

string="1:2:3:4:5"
set -f # avoid globbing (expansion of *).
array=(${string//:/ })

similar理念：＜P / S＞。

1
2
3

t="one,two,three"
a=($(echo $t | tr ','"
"))

(注：我错过了parentheses周围添加的"替代"的命令，answerer似乎有omitted。) ＜P / S＞。

similar理念：＜P / S＞。

1
2
3

string="1,2,3,4"
array=(`echo $string | sed 's/,/
/g'`)

这些解决方案，利用Word的splitting在一个阵列分配到分离的字符串中的领域。funnily不够，就像read，一般用途的专用Word splitting也$IFS可变的，虽然在这一情况下，它也implied，它也设定到其违约value of <空格> <标签> <和> newline，therefore任何序列的一个或多个字符IFS(这是所有的字符数，现在也被视为对whitespace)在delimiter领域。＜P / S＞。

这就解决了read提交的两级拆分问题，因为单词本身拆分仅构成一级拆分。但和以前一样，这里的问题是输入字符串中的各个字段可能已经包含了$IFS字符，因此在分词操作期间它们将被不正确地拆分。对于这些应答器提供的任何示例输入字符串(多么方便…)来说，情况并非如此，但这当然不会改变这样一个事实，即如果在某个时刻违反了这个假设，那么使用这个习语的任何代码基都会有崩溃的风险。再次，考虑一下我对'Los Angeles, United States, North America'或'Los Angeles:United States:North America'的反例。好的。

另外，分词后通常是文件名扩展(也称为路径名扩展，也称为globbing)，如果这样做，可能会损坏包含字符*、?或[的单词，然后是](如果设置了extglob，则括号片段前面是?、*、+、@或!通过将它们与文件系统对象匹配并相应地扩展单词("globs")。这三个回答者中的第一个巧妙地通过预先运行set -f来禁用globbing来削弱这个问题。从技术上讲，这是可行的(尽管您可能应该在之后添加set +f以重新启用可能依赖它的后续代码的全局绑定)，但不希望为了在本地代码中破解基本的字符串到数组的解析操作而混乱全局shell设置。好的。

此答案的另一个问题是，所有空字段都将丢失。这可能是问题，也可能不是问题，具体取决于应用程序。好的。

注意：如果您要使用这个解决方案，最好使用参数扩展的${string//:/ }模式替换形式，而不是麻烦调用命令替换(它分叉外壳)、启动管道和运行外部可执行文件(tr或sed，因为参数扩展是纯粹是一个shell内部操作。(另外，对于tr和sed解决方案，输入变量应在命令替换中进行双引号；否则，分词将在echo命令中生效，并可能与字段值混淆。此外，命令替换的$(...)形式比旧的`...`形式更可取，因为它简化了命令替换的嵌套，并允许文本编辑器更好地突出显示语法。)好的。

回答错误3好的。

1 2	str="a, b, c, d" # assuming there is a space after ',' as in Q arr=(${str//,/}) # delete all occurrences of ','

这个答案几乎与2相同。不同之处在于，回答者假定字段由两个字符分隔，其中一个字符在默认的$IFS中表示，另一个字符不表示。他通过使用模式替换扩展删除非IFS表示的字符，然后使用分词来拆分剩余的IFS表示的分隔符字符上的字段，解决了这个相当具体的问题。好的。

这不是一个非常通用的解决方案。此外，可以认为逗号实际上是这里的"主要"分隔符，剥离它然后根据空格字符进行字段拆分是完全错误的。再一次，考虑我的反例：'Los Angeles, United States, North America'。好的。

同样，文件名扩展可能会损坏扩展的单词，但是可以通过暂时禁用set -f和set +f的分配的全局性来防止这种情况。好的。

同样，所有空字段都将丢失，这可能是问题，也可能不是问题，具体取决于应用程序。好的。

回答错误4好的。

1
2
3
4
5
6
7
8
9
10

string='first line
second line
third line'

oldIFS="$IFS"
IFS='
'
IFS=${IFS:0:1} # this is useful to format your code with tabs
lines=( $string )
IFS="$oldIFS"

号

这类似于2和3，因为它使用分词来完成任务，只是现在代码显式地将$IFS设置为只包含输入字符串中存在的单个字符字段分隔符。应该重复的是，这对于多字符字段分隔符(如op的逗号空间分隔符)不起作用。但是对于像本例中使用的LF这样的单个字符分隔符，它实际上接近完美。正如我们在前面的错误答案中看到的那样，字段不能在中间无意中被拆分，并且根据需要，只有一个级别的拆分。好的。

一个问题是，文件名扩展会破坏前面描述的受影响的单词，尽管这可以通过在set -f和set +f中包装critical语句来解决。好的。

另一个潜在的问题是，由于LF符合前面定义的"IFS空白字符"，所有空字段都将丢失，就像在2和3中一样。如果分隔符恰好是非"ifs空白字符"，这当然不是问题，而且根据应用程序的不同，它可能无论如何都不重要，但它确实会影响解决方案的通用性。好的。

因此，总而言之，假设您有一个单字符分隔符，并且它不是一个非"ifs空白字符"，或者您不关心空字段，并且您将关键语句包装在set -f和set +f中，那么这个解决方案是有效的，但不是有效的。好的。

(另外，为了便于参考，可以使用$'...'语法(例如IFS=$'
';)更容易地为bash中的变量分配LF。)好的。

回答错误5好的。

1
2
3
4

countries='Paris, France, Europe'
OIFS="$IFS"
IFS=', ' array=($countries)
IFS="$OIFS"

类似的想法：好的。

1	IFS=', ' eval 'array=($string)'

这个解决方案实际上是1(它将$IFS设置为逗号空间)和2-4(它使用分词将字符串拆分为字段)之间的交叉。正因为如此，它遭受了困扰上述所有错误答案的大多数问题，有点像世界上最糟糕的问题。好的。

另外，对于第二个变量，似乎完全不需要eval调用，因为它的参数是单引号字符串文字，因此是静态已知的。但这样使用eval实际上有一个非常不明显的好处。通常，当运行仅由变量赋值组成的简单命令时，意味着后面没有实际的命令字，赋值在shell环境中生效：好的。

1	IFS=', '; ## changes $IFS in the shell environment

号

即使简单命令涉及多个变量分配，也是如此；同样，只要没有命令字，所有变量分配都会影响shell环境：好的。

1	IFS=', ' array=($countries); ## changes both $IFS and $array in the shell environment

但是，如果变量赋值附加到命令名(我喜欢称之为"前缀赋值")，那么它不会影响shell环境，而是只影响已执行命令的环境，不管它是内置的还是外部的：好的。

1 2	IFS=', ' :; ## : is a builtin command, the $IFS assignment does not outlive it IFS=', ' env; ## env is an external command, the $IFS assignment does not outlive it

。

bash手册中的相关引用：好的。

If no command name results, the variable assignments affect the current shell environment. Otherwise, the variables are added to the environment of the executed command and do not affect the current shell environment.

Ok.

号

利用变量分配的这一特性，我们可以暂时改变$IFS，这样我们就可以避免第一个变量中的$OIFS变量所带来的整个保存和恢复。但我们在这里面临的挑战是，我们需要运行的命令本身只是一个变量赋值，因此它不涉及命令字来临时执行$IFS赋值。你可能会想，为什么不在声明中添加一个no-op命令字，比如: builtin，以使$IFS赋值是临时的？这不起作用，因为这样一来，$array任务也将成为临时任务：好的。

1	IFS=', ' array=($countries) :; ## fails; new $array value never escapes the : command

所以，我们实际上陷入了僵局，有点像第22条军规。但是，当eval运行它的代码时，它在shell环境中运行，就像它是正常的静态源代码一样，因此我们可以在eval参数内部运行$array赋值，使它在shell环境中生效，而在eval命令前面的$IFS前缀赋值将不会比eval命令还长。这正是该解决方案的第二个变体所使用的技巧：好的。

1	IFS=', ' eval 'array=($string)'; ## $IFS does not outlive the eval command, but $array does

所以，正如你所看到的，这实际上是一个相当聪明的技巧，并且以一种相当不明显的方式完成所需的工作(至少在任务完成方面)。实际上，我并不反对这种伎俩，尽管eval参与其中；只是要小心地单引用参数字符串以防范安全威胁。好的。

但同样，由于"世界上最糟糕的"问题的聚集，这仍然是对OP要求的错误回答。好的。

回答错误6好的。

1
2
3

IFS=', '; array=(Paris, France, Europe)

IFS=' ';declare -a array=(Paris France Europe)

号

嗯。。。什么？OP有一个字符串变量需要解析为数组。这个"答案"以粘贴到数组文字中的输入字符串的逐字内容开始。我想这是一种方法。好的。

看起来，应答者可能假设$IFS变量影响所有上下文中的所有bash解析，但这不是真的。从bash手册：好的。

IFS The Internal Field Separator that is used for word splitting after expansion and to split lines into words with the read builtin command. The default value is .

Ok.

号

因此，$IFS特殊变量实际上只在两个上下文中使用：(1)扩展后执行的分词(意思是解析bash源代码时不执行)和(2)由read内置的将输入行拆分为单词。好的。

让我试着让这更清楚些。我认为在解析和执行之间划出一个界限可能会比较好。bash必须首先解析源代码，这显然是一个解析事件，然后执行代码，这就是扩展进入图片的时候。扩展实际上是一个执行事件。此外，我对我刚才引用的$IFS变量的描述有异议；我认为分词是在扩展过程中执行的，而不是在扩展后执行的，或者更准确地说，分词是扩展过程的一部分。短语"分词"只指扩展的这一步；它不应该用于bash源代码的解析，尽管不幸的是，文档似乎经常围绕"分词"和"词"这两个词。以下是bash手册linux.die.net版本的相关摘录：好的。

将命令行拆分为单词后，在命令行上执行扩展。执行了七种扩展：大括号扩展、颚化符扩展、参数和变量扩展、命令替换、算术扩展、分词和路径名扩展。好的。
扩展的顺序是：大括号扩展；tilde扩展、参数和变量扩展、算术扩展和命令替换(从左到右进行)；分词；路径名扩展。好的。

您可以争辩说，GNU版本的手册做得稍微好一些，因为它在扩展部分的第一句话中选择了单词"tokens"而不是"words"：好的。

Expansion is performed on the command line after it has been split into tokens.

Ok.

号
重要的是，$IFS不会改变bash解析源代码的方式。bash源代码的解析实际上是一个非常复杂的过程，涉及到对shell语法的各种元素的识别，例如命令序列、命令列表、管道、参数扩展、算术替换和命令替换。在大多数情况下，bash解析过程不能被用户级操作(如变量分配)改变(实际上，这条规则有一些小的例外；例如，查看各种compatxxshell设置，这些设置可以动态地改变解析行为的某些方面)。然后，根据上述文档摘录中分解的"扩展"一般过程，扩展由此复杂解析过程产生的上游"单词"/"令牌"，其中扩展(扩展？)的分词。将文本转换为下游单词只是这个过程的一个步骤。分词只涉及前面扩展步骤中吐出的文本；它不影响直接从源字节流分析的文本。好的。
回答错误7好的。

1
2
3
4
5
string='first line
second line
third line'

while read -r line; do lines+=("$line"); done <<<"$string"

这是最好的解决方案之一。注意，我们又开始使用read。我刚才不是说read不合适，因为它执行两个级别的拆分，而我们只需要一个级别？这里的诀窍是，您可以以这样的方式调用read，它实际上只执行一个级别的拆分，特别是每次调用只拆分一个字段，这就需要在一个循环中重复调用它的成本。这有点花招，但很管用。好的。
但也有问题。第一：当您向read提供至少一个name参数时，它会自动忽略从输入字符串中分离出来的每个字段中的前导和尾随空格。无论$IFS是否设置为默认值，都会发生这种情况，如本文前面所述。现在，对于特定的用例，操作人员可能不关心这个问题，事实上，它可能是解析行为的理想特性。但不是所有想将字符串解析为字段的人都想这样做。然而，有一个解决方案：read的一个不明显的用法是传递零名称参数。在这种情况下，read将把它从输入流中获得的整个输入行存储在名为$REPLY的变量中，并且作为一个额外的好处，它不会从值中去掉前导和尾随空格。这是我在shell编程生涯中经常使用的read的一个非常健壮的用法。下面是对行为差异的演示：好的。

1
2
3
4
5
6
7
8
9
string=$' a b
c d
e f '; ## input string

a=(); while read -r line; do a+=("$line"); done <<<"$string"; declare -p a;
## declare -a a=([0]="a b" [1]="c d" [2]="e f") ## read trimmed surrounding whitespace

a=(); while read -r; do a+=("$REPLY"); done <<<"$string"; declare -p a;
## declare -a a=([0]=" a b " [1]=" c d " [2]=" e f ") ## no trimming

这个解决方案的第二个问题是，它实际上并没有处理自定义字段分隔符的情况，例如op的逗号空间。和以前一样，不支持多字符分隔符，这是该解决方案的一个不幸限制。我们可以通过指定-d选项的分隔符来尝试至少在逗号上拆分，但要看会发生什么：好的。

1
2
3
string='Paris, France, Europe';
a=(); while read -rd,; do a+=("$REPLY"); done <<<"$string"; declare -p a;
## declare -a a=([0]="Paris" [1]=" France")

可以预见，未计算的周围空白被拉入字段值中，因此必须随后通过剪裁操作更正(这也可以直接在while循环中完成)。但还有一个明显的错误：欧洲不见了！怎么了？答案是，如果read到达文件结尾(在本例中，我们可以称之为字符串结尾)，而不在最后一个字段上遇到最后一个字段终止符，则返回失败的返回代码。这会导致while循环过早中断，从而丢失最终字段。好的。
从技术上讲，同样的错误也影响了前面的例子；不同之处在于，字段分隔符被认为是lf，这是不指定-d选项时的默认值，并且<<<机制自动将lf附加到字符串ju在它将它作为命令的输入提供之前。因此，在这些情况下，我们无意中在输入端附加了一个虚拟终止符，从而解决了最终字段丢失的问题。让我们把这个解决方案称为"虚拟终结器"解决方案。我们可以手动为任何自定义分隔符应用虚拟终止符解决方案，方法是在将其实例化为此处字符串时将其与输入字符串连接起来：好的。

1
2
a=(); while read -rd,; do a+=("$REPLY"); done <<<"$string,"; declare -p a;
declare -a a=([0]="Paris" [1]=" France" [2]=" Europe")

在那里，问题解决了。另一种解决方案是，只有当(1)read返回失败，(2)$REPLY为空时，才能中断while循环，这意味着read在到达文件结尾之前无法读取任何字符。演示：好的。

1
2
3
a=(); while read -rd,|| [[ -n"$REPLY" ]]; do a+=("$REPLY"); done <<<"$string"; declare -p a;
## declare -a a=([0]="Paris" [1]=" France" [2]=$' Europe
')

这种方法还揭示了由<<<重定向操作符自动附加到here字符串的秘密lf。当然，可以通过前面描述的显式剪裁操作将其单独剥离，但显然，手动虚拟终结器方法直接解决了这一问题，所以我们可以继续。手动虚拟终止器解决方案实际上非常方便，因为它一次性解决了这两个问题(丢弃的最终字段问题和附加的LF问题)。好的。
所以，总的来说，这是一个非常强大的解决方案。唯一剩下的弱点是缺乏对多字符定界符的支持，稍后我将对此进行讨论。好的。
错误答案8好的。

1
2
3
4
5
string='first line
second line
third line'

readarray -t lines <<<"$string"

(事实上，这与7来自同一个帖子；回答者在同一帖子中提供了两个解决方案。)好的。
作为mapfile的同义词，readarray内置是理想的。它是一个内置命令，一次将字节流解析为数组变量；不与循环、条件、替换或其他任何操作混淆。它不会秘密地从输入字符串中删除任何空白。并且(如果没有给定-O)它在分配给目标数组之前方便地清除目标数组。但它仍然不完美，因此我批评它是一个"错误的答案"。好的。
首先，为了避免这种情况的发生，请注意，正如在进行字段解析时read的行为一样，readarray会在尾随字段为空时丢弃尾随字段。同样，这可能不是操作的问题，但也可能是一些用例的问题。我马上就回来。好的。
第二，和以前一样，它不支持多字符分隔符。我也会马上解决这个问题。好的。
第三，编写的解决方案不解析OP的输入字符串，事实上，它不能像解析那样被使用。我也会在这方面做些扩展。好的。
基于以上原因，我仍然认为这是对OP问题的"错误答案"。下面我将给出我认为正确的答案。好的。
正确答案好的。
这是NA？我试图通过指定-d选项来实现工作：好的。

1
2
3
4
string='Paris, France, Europe';
readarray -td, a <<<"$string"; declare -p a;
## declare -a a=([0]="Paris" [1]=" France" [2]=$' Europe
')

我们看到结果与我们从循环read解决方案的双条件方法得到的结果相同，如7所述。我们几乎可以用手工的虚拟终结者技巧来解决这个问题：好的。

1
2
3
readarray -td, a <<<"$string,"; declare -p a;
## declare -a a=([0]="Paris" [1]=" France" [2]=" Europe" [3]=$'
')

号
这里的问题是readarray保留了尾随字段，因为<<<重定向运算符将lf附加到输入字符串，因此尾随字段不是空的(否则它会被删除)。我们可以通过在以下事实之后显式地取消设置最终数组元素来解决这一问题：好的。

1
2
readarray -td, a <<<"$string,"; unset 'a[-1]'; declare -p a;
## declare -a a=([0]="Paris" [1]=" France" [2]=" Europe")

剩下的两个实际相关的问题是：(1)需要修剪的外来空白；(2)缺乏对多字符分隔符的支持。好的。
当然，空白可以在后面进行修剪(例如，参见如何从bash变量中修剪空白？)但是如果我们能破解一个多字符分隔符，那么这将一次性解决这两个问题。好的。
不幸的是，无法直接使用多字符分隔符。我想到的最佳解决方案是对输入字符串进行预处理，将多字符分隔符替换为单字符分隔符，这样可以保证不会与输入字符串的内容冲突。唯一具有此保证的字符是nul字节。这是因为，在bash中(顺便说一下，不是在zsh中)，变量不能包含nul字节。这个预处理步骤可以在进程替换中以内联方式完成。下面介绍如何使用awk：好的。

1
2
3
readarray -td '' a < <(awk '{ gsub(/, /,"\0"); print; }' <<<"$string,"); unset 'a[-1]';
declare -p a;
## declare -a a=([0]="Paris" [1]="France" [2]="Europe")

终于到了！此解决方案不会在中间错误地拆分字段，不会过早地剪切，不会删除空字段，不会损坏文件名扩展名本身，不会自动删除前导和尾随的空格，不会在结尾处留下一个收起LF，不需要循环，也不会固定为单个字符分隔符。好的。
切边液好的。
最后，我想用readarray的模糊的-C callback选项演示我自己相当复杂的修剪解决方案。不幸的是，我已经没有足够的空间来应对堆栈溢出的30000个字符的严格限制，所以我无法解释它。我把它留给读者作为练习。好的。

1
2
3
4
5
6
function mfcb { local val="$4";"$1"; eval"$2[$3]=\$val;"; };
function val_ltrim { if [["$val" =~ ^[[:space:]]+ ]]; then val="${val:${#BASH_REMATCH[0]}}"; fi; };
function val_rtrim { if [["$val" =~ [[:space:]]+$ ]]; then val="${val:0:${#val}-${#BASH_REMATCH[0]}}"; fi; };
function val_trim { val_ltrim; val_rtrim; };
readarray -c1 -C 'mfcb val_trim a' -td, <<<"$string,"; unset 'a[-1]'; declare -p a;
## declare -a a=([0]="Paris" [1]="France" [2]="Europe")

号好啊。

相关讨论

注意到(可以理解的是，您没有空间这样做)，-d选项首次出现在bash 4.4中可能也会有所帮助。

您应该添加一个"tl；dr:scroll 3 pages to see the right solution at the end of my answer"

很好的答案(+1)。如果你把你的锥子换成awk '{ gsub(/,[ ]+|$/,"\0"); print }'，并消除了最终的","的连接，那么你就不必再去练习如何消除最后的记录了。所以：支持readarray的bash上的readarray -td '' a < <(awk '{ gsub(/,[ ]+/,"\0"); print; }' <<<"$string")。注意，你的方法是bash 4.4+我想是因为readarray中的-d。

您声明：不幸的是，无法直接使用多字符分隔符。实际上，bash中有一个regex：您可以使用类似于在sed或awk中使用的regex。我答案中的一个例子。

@很酷的解决方案！查看我的评论并编辑为您的答案。

看起来readarray不是OSX上可用的内置组件。

@很不幸。您的bash版本对于readarray来说一定太旧了。在这种情况下，您可以使用基于read构建的第二最佳解决方案。我指的是：a=(); while read -rd,; do a+=("$REPLY"); done <<<"$string,";(如果您需要多字符分隔符支持，则使用awk替换)。如果遇到任何问题，请告诉我；我很确定这个解决方案应该适用于相当旧的bash版本，回到20年前发布的版本2-something。

哇，回答得真好！嘻嘻，我的回答是：放弃bash脚本，启动了python！

@OSX上的datuser bash仍然停留在3.2版本(约2007年发布)；我使用了自制的bash在OSX上获得了4.x bash版本。

readarray:-d:无效选项，您确定答案正确吗？

如果我不想使用"，"但""作为分隔符，我必须更改什么？

非常感谢！你是我的救世主。

现在这是一个答案！它应该得到每一点500分的赏金。

以下是不设置IFS的方法：

1
2
3
4
5
6
7
string="1:2:3:4:5"
set -f # avoid globbing (expansion of *).
array=(${string//:/ })
for i in"${!array[@]}"
do
echo"$i=>${array[i]}"
done

想法是使用字符串替换：

1
${string//substring/replacement}

。
要用空白替换$substring的所有匹配项，然后使用替换字符串初始化数组：

1
(element1 element2 ... elementN)

号
注意：这个答案使用了split+glob操作符。因此，为了防止某些字符(如*)的扩展，最好暂停此脚本的全局切换。

相关讨论

使用这种方法…直到我遇到一根要分开的长绳子。100%的CPU时间超过一分钟(然后我杀了它)。很遗憾，因为此方法允许按字符串进行拆分，而不是按IFS中的某些字符进行拆分。

一分钟以上的100%CPU时间在我看来肯定有什么问题。这个字符串有多长，大小是MB还是GB？我认为，通常情况下，如果您只需要一个小的字符串拆分，那么您希望留在bash中，但是如果它是一个大文件，那么我将执行类似perl的操作来完成它。

警告：这种方法刚刚遇到问题。如果您有一个名为*的元素，那么您也将获得您的CWD的所有元素。因此，string="1:2:3:4:*"将根据您的实现给出一些意外的、可能是危险的结果。在(ifs=''read-a array<<<"$string")中没有得到相同的错误，而这个错误似乎可以安全使用。

对多种价值不可靠，小心使用

在基本shell中工作，而另一个答案不工作。谢谢！

引用${string//:/ }可防止壳体膨胀

我不得不在OSX上使用以下命令：array=(${string//:/ })。

和@markouver一样，我没有直接在答案后面得到预期的结果，而是使用了一个不带引号的版本。

@andrewwhite添加引用的编辑可防止外壳拆分并中断答案。它仍然容易受到*和相关问题的扩展。

这个答案是基于外壳的拆分，避免全局扩展是明智的，以避免*的扩展。相应地编辑了答案。

@斑马很漂亮。由于全球扩张和引用这个问题解决了这个问题，我的回答确实不起作用。对不起，如果我弄错了。

我更喜欢这件事，而不是与国际单项体育联合会混在一起。吨比"分裂"快。

当我尝试处理一个以"/"作为分隔符的字符串时，这对我很有用。(是的，我甚至想逃离它。)谢谢！

太好了，我喜欢这个非IFS解决方案！

大家都不知道，分裂仍在使用IFS。它只是使用IFS的默认值是空格、制表符和换行符。

@Jim如果string中的元素包含空格怎么办？

1
2
3
4
t="one,two,three"
a=($(echo"$t" | tr ',' '
'))
echo"${a[2]}"

号
打印三张

相关讨论

我其实更喜欢这种方法。简单。

我复制并粘贴了这个，它不适用于Echo，但当我在for循环中使用它时，它确实起作用。

这是最简单的方法。谢谢

这不符合规定。@jmoney38或shrimpwagon如果您可以将其粘贴到终端中并获得所需的输出，请将结果粘贴到此处。

@阿巴特为我和埃多克斯1〔5〕合作。与a=($(echo $t | tr ',' ' '))结果相同。

@拖延者，我只是在bash壳里试了一下，最后一个echo只印了一条空行。Linux的哪个版本以及您使用的是哪个shell？很遗憾，无法在注释中显示终端会话。

我把它卷回原版，效果很好。2015年10月16日的编辑打破了它。请注意，反勾号已被弃用，首选$()。编辑的人只是把更正放错了地方。此外，还应引用变量。我做了一个编辑来反映这些变化。

在Ubuntu Trusty上工作顺利！最简单明了的回答。

有时我突然想到，在接受的答案中描述的方法不起作用，特别是如果分隔符是回车符。在这些情况下，我是这样解决的：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
string='first line
second line
third line'

oldIFS="$IFS"
IFS='
'
IFS=${IFS:0:1} # this is useful to format your code with tabs
lines=( $string )
IFS="$oldIFS"

for line in"${lines[@]}"
do
echo"--> $line"
done

。

相关讨论

+这对我完全有效。我需要将多个字符串用换行符分隔成一个数组，而read -a arr <<<"$strings"不适用于IFS=$'
'。

下面是使接受的答案在分隔符是换行符时起作用的答案。

接受的答案适用于一行中的值。如果变量有多行：

1
2
3
string='first line
second line
third line'

号
我们需要一个非常不同的命令来获取所有行：
埃多克斯1〔2〕
或者更简单的bash readarray：

1
readarray -t lines <<<"$string"

号
打印所有行非常容易利用打印功能：

1
2
3
4
5
6
printf">[%s]
""${lines[@]}"

>[first line]
>[ second line]
>[ third line]

号

相关讨论

虽然不是所有的解决方案都适用于每种情况，但您提到的readarray…用5分钟取代了我过去的两个小时…你得到了我的选票

readarray是正确的答案。

将字符串拆分为数组的关键是","的多字符分隔符。对于多字符分隔符使用IFS的任何解决方案都是固有错误的，因为ifs是一组这些字符，而不是字符串。
如果指定IFS=","，则字符串将在","或""或它们的任何组合上中断，这不是","的两个字符分隔符的准确表示。
您可以使用awk或sed分割字符串，过程替换为：

1
2
3
4
5
6
7
8
9
#!/bin/bash

str="Paris, France, Europe"
array=()
while read -r -d $'\0' each; do # use a NUL terminated field separator
array+=("$each")
done < <(printf"%s""$str" | awk '{ gsub(/,[ ]+|$/,"\0"); print }')
declare -p array
# declare -a array=([0]="Paris" [1]="France" [2]="Europe") output

直接在bash中使用regex更有效：

1
2
3
4
5
6
7
8
9
10
11
12
13
#!/bin/bash

str="Paris, France, Europe"

array=()
while [[ $str =~ ([^,]+)(,[ ]+|$) ]]; do
array+=("${BASH_REMATCH[1]}") # capture the field
i=${#BASH_REMATCH} # length of field + delimiter
str=${str:i} # advance the string by that length
done # the loop deletes $str, so make a copy if needed

declare -p array
# declare -a array=([0]="Paris" [1]="France" [2]="Europe") output...

对于第二种形式，没有子shell，而且它本身就更快。
bgoldst编辑：这里有一些比较我的readarray解决方案与dawg的regex解决方案的基准，我还包括了read解决方案，以供检查(注：我稍微修改了regex解决方案，以使其与我的解决方案更协调)(另请参见我在帖子下面的评论)：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
## competitors
function c_readarray { readarray -td '' a < <(awk '{ gsub(/, /,"\0"); print; };' <<<"$1,"); unset 'a[-1]'; };
function c_read { a=(); local REPLY=''; while read -r -d ''; do a+=("$REPLY"); done < <(awk '{ gsub(/, /,"\0"); print; };' <<<"$1,"); };
function c_regex { a=(); local s="$1,"; while [[ $s =~ ([^,]+),\ ]]; do a+=("${BASH_REMATCH[1]}"); s=${s:${#BASH_REMATCH}}; done; };

## helper functions
function rep {
local -i i=-1;
for ((i = 0; i<$1; ++i)); do
printf %s"$2";
done;
}; ## end rep()

function testAll {
local funcs=();
local args=();
local func='';
local -i rc=-1;
while [["$1" != ':' ]]; do
func="$1";
if [[ !"$func" =~ ^[_a-zA-Z][_a-zA-Z0-9]*$ ]]; then
echo"bad function name: $func">&2;
return 2;
fi;
funcs+=("$func");
shift;
done;
shift;
args=("$@");
for func in"${funcs[@]}"; do
echo -n"$func";
{ time $func"${args[@]}">/dev/null 2>&1; } 2>&1| tr '
' '/';
rc=${PIPESTATUS[0]}; if [[ $rc -ne 0 ]]; then echo"[$rc]"; else echo; fi;
done| column -ts/;
}; ## end testAll()

function makeStringToSplit {
local -i n=$1; ## number of fields
if [[ $n -lt 0 ]]; then echo"bad field count: $n">&2; return 2; fi;
if [[ $n -eq 0 ]]; then
echo;
elif [[ $n -eq 1 ]]; then
echo 'first field';
elif [["$n" -eq 2 ]]; then
echo 'first field, last field';
else
echo"first field, $(rep $[$1-2] 'mid field, ')last field";
fi;
}; ## end makeStringToSplit()

function testAll_splitIntoArray {
local -i n=$1; ## number of fields in input string
local s='';
echo"===== $n field$(if [[ $n -ne 1 ]]; then echo 's'; fi;) =====";
s="$(makeStringToSplit"$n")";
testAll c_readarray c_read c_regex :"$s";
}; ## end testAll_splitIntoArray()

## results
testAll_splitIntoArray 1;
## ===== 1 field =====
## c_readarray real 0m0.067s user 0m0.000s sys 0m0.000s
## c_read real 0m0.064s user 0m0.000s sys 0m0.000s
## c_regex real 0m0.000s user 0m0.000s sys 0m0.000s
##
testAll_splitIntoArray 10;
## ===== 10 fields =====
## c_readarray real 0m0.067s user 0m0.000s sys 0m0.000s
## c_read real 0m0.064s user 0m0.000s sys 0m0.000s
## c_regex real 0m0.001s user 0m0.000s sys 0m0.000s
##
testAll_splitIntoArray 100;
## ===== 100 fields =====
## c_readarray real 0m0.069s user 0m0.000s sys 0m0.062s
## c_read real 0m0.065s user 0m0.000s sys 0m0.046s
## c_regex real 0m0.005s user 0m0.000s sys 0m0.000s
##
testAll_splitIntoArray 1000;
## ===== 1000 fields =====
## c_readarray real 0m0.084s user 0m0.031s sys 0m0.077s
## c_read real 0m0.092s user 0m0.031s sys 0m0.046s
## c_regex real 0m0.125s user 0m0.125s sys 0m0.000s
##
testAll_splitIntoArray 10000;
## ===== 10000 fields =====
## c_readarray real 0m0.209s user 0m0.093s sys 0m0.108s
## c_read real 0m0.333s user 0m0.234s sys 0m0.109s
## c_regex real 0m9.095s user 0m9.078s sys 0m0.000s
##
testAll_splitIntoArray 100000;
## ===== 100000 fields =====
## c_readarray real 0m1.460s user 0m0.326s sys 0m1.124s
## c_read real 0m2.780s user 0m1.686s sys 0m1.092s
## c_regex real 17m38.208s user 15m16.359s sys 2m19.375s
##

相关讨论

非常酷的解决方案！我从来没有想过在regex匹配上使用循环，巧妙地使用$BASH_REMATCH。它有效，并且确实避免了生成子shell。+从我这里。然而，通过批评，regex本身有点不理想，因为看起来您不得不复制分隔符标记的一部分(特别是逗号)，以解决对其中非贪婪乘法器(也是lookarounds)缺乏支持的问题("扩展的"regex风格内置到bash中)。这使得它的通用性和健壮性稍差。

其次，我做了一些基准测试，虽然性能比其他小字符串的解决方案要好，但由于重复的字符串重建，性能呈指数级下降，对于非常大的字符串来说，这将变得灾难性的。查看我对您答案的编辑。

@好酷的基准！为了保护regex，对于10或100上千个字段(regex正在拆分的内容)，可能会有某种形式的记录(如
分隔的文本行)包含这些字段，因此不会发生灾难性的减速。如果您有一个包含100000个字段的字符串——也许bash不理想；-)谢谢基准测试。我学到了一两件事。

这类似于JMoney38的方法，但使用的是SED：

1
2
3
4
string="1,2,3,4"
array=(`echo $string | sed 's/,/
/g'`)
echo ${array[0]}

印刷品1

纯bash多字符分隔符解决方案。
正如其他人在这个线程中指出的那样，op的问题给出了一个逗号分隔字符串的例子，将其解析为数组，但没有指出他/她是否只对逗号分隔符、单字符分隔符或多字符分隔符感兴趣。
由于谷歌倾向于将这个答案排在搜索结果的顶部或附近，所以我想为读者提供一个关于多个字符分隔符问题的强有力的答案，因为至少有一个回答中也提到了这个问题。
如果你在寻找一个多字符定界符问题的解决方案，我建议你回顾一下Mallikarjun M的文章，特别是gniourf的回复。谁使用参数扩展提供了这个优雅的纯bash解决方案：

1
2
3
4
5
6
7
8
9
10
#!/bin/bash
str="LearnABCtoABCSplitABCaABCString"
delimiter=ABC
s=$str$delimiter
array=();
while [[ $s ]]; do
array+=("${s%%"$delimiter"*}" );
s=${s#*"$delimiter"};
done;
declare -p array

引用评论/参考文章链接
链接到引用的问题：如何在bash中拆分多字符分隔符上的字符串？

相关讨论

请参阅我的评论，了解类似但改进的方法。

我在分析输入时遇到了这篇文章，比如：单词1，单词2，…
以上都没有帮助我。用锥子解决了这个问题。如果它能帮助某人：

1
2
3
4
5
6
7
STRING="value1,value2,value3"
array=`echo $STRING | awk -F ',' '{ s = $1; for (i = 2; i <= NF; i++) s = s"
"$i; print s; }'`
for word in ${array}
do
echo"This is the word $word"
done

。

试试这个

1
2
IFS=', '; array=(Paris, France, Europe)
for item in ${array[@]}; do echo $item; done

号
很简单。如果需要，还可以添加声明(也可以删除逗号)：

1
IFS=' ';declare -a array=(Paris France Europe)

号
添加ifs是为了撤消上面的操作，但是在新的bash实例中没有它就可以工作。

更新：不要这样做，因为Eval有问题。
仪式稍微少一点：

1
IFS=', ' eval 'array=($string)'

号
例如

1
2
3
string="foo, bar,baz"
IFS=', ' eval 'array=($string)'
echo ${array[1]} # -> bar

号

相关讨论

埃瓦尔是邪恶的！不要这样做。

PFFT不。如果你写的脚本足够大，这就很重要了，那你就错了。在应用程序代码中，eval是邪恶的。在shell脚本中，这是常见的、必要的和无关紧要的。

把一个EDOCX1[3]放到变量中，你会看到…我写了很多剧本，从来没有用过一个eval

eval命令和安全问题

您是对的，只有当输入是干净的时，这才可用。不是一个强大的解决方案。

我唯一一次不得不使用eval，是为了一个可以自己生成代码/模块的应用程序…这从来没有任何形式的用户输入…

使用此：

1
2
3
4
5
6
7
8
countries='Paris, France, Europe'
OIFS="$IFS"
IFS=', ' array=($countries)
IFS="$OIFS"

#${array[1]} == Paris
#${array[2]} == France
#${array[3]} == Europe

号

相关讨论

坏：受分词和路径名扩展的影响。请不要用好答案来复述旧问题而给出坏答案。

这可能是一个错误的答案，但它仍然是一个有效的答案。标记者/审阅者：对于不正确的答案，如此，投反对票，不要删除！

@你能解释一下为什么答案不好吗？我真的不明白什么时候失败了。

@乔治斯韦托夫：正如我所说，它会被分词和扩展路径名。更一般地说，由于array=( $string )是一个(非常常见的)反模式，将字符串拆分为数组：分词发生：string='Prague, Czech Republic, Europe'；路径名扩展发生：如果目录中有名为food或barf的文件，string='foo[abcd],bar[efgh]'将失败。这种构造的唯一有效用法是当string是一个glob时。

这对我在OSX上有效：

1
2
string="1 2 3 4 5"
declare -a array=($string)

如果字符串具有不同的分隔符，只需首先用空格替换这些分隔符：

1
2
3
string="1,2,3,4,5"
delimiter=","
declare -a array=($(echo $string | tr"$delimiter"""))

。
简单：—)

这是我的黑客！
用字符串分割字符串是使用bash非常无聊的事情。会发生的是，我们的方法有限，只能在少数情况下工作(按"；"，"/"，"等等分割)，或者我们在输出中有各种副作用。
下面的方法需要一些操作，但我相信它可以满足我们的大多数需求！

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
#!/bin/bash

# --------------------------------------
# SPLIT FUNCTION
# ----------------

F_SPLIT_R=()
f_split() {
: 'It does a"split" into a given string and returns an array.

Args:
TARGET_P (str): Target string to"split".
DELIMITER_P (Optional[str]): Delimiter used to"split". If not
informed the split will be done by spaces.

Returns:
F_SPLIT_R (array): Array with the provided string separated by the
informed delimiter.
'

F_SPLIT_R=()
TARGET_P=$1
DELIMITER_P=$2
if [ -z"$DELIMITER_P" ] ; then
DELIMITER_P=""
fi

REMOVE_N=1
if ["$DELIMITER_P" =="
" ] ; then
REMOVE_N=0
fi

# NOTE: This was the only parameter that has been a problem so far!
# By Questor
# [Ref.: https://unix.stackexchange.com/a/390732/61742]
if ["$DELIMITER_P" =="./" ] ; then
DELIMITER_P="[.]/"
fi

if [ ${REMOVE_N} -eq 1 ] ; then

# NOTE: Due to bash limitations we have some problems getting the
# output of a split by awk inside an array and so we need to use
#"line break" (
) to succeed. Seen this, we remove the line breaks
# momentarily afterwards we reintegrate them. The problem is that if
# there is a line break in the"string" informed, this line break will
# be lost, that is, it is erroneously removed in the output!
# By Questor
TARGET_P=$(awk 'BEGIN {RS="dn"} {gsub("
","3F2C417D448C46918289218B7337FCAF"); printf $0}' <<<"${TARGET_P}")

fi

# NOTE: The replace of"
" by"3F2C417D448C46918289218B7337FCAF" results
# in more occurrences of"3F2C417D448C46918289218B7337FCAF" than the
# amount of"
" that there was originally in the string (one more
# occurrence at the end of the string)! We can not explain the reason for
# this side effect. The line below corrects this problem! By Questor
TARGET_P=${TARGET_P%????????????????????????????????}

SPLIT_NOW=$(awk -F"$DELIMITER_P" '{for(i=1; i<=NF; i++){printf"%s
", $i}}' <<<"${TARGET_P}")

while IFS= read -r LINE_NOW ; do
if [ ${REMOVE_N} -eq 1 ] ; then

# NOTE: We use"'" to prevent blank lines with no other characters
# in the sequence being erroneously removed! We do not know the
# reason for this side effect! By Questor
LN_NOW_WITH_N=$(awk 'BEGIN {RS="dn"} {gsub("3F2C417D448C46918289218B7337FCAF","
"); printf $0}' <<<"'${LINE_NOW}'")

# NOTE: We use the commands below to revert the intervention made
# immediately above! By Questor
LN_NOW_WITH_N=${LN_NOW_WITH_N%?}
LN_NOW_WITH_N=${LN_NOW_WITH_N#?}

F_SPLIT_R+=("$LN_NOW_WITH_N")
else
F_SPLIT_R+=("$LINE_NOW")
fi
done <<<"$SPLIT_NOW"
}

# --------------------------------------
# HOW TO USE
# ----------------

STRING_TO_SPLIT="
* How do I list all databases and tables using psql?

"
sudo -u postgres /usr/pgsql-9.4/bin/psql -c "\l"
sudo -u postgres /usr/pgsql-9.4/bin/psql <DB_NAME> -c "\dt"
"

"
\list or \l: list all databases
\dt: list all tables in the current database
"

[Ref.: https://dba.stackexchange.com/questions/1285/how-do-i-list-all-databases-and-tables-using-psql]

"

f_split"$STRING_TO_SPLIT""bin/psql -c"

# --------------------------------------
# OUTPUT AND TEST
# ----------------

ARR_LENGTH=${#F_SPLIT_R[*]}
for (( i=0; i<=$(( $ARR_LENGTH -1 )); i++ )) ; do
echo"> -----------------------------------------"
echo"${F_SPLIT_R[$i]}"
echo" < -----------------------------------------"
done

if ["$STRING_TO_SPLIT" =="${F_SPLIT_R[0]}bin/psql -c${F_SPLIT_R[1]}" ] ; then
echo"> -----------------------------------------"
echo"The strings are the same!"
echo" < -----------------------------------------"
fi

另一种不修改IFS的方法是：

1
read -r -a myarray <<<"${string//, /$IFS}"

号
我们可以通过"${string//, /$IFS}"将所需分隔符","的所有内容替换为$IFS的内容，而不是更改ifs以匹配所需分隔符。
但对于非常大的弦来说，这可能会很慢？
这是基于丹尼斯·威廉姆森的回答。

另一种方法是：

1
2
string="Paris, France, Europe"
IFS=', ' arr=(${string})

号
现在元素存储在"arr"数组中。要遍历元素，请执行以下操作：

1
for i in ${arr[@]}; do echo $i; done

相关讨论

我在回答中提到了这个想法；请看错误的回答5(您可能对我关于eval技巧的讨论特别感兴趣)。您的解决方案会将$IFS设置为事实之后的逗号空间值。

另一种方法是：

1
2
str="a, b, c, d" # assuming there is a space after ',' as in Q
arr=(${str//,/}) # delete all occurrences of ','

。
在这个"arr"之后是一个包含四个字符串的数组。这不需要处理ifs或read或任何其他特殊的东西，因此更简单和直接。

相关讨论

与其他答案相同(不幸的是，很常见)的反模式：服从分词和文件名扩展。