关于python:清理没有split / strip /内置函数的字符串

Cleaning up a string without split/strip/built-in functions

我的要求

使用Python创建一个函数cleanstring(S)来"清理"句子S中的空格。

  • 句子可以在前面和/或末尾和/或单词之间具有额外的空格。
  • 子例程返回句子的新版本而没有额外的空格。

    • 也就是说,在新字符串中,单词应该相同但开头不应有空格,每个单词之间只有一个空格,末尾没有空格。

这个程序是关于你编写代码来搜索字符串来查找单词,所以你不能在Python中使用split函数。

您可以使用if和while语句的基本功能以及len和concatentation的字符串操作来解决此问题。

例如:如果输入是:"Hello to the world!"那么输出应该是:"向世界问好!"

我的程序删除程序中比需要的更多字符。

输入:"Hello World!"

输出:"HellWorl"

如何修复程序中的错误?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
def cleanupstring (S):
    newstring = ["", 0]
    j = 1
    for i in range(len(S) - 1):
        if S[i] !="" and S[i+1] !="":
            newstring[0] = newstring[0] + S[i]
        else:
            newstring[1] = newstring [1] + 1
    return newstring

# main program

sentence = input("Enter a string:")

outputList = cleanupstring(sentence)

print("A total of", outputList[1],"characters have been removed from your
string."
)
print("The new string is:", outputList[0])


欢迎来到Stackoverflow。当我开始阅读时,虽然这将是一个"请回答我的作业"的问题,但你实际上已经做了相当公平的努力解决问题,所以我很乐意尝试和帮助(只有你可以说是否我其实这样做。)

当你学习一门新语言来放弃更适合其他语言的技巧时,有时会很困难。逐个字符地执行它通常只使用for c in s而不是像在C中那样递增索引值(尽管任何一种方法都可行,索引增量在不必要的情况下有时被视为"unpythonic")。您的基本想法似乎是检测空格后跟另一个空格,否则将字符从输入复制到输出。

通过保留发送到输出的最后一个字符可以简化逻辑。如果是空格,请不要再发送空格。前面的一个环摆脱了任何前导空间,并且由于最后一个空间最多只能有一个空间,如果存在,它可以很容易地消除。

我不确定为什么你使用列表来保持你的结果,因为它使代码更难理解。如果需要返回多条信息,则可以更容易地在单个变量中计算它们,然后在return语句中构造结果。

因此,一个理想的修改是将newstring[0]替换为out_snewstring[1],例如count。这将使正在发生的事情变得更加清晰。然后在结尾return [out_s, count],如果你真的需要一个列表。使用return out_s, count的元组会更常见。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
def cleanupstring (s):
    out_s = ''
    count = 0
    last_out = ' '
    for c in s:
        if c != ' ' or last_out != ' ':
            last_out = c
            out_s += c
        else:
            count += 1
    if last_out == ' ':
        count -= 1
        out_s = out_s[:-1]
    return out_s, count

# main program

sentence = input("Enter a string:")

outputList = cleanupstring(sentence)

print("A total of", outputList[1],"characters have been removed from your string.")
print("The new string is:", outputList[0])

有时你只是没有某些信息可以帮助你非常简洁地回答这个问题。你很可能还没有学过stripreplace方法,所以我想象下面的(未经测试的)代码

1
2
3
4
5
def cleanupstring(s):
    out_s = s
    while '  ' in out_s:
        out_s = out_s.strip().replace('  ', ' ')
    return out_s, len(s)-len(out_s)

会马上出来的。

此外,您可以使用"解包分配"通过写入将函数输出的不同元素直接绑定到名称

1
s, c = cleanupstring(...)

我相信你会同意的

1
2
print("A total of", c,"characters have been removed from your string.")
print("The new string is:", s)

更容易阅读。 Python非常重视可读性,因为使用可读代码可以更容易理解作者的意图。如果您的代码很难理解,那么您仍有机会进行重构!


如果"空间"它实际上是空格而不是空格,那么以下内容将起作用:

1
2
3
import re
def clean_string(value):
     return re.sub('[ ]{2,}', ' ', value.strip())

如果剥离的值包含连续的空格,则替换为一个空格。


我的方法是保留最后一个角色并决定它是否是空格:

1
2
3
4
5
6
7
8
9
10
11
12
def cleanupstring (S):
    newstring = ["", 0]
    last_character = ' ' # catch initial spaces
    for i in range(len(S)-1):
        char = S[i]
        if char is ' ' and last_character is ' ':
            continue # ignore
        else:
            last_character = char
            newstring [0] = newstring[0] + char

    return newstring