LeetCode 题解工作台
删除注释
给一个 C++ 程序,删除程序中的注释。这个程序 source 是一个数组,其中 source[i] 表示第 i 行源码。 这表示每行源码由 '\n' 分隔。 在 C++ 中有两种注释风格,行内注释和块注释。 字符串 // 表示行注释,表示 // 和其右侧的其余字符应该被忽略。 字符串 /* 表示一…
2
题型
6
代码语言
3
相关题
当前训练重点
中等 · 数组·string
答案摘要
我们用一个变量 来表示当前是否处于块注释中,初始时 为 `false`;用一个变量 来存储当前行的有效字符。 接下来,遍历每一行,分情况讨论:
Interview AiBoxInterview AiBox 实时 AI 助手,陪你讲清 数组·string 题型思路
题目描述
给一个 C++ 程序,删除程序中的注释。这个程序source是一个数组,其中source[i]表示第 i 行源码。 这表示每行源码由 '\n' 分隔。
在 C++ 中有两种注释风格,行内注释和块注释。
- 字符串
//表示行注释,表示//和其右侧的其余字符应该被忽略。 - 字符串
/*表示一个块注释,它表示直到下一个(非重叠)出现的*/之间的所有字符都应该被忽略。(阅读顺序为从左到右)非重叠是指,字符串/*/并没有结束块注释,因为注释的结尾与开头相重叠。
第一个有效注释优先于其他注释。
- 如果字符串
//出现在块注释中会被忽略。 - 同样,如果字符串
/*出现在行或块注释中也会被忽略。
如果一行在删除注释之后变为空字符串,那么不要输出该行。即,答案列表中的每个字符串都是非空的。
样例中没有控制字符,单引号或双引号字符。
- 比如,
source = "string s = "/* Not a comment. */";"不会出现在测试样例里。
此外,没有其他内容(如定义或宏)会干扰注释。
我们保证每一个块注释最终都会被闭合, 所以在行或块注释之外的/*总是开始新的注释。
最后,隐式换行符可以通过块注释删除。 有关详细信息,请参阅下面的示例。
从源代码中删除注释后,需要以相同的格式返回源代码。
示例 1:
输入: source = ["/*Test program */", "int main()", "{ ", " // variable declaration ", "int a, b, c;", "/* This is a test", " multiline ", " comment for ", " testing */", "a = b + c;", "}"]
输出: ["int main()","{ "," ","int a, b, c;","a = b + c;","}"]
解释: 示例代码可以编排成这样:
/*Test program */
int main()
{
// variable declaration
int a, b, c;
/* This is a test
multiline
comment for
testing */
a = b + c;
}
第 1 行和第 6-9 行的字符串 /* 表示块注释。第 4 行的字符串 // 表示行注释。
编排后:
int main()
{
int a, b, c;
a = b + c;
}
示例 2:
输入: source = ["a/*comment", "line", "more_comment*/b"] 输出: ["ab"] 解释: 原始的 source 字符串是 "a/*comment\nline\nmore_comment*/b", 其中我们用粗体显示了换行符。删除注释后,隐含的换行符被删除,留下字符串 "ab" 用换行符分隔成数组时就是 ["ab"].
提示:
1 <= source.length <= 1000 <= source[i].length <= 80source[i]由可打印的 ASCII 字符组成。- 每个块注释都会被闭合。
- 给定的源码中不会有单引号、双引号或其他控制字符。
解题思路
方法一:分情况讨论
我们用一个变量 来表示当前是否处于块注释中,初始时 为 false;用一个变量 来存储当前行的有效字符。
接下来,遍历每一行,分情况讨论:
如果当前处于块注释中,那么如果当前字符和下一个字符是 '*/',说明块注释结束,我们将 置为 false,并且跳过这两个字符;否则,我们继续保持块注释状态,不做任何操作;
如果当前不处于块注释中,那么如果当前字符和下一个字符是 '/*',说明块注释开始,我们将 置为 true,并且跳过这两个字符;如果当前字符和下一个字符是 '//',那么说明行注释开始,我们直接退出当前行的遍历;否则,说明当前字符是有效字符,我们将其加入 中;
遍历完当前行后,如果 为 false,并且 不为空,说明当前行是有效行,我们将其加入答案数组中,并且清空 。继续遍历下一行。
时间复杂度 ,空间复杂度 ,其中 是源代码的总长度。
class Solution:
def removeComments(self, source: List[str]) -> List[str]:
ans = []
t = []
block_comment = False
for s in source:
i, m = 0, len(s)
while i < m:
if block_comment:
if i + 1 < m and s[i : i + 2] == "*/":
block_comment = False
i += 1
else:
if i + 1 < m and s[i : i + 2] == "/*":
block_comment = True
i += 1
elif i + 1 < m and s[i : i + 2] == "//":
break
else:
t.append(s[i])
i += 1
if not block_comment and t:
ans.append("".join(t))
t.clear()
return ans
复杂度分析
| 指标 | 值 |
|---|---|
| 时间 | O(S) |
| 空间 | O(S) |
面试官常问的追问
外企场景- question_mark
Can the candidate correctly handle nested comments and multi-line block comments?
- question_mark
Is the candidate using an efficient way to skip over block comments without unnecessary operations?
- question_mark
Does the candidate preserve the original structure of the code after comment removal?
常见陷阱
外企场景- error
Not handling multi-line block comments properly, which can lead to incorrect removal of code.
- error
Ignoring nested comments and not processing each part of the code in the correct order.
- error
Overcomplicating the parsing logic, making the solution more difficult to understand or less efficient.
进阶变体
外企场景- arrow_right_alt
Extend the problem to handle comments within strings or character literals.
- arrow_right_alt
Optimize the solution for very large input arrays with more stringent time constraints.
- arrow_right_alt
Modify the solution to also detect and remove deprecated or obsolete code sections along with comments.