LeetCode 题解工作台
Bigram 分词
给出第一个词 first 和第二个词 second ,考虑在某些文本 text 中可能以 "first second third" 形式出现的情况,其中 second 紧随 first 出现, third 紧随 second 出现。 对于每种这样的情况,将第三个词 " third " 添加到答案中,…
1
题型
5
代码语言
3
相关题
当前训练重点
简单 · String-driven solution strategy
答案摘要
我们可以将字符串 按照空格分割成字符串数组 ,然后遍历 ,如果 和 分别等于 和 ,那么就将 添加到答案中。 遍历结束后,返回答案列表。
Interview AiBoxInterview AiBox 实时 AI 助手,陪你讲清 String-driven solution strategy 题型思路
题目描述
给出第一个词 first 和第二个词 second,考虑在某些文本 text 中可能以 "first second third" 形式出现的情况,其中 second 紧随 first 出现,third 紧随 second 出现。
对于每种这样的情况,将第三个词 "third" 添加到答案中,并返回答案。
示例 1:
输入:text = "alice is a good girl she is a good student", first = "a", second = "good" 输出:["girl","student"]
示例 2:
输入:text = "we will we will rock you", first = "we", second = "will" 输出:["we","rock"]
提示:
1 <= text.length <= 1000text由小写英文字母和空格组成text中的所有单词之间都由 单个空格字符 分隔1 <= first.length, second.length <= 10first和second由小写英文字母组成text不包含任何前缀或尾随空格。
解题思路
方法一:字符串分割
我们可以将字符串 按照空格分割成字符串数组 ,然后遍历 ,如果 和 分别等于 和 ,那么就将 添加到答案中。
遍历结束后,返回答案列表。
时间复杂度 ,空间复杂度 ,其中 是 的长度。
class Solution:
def findOcurrences(self, text: str, first: str, second: str) -> List[str]:
words = text.split()
ans = []
for i in range(len(words) - 2):
a, b, c = words[i : i + 3]
if a == first and b == second:
ans.append(c)
return ans
复杂度分析
| 指标 | 值 |
|---|---|
| 时间 | Depends on the final approach |
| 空间 | Depends on the final approach |
面试官常问的追问
外企场景- question_mark
Ability to recognize string manipulation patterns.
- question_mark
Efficient handling of adjacent word comparisons.
- question_mark
Understanding of time and space complexity for string operations.
常见陷阱
外企场景- error
Overlooking cases where the bigram is not followed by a valid third word.
- error
Incorrectly handling spaces or punctuation, which could affect word separation.
- error
Misunderstanding the need to iterate through adjacent triples, rather than simply searching for individual words.
进阶变体
外企场景- arrow_right_alt
Handle different forms of text input (e.g., multiple spaces or punctuation marks).
- arrow_right_alt
Extend the problem to support variable-sized n-grams, not just bigrams.
- arrow_right_alt
Optimize for cases with very large text inputs, considering time and space trade-offs.