内容简介:本题需要注意以下两点:
前言
Weekly Contest 140 的 Bigram 分词 :
给出第一个词 first
和第二个词 second
,考虑在某些文本 text
中可能以 " first second third
" 形式出现的情况,其中 second
紧随 first
出现, third
紧随 second
出现。
对于每种这样的情况,将第三个词 " third
" 添加到答案中,并返回答案。
示例1:
输入:text = "alice is a good girl she is a good student", first = "a", second = "good" 输出:["girl","student"]
示例2:
输入:text = "we will we will rock you", first = "we", second = "will" 输出:["we","rock"]
提示:
-
1 <= text.length <= 1000 -
text由一些用空格分隔的单词组成,每个单词都由小写英文字母组成 -
1 <= first.length, second.length <= 10 -
first和second由小写英文字母组成
解题思路
本题需要注意以下两点:
-
first second third三个单词是要连续出现的,例如输入:text = "alice is a good girl she is a really good student", first = "a", second = "good" 输出:["girl"]
-
first second third三个单词中的third可能是下一次循环的first,例如示例2
实现代码
/**
* 5083. Bigram 分词
* @param text
* @param first
* @param second
* @return
*/
public String[] findOcurrences(String text, String first, String second) {
// 按空格分割单词
String[] words = text.split(" ");
List<String> list = new ArrayList<>();
// 匹配第一个单词的索引
int firstIndex = -1;
// 匹配第二个单词的索引
int secondIndex = -1;
for (int i = 0; i < words.length; i++) {
String word = words[i];
if (firstIndex >= 0 && secondIndex > 0) { // 判断前两个单词是否已经匹配
firstIndex = -1; // 重置索引
secondIndex = -1; // 重置索引
list.add(word);
}
// 判断是否为第二个单词,判断条件为
// 1. 当前单词与第二个单词相同
// 2. 第一个单词已经匹配
// 3. 第二个单词紧跟着第一个单词之后出现(secondIndex = firstIndex+1)
// 此处先判断第二个单词是为了处理第三个单词为第一个单词的情况
if (word.equals(second) && firstIndex >= 0 && firstIndex == i - 1) {
secondIndex = i;
continue; // 匹配则中断当前循环
} else {
// 第一个单词已经匹配,但是第二个单词不匹配,重置第一个单词的匹配结果
if (firstIndex >= 0) {
firstIndex = -1;
}
}
// 判断是否为第一个单词
// 1. 第一个单词未匹配
// 2. 当前单词与第一个单词相同
if (firstIndex < 0 && word.equals(first)) {
firstIndex = i;
continue; // 匹配则中断当前循环
}
}
String[] result = new String[list.size()];
return list.toArray(result);
}
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 基于海量公司分词ES中文分词插件
- 北大开源全新中文分词工具包:准确率远超THULAC、结巴分词
- 复旦大学提出中文分词新方法,Transformer连有歧义的分词也能学
- 分词,难在哪里?
- 隐马尔可夫分词
- 【NLP】分词算法综述
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
高效前端:Web高效编程与优化实践
李银城 著 / 机械工业出版社 / 2018-3-15 / 89.00元
这不是一本单纯讲解前端编程技巧的书,而是一本注重思想提升和内功修炼的书。 全书以问题为导向,精选了前端开发中的34个疑难问题,从分析问题的原因入手,逐步给出解决方案,并分析各种方案的优劣,最后针对每个问题总结出高效编程的最佳实践和各种性能优化的方法。 全书共7章,内容从逻辑上大致可以分为两大类: 第一类,偏向实践,围绕HTML、CSS、JavaScript等传统前端技术,以及PW......一起来看看 《高效前端:Web高效编程与优化实践》 这本书的介绍吧!