5083-Bigram 分词

栏目: 编程工具 · 发布时间: 6年前

内容简介:本题需要注意以下两点:

前言

Weekly Contest 140Bigram 分词

给出第一个词 first 和第二个词 second ,考虑在某些文本 text 中可能以 " first second third " 形式出现的情况,其中 second 紧随 first 出现, third 紧随 second 出现。

对于每种这样的情况,将第三个词 " third " 添加到答案中,并返回答案。

示例1:

输入:text = "alice is a good girl she is a good student", first = "a", second = "good"
输出:["girl","student"]

示例2:

输入:text = "we will we will rock you", first = "we", second = "will"
输出:["we","rock"]

提示:

  1. 1 <= text.length <= 1000
  2. text 由一些用空格分隔的单词组成,每个单词都由小写英文字母组成
  3. 1 <= first.length, second.length <= 10
  4. firstsecond 由小写英文字母组成

解题思路

本题需要注意以下两点:

  1. first second third 三个单词是要连续出现的,例如

    输入:text = "alice is a good girl she is a really good student", first = "a", second = "good"
    输出:["girl"]
  2. first second third 三个单词中的 third 可能是下一次循环的 first ,例如示例2

实现代码

/**
     * 5083. Bigram 分词
     * @param text
     * @param first
     * @param second
     * @return
     */
    public String[] findOcurrences(String text, String first, String second) {
        // 按空格分割单词
        String[] words = text.split(" ");
        List<String> list = new ArrayList<>();
        // 匹配第一个单词的索引
        int firstIndex = -1;
        // 匹配第二个单词的索引
        int secondIndex = -1;
        for (int i = 0; i < words.length; i++) {
            String word = words[i];
            if (firstIndex >= 0 && secondIndex > 0) { // 判断前两个单词是否已经匹配
                firstIndex = -1; // 重置索引
                secondIndex = -1; // 重置索引
                list.add(word);
            }
            // 判断是否为第二个单词,判断条件为
            // 1. 当前单词与第二个单词相同
            // 2. 第一个单词已经匹配
            // 3. 第二个单词紧跟着第一个单词之后出现(secondIndex = firstIndex+1)
            // 此处先判断第二个单词是为了处理第三个单词为第一个单词的情况
            if (word.equals(second) && firstIndex >= 0 && firstIndex == i - 1) {
                secondIndex = i;
                continue; // 匹配则中断当前循环
            } else {
                // 第一个单词已经匹配,但是第二个单词不匹配,重置第一个单词的匹配结果
                if (firstIndex >= 0) {
                    firstIndex = -1;
                }
            }
            // 判断是否为第一个单词
            // 1. 第一个单词未匹配
            // 2. 当前单词与第一个单词相同
            if (firstIndex < 0 && word.equals(first)) {
                firstIndex = i;
                continue; // 匹配则中断当前循环
            }
        }
        String[] result = new String[list.size()];
        return list.toArray(result);
    }

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Web协议与实践

Web协议与实践

克里希纳穆尔蒂 (KrishnamurthyBalachander) / 范群波 / 科学出版社 / 2003-7 / 46.0

本书全面论述了传输Web内容的系统和协议,重点讲述了Web中业已成熟和稳定的技术,如TCP/IP协议及DNS技术、HITP/1.0的设计及其与TCP之间的交互;深入阐述了Web高速缓存技术和多媒体流播技术的最新技术动态;分析了Apache Web服务器和Squid代理;还探讨了通信量的分析和测量技术。书中使用了大量示例、技术发展水平报告以及案例分析来阐述Web的工作原理和各个组件之间的交互。本书是......一起来看看 《Web协议与实践》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

在线进制转换器
在线进制转换器

各进制数互转换器

SHA 加密
SHA 加密

SHA 加密工具