前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法

揭开JavaScript字符串搜索的秘密:indexOf、includes与KMP算法

原创
作者头像
jackcode
发布2024-07-02 11:36:50
860
发布2024-07-02 11:36:50
举报
文章被收录于专栏:爬虫资料爬虫资料
爬虫代理
爬虫代理

在JavaScript编程中,字符串搜索是一个常见而基础的操作。无论是查找特定字符、子字符串还是模式匹配,掌握有效的字符串搜索方法对于编程效率和性能优化至关重要。本文将揭示三种常用的JavaScript字符串搜索技术:indexOfincludes和KMP算法,并通过实际代码示例展示如何在数据采集的情况下实现这些技术。

概述

  1. 基本字符串方法let text = "hello world"; let searchString = "world"; console.log(text.indexOf(searchString)); // 输出:6includes()includes()方法检查一个字符串是否包含另一个子字符串,返回布尔值。let text = "hello world"; let searchString = "world"; console.log(text.includes(searchString)); // 输出:trueKMP算法KMP算法是一种高效的字符串搜索算法,特别适用于在大文本中搜索长模式的情况。它的时间复杂度为O(n + m),比简单的暴力匹配算法更高效。// KMP字符串搜索算法实现 function kmpSearch(pattern, text) { if (pattern.length === 0) return 0; let lsp = [0]; for (let i = 1; i < pattern.length; i++) { let j = lsp[i - 1]; while (j > 0 && pattern[i] !== pattern[j]) { j = lsp[j - 1]; } if (pattern[i] === pattern[j]) { j++; } lsp.push(j); } let j = 0; for (let i = 0; i < text.length; i++) { while (j > 0 && text[i] !== pattern[j]) { j = lsp[j - 1]; } if (text[i] === pattern[j]) { j++; if (j === pattern.length) { return i - (j - 1); } } } return -1; } let text = "haystack"; let pattern = "needle"; console.log(kmpSearch(pattern, text) !== -1); // 输出:false数据采集中实现字符串搜索下面的示例展示了如何结合数据采集与上述字符串搜索方法。请注意在实际的网络爬虫中,我们常常需要使用代理IP来隐藏真实IP地址,防止被目标网站封禁。const axios = require('axios'); const querystring = require('querystring'); // 代理IP配置 爬虫代理标准版 const proxy = { host: 'www.host.cn', // 代理IP地址 port: 12345, // 代理端口 auth: { username: 'yourUsername', // 代理用户名 password: 'yourPassword' // 代理密码 } }; // KMP字符串搜索算法实现 function kmpSearch(pattern, text) { if (pattern.length === 0) return 0; let lsp = [0]; for (let i = 1; i < pattern.length; i++) { let j = lsp[i - 1]; while (j > 0 && pattern[i] !== pattern[j]) { j = lsp[j - 1]; } if (pattern[i] === pattern[j]) { j++; } lsp.push(j); } let j = 0; for (let i = 0; i < text.length; i++) { while (j > 0 && text[i] !== pattern[j]) { j = lsp[j - 1]; } if (text[i] === pattern[j]) { j++; if (j === pattern.length) { return i - (j - 1); } } } return -1; } // 搜索关键词“新闻” const searchKeyword = '新闻'; const searchUrl = `https://www.baidu.com/s?${querystring.stringify({ wd: searchKeyword })}`; // 使用代理IP发送HTTP请求访问百度搜索结果页面 axios.get(searchUrl, { proxy: proxy }) .then(response => { let text = response.data; let searchString = "中国"; // 要搜索的字符串 // 使用indexOf方法 console.log('Using indexOf:', text.indexOf(searchString) !== -1); // 使用includes方法 console.log('Using includes:', text.includes(searchString)); // 使用KMP算法 console.log('Using KMP:', kmpSearch(searchString, text) !== -1); }) .catch(error => { console.error('Error fetching the page:', error); });在这个代码示例中,我们通过百度的搜索接口进行搜索关键词“新闻”,然后检查搜索结果页面中是否包含字符串“中国”。使用了axios库进行HTTP请求,并配置了代理IP,以确保请求通过代理服务器发送。结论本文介绍了三种常用的JavaScript字符串搜索技术:indexOfincludes和KMP算法,并提供了结合爬虫代理IP技术的实现示例。掌握这些方法可以帮助开发者在各种场景中高效地进行字符串搜索和匹配。希望这篇文章对你理解和应用JavaScript字符串搜索有所帮助。
    • indexOf()
    • includes()
    • search()
    • match()
  2. 高级字符串搜索算法
    • KMP算法(Knuth-Morris-Pratt)
  3. 实现数据采集的字符串搜索细节基本字符串方法indexOf()indexOf()方法返回在调用该方法的字符串中找到的第一个子字符串的索引,如果未找到,则返回-1。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 概述
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档