设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 重新 试卷 创业者
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

内存崩溃了?其实你只需要换一种方式(4)

发布时间:2019-10-28 17:52 所属栏目:21 来源:平头哥
导读:最常见的解决办法就是采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的bitmap中,一个一定不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。下面是一段伪代码: publicStringgetByK

最常见的解决办法就是采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的bitmap中,一个一定不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。下面是一段伪代码:

  1. public String getByKey(String key) { 
  2.     // 通过key获取value 
  3.     String value = redis.get(key); 
  4.     if (StringUtil.isEmpty(value)) { 
  5.         if (bloomFilter.mightContain(key)) { 
  6.             value = xxxService.get(key); 
  7.             redis.set(key, value); 
  8.             return value; 
  9.         } else { 
  10.             return null; 
  11.         } 
  12.     } 
  13.     return value; 

爬虫 URL 去重

爬虫是对 url 的去重,防止 url 重复采集,这也是我们这篇文章重点讲解的内容

垃圾邮件识别

从数十亿个垃圾邮件列表中判断某邮箱是否垃圾邮箱,将垃圾邮箱添加到布隆过滤器中,然后判断某个邮件是否是存在在布隆过滤器中,存在说明就是垃圾邮箱。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读