Begin

存在问题

  • 海量用户
  • 高并发
  • 罪魁祸首:关系型数据库
  • 性能瓶颈:磁盘IO性能低下
  • 扩展瓶颈:数据关系复杂,扩展性差,不便于大规模集群

解决思路(Nosql)

  • 降低磁盘IO次数,越低越好 —— 内存存储
  • 去除数据间的关系,越简单越好 —— 不存储关系,仅存储数据

Nosql简介

NoSQL:即Not-OnlySQL(泛指非关系型的数据库),作为关系型数据库的补充。

作用:应用对于海量用户和海量数据前提吓得数据处理问题。

特征:

  • 可扩容,可伸缩
  • 大数据量下得高性能
  • 灵活得数据模型
  • 高可用

常见Nosql数据库:

  • Redis
  • memcache
  • HBase
  • MongoDB

解决方案举例

Redis简介

概念

Redis(REmote DIctinary Server)是用C语言开发的一个开源的高性能键值对(key-value)数据库。

特征

  1. 数据间没有必然的关联关系
  2. 内部采用单线程机制进行工作
  3. 高性能。官方提供测试数据,50个并发执行100000个请求,读的速度是110000次/s,写的速度是81000次/s。
  4. 多数据类型支持:

    string(字符串类型)
    list(列表类型)
    hash(散列类型)
    set(集合类型)
    sorted_set(有序集合类型)
  5. 持久化支持。可以进行数据灾难恢复

Redis的应用

  • 为热点数据加速查询(主要场景)、如热点商品、热点新闻、热点资讯、推广类等提高访问量信息等。
  • 任务队列、如秒杀、抢购、购票等
  • 即时信息查询,如各位排行榜、各类网站访问统计、公交到站信息、在线人数信息(聊天室、网站)、设备信号等
  • 时效性信息控制,如验证码控制,投票控制等
  • 分布式数据共享,如分布式集群构架中的session分离
  • 消息队列
  • 分布式锁

安装

https://github.com/tporadowski/redis/releases

Redis的基本操作

信息添加

  • 功能:设置key,value数据
  • 命令

    set key value
  • 范例

    set name itheima

信息查询

  • 功能:根据key查询对应的value,如果不存在,返回空(null)
  • 命令

    get key
  • 范例

    get name

清除屏幕信息

  • 功能:清除屏幕中的信息
  • 命令

    clear

帮助命令

  • 功能:获取命令帮助文档,获取组中所有命令信息名称
  • 命令

    help 命令名称
    help @组名

退出客户端命令行

  • 功能:退出客户端
  • 命令

    quit
    exit
    <ESC>

数据类型

业务场景

作为缓存使用

  1. 原始业务功能设计
  • 秒杀
  • 618活动
  • 双十一活动
  • 排队购票
  1. 运营平台监控到的突发高频访问数据
  • 突发市政要闻,被强势关注围观
  1. 高频、复杂的统计数据
  • 在线人数
  • 投票排行榜

附加功能

系统功能优化或升级

  • 单服务器升级集群
  • Session管理
  • Token管理

Redis 数据类型(5种常用)

基于以上需求,我们有了以下常用数据类型

  • string --> String
  • hash --> Hashmap
  • list --> LinkList
  • set --> HashSet
  • sorted_set --> TreeSet

Redis 数据存储格式

  • Redis自身是一个Map,其中所有的数据都是采用 key:value的形式存储
  • 数据类型指的是存储的数据的类型,也就是value部分的类型,key部分永远都是字符串

String

基本操作

  • 添加/修改数据
    set key value
  • 获取数据get key
  • 删除数据del key
  • 添加/修改多个数据mset key1 value1 key2 value2 …
  • 获取多个数据mget key1 key2 …
  • 获取数据字符个数(字符串长度)strlen key
  • 追加信息到原始信息后部(如果原始信息存在就追加,否则新建)
    append key value

扩展操作

业务场景:
大型企业级应用中,分表操作是基本操作,使用多张表存储同类型数据,但是对应的主键id必须保证统一性,不能重复。Oracle数据库具有sequence设定,可以解决该问题,但是MySQL数据库并不具有类似的机制,那么如何解决?

解决方案:

  • 设置数值数据增加指定范围的值

    incr key
    incrby key increment
    incrbyfloat key increment
  • 设置数值数据减少指定范围的值

    decr key
    decrby key increment
  • 两者都可以跟正负数

String作为数值操作:

  • String在Redis内部存储默认就是一个字符串,当遇到增减类操作incr,decr时会转成数值型进行计算
  • Redis所有的操作都是原子性的,采用单线程处理所有业务,命令是一个一个执行的,因此无需考虑并发带来的数据影响。
  • 注意:按数值进行操作的数据,如果原始数据不能转成数值,或超过了Redis数值上线范围,将会报错。9223372036854775807 (java中long型数据最大值,Long.MAX_VALUE)

String数据时效性设置

业务场景:
场景一:“最强女生”,启动海选投票,只能通过微信投票,每个微信号每4个小时只能投1票。

场景二:电商商家开启热门商品推荐,热门商品不能一直处于热门期,每种商品热门期维持3天,3天后自动取消热门

场景三:新闻网站会出现热点新闻,热点新闻最大的特征是对时效性,如何自动控制热点新闻的时效性

解决方案:
设置数据具有指定的声明周期

setex key seconds value
psetex key milliseconds value
  • Redis控制数据的生命周期,通过数据是否失效控制业务行为,适用于所有具有时效性限定控制的操作。

String类型的注意事项

  • 数据操作不成功的反馈与数据正常操作之间的差异
  1. 表示运行结果是否成功

     (integer)0 –> false 失败
     (integer)1 –> true  成功
  2. 表示运行结果值

     (integer)3 –> 3 3个
     (integer)1 –> 1 1个
  • 数据未获取到(nil)等同于null
  • 数据最大存储量512MB
  • 数值计算最大范围
    java中的long的最大值

String类型应用场景

业务场景:
主页高频访问信息显示控制,例如新浪微博大V主页显示粉丝数与微博数量。

解决方案:

  • 在redis中为大V用户设定用户信息,以用户主键和属性值作为key,后台设定定时刷新策略即可

    eg: user:id:3506728370:fans → 12210947 
    eg: user:id:3506728370:blogs → 6164 
    eg: user:id:3506728370:focuss → 83
  • 在redis中以json格式存储大V用户信息,定时刷新(也可以使用Hash类型)

    eg: user:id:3506728370 → 
        {"id":3506728370,"name":"春晚","fans":12210862,"blogs":6164, "focus":83}

Tips:Redis应用于各种结构型和非结构型高热度数据访问加速

Key的设置约定

Hash

  • 新的存储需求:对一系列存储的数据进行编组,方便管理,典型应用存储对象信息
  • 需要的存储结构:一个存储空间保存多个键值对数据
  • hash类型:底层使用哈希表结构实现数据存储

基本操作

  • 添加/修改数据
hset key field value
  • 获取数据
hget key field
hgetall key
  • 删除数据
hdel key field1 [field2]
  • 添加/修改多个数据
hmset key field1 value1 field2 calue2
  • 获取多个数据
hmget key field1 field2 …
  • 获取哈希表中字段的数量
hlen key
  • 获取哈希表中是否存在指定的字段
hexists key field

扩展操作

  • 获取哈希表中所有的字段名和字段值
hkeys key
hvals key
  • 设置指定字段的数值数据增加指定范围的值
hincrby key field increment
hincrbyfloat key field increment

hash类型数据操作的注意事项

  • hash类型下的value只能存储字符串,不允许存储其他类型数据,不存在嵌套现象。如果数据未获取到,对应的值为(nil)
  • 每个hash可以存储$2^{32}-1$个键值对
  • hash类型十分贴近对象的数据存储形式,并且可以灵活添加删除对象属性。但hash设计初衷不是为了存储大量对象而设计的,切记不可滥用,更不可以将hash作为对象列表使用
  • hgetall 操作可以获取全部属性,如果内部field过多,遍历整体数据效率就很会低,有可能成为数据访问瓶颈

hash类型应用场景购物车

解决方案:

  • 以客户id作为key,每位客户创建一个hash存储结构存储对应的购物车信息
  • 将商品编号作为field,购买数量作为value进行存储
  • 添加商品:追加全新的field与value
  • 浏览:遍历hash
  • 更改数量:自增/自减,设置value值
  • 删除商品:删除field
  • 清空:删除key

此处仅讨论购物车中的模型设计

购物车与数据库间持久化同步、购物车与订单间关系、未登录用户购物车信息存储不进行讨论

hash实现抢购

redis 应用于抢购,限购类、限量发放优惠卷、激活码等业务的数据存储设计

解决方案:

  • 以商家id作为key
  • 将参与抢购的商品id作为field
  • 将参与抢购的商品数量作为对应的value
  • 抢购时使用降值的方式控制产品数量
  • 实际业务中还有超卖等实际问题,这里不做讨论

hastnx判断field中有值,则不改变。没值则新建。

string存储对象(json)与hash存储对象的优缺点

string整体性,一次性读写。
hash单个更新。

List

  • 数据存储需求:存储多个数据,并对数据进入存储空间的顺序进行区分
  • 需要的存储数据:一个存储空间保存多个数据,且通过数据可以体现进入顺序
  • list类型:保存多个数据,底层使用双向链表存储结构实现

list类型数据基本操作

  • 添加/修改数据
lpush key value1 [value2] …
rpush key value1 [value2] …
  • 获取数据
lrange key start stop
lindex key index
llen key
  • 删除并移除数据
lpop key
rpop key

list类型数组扩展操作

  • 规定时间内获取并移除数据
blpop key1 [key2] timeout
brpop key1 [key2] timeout

阻塞式获取,获取值如果还没有的时候可以等,如果有值就可以获取到。

  • 移除指定数据
lrem key count value

Redis应用于具有操作先后顺序的数据控制

list类型数据操作注意事项

  • list中保存的数据都是string类型的,数据总容量是有限的,最多$2^{32} - 1$ 个元素 (4294967295)。
  • list具有索引的概念,但是操作数据时通常以队列的形式进行入队出队操作,或以栈的形式进行入栈出栈操作
  • 获取全部数据操作结束索引设置为-1
  • list可以对数据进行分页操作,通常第一页的信息来自于list,第2页及更多的信息通过数据库的形式加载

业务场景

twitter、新浪微博、腾讯微博中个人用户的关注列表需要按照用户的关注顺序进行展示,粉丝列表需要将最近关注的粉丝列在前面

Set

  • 新的存储需求:存储大量的数据,在查询方面提供更高的效率
  • 需要的存储结构:能够保存大量的数据,高效的内部存储机制,便于查询
  • set类型:与hash存储结构完全相同,仅存储键,不存储值(nil),并且值是不允许重复的

基本操作

  • 添加数据
    sadd key member1 [member2]
  • 获取全部数据
    smembers key
  • 删除数据
    srem key member1 [member2]
  • 获取集合数据总量
    scard key
  • 判断集合中是否包含指定数据
    sismember key member
  • 随机获取集合中指定数量的数据
    srandmember key [count]
  • 随机获取集合中的某个数据并将该数据移出集合
    spop key [count]

扩展操作

  • 求两个集合的交、并、差集
sinter key1 [key2] 
sunion key1 [key2] 
sdiff key1 [key2]
  • 求两个集合的交、并、差集并存储到指定集合中
sinterstore destination key1 [key2] 
sunionstore destination key1 [key2] 
sdiffstore destination key1 [key2]
  • 将指定数据从原始集合中移动到目标集合中
smove source destination member

注意

  • set 类型不允许数据重复,如果添加的数据在 set 中已经存在,将只保留一份
  • set 虽然与hash的存储结构相同,但是无法启用hash中存储值的空间

Sorted_set

  • 新的存储需求:数据排序有利于数据的有效展示,需要提供一种可以根据自身特征进行排序的方式
  • 需要的存储结构:新的存储模型,可以保存可排序的数据
  • sorted_set类型:在set的存储结构基础上添加可排序字段
  • 添加数据
zadd key score1 member1 [score2 member2]
  • 获取全部数据
zrange key start stop [WITHSCORES]
zrevrange key start stop [WITHSCORES]
  • 删除数据
    zrem key member [member ...]
  • 按条件获取数据
zrangebyscore key min max [WITHSCORES] [LIMIT]
zrevrangebyscore key max min [WITHSCORES]
  • 条件删除数据
zremrangebyrank key start stop 
zremrangebyscore key min max

注意:

  • min与max用于限定搜索查询的条件
  • start与stop用于限定查询范围,作用于索引,表示开始和结束索引
  • offset与count用于限定查询范围,作用于查询结果,表示开始位置和数据总量
  • 获取集合数据总量
zcard key
zcount key min max
  • 集合交、并操作
zinterstore destination numkeys key [key ...] 
zunionstore destination numkeys key [key ...]
  • 获取数据对应的索引(排名)
zrank key member 
zrevrank key member
  • score值获取与修改
zscore key member 
zincrby key increment member

注意

  • score保存的数据存储空间是64位,如果是整数范围是-9007199254740992~9007199254740992
  • score保存的数据也可以是一个双精度的double值,基于双精度浮点数的特征,可能会丢失精度,使用时候要慎重
  • sorted_set 底层存储还是基于set结构的,因此数据不能重复,如果重复添加相同的数据,score值将被反复覆盖,保留最后一次修改的结果



扫一扫在手机打开当前页
最后修改:2020 年 08 月 08 日 05 : 49 PM