6.常见概念和问题

##目录

一、概念
- 1. 应用、实例、机器、CacheCloud客户端、CacheCloud服务端
- 2. 下线和心跳停止
二、常见开发问题
三、运维技巧

##一、概念： ###1. 应用、实例、机器、CacheCloud客户端、CacheCloud服务端 ####(a) 实例一个redis进程，例如在ip为10.10.xx.xx启动了端口为6379的redis进程。实例可以是redis单机数据节点、redis-sentinel类型下的redis数据节点和sentinel节点、也可以是redis-cluster下的redis数据节点。 ####(b) 应用一个redis集群是由若干个实例组成的，分配给每个cachecloud用户的redis集群就是一个应用（包含应用id）

一个应用可以是一个Redis单机、一个Redis-Sentinel集群、一个Redis-Cluster集群。但是对于CacheCloud用户来说，不需要知道每个Redis实例的ip:port，只需要一个appId就可以获取这些细节。主流云服务都采用appid的形式分配给用户，提供各种云服务。 ####(c) 机器一台物理机或者虚拟机。一台机器可以部署多个应用，多个实例。 ####(d) cachecloud客户端提供给cachecloud用户通过appId快速接入cachecloud系统的api。（可以理解成获取应用对应redis实例的REST接口或者封装好的jar包） ####(e) cachecloud服务端（cachecloud管理系统） cachecloud用户通过appId获取Redis服务地址的服务端。用于收集、展示、管理实例、应用、机器各个层面的数据，帮助cachecloud用户高效快速了解redis集群使用状态。

###2. 下线和心跳停止 + 下线：管理员人工处理，真的下线了。 + 心跳停止：监控认为有可能下线，但是由于网络等原因，可能并没有下线，所以需要管理员处理 ##二、常见开发问题 ###1. 客户端服务机房问题 Redis是比较依赖于网络环境的，较差的网络环境会带来一系列问题，最明显的就是访问速度，之前做过一个统计，跨机房要比同一个机房慢数倍。

所以用户在申请应用的时候，要填写自己的服务所在的机房，这样Cachecloud的管理员会根据您的机房情况给予合理的分配。

###2. 配置修改问题 Cachecloud中各种类型(Redis-standalone, Redis-sentinel, Redis-cluster)，在开启应用时，使用的我们认为最优的配置。

但是，每个用户自己服务类型不同，需求可能会不同，例如对于maxmemory-policy、list-max-ziplist-entries、list-max-ziplist-value等配置就会有所不同，如果有需要修改配置，用户可以自行提交配置修改。

修改方法如下：

(1) 进入应用页面的拓扑结构选项卡，点击ID进入实例页面

(2) 进入配置查询选项卡

(3) 点击申请修改配置，填写相应字段和值

(4) 后台管理员接收到申请邮件，进行处理，处理完成后，用户将收到相应处理邮件

####注：修改的配置会对应用的所有节点生效，因为所有节点的配置是统一的。

###3. maxmemory-policy配置说明 Cachecloud对于每个Redis节点都设置了maxmemory, 所以需要有对应的maxmemory-policy，默认策略是volatile-lru。

Redis提供了6种策略应对maxmemory, 用户可以根据自己的需求选择对应的策略。

volatile-lru -> 用lru算法删除过期的键值
allkeys-lru -> 用lru算法删除所有键值
volatile-random -> 随机删除过期的键值
allkeys-random -> 随机删除任何键值
volatile-ttl -> 删除最近要到期的键值（监控TTL）
noeviction -> 不会写操作，返回一个错误

###4. 数据清理问题 Cachecloud测试应用用户可以自行清理内存，处于安全的考虑正式应用需要联系管理员进行清理。

###5. 应用选型问题如上图所示，目前CacheCloud提供了5种类型的存储类型（注：目前Cachecloud重点维护Redis三种类型）

用户可以根据自己的需要选择适合自己的类型，下面对Redis的三种类型使用场景进行简单说明：

(1) 底层数据（例如mysql, hbase等等）允许被穿透，而且不考虑高可用性，可以考虑Redis-Standalone类型。
- 缺点：非高可用、受单机影响扩展性(容量，读写等)有限
- 优点：结构简单

(2) 如想保证Redis的高可用（通过主从和sentinel机制），可以选择Redis-Sentinel类型
- 缺点：受单机影响扩展性(容量，读写等)有限
- 优点：高可用，结构相对简单

(3) 如想保证高可用、可扩展、大容量等要求，可以选择Redis-Cluster 下面给一些建议：
- 并不是说Redis-Cluster比其他两种类型好，用户需要根据自己的需求选择（比如内存需求量不大，保证高可用选择Redis-Sentinel类型就足够了）
- 如果当前或者未来需要的内存量超过6个G，建议选择Redis-Cluster类型。

###6. Jedis连接池GenericObjectPoolConfig配置 Jedis源码中使用了common-pool2作为连接池管理工具，无论是对于Redis-Standalone, Redis-Sentinel, Redis-Cluster进行操作，通常是通过jedis连接池(JedisPool, JedisSentinelPool)获取连接，所以需要选择合理的连接池配置。通常的代码如下（可以参考cachecloud中代码接入模块）： ```Java GenericObjectPoolConfig poolConfig = new GenericObjectPoolConfig(); poolConfig.setMaxTotal(GenericObjectPoolConfig.DEFAULT_MAX_TOTAL * 5); poolConfig.setMaxIdle(GenericObjectPoolConfig.DEFAULT_MAX_IDLE * 3); poolConfig.setMinIdle(GenericObjectPoolConfig.DEFAULT_MIN_IDLE * 2); poolConfig.setJmxEnabled(true); poolConfig.setMaxWaitMillis(3000); PipelineCluster redisCluster = ClientBuilder.redisCluster(appId) .setJedisPoolConfig(poolConfig) .setTimeout(1) .setMaxRedirections(5) .build(); ``` 其中poolConfig就是对于连接池的配置，其中有几个配置较为重要。 maxActive: 链接池中最大连接数,默认为8. (并非越大越好，具体原因可以参考GenericObjectPool的实现) maxIdle: 链接池中最大空闲的连接数,默认为8. minIdle: 连接池中最少空闲的连接数,默认为0. maxWait: 当连接池资源耗尽时，调用者最大阻塞的时间，超时将跑出异常。单位，毫秒数;默认为-1.表示永不超时. jmxEnabled：当设置为true, 且服务开启的jmx服务时，使用jconsole, jvisualvm等工具将看到如下关于连接池的很全面的统计，这些统计结果有助于优化自己的配置。

###其余配置如下：

1. minEvictableIdleTimeMillis: 连接空闲的最小时间，达到此值后空闲连接将可能会被移除。负值(-1)表示不移除。默认-1。这个也挺重要，一般不用移除，每次makeObject()开销比较大
1. numTestsPerEvictionRun: 对于“空闲链接”检测线程而言，每次检测的链接资源的个数。默认为3
1. testOnBorrow: 向调用者输出“链接”资源时，是否检测是有有效，如果无效则从连接池中移除，并尝试获取继续获取。默认为false。借资源时候是否要验证，比如jedis对象验证是ip:port是否发生改变，且执行一个ping命令
1. testOnReturn: 向连接池“归还”链接时，是否检测“链接”对象的有效性。默认为false。还资源时候是否要验证，同上。
1. testWhileIdle: 向调用者输出“链接”对象时，是否检测它的空闲超时；如果“链接”空闲超时，将会被移除。默认为false 空闲是否是否要定时检查一遍所有的对象
1. timeBetweenEvictionRunsMillis: “空闲链接”检测线程，检测的周期，毫秒数。如果为负值，表示不运行“检测线程”。默认为-1。
1. whenExhaustedAction: 当“连接池”中active数量达到阀值时，即“链接”资源耗尽时，连接池需要采取的手段, 默认为1：

###7. Redis-Sentinel类型的客户端调用过程（建议） (1) 初始化JedisSentinelPool (通常是单例的，可以通过java代码或者spring实现)，具体方法可以参考Cachecloud接入代码模块 ```Java //spring 配置

package xx.xx; import com.sohu.tv.builder.ClientBuilder; import org.apache.commons.pool2.impl.GenericObjectPoolConfig; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import redis.clients.jedis.JedisSentinelPool; public class RedisSentinelFactory {

private final Logger logger = LoggerFactory.getLogger(this.getClass());

private JedisSentinelPool jedisSentinelPool;

private int appId;

public void init(){
    //根据自己需要设置poolConfig
    GenericObjectPoolConfig poolConfig = new GenericObjectPoolConfig();
    poolConfig.setMaxTotal(GenericObjectPoolConfig.DEFAULT_MAX_TOTAL * 10);
    poolConfig.setMaxIdle(GenericObjectPoolConfig.DEFAULT_MAX_IDLE * 5);
    poolConfig.setMinIdle(GenericObjectPoolConfig.DEFAULT_MAX_IDLE * 2);
    poolConfig.setMaxWaitMillis(1000L);
    poolConfig.setJmxEnabled(true);
    try {
        //根据自己需要设置超时时间
        jedisSentinelPool = ClientBuilder.redisSentinel(appId)
            .setTimeout(2000)
            .setPoolConfig(poolConfig)
            .build();
    } catch (Exception e) {
        logger.error(e.getMessage(), e);
    }
}

public JedisSentinelPool getJedisSentinelPool() {
    return jedisSentinelPool;
}

public void setAppId(int appId) {
    this.appId = appId;
}

}


(2) 每次调用的建议写法：
```Java
		Jedis jedis = null;
        try {
            jedis = redisSentinelPool.getResource();
            //jedis command
        } catch (Exception e) {
            logger.error(e.getMessage(), e);
        } finally {
            if (jedis != null)
                jedis.close();
        }

其中jedis.close()并非关闭连接（可能是jedis定义上带来的歧义），如果看jedis源码会发现close实现如下:

    public void close() {
        if (dataSource != null) {
            if (client.isBroken()) {
                this.dataSource.returnBrokenResource(this);
            } else {
                this.dataSource.returnResource(this);
            }
        } else {
            client.close();
        }
    }

(它会帮助你决定returnBrokenResource还是returnResource来归回jedis连接对象) 其中dataSource!=null说明使用pool管理jedis连接(具体可以参考JedisPool, JedisSentinelPool的实现中 setDataSource)

###8. Redis-Cluster类型的客户端调用过程（建议）相比于Redis-Sentinel类型Jedis-Cluster的调用相对简单(Jedis源码内部对于cluster节点的选择以及pool的管理做了透明处理) + (1) 初始化JedisCluster(通常是单例的，可以通过java代码或者spring实现)。具体方法可以参考cachecloud接入代码模块 + (2) 每次调用直接使用jedisCluster.command即可。 ###9. 数据库个数问题 Redis实例（Redis-Cluster除外）默认提供了16个数据库，用户可以使用select x来实现数据库的切换，但是这个功能从总体上弊大于利，不建议使用，默认使用数据库0即可。具体原因：如果你在其他语言的客户端中执行Redis命令，并且该客户端没有像redis-cli那样一直显示目标数据库的号码，那么在数次切换数据库之后，你很可能会忘记自己当前正在使用的是哪个数据库。当出现这种情况时，为了避免对数据库进行误操作，在执行Redis命令特别是像FLUSHDB这样的危险命令之前，最好先执行一个SELECT命令，显式地切换到指定的数据库，然后才执行别的命令，总之会陷入混乱。 ###10. Redis-Sentinel类型应用统计中publish命令细心的人会发现即使你的Redis-Sentinel类型的应用没做过任何publish操作，命令统计依然会有周期性publish的调用记录。

原因是因为sentinel为了保证高可用性，订阅节点上 sentinel:hello 频道上publish的信息，确认redis节点的可用性。所以这个统计用户不需要关心，可以忽略。

###11. 命令执行模块问题为了保证数据安全，对于测试应用可以执行任意命令。

对于线上应用，只允许执行如下命令：

debug,exists,object,ttl,type,scan,get,getbit,getrange,mget,setrange,strlen,hexists,hget,hgetall,hkeys,hlen,hmget,hvals,hscan,lindex,llen,
lrange,scard,sismember,sscan,srandmember,zcard,zcount,zrange,zrangebyscore,zrank,zrevrange,zscore,zscan,dbsize,info,time,lastsave;

##三、运维技巧: ###1. 迁移机器实例 updating... ###2. 更换Redis版本 updating... ###3. 机器选取、分配技巧和坑 updating... ###4. 个性化配置优化 updating... ###5. 密码考虑到安全和内网环境，CacheCloud并没有为每个Redis实例配置安全密码，如有需要请自行添加，并对个客户端进行调整。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

6.常见概念和问题

Clone this wiki locally