实时我对数据库的认识是什么?有了解的吗?

实时数据库和“普通”数据库有什么区别?


我正在研究一些用于开发Web应用程序的后端即服务(BaaS)解决方案,并且我经常看到Firebase将他们的数据库称为“实时数据库”,而例如Backawa没有提到短语“实时”任何地方。

我知道实时意味着数据会立即得到处理,但我认为所有数据库都会这样做?例如,如果我有一个MySQL/SQLite/PostgreSQL数据库和insert数据,我希望它能在(毫秒)秒内检索到,而且肯定是在“insert…”之后直接检索到查询已完成。

与其他BaaS服务“普通”数据库相比,Firebase实时数据库有什么不同?


实时一词有点令人困惑,但实际上Firebase与普通数据库有很大不同。有两个主要区别。首先是它存储数据的方式,另一个是我们访问数据的方式。在普通数据库中,当后端数据更新时,我们需要刷新浏览器或android应用程序以获取更新的数据,另一方面,在firebase中,我们甚至不需要刷新页面。从任何其他客户端浏览器所做的更改将反映到所有连接的客户端,而无需进行任何服务器端调用。

它很少与人们如何创造“实时”这个名字或它是否作为BAA提供有关。如果通过优化存储和检索可以更快地检索数据,则可以将其归类为实时数据。E、 g.实时数据库Aerospike、SAP Hana、Volt DB、memcached、redis和SQLite。

  1. 存储在RAM中的数据。为了可靠性,数据备份在非易失性存储器上。未来可能会使用nvram
  2. 无需序列化。因为数据是使用指针访问的
  3. 使用AVL树(或其他最佳数据结构)进行索引,以支持范围查询

RDBMS“普通”数据库,

  1. 存储在硬盘或SSD中的数据



详细看这里吧,太多字懒得打了

7.MYSQL索引讲一下,为什么B+树更好?B+树与B树的差别在哪里?

1.有k个元素的中间节点的包含k个元素(b树中是k个元素),中间节点的每个元素不保存数据,数据存储在叶子上面

2.叶子节点包含了全部元素的信息,以及指向含这些元素记录的指针。

3.所有的叶子接点都同时存在于子接点,在子接点中是最大(或最小)的元素

8.B+树相对于B树的优势:

1.单一节点存储更多的元素,使得查询的IO次数更少;
  2.所有查询都要查找到叶子节点,查询性能稳定;
  3.所有叶子节点形成有序链表,便于范围查询。

9,mysql各个数据类型有什么需要注意的地方

读未提交(会产生脏读)

(A事务读取了B事务未提交的数据)

解决方法:在事务提交前,不允许读取其修改后的数据

读已提交(会产生不可重复读)

修改事务完全提交后,才可以读取数据,就可以解决不可重复读

可重复读(会产生幻读)

解决方法:在其他操作事务完成数据处理之前,任何其他新事务都不可以添加新数据,可以避免该问题(只允许一个事务进行)

(一次只运行一个事务进行)

1.中间节点会在子节点中冗余一份,而且在子节点中是最大(或最小的)

2.叶子结点存的数据,而且数据之间有双向指针把数据连接在一起

2.b+树的增删改查?

在索引列上进行运算操作,索引将失效

字符串类型字段使用时,不加引号,索引将失效

如果仅仅是尾部模糊匹配,索引不会失效,如果是头部模糊查询,索引失效

用or分割开的条件,如果or前的条件中有索引,后面的列中没有索引,那么涉及的索引都不会被用到。

在MYSQL查询时,会评估使用索引的效率和走全表扫描的效率,如果走全表扫描更快,则放弃索引,走全表扫描,因为索引是用来索引少量数据的,如果索引查询放回大批量的数据,还不如走全表扫描来的快,此时索引会失效

14.存储引擎知道哪些,有哪些索引,底层是什么实现的

空间索引(针对空间的数据结构建立的索引)

原子性是指一个事务是一个不可分割的整体,内部的操作要么都做,要么都不做,所以说,实现原子性的核心就在于如何实现回滚

事务执行的结果是数据库从一个一致性状态变到另一个一致状态,即数据库完整性没有被破坏,事务执行的前后都是合法的状态

(数据完整性包括但不限于,实体完整性,如行的主键存在且唯一,列完整性如字段的类型,大小,长度要符合要求,外键约束,用户自定义完整性)

事物内部的操作与其他事务是隔离的,并发执行的各个事务之间不能互相干扰。

持久性是指事务一旦提交,他对数据库的改变就是永久的,接下来的其他操作不对应该对其有任何影响,并且不能回滚

1.保证原子性,持久性,隔离性,如果这些无法保证,事务的一致性也无法保证

2.数据库本身提供保障,例如不运行向整行列插入字符串值,字符串长度不能超过列的限制等

3.应用层面进行保障,例如如果转账操作只扣除转账者的劲儿,二没有增加接收者的余额,无论数据库实现的多么完美,也无法保证状态的一致性

1.一个事务写操作对另外一个事务写操作的影响:锁机制保证隔离性

2.一个事务写操作对另外一个事务读操作的影响:MVVC保证隔离性

数据是放在磁盘的,但是如果每次读写数据都需要磁盘io,效率会很低,为此,Innodb提供了缓存,bp中包含了部分数据页的映射,作为访问数据库的缓冲,当从数据库读取数据时,会首先写入BP,BP中修改的数据会定期刷新到磁盘中(这一过程称为刷脏)

BP的使用打打提高了读写数据的效率,但是也带来了新的问题,如果MYSQL宕机,而此时BP中修改的数据还没有刷新到磁盘,就会导致数据的丢失,事务的持久性就无法保证。

redo log就被引入来解决这个问题(宕机导致BP中的数据没有刷新磁盘,造成数据丢失)当数据被修改时,除了修改BP中的数据,还会在redo log中记录这次操作

当事务提交是,会调用fsync接口对redo log 进行刷盘,如果MYSQL宕机,重启时可以读取redo log 中的数据,对数据库进行恢复,redo log 采用的是 WAL(write-ahead logging,预写式日志)所有修改先写入日志,在更新到BP,保证了数据不会因为MYSQL宕机而丢失,从而满足了持久性的要求。

将数据库设定为多主模式,这样每次新增数据都会去做同步这样避免生成一样的iad

4.自动增长列(也被称为升级版本号段模式)

设置起始值和步长(缺点是需要规定数据库个数)

18mysql索引慢分析:线上开启slowlog,提取慢查询,然后仔细分析explain中type字段以及extra字段,发生的具体场景以及mysql是怎么做的?

19mysql分表分库平滑扩容方案

2.同步完成后进行主主双写

3.删除双主同步,修改数据库配置并重启(秒级)

4.清空数据库中多余数据

2.需要考虑分布式id的问题见问题17,避免数据库id重复

20隔离级别,sql慢查询

21对mysql的设计掌握如何(应该是范式那些东西)

23.存储引擎了解哪些?

25mysql主键索引和非主键索引在搜索和检索的过程中有什么区别吗

在innodb中普通索引只包含主键id需要回表查询,而myisam则不需要,因为存的都是数据

26mysql如何实现事务的?(复习)

27.mysql主从同步过程了解吗?

1.中间节点只保存索引,并且在子节点中冗余一份,而且是子节点数据中的最小(或最大)值

2.叶子节点存储的是数据,并且通过双向链表链接起来

31mysql事务的隔离级别,分别解决了什么问题

可重复读(不可重复读)

39mysql根据多列构造索引(实践题吧…)

40mysql索引结构为什么不用跳表(这个因为上面一个问题问到的是zset为什么用的是跳表)

41mysql有哪些存储引擎,你用到的是什么存储引擎,区别是什么

43.mysql索引,联合索引,索引失效,左连接

2.索引失效(复习题12)

5.数据分布影响(如果全表更快的话就不走索引)

45.为什么项目的数据库要用到mysql innodb特性底层了解吗数据分区,怎么加快读写效率

55mysql ab 两个分别建立索引会更快吗

56.mysql主从复制以及好处,工作原理和机制

1.数据更安全:做了数据冗余,不会因为单台服务器的宕机而丢失数据

2.性能大大提升:一主多从,不同用户从不同数据库读取,性能提升

3.扩展性更优:流量增大时,可以方便的增加从服务器,不影响系统使用

4.负载均衡:一主多从相当于分担了主机任务,做了负载均衡

2.发扬不同表引擎的优点

1.slave端的io线程链接上master端,并请求从制定binlog日志文件指定的pos节点位置(或则从最开始)开始复制之后的日志内容

2.master端在接受到来自slave端的io线程请求后,通知负责复制线程的io线程,根据slave端io线程的请求信息,读取制定binlog日志指定pos节点位置之后的日志信息,然后放回给slave端的io线程。该放回信息中除了binlog日志所包含的信息之外,还包括本次返回信息在master端的binlog文件名以及在binlog日志中的pos节点位置(便于下次同步)

3.slave端的io线程在接受到master端io放回的信息后,将接收到的binlog日志内容依次写入到slave端的relaylog文件(mysql-reply-bin.xxx)的最末端,并将读取到的master端的binlog文件名和pos节点的位置记录到master-info(该文件存在slave端)文件中,以便在下一次读取的时候能够qingchude告诉masrer,我需要从那个binlog文件的哪个pos节点位置开始,请把此节点后的日志内容发给我。

4.slave的sql线程在检测到relaylog文件中新增内容后,会马上解析该log文件中的内容。然后还原成在master端真正执行的那些sql语句,并在自身按顺序依次执行这些sql语句。这样实际上就是master端真正执行的那些sql语句,并在自身按顺序执行这些sql语句。这样,实际上就是master端和slave端执行了同样的sql语句,所以master端和slave端是完全一样的

1.主从间的数据库不是实时同步,就算网络连接正常,也能存在主从数据不一致的情况

2.如果主从的网络断开,则从库会在网络恢复正常后,批量进行同步。

3.如果对从库进行修改数据,那么如果此时从库正在执行主库的binlog时,则会出现错误而停止同步,这是一个很危险的操作,所以一般情况下,我们要非常小心的修改从库上的数据。

57.mysql引擎,索引数据结构,为什么用b+树不用别的(复习)

60.说下mysql的索引结构?b+树和红黑对比下

61.mysql聚簇索引?(复习)联合索引?为什么会有最左匹配原则?

联合索引本质,创建(a,b,c) 的时候,相当于创建了(a)单列索引(a,b)联合索引以及(a,b,c)联合索引,想要索引生效的话,只能使用a和a,b和a,b,c三种组合当然,我们上面测试过,a,c也会走索引但是实际上只用到了a的索引,c并没有用到

但是如果在a相同的情况下,b也是有顺序的

65.mysql索引知道哪些,底层是怎么实现的(复习)

67.mysql的事务隔离级别,mysql acid 回表,普通索引和唯一索引的区别;mysql最左匹配原则

72zookeeper,mysql,redis怎么实现分布式锁,各有什么优缺点,生产中一般用哪个

73mysql查询速度慢如何优化,如何添加索引(覆盖索引/前缀匹配)

75mysql默认使用哪个隔离级别

78mysql把时间戳转化成日常格式时间的函数

80mysql怎么去查询的,什么时候走索引,什么时候不走

86mysql有哪些索引,介绍一下b+树具体的结构

87mysql索引分类分别说一下

92聚簇索引和非聚簇索引有什么区别

96mysql的两个引擎及使用场景

97怎么查看优化mysql语句耗时操作

98mysql的索引,为什么是b+树而不是平衡二叉树

99mysql的io过高怎么优化,分库分表以及分区

101请说一下mysql的事务隔离级别

103什么情况下会导致索引失效

104mysql底层有几种实现方式

107mysql常见引擎的区别,mvvc机制是干嘛的

108索引失效的几个场景

很好理解,就是服务运行过程中发生的严重错误日志。但我们的数据库无法启动时,就可以来这里看看具体不能启动的原因是什么

它有另外一个名字你应该熟悉,叫Binlog,其记录了对数据库所有的更改

记录了来自客户端的所有语句

这里记录了所有响应时间超过阈值的SQL语句,这个阈值我们可以自己设置,参数为long_query_time,其默认值为10s,且默认是关闭的状态,需要手动的打开。

117如何解决mysql高并发的问题

119mysql多事务操作会有哪些问题,具体解释一下,对应的有哪些事务隔离级别,怎么实现的(MVCC,版本链+undo log+read view)

120通过慢查询(explain)哪些字段可以判断优化

121mysql为什么往往以集群提供服务,扩容会有什么问题

122mysql的表级锁和行级锁是悲观锁还是乐观锁

123mysql的分表是怎么处理的

126查看mysql死锁用什么命令

130一亿人中怎么找身份证

它有另外一个名字你应该熟悉,叫Binlog,其记录了对数据库所有的更改

记录了来自客户端的所有语句

这里记录了所有响应时间超过阈值的SQL语句,这个阈值我们可以自己设置,参数为long_query_time,其默认值为10s,且默认是关闭的状态,需要手动的打开。

117如何解决mysql高并发的问题

119mysql多事务操作会有哪些问题,具体解释一下,对应的有哪些事务隔离级别,怎么实现的(MVCC,版本链+undo log+read view)

120通过慢查询(explain)哪些字段可以判断优化

121mysql为什么往往以集群提供服务,扩容会有什么问题

122mysql的表级锁和行级锁是悲观锁还是乐观锁

123mysql的分表是怎么处理的

126查看mysql死锁用什么命令

130一亿人中怎么找身份证

我有一个主意,但它仍然使我迷惑数据库区域

想象一下,我想显示实时数据,并使用一种最新的浏览器技术(Web套接字 -甚至使用),很容易向所有可观察对象(用户浏览器)显示每个人的工作。

但是我仍然不了解数据库,我该如何喂食,让我们想象一下(使用Remy游戏Tron),我想在数据库中保存每个已连接用户的路径,以及客户端是否想了解发生了什么事情一个5秒的延迟,他将看到,不仅是那一刻的5秒,而且是时间的延续 ...

我如何查询这样的数据库?

并在x时间内拉出x ...这不是真实的数据Feed正确吗?

如果有人可以帮助我理解数据库的观点,我将不胜感激。

我要回帖

更多关于 我对数据库的认识 的文章

 

随机推荐