我正在研究一些用于开发Web应用程序的后端即服务(BaaS)解决方案,并且我经常看到Firebase将他们的数据库称为“实时数据库”,而例如Backawa没有提到短语“实时”任何地方。
我知道实时意味着数据会立即得到处理,但我认为所有数据库都会这样做?例如,如果我有一个MySQL/SQLite/PostgreSQL数据库和insert数据,我希望它能在(毫秒)秒内检索到,而且肯定是在“insert…”之后直接检索到查询已完成。
与其他BaaS服务“普通”数据库相比,Firebase实时数据库有什么不同?
实时一词有点令人困惑,但实际上Firebase与普通数据库有很大不同。有两个主要区别。首先是它存储数据的方式,另一个是我们访问数据的方式。在普通数据库中,当后端数据更新时,我们需要刷新浏览器或android应用程序以获取更新的数据,另一方面,在firebase中,我们甚至不需要刷新页面。从任何其他客户端浏览器所做的更改将反映到所有连接的客户端,而无需进行任何服务器端调用。
它很少与人们如何创造“实时”这个名字或它是否作为BAA提供有关。如果通过优化存储和检索可以更快地检索数据,则可以将其归类为实时数据。E、 g.实时数据库Aerospike、SAP Hana、Volt DB、memcached、redis和SQLite。
RDBMS“普通”数据库,
详细看这里吧,太多字懒得打了
1.有k个元素的中间节点的包含k个元素(b树中是k个元素),中间节点的每个元素不保存数据,数据存储在叶子上面
2.叶子节点包含了全部元素的信息,以及指向含这些元素记录的指针。
3.所有的叶子接点都同时存在于子接点,在子接点中是最大(或最小)的元素
1.单一节点存储更多的元素,使得查询的IO次数更少;
2.所有查询都要查找到叶子节点,查询性能稳定;
3.所有叶子节点形成有序链表,便于范围查询。
(A事务读取了B事务未提交的数据)
解决方法:在事务提交前,不允许读取其修改后的数据
修改事务完全提交后,才可以读取数据,就可以解决不可重复读
解决方法:在其他操作事务完成数据处理之前,任何其他新事务都不可以添加新数据,可以避免该问题(只允许一个事务进行)
(一次只运行一个事务进行)
1.中间节点会在子节点中冗余一份,而且在子节点中是最大(或最小的)
2.叶子结点存的数据,而且数据之间有双向指针把数据连接在一起
在索引列上进行运算操作,索引将失效
字符串类型字段使用时,不加引号,索引将失效
如果仅仅是尾部模糊匹配,索引不会失效,如果是头部模糊查询,索引失效
用or分割开的条件,如果or前的条件中有索引,后面的列中没有索引,那么涉及的索引都不会被用到。
在MYSQL查询时,会评估使用索引的效率和走全表扫描的效率,如果走全表扫描更快,则放弃索引,走全表扫描,因为索引是用来索引少量数据的,如果索引查询放回大批量的数据,还不如走全表扫描来的快,此时索引会失效
空间索引(针对空间的数据结构建立的索引)
原子性是指一个事务是一个不可分割的整体,内部的操作要么都做,要么都不做,所以说,实现原子性的核心就在于如何实现回滚
事务执行的结果是数据库从一个一致性状态变到另一个一致状态,即数据库完整性没有被破坏,事务执行的前后都是合法的状态
(数据完整性包括但不限于,实体完整性,如行的主键存在且唯一,列完整性如字段的类型,大小,长度要符合要求,外键约束,用户自定义完整性)
事物内部的操作与其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
持久性是指事务一旦提交,他对数据库的改变就是永久的,接下来的其他操作不对应该对其有任何影响,并且不能回滚
1.保证原子性,持久性,隔离性,如果这些无法保证,事务的一致性也无法保证
2.数据库本身提供保障,例如不运行向整行列插入字符串值,字符串长度不能超过列的限制等
3.应用层面进行保障,例如如果转账操作只扣除转账者的劲儿,二没有增加接收者的余额,无论数据库实现的多么完美,也无法保证状态的一致性
1.一个事务写操作对另外一个事务写操作的影响:锁机制保证隔离性
2.一个事务写操作对另外一个事务读操作的影响:MVVC保证隔离性
数据是放在磁盘的,但是如果每次读写数据都需要磁盘io,效率会很低,为此,Innodb提供了缓存,bp中包含了部分数据页的映射,作为访问数据库的缓冲,当从数据库读取数据时,会首先写入BP,BP中修改的数据会定期刷新到磁盘中(这一过程称为刷脏)
BP的使用打打提高了读写数据的效率,但是也带来了新的问题,如果MYSQL宕机,而此时BP中修改的数据还没有刷新到磁盘,就会导致数据的丢失,事务的持久性就无法保证。
redo log就被引入来解决这个问题(宕机导致BP中的数据没有刷新磁盘,造成数据丢失)当数据被修改时,除了修改BP中的数据,还会在redo log中记录这次操作
当事务提交是,会调用fsync接口对redo log 进行刷盘,如果MYSQL宕机,重启时可以读取redo log 中的数据,对数据库进行恢复,redo log 采用的是 WAL(write-ahead logging,预写式日志)所有修改先写入日志,在更新到BP,保证了数据不会因为MYSQL宕机而丢失,从而满足了持久性的要求。
将数据库设定为多主模式,这样每次新增数据都会去做同步这样避免生成一样的iad
设置起始值和步长(缺点是需要规定数据库个数)
2.同步完成后进行主主双写
3.删除双主同步,修改数据库配置并重启(秒级)
4.清空数据库中多余数据
在innodb中普通索引只包含主键id需要回表查询,而myisam则不需要,因为存的都是数据
1.中间节点只保存索引,并且在子节点中冗余一份,而且是子节点数据中的最小(或最大)值
2.叶子节点存储的是数据,并且通过双向链表链接起来
5.数据分布影响(如果全表更快的话就不走索引)
1.主从间的数据库不是实时同步,就算网络连接正常,也能存在主从数据不一致的情况
2.如果主从的网络断开,则从库会在网络恢复正常后,批量进行同步。
3.如果对从库进行修改数据,那么如果此时从库正在执行主库的binlog时,则会出现错误而停止同步,这是一个很危险的操作,所以一般情况下,我们要非常小心的修改从库上的数据。
联合索引本质,创建(a,b,c) 的时候,相当于创建了(a)单列索引(a,b)联合索引以及(a,b,c)联合索引,想要索引生效的话,只能使用a和a,b和a,b,c三种组合当然,我们上面测试过,a,c也会走索引但是实际上只用到了a的索引,c并没有用到
但是如果在a相同的情况下,b也是有顺序的
很好理解,就是服务运行过程中发生的严重错误日志。但我们的数据库无法启动时,就可以来这里看看具体不能启动的原因是什么
它有另外一个名字你应该熟悉,叫Binlog,其记录了对数据库所有的更改
记录了来自客户端的所有语句
这里记录了所有响应时间超过阈值的SQL语句,这个阈值我们可以自己设置,参数为long_query_time
,其默认值为10s,且默认是关闭的状态,需要手动的打开。
它有另外一个名字你应该熟悉,叫Binlog,其记录了对数据库所有的更改
记录了来自客户端的所有语句
这里记录了所有响应时间超过阈值的SQL语句,这个阈值我们可以自己设置,参数为long_query_time
,其默认值为10s,且默认是关闭的状态,需要手动的打开。
我有一个主意,但它仍然使我迷惑数据库区域。
想象一下,我想显示实时数据,并使用一种最新的浏览器技术(Web套接字 -甚至使用),很容易向所有可观察对象(用户浏览器)显示每个人的工作。
但是我仍然不了解数据库,我该如何喂食,让我们想象一下(使用Remy游戏Tron),我想在数据库中保存每个已连接用户的路径,以及客户端是否想了解发生了什么事情一个5秒的延迟,他将看到,不仅是那一刻的5秒,而且是时间的延续 ...
我如何查询这样的数据库?
并在x时间内拉出x ...这不是真实的数据Feed正确吗?
如果有人可以帮助我理解数据库的观点,我将不胜感激。