关于NoSQL和SQL选择的问题

欢马劈雪

工程师 (已认证)

原创分享签约作者

发表于教程文章

961

我理解上，Column Family NoSQL的schema和SQL schema大多能够互相作逻辑转换。也就是说，给一个DB，里面有很多table，table里有很多column，然后跟你说我query的型态会长怎样 (等同告诉你app layer的join要怎么做)。我们多半能把这些DB schema转成CF NoSQL的schema。反之亦然。

对single box(单一机器)来说，CF NoSQL能承受的qps比SQL要高；不过在multiple machines的情况下，可对SQL去作sharding & replicas来增加其performace和availability/reliability。这边甚至可混用cosistent hashing的架构来作SQL sharding/replication。也就是说:

在多台机器可用的环境下，CF NoSQL 和 SQL 的效能，是可以做到差不多的。

1、Data相关性极低
Data非常不relational (require no join or few joins)，这时用SQL 就有点浪费，可能会有不必要的overhead。

2、Data相关性极高
这时用CF NoSQL可能要处理大量的de-normalization，虽然disk便宜，但duplicated data太多的话可能也会爆容量。而且update时要处理de-norm data间consistency的问题。

e.g. 一个data可能属于(row_key_A, column_key_A)同时也属于(row_key_B, column_key_B)，这样更新这data时就要同时更新这两个row。感觉这种情况选用SQL会较佳。

3、Data相关性一般
去除以上两个极端cases，通常data是介于中间。这时候感觉：

用 CF NoSQL 和 SQL是差不多的。

用SQL的话，developer要自己处理sharding/replication。不过相对而言SQL expert的数量远大于Cassandra/Hbase expert, SQL communities也相对成熟许多。

展开阅读全文

本文系作者在时代Java发表，未经许可，不得转载。

如有侵权，请联系nowjava@qq.com删除。

编辑于 2020-08-31 12:26:562020-08-31 12:26:56

教程文章

文章订阅